生物分子模拟论坛

 找回密码
 我想注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: lrf1980

Modeller 学习记录(五)

[复制链接]
发表于 2014-11-22 15:27:38 | 显示全部楼层
lrf1980 发表于 2014-11-21 07:44
SOAP 打分开启方法

从下面网站上下载SOAP相关文件放到目录 modeller-9.14/modlib下

我下载的是basic-example,modeller9.14,这两个文件夹均放在了C盘中,目录级别是一样的,并没有把谁放在谁里面,接着将soap_protein_od.hdf5文件下载下来,属性显示是180M大小,然后该文件放在了modeller-9.14/modlib/目录中,结果显示如下:
>> ENERGY; Differences between the model's features and restraints:
Number of all residues in MODEL                   :      335
Number of all, selected real atoms                :     2605    2605
Number of all, selected pseudo atoms              :        0       0
Number of all static, selected restraints         :    28624   28624
COVALENT_CYS                                      :        F
NONBONDED_SEL_ATOMS                               :        1
Number of non-bonded pairs (excluding 1-2,1-3,1-4):   523644
Dynamic pairs routine                             : 1, NATM x NATM double loop
Atomic shift for contacts update (UPDATE_DYNAMIC) :    0.390
LENNARD_JONES_SWITCH                              :    6.500   7.500
COULOMB_JONES_SWITCH                              :    6.500   7.500
RESIDUE_SPAN_RANGE                                :        1    9999
NLOGN_USE                                         :       15
CONTACT_SHELL                                     :   15.000
DYNAMIC_PAIRS,_SPHERE,_COULOMB,_LENNARD,_MODELLER :        T       F       F       F       T
SPHERE_STDV                                       :    0.050
RADII_FACTOR                                      :    0.820
Current energy                                    :      -38043.4922




<< end of ENERGY.
DOPE score               : -38043.492188
>> Model assessment by SOAP-Protein-OD score
hdf5err____E> unable to open file


Traceback (most recent call last):
  File "C:\basic-example\model-single.py", line 13, in <module>
    a.make()
  File "C:\Modeller9.14\modlib\modeller\automodel\automodel.py", line 121, in make
    self.multiple_models(atmsel)
  File "C:\Modeller9.14\modlib\modeller\automodel\automodel.py", line 225, in multiple_models
    self.outputs.append(self.single_model(atmsel, num))
  File "C:\Modeller9.14\modlib\modeller\automodel\automodel.py", line 322, in single_model
    self.model_analysis(atmsel, filename, out, num)
  File "C:\Modeller9.14\modlib\modeller\automodel\automodel.py", line 369, in model_analysis
    assess_keys = self.assess(atmsel, self.assess_methods, out)
  File "C:\Modeller9.14\modlib\modeller\automodel\automodel.py", line 417, in assess
    (key,value) = method(atmsel)
  File "C:\Modeller9.14\modlib\modeller\terms.py", line 60, in __call__
    return (self.name, atmsel.assess(self))
  File "C:\Modeller9.14\modlib\modeller\selection.py", line 655, in assess
    molpdf, terms = assessor._assess(self, output=output, **vars)
  File "C:\Modeller9.14\modlib\modeller\terms.py", line 56, in _assess
    return atmsel.energy(edat=self._get_energy_data_cached(),
  File "C:\Modeller9.14\modlib\modeller\terms.py", line 68, in _get_energy_data_cached
    self._edat = self._get_energy_data_all()
  File "C:\Modeller9.14\modlib\modeller\terms.py", line 73, in _get_energy_data_all
    edat.energy_terms.append(self)
  File "C:\Modeller9.14\modlib\modeller\util\modlist.py", line 155, in append
    self.insert(len(self), obj)
  File "C:\Modeller9.14\modlib\modeller\util\modlist.py", line 167, in insert
    self._insfunc(indx, obj)
  File "C:\Modeller9.14\modlib\modeller\terms.py", line 38, in _insfunc
    obj._add_term(self.__edat(), indx)
  File "C:\Modeller9.14\modlib\modeller\soap_protein_od.py", line 21, in _add_term
    self.__library)
ModellerError: hdf5err____E> unable to open file
显示不能打开文件,跪求照葫芦画瓢为啥还是错??python是2.7版本的。。
>>>
 楼主| 发表于 2014-11-22 16:33:25 | 显示全部楼层
文件你没有下载全,确实是1.6g左右大小,我的就是那么大的。再下载一次吧
发表于 2015-5-19 22:36:06 | 显示全部楼层
我用 多模板 模建。根据 你这个 方法,在其中 一个模板后加.. 再把相应的氨基酸个数 加2,其他几个模板只在*号前加-- 氨基酸 个数,不做修改,目标序列,*前加..   但是,老报错。错误是:_modeller.ModellerError: read_te_290E> Number of residues in the alignment and  pdb files are different:      243      239 For alignment entry:        1  1zoyB  。我认为 不是 我残基 个数 修改有问题,因为 我只用1zoy这一个模板,同源模建 是成功的,加了另外 几个模板 就出现这个错误,请问原因是什么?
 楼主| 发表于 2015-5-20 16:26:13 | 显示全部楼层
zhuimeng0812 发表于 2015-5-19 22:36
我用 多模板 模建。根据 你这个 方法,在其中 一个模板后加.. 再把相应的氨基酸个数 加2,其他几个模板只在 ...

应该就是实际的氨基酸数目不对,你把alignment的文件内容贴出来看看吧,我有的时候也遇到这个问题,没有找到合适的办法。
发表于 2015-5-20 19:26:15 | 显示全部楼层
lrf1980 发表于 2015-5-20 16:26
应该就是实际的氨基酸数目不对,你把alignment的文件内容贴出来看看吧,我有的时候也遇到这个问题,没有 ...

>P1;1zoyB
structureX:1zoy_fit.pdb:9    :B:+243 :B:::-1.00:-1.00
-------------------------------------------PRIKKFAIYRWDPDKTGDKPHMQTYEIDLNNC
GPMVLDALIKIKNEIDSTLTFRRSCREGICGSCAMNINGGNTLACTRRIDTNLDKVSKIYPLPHMYVIKDLVPDL
SNFYAQYKSIEPYLKKKDESQEGKQQYLQSIEEREKLDGLYECILCACCSTSCPSYWWNGDKYLGPAVLMQAYRW
MIDSRDDFTEERLAKLQDPFSLYRCHTIMNCTGTCPKGLNPGKAIAEIKKMMATYKE----------....*
>P1;2h88B
structureX:2h88_fit.pdb:8    :B:+239 :B:MOL_ID
------------------------------------------TSRIKKFSIYRWDPDKPGDKPRMQTYEVDLNKC
GPMVLDALIKIKNELDSTLTFRRSCREGICGSCAMNIAGGNTLACTKKIDPDLSKTTKIYPLPHMYVVKDLVPDL
SNFYAQYKSIEPYLKKKDESKQGKEQYLQSIEDRQKLDGLYECILCACCSTSCPSYWWNGDKYLGPAVLMQAYRW
MIDSRDDYTEERLAQLQDPFSLYRCHTIMNCTRTCPKGLNPGKAIAEIKKMMATYK---------------*

>P1;3vr8B
structureX:3vr8_fit.pdb:33   :B:+249 :B:MOL_ID
-------------------------------------------KRIKTFEIYRFNPEEPGAKPKLQKFDVDLDKC
GTMVLDALIKIKNEVDPTLTFRRSCREGICGSCAMNIAGENTLACICNIDQNTSKTTKIYPLPHMFVIKDLVPDM
NLFYAQYASIQPWLQKKTKINLGEKQQYQSIKEQEKLDGLYECILCACCSASCPSYWWNADKYLGPAVLMQAYRW
IIDSRDDSAAERLARMQDGFSAFKCHTIMNCTKTCPKHLNPARAIGEIKMLLTKMKTKPAPLPTPAN----*

>P1;B
sequence:B:     : :     : ::: 0.00: 0.00
MSLARQIASSSRSFGARRAFASSAIRSQAVPTQEHGQIPTGKKPLNKVFKIYRWNPDEPATKPKLQSYTVDLNSC
GPMILDALIKIKNEMDPTLTFRRSCREGICGSCAMNIDGINTLACLCRISRAESQDAKIYPLPHMYVVKDLVPDL
TQFYKQYKSIEPYLKNDNPPEKG--EFLQSPEDRRKLDGMYECILCACCSTSCPSYWWNQDEYLGPATLMQAYRW
IADSRDSYGAERRERLQNSLSVYRCHTIFNCTRTCPKGLNPAQAIAKIKQELAAE------------....*
发表于 2015-5-20 19:28:16 | 显示全部楼层
本帖最后由 zhuimeng0812 于 2015-5-20 19:35 编辑
zhuimeng0812 发表于 2015-5-20 19:26
>P1;1zoyB
structureX:1zoy_fit.pdb:9    :B:+243 :B:::-1.00:-1.00
---------------------------------- ...


因为,我已经 只用1zoy这个模板做过了,coppy了配体,是没有问题的。我用 多模板 却出现 这个问题,我觉得应该 不是个数不对应的问题。而是其他的问题!
发表于 2015-5-20 19:33:18 | 显示全部楼层
我准备用1zoy这一个模板把整个蛋白 构建下来,构建的蛋白有4条链,也就是4个亚基。
我先尝试了同时 构建2条链,这是 我准备同时建2条链的序列比对结果:
>P1;1zoyC
structureX:1zoy.pdb:   6 :C:+240 :C:::-1.00:-1.00
TTAKEEMERFWNKNLGS------------N-----RPLSPHITIYRWSLPMAMSICHRGTGIALSAGVSLFGLSALLLP--G---NFESHLELVKSLCLGPTLIYTAKFGIVFPLMYHTWNGIRHLIW
DLGKGLTIPQLTQSGVVVLILTVLSSVGLAAM/
SSKAASLHWTGERVVSVLLLGLLPAAYLN-P--CSAMDYSLAAALTLHGHWGIGQVVTDYV--R-GDALQKAAKAGLLALSAFTFAGLCYFNYHDVGICKAVAMLWKL*

>P1;C
sequence:C:     : :     : ::: 0.00: 0.00
QSRATPLARQFVRSIQTESLPPSAATEILNAQRVKRPSSPHFTIYQPQITWIGSIANRITGGVLSGGLYLFALAYLAGPVVGIPVDTAHVVDLVAS--LPDWFKYAVKGALGMSFSFHSWNGIRHLLW
DAGRLMTNTAVMRSGYAVIGLSVATTIGLLTW/
SSKAGSHHWAFERLLSVALVPATVSAFVVSPTAYPVLDGILAVSLVVHSHIGFDSMVVDYLHPRKWPIFGPIIKWTLRLLTTGTLIGVYQFNTEDVGLSELVRRVWNA*


我用的*py脚本。网址:http://www.salilab.org/modeller/manual/node21.html
但是依然报错:报的错误是:modeller.ModellerError: define__595E> Number of selected atoms in sets 2 & 3 is not the same:      158      108
 楼主| 发表于 2015-5-20 21:30:38 | 显示全部楼层
zhuimeng0812 发表于 2015-5-20 19:26
>P1;1zoyB
structureX:1zoy_fit.pdb:9    :B:+243 :B:::-1.00:-1.00
---------------------------------- ...

要包含配体的话,好像不能用*.fit.pdb做模版,你看看*_fit.pdb,这里面是没有配体信息的,你还需要改成*.pdb。如果我没有记错的话。
发表于 2015-5-21 17:03:33 | 显示全部楼层
lrf1980 发表于 2015-5-20 21:30
要包含配体的话,好像不能用*.fit.pdb做模版,你看看*_fit.pdb,这里面是没有配体信息的,你还需要改成 ...

你的意思是 只保留一个蛋白中有配体信息,其他的模板 把配体去掉!
我再向你请教一个问题,modeller 同源模建的时候,提供的模板是不是必须要有链的信息。比如:A、B、C......链等,而把这些表示链的信息A、B、C...... 去掉,modeller 就不识别了?对吗? 如下面的B 去掉:

ATOM   4731  N   PRO B   9     111.971  33.330  97.856  1.00 92.26           N
ATOM   4732  CA  PRO B   9     112.160  34.798  97.760  1.00 92.31           C
ATOM   4733  C   PRO B   9     111.127  35.407  96.816  1.00 93.29           C
ATOM   4734  O   PRO B   9     110.966  34.956  95.677  1.00 92.89           O
ATOM   4735  CB  PRO B   9     113.573  35.036  97.237  1.00 91.79           C
ATOM   4736  CG  PRO B   9     114.270  33.722  97.624  1.00 93.83           C
ATOM   4737  CD  PRO B   9     113.196  32.635  97.440  1.00 91.53           C


报的错误是:
modeller.ModellerError: rdpdb___303E> No atoms were read from the specified input PDB file, since the starting residue number and/or chain id in MODEL_SEGMENT (or the alignment file header) was not found; requested starting position: residue number " 6", chain " C"; atom file name:  1zoy.pdb


让我奇怪的是:swiss-model 却是可以构建的,swiss-model 也是用的modeller 的模块,只是更便于操作而已,为什么 swiss-model可以,而modeller却不识别呢?

请你指导一下!谢谢!
 楼主| 发表于 2015-5-23 07:24:15 | 显示全部楼层
zhuimeng0812 发表于 2015-5-21 17:03
你的意思是 只保留一个蛋白中有配体信息,其他的模板 把配体去掉!
我再向你请教一个问题,modeller 同源 ...

抱歉,我没有说清楚,我的意思是,对于单模版建模的时候,我们给了模版的pdb code,align后在align 的ali文件中,structureX file 的名字应该就是pdb code.pdb,如果你的模版是1zoy,那么名字就是1zoy.pdb。 但是在多模版建模的时候,程序会处理成pdb code-fit.pdb格式,像你的就是1zoy-fit.pdb,而且这个fit后的pdb里面是没有配体的,所以,如果你想用这个蛋白的配体,你需要在ali文件里把1zoy-fit.pdb改成1zoy.pdb。  
您需要登录后才可以回帖 登录 | 我想注册

本版积分规则

QQ|分迪科技|小黑屋|手机版|Archiver|生物分子模拟论坛 ( 蜀ICP备14009200号-3 )

GMT+8, 2025-8-3 06:09 , Processed in 0.067767 second(s), 15 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表