LigParGen是一個(gè)提供有機(jī)分子或者配體力場(chǎng)的在線服務(wù)網(wǎng)站,其能夠提供鍵長(zhǎng),二面角以及Lennard-Jones OPLS-AA參數(shù),電荷算法為1.14*CM1A或1.14*CM1A-LBCC。生成的配體力場(chǎng)可以非常容易的在Gromacs,NAMD以及OpenMM中使用,文章中說(shuō)明將在不久提供Amber軟件的支持。最大配體原子大小不超過(guò)200個(gè)原子,計(jì)算模型的電荷最大為正負(fù)2。
該在線服務(wù)器的使用方法非常的簡(jiǎn)單,并且使用的電荷計(jì)算模型1.14*CM1A在OPLS-AA力場(chǎng)中水化自由能計(jì)算(hydration free energies ,HFE)與實(shí)驗(yàn)具有良好的擬合效果,而改進(jìn)的局部電荷校正(LBCC)方法更加提供了電荷的精確度,稱(chēng)之為1.14*CM1A-LBCC模型。在在線服務(wù)中,對(duì)于不帶電的小分子提供1.14*CM1A和1.14*CM1A-LBCC模型,而帶電荷的分子僅提供不放大1.14倍的CM1A模型。故帶電荷的小分子還是最好使用GAFF力場(chǎng)制作方法。
LigParGen服務(wù)網(wǎng)址為:http://zarbi.chem.yale.edu/ligpargen/index.html
理論基礎(chǔ)
CM1A方法使用來(lái)自于電荷密度的Mulliken分布分析,而電荷密度獲得的方式為AM1方法基于配體幾何計(jì)算,*故配體幾何的差別會(huì)導(dǎo)致電荷計(jì)算輕微差別,但影響不大。
Mulliken電荷對(duì)原子A的計(jì)算方法大致如下(具體可以查看參考文獻(xiàn)4):
qA是部分Mulliken 電荷,ZA是原子A的中性電荷,NA是原子A的電荷密度分布,計(jì)算方法如下:
N是分子的總電荷數(shù),Cn,i 為分子軌道系數(shù),χn 和SnkQM多重積分,但1.14*CM1A電荷模型在苯環(huán),醚類(lèi)和酮類(lèi)中參數(shù)不理想, 在426個(gè)有機(jī)分子的測(cè)試集中和實(shí)驗(yàn)數(shù)據(jù)相比mean unsigned error (MUE)達(dá)到1.5kcal/mol,而改進(jìn)的局部電荷校正(LBCC)方法具有更好的效果。
作者進(jìn)行了水化自由能(HFE)的評(píng)價(jià),模擬的計(jì)算方法軟件采用的NAMD,一共計(jì)算了10個(gè)分子,每個(gè)分子進(jìn)行了36個(gè)窗口計(jì)算,每個(gè)窗口模擬1ns,力場(chǎng)采用OPLS-AA/1.14*CM1A-LBCC,水采用的TIP3P,完成參數(shù)請(qǐng)看底部的參考文獻(xiàn)3。實(shí)驗(yàn)結(jié)果與模擬的結(jié)果擬合的較好,結(jié)果如下:
說(shuō)明模擬結(jié)果和實(shí)驗(yàn)結(jié)果擬合的非常棒!
LigParGen使用方法
LigParGen的使用方法非常的簡(jiǎn)單:
首先上傳MOL或者PDB文件或者SMILES Code:
當(dāng)然也可以通過(guò)JSME自己畫(huà),如下圖:
首先點(diǎn)一下Make SMILES,畫(huà)完以后再點(diǎn)擊一下Make SMILES即可。
然后選擇電荷模型,是否優(yōu)化分子,分子電荷等選項(xiàng)。
之后便可以下載不同軟件需要用到的文件。軟件的工作流程如下:
蛋白配體復(fù)合物模擬
LigParGen提供了3種模擬軟件的蛋白配體復(fù)合物模擬的方法,可以在官網(wǎng)上查看,我們這里翻譯GROMACS的蛋白配體復(fù)合物模擬。
1.準(zhǔn)備蛋白配體系統(tǒng)
Gromacs,Chimera和python被要求安裝。
1.1 獲得復(fù)合物
使用T4溶菌酶L99A與苯環(huán)分子復(fù)合物(PDB ID:4W52)作為教程,結(jié)構(gòu)如下圖,僅包含一條鏈
1.2 模擬前的蛋白準(zhǔn)備工作
清理蛋白使用Chimera的對(duì)接準(zhǔn)備功能(dockprep ),增加缺失殘基使用Dunbrack rotamer庫(kù),這一部并不會(huì)進(jìn)行蛋白加氫,因?yàn)樵诤竺鎝db2gmx會(huì)對(duì)蛋白進(jìn)行加氫。Chimera腳本如下:
## PDB_FILE SHOULD THE COMPLETE PATH OF THE FILE
## REPLACE BNZ with LIGAND resname
## USAGE: Chimera --nogui --script "prep_prot_lig.py 4w52.pdb BNZ"
import chimera
from DockPrep import prep
import Midas
import sys
import os
PDB_file = sys.argv[1]
lig_name = sys.argv[2]
os.system('grep ATOM %s > %s_clean.pdb'%(PDB_file,PDB_file[:-4]))
os.system('grep %s %s > %s.pdb'%(lig_name,PDB_file,lig_name))
protein=chimera.openModels.open('%s_clean.pdb'%PDB_file[:-4])
ligand=chimera.openModels.open('%s.pdb'%lig_name)
prep(protein,addHFunc=None,addCharges=False)
prep(ligand)
Midas.write(protein,None,"protein_clean.pdb")
Midas.write(ligand,None,"ligand_wH.pdb")
使用腳本:
Chimera --nogui --script "prep_prot_lig.py 4w52.pdb BNZ"
生成的 protein_clean.pdb和ligand_wH.pdb將會(huì)在隨后使用。
1.3 準(zhǔn)備配體
使用的方法如第2部分,后下載BNZ.gro(坐標(biāo)文件)與BNZ.itp(拓?fù)湮募?/p>
2 設(shè)置Gromacs模擬
2.1 結(jié)合蛋白配體坐標(biāo)
其Gromacs版本使用的為4.6.5,若使用的為5.x或者2016版本可以具體查看李繼存老師翻譯的配體蛋白教程的后續(xù)命令。差別不大。
pdb2gmx -f protein_clean.pdb -o protein_processed.gro -water spce
兩個(gè)蛋白的結(jié)合可以手動(dòng)或者使用如下腳本完成:
import sys
pro_gro = sys.argv[1]
lig_gro = sys.argv[2]
pro = open(pro_gro,'r').readlines()
lig = open(lig_gro,'r').readlines()
pro_dat = [line.rstrip() for line in pro]
lig_dat = [line.rstrip() for line in lig]
tot_num = int(pro_dat[1])+int(lig_dat[1])
com_dat = [pro_dat[0],'%5d'%tot_num]+pro_dat[2:-1] + lig_dat[2:-1] + [pro_dat[-1]]
for line in com_dat: print line
運(yùn)行腳本
python combineGro_prot_lig.py protein_processed.gro BNZ.gro > complex.gro
2.2 蛋白配體拓?fù)浣Y(jié)合
我們對(duì)拓?fù)湮募?topol.top)進(jìn)行修改。
在#include "oplsaa.ff/forcefield.itp"
后加上#include "BNZ.itp"
行來(lái)merge蛋白和配體。在Protein_chain_A 1
后加上BNZ 1
2.3 設(shè)置MD模擬
后面的部分與載脂蛋白模擬部分類(lèi)似:
首先增加水盒子
editconf -f complex.gro -o complex_box.gro -c -d 1.0 -bt cubic
填充水:
genbox -cp complex_box.gro -cs spc216.gro -o complex_box_wSPCE.gro -p topol.top
增加原子:
grompp -f MDP/ions.mdp -c complex_box_wSPCE.gro -p topol.top -o ions.tpr
genion -s ions.tpr -o complex_box_wSPCE_ions.gro -p topol.top -pname NA -nname CL -nn 8
能量最小化:
grompp -f MDP/em_real.mdp -c complex_box_wSPCE_ions.gro -p topol.top -o em.tpr
mdrun -v -deffnm em
一般說(shuō)來(lái),在進(jìn)行NVT模擬之前,用戶(hù)需要增加配體的位置限制從而不會(huì)在加熱過(guò)程中使得配體從蛋白中逃逸
位置限制
genrestr -f BNZ.gro -o posre_BNZ.itp -fc 1000 1000 1000
上面命令會(huì)使得posre_BNZ.itp生成,需要在#include "oplsaa.ff/ions.itp"
上增加#include "posre_BNZ.itp"
的內(nèi)容
為了讓蛋白配體系統(tǒng)一起進(jìn)行溫度計(jì)算,需要通過(guò)如下命令使得兩者成為一個(gè)體系
make_ndx -f em.gro -o index.ndx
#選擇蛋白和配體選項(xiàng)
1|13
q
平衡與正式模擬:
grompp -f nvt.mdp -c em.gro -p topol.top -n index.ndx -o nvt.tpr
mpirun.lsf mdrun -deffnm nvt
grompp -f npt.mdp -c nvt.gro -p topol.top -n index.ndx -o npt.tpr
mpirun.lsf mdrun -deffnm npt
grompp -f md.mdp -c npt.gro -p topol.top -n index.ndx -o md.tpr
mpirun.lsf mdrun -deffnm md
如果對(duì)配體為進(jìn)行限制,那么NVT和NPT平衡設(shè)置文件中define = -DPOSRES ; position restrain the protein and ligand
需要被移去
模擬中用到的mdp文件可以在github上下載:https://github.com/leelasd/ligpargen/tree/master/GMX_LP_MDPS
參考文獻(xiàn):
Potential energy functions for atomic-level simulations of water and organic and biomolecular systems. Jorgensen, W. L.; Tirado-Rives, J. Proc. Nat. Acad. Sci. USA 2005, 102, 6665-6670
1.14*CM1A-LBCC: Localized Bond-Charge Corrected CM1A Charges for Condensed-Phase Simulations. Dodda, L. S.; Vilseck, J. Z.; Tirado-Rives, J.; Jorgensen, W. L. J. Phys. Chem. B. DOI:10.1021/acs.jpcb.7b00272
LigParGen web server: An automatic OPLS-AA parameter generator for organic ligands. Nuc. Acids. Res., DOI: 10.1093/nar/gkx312
Storer J W, Giesen D J, Cramer C J, et al. Class IV charge models: a new semiempirical approach in quantum chemistry.[J]. Journal of computer-aided molecular design, 1995, 9(1):87-110.
更多原創(chuàng)精彩視頻敬請(qǐng)關(guān)注生信雜談: