一、引子
??2005年,Wigge等【1】在《Science》上報道了擬南芥“誘導(dǎo)開花”的信號調(diào)控通路,簡言之:在擬南芥體內(nèi),一個叫做FLOWERING LOCUS T (FT)的基因,其編碼蛋白與一個bZIP 族的轉(zhuǎn)錄因子FD,形成復(fù)合體,從而激活A(yù)PETALA1 (AP1)的表達(dá),AP1是誘導(dǎo)開花的關(guān)鍵蛋白。并且,他們推測該通路在高等植物種可能是保守的。水稻中有一個叫Hd3a的蛋白,與擬南芥FT有很高的同源性。Taoka等【2】發(fā)現(xiàn)其調(diào)控機制可能與擬南芥FT-FD-AP1通路類似,因此展開了一系列研究。研究的結(jié)果,可以通過下面的三個實驗來推斷。
-
Hd3a和OsFD1協(xié)作激活水稻開花的關(guān)鍵蛋白表達(dá)
Hd3a和OsFD1對OsMADS15的轉(zhuǎn)錄激活分析
?OsMADS15與擬南芥AP1是高度同源蛋白,是水稻誘導(dǎo)開花的關(guān)鍵蛋白。OsFD1與擬南芥FD是功能類似的蛋白,可能是OsMADS15的轉(zhuǎn)錄因子。在進(jìn)行RT-qPCR分析OsMADS15的轉(zhuǎn)錄水平時,發(fā)現(xiàn)單獨存在Hd3a和OsFD1都無法激活OsMADS15的表達(dá),只有兩者共存時才可以。
- Hd3a與OsFD1的協(xié)作需要14-3-3c蛋白的參與
?GST-Pull Down的結(jié)果表明, Hd3a與14-3-3c互作,14-3-3c與OsFD1互作,Hd3a與OsFD1不互作,但三者共同存在時互作。
- Hd3a/14-3-3c/OsFD1復(fù)合物是OsMADS15的激活轉(zhuǎn)錄因子
?OsFD1可以與OsMADS15的啟動子結(jié)合,但只有與Hd3a、14-3-3形成復(fù)合結(jié)構(gòu),才能實現(xiàn)對OsMADS15的轉(zhuǎn)錄激活。
- 結(jié)論
??Hd3a在葉片細(xì)胞表達(dá),經(jīng)運輸?shù)竭_(dá)莖尖細(xì)胞,14-3-3家族蛋白作為胞內(nèi)受體,與Hd3a結(jié)合形成復(fù)合體,并在OsFD1的作用下進(jìn)入細(xì)胞核,與OsFD1形成三元復(fù)合體,三元復(fù)合體可以激活OsMADS15的表達(dá),從而完成對開花的誘導(dǎo)。
二、蛋白質(zhì)-蛋白質(zhì)對接
??通過上面的文獻(xiàn)解析,發(fā)現(xiàn)論文的重點就是研究Hd3a、14-3-3、OsFD1三類蛋白間的相互作用。如果把互作的蛋白對比作“情侶”,那么故事就是:Hd3a、14-3-3c、OsFD1間的一場“三角戀”,最終“三人”因為“愛”(互作),共同協(xié)作完成了促進(jìn)水稻開花這一結(jié)果。而我們的任務(wù)就是,利用蛋白質(zhì)-蛋白質(zhì)對接軟件,從理論模擬上重現(xiàn)這場“愛情故事”。先說明一下,Hd3a/14-3-3c的復(fù)合結(jié)構(gòu),已經(jīng)被Taoka等解析了,但我們要假裝他們的結(jié)構(gòu)還未解析,然后以擬南芥(或煙草)的同源蛋白為模板,預(yù)測三維結(jié)構(gòu),再通過對接軟件模擬互作過程。
??在對接之前,首先要分析下任務(wù)。從論文報道的復(fù)合結(jié)構(gòu)的剖視圖來看,可能發(fā)生互作的有Hd3a與 14-3-3c、14-3-3c與14-3-3c、14-3-3c與OsFD1、OsFD1與OsFD1,但是OsFD1的結(jié)構(gòu)實在難以獲得,因此對于它的互作不做分析。
- 準(zhǔn)備好兩個蛋白的PDB文件。
??對于如何獲得目標(biāo)蛋白的三維結(jié)構(gòu)文件,在這里先給大家介紹三個常用的方法:
① 如果目標(biāo)蛋白的結(jié)構(gòu)在RSCP PDB數(shù)據(jù)庫中已經(jīng)存在,則可以直接下載。如果不存在,則可以通過同源建模和從頭預(yù)測軟件構(gòu)建目標(biāo)蛋白的三維結(jié)構(gòu)。
② 今年7月份報道的AlphaFold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面表現(xiàn)卓越,已獲得人、水稻、擬南芥、玉米等二十多個物種的全部預(yù)測蛋白,可以在UniPort等數(shù)據(jù)庫上直接下載。
③ 如果RSCP PDB數(shù)據(jù)庫和AlphaFold2數(shù)據(jù)庫中都沒有,那么就使用在線同源建模的方法——SWISS-MODEL(網(wǎng)址https://swissmodel.expasy.org/),該方法不需要安裝任何軟件,并且,如果同源建模的模板與目標(biāo)蛋白的序列一致性較高(具體多高算高,其實沒有一個統(tǒng)一的定論,一般大于60%已經(jīng)可以得到高質(zhì)量的三維模型),那么同源建模的準(zhǔn)確性就會極高,甚至優(yōu)于AlphaFold2預(yù)測。
??SWISS-MODEL是使用最為廣泛的同源建模在線軟件,沒有之一,而且免費!其操作簡單。進(jìn)入首頁后,只需填入序列、項目名稱等信息,點擊“Build Model”按鈕即可開始同源建模。
??程序運行結(jié)束,可以在“Model Results”界面查看建模結(jié)果(上圖)。其中三個關(guān)鍵參數(shù)分別為:(1)六邊形里的代表模型的質(zhì)量,數(shù)值越接近1越好;(2)橢圓形里的代表與模板序列的一致性,數(shù)值越接近100%越好,特別注意的是,要看一下“Coverage”,它代表模板對目標(biāo)蛋白的覆蓋度,程序只用已有結(jié)構(gòu)的部分建模;(3)長方形里的代表建模結(jié)果,一般選擇PDB格式。
(注:有時從RSCP PDB數(shù)據(jù)庫中下載的文件會存在氨基酸信息缺失現(xiàn)象,從而導(dǎo)致后續(xù)的分析程序報錯,需要先用SPDBV軟件打開重新保存,如果含有缺失序列,軟件會自動補全;同源結(jié)構(gòu)建模或者AlphaFold2、RoseTTAFold等軟件構(gòu)建的三維結(jié)構(gòu)模型不存在這個問題。)
a:雖然AlphaFold2已把水稻和擬南芥所有的蛋白結(jié)構(gòu)已經(jīng)預(yù)測出來了,但OsFD1/AtFD比較特殊,它們含有大量不規(guī)則卷曲片段(Loop區(qū)),一般在Loop長度超過12個氨基酸的情況下,如果沒有可靠的模板或限制信息,幾乎無法通過預(yù)測構(gòu)建結(jié)構(gòu)。而OsFD1/AtFD的不規(guī)則區(qū)有100多個氨基酸,AlphaFold2也沒有辦法。好在OsFD1的A123-V177區(qū)域是一段保守的α螺旋,也是bZIP類蛋白的共有結(jié)構(gòu)域,因此可截取123-195區(qū)間的肽段來進(jìn)行預(yù)測結(jié)果。
??根據(jù)上表的參考信息,我們通過同源建模和從頭預(yù)測,逐一建立Hd3a、14-3-3c、OsFD1的三維結(jié)構(gòu)。完成建模后,可以通過在線工具SuperPose(網(wǎng)址:http://superpose.wishartlab.com/)對比模型(以Hd3a為例)的準(zhǔn)確性,從下圖可以看出,相較于Hd3a的晶體結(jié)構(gòu),同源建模與AlphaFold2的準(zhǔn)確性相當(dāng),在全原子層面,同源建模甚至更勝一籌(RMSD越小,兩個三維結(jié)構(gòu)越接近,一般全部原子的RMSD小于2,認(rèn)為兩個結(jié)構(gòu)已經(jīng)十分接近了)。
- 分子對接
??蛋白結(jié)構(gòu)準(zhǔn)備完成后,就可以進(jìn)入對接步驟啦!由于蛋白-蛋白對接是一個十分復(fù)雜的事情,影響因素有很多,預(yù)測算法也從一開始的基于FFTs算法的剛性對接(ZDOCK),發(fā)展到現(xiàn)在整合多步驟的HADDOCK、ClusPro、SwamDock等。尤其是近年來,隨著機器學(xué)習(xí)算法的發(fā)展以及實驗數(shù)據(jù)的積累,一些基于共進(jìn)化、同源蛋白的互作預(yù)測算法,顯著提高了蛋白質(zhì)-蛋白質(zhì)預(yù)測的準(zhǔn)確性。下面,為大家介紹兩條技術(shù)路線:
(1)基于ZDOCK-RosettaDock的方法
??ZDOCK-RosettaDock方法是先將兩個大分子進(jìn)行基于全局算法的剛性對接,就好比將一對“情侶”拉到“當(dāng)面”聊一聊。其過程是一個分子不動,另一個分子從各種位置靠近它,最終選出得分最高的結(jié)構(gòu)。不過“百煉鋼終敵不過繞指柔”,對接模式就好比“擇偶標(biāo)準(zhǔn)”,也是因人而異的,當(dāng)一個分子接近另一個分子時,其表面構(gòu)象是會發(fā)生變化的,因此,就有了RosettaDock局部精細(xì)對接,它允許對接分子進(jìn)行構(gòu)象選擇和調(diào)整。
??ZDOCK-RosettaDock方法既有本地版也有在線版,本地版需要安裝對應(yīng)的軟件,并具有l(wèi)inux腳本編程能力,本文僅介紹下在線版的使用方法:
1)ZDOCK(https://zdock.umassmed.edu/)
ZDOCK需要提供學(xué)校郵箱才能使用,具體參數(shù)設(shè)置可參考http://www.lxweimin.com/p/8e446461e89f。下載好結(jié)果后,需檢查PDB文件,確保每個結(jié)構(gòu)末尾均添加了“TER”字符,否則RosettaDock步驟可能會出錯。
2)RosettaDock(https://rosie.graylab.jhu.edu/)
RosettaDock在線服務(wù)器【3】提供了Rosetta程序集的主要功能,其中“[Docking2]”代表RosettaDock模塊。網(wǎng)站自帶使用說明,只需提供單體結(jié)構(gòu),填寫肽鏈信息等,使用十分簡便!
??上面的方法對接效果如何呢?小編從已報道的Hd3a/14-3-3c復(fù)合結(jié)構(gòu)中,利用SPDBV軟件把Hd3a/14-3-3c的異二聚體結(jié)構(gòu)提取出來,然后把通過ZDOCK-RosettaDock對接得到的復(fù)合結(jié)構(gòu)與實驗數(shù)據(jù)進(jìn)行擬合比對,結(jié)果如下圖所示。
??臉打的啪啪響啊,預(yù)測與事實根本不一致(上圖中14-3-3c是重疊的,但真實的Hd3a與預(yù)測的Hd3a一左一右,方位完全不同)。怎么辦呢?別怕,咱們還有套路。
(2)基于限制殘基信息的HADDOCK方法
??上面的對接結(jié)果之所以不準(zhǔn)確,是因為對接分子是從完全隨機的位置開始的,而且,因為ZDOCK是剛性對接軟件,評分時偏重于互作界面面積較大的方位,這與事實可能是不符的。如果能夠獲得兩個對接分子的初始位置,或者位于互作界面的氨基酸信息,那么對結(jié)結(jié)果的準(zhǔn)確性會顯著提高。小編分別介紹下這兩種情況:
(1)有限制性殘基的實驗數(shù)據(jù)
??文章中的酵母雙雜結(jié)果表明,Hd3a的R64、P96、F103、R132以及14-3-3c的F200、I204、Y215都可能是互作界面的關(guān)鍵殘基,因為它們突變后,雙雜結(jié)果由陽性變?yōu)殛幮浴H绻阉鼈冊诰w結(jié)構(gòu)上標(biāo)出來,就可以很直觀的看到了(上圖)。這些界面上的關(guān)鍵氨基酸,在蛋白質(zhì)對接中叫做限制性殘基,若能夠通過實驗獲取它們的信息,那么利用HADDOCK進(jìn)行對接,準(zhǔn)確性極高。
(2)有同源復(fù)合結(jié)構(gòu)做參考
??如果已經(jīng)報道了同源蛋白的結(jié)構(gòu),或者結(jié)構(gòu)功能相似的同類復(fù)合結(jié)構(gòu),則可以通過結(jié)構(gòu)擬合先把兩個待對接的單體分子與參考復(fù)合結(jié)構(gòu)疊加,然后撤掉參考結(jié)構(gòu)。這時兩個對接分子的空間位置,就是一個很好的起始位置,以此進(jìn)行ZDOCK-RosettaDock對接,或者推測出限制性殘基信息進(jìn)行HADDOCK對接,都能夠得到比較精確的預(yù)測結(jié)果。
??HADDOCK(https://wenmr.science.uu.nl/haddock2.4/)是一款非常優(yōu)秀的軟件,使用前需注冊。該軟件需提供兩個待對接分子以及限制性殘基的相關(guān)信息,小編在加入Hd3a和14-3-3c的限制殘基信息后,獲得的模擬二聚體與真實的晶體結(jié)構(gòu)重疊性極好(這里圖片不再展示)。另外,該軟件允許修改大量的參數(shù),靈活性極高,輸出內(nèi)容豐富而精美,數(shù)據(jù)可用于實際研究。(HADDOCK網(wǎng)站上提供了使用說明,對蛋白質(zhì)-蛋白質(zhì)對接有興趣或者有需求的同學(xué),值得好好研究一番)。
3 對接結(jié)果的分析
??兩個蛋白質(zhì)能夠相互結(jié)合,主要取決于它們之間的靜電引力和范德華力,具體包括:互作界面的電荷分布、幾何形狀互補面積、氫鍵、鹽橋、疏水相互作用、芳環(huán)堆積作用等。在軟件中,這些因素集中體現(xiàn)在自由結(jié)合能上。蛋白質(zhì)對接的物理、化學(xué)原理,模型評價方法是十分復(fù)雜的,本文先不討論。
??分析互作蛋白的界面,可以使用Rosetta軟件的InterfaceAnalyzer應(yīng)用,但需要本地運行。本文重點推薦下PDBePISA(https://www.ebi.ac.uk/msd-srv/prot_int/pistart.html),該軟件在分析大分子溶劑可及性和相互作用界面方面非常優(yōu)秀,其可通過輸入復(fù)合結(jié)構(gòu)的RSCP PDB編號或上傳對接的復(fù)合結(jié)構(gòu)文件來進(jìn)行分析,使用方法十分簡單。重點是面對分析結(jié)果,又該如何理解呢?
??首先,信息匯總欄的各項重點指標(biāo)已在下圖標(biāo)出,有些參數(shù)越大越好,有些越小越好。但沒有明確的能判斷是否互作的標(biāo)準(zhǔn),因此,最好采用同源蛋白或同類蛋白復(fù)合物的結(jié)構(gòu)做為參考;其次,氫鍵、鹽橋的數(shù)目越多越好,距離越短越好,也沒有參考閾值;最后,PDBePISA有一個參數(shù)叫復(fù)合結(jié)構(gòu)顯著性分?jǐn)?shù)(CSS),它并不是指示互作可信度的,而是指該界面在復(fù)合體形成中的重要程度,即使CSS=0,也不能代表兩分子間沒有互作,但若CSS>0,則兩分子間極可能存在互作。
三、三元復(fù)合體的組裝
??上面一系列的操作獲得了Hd3a/14-3-3c的二元結(jié)構(gòu)(圖片未展示),而三元結(jié)構(gòu)是兩個Hd3a/14-3-3c二元結(jié)構(gòu)依靠14-3-3c和14-3-3c互作聯(lián)系起來的,因此還需要構(gòu)建14-3-3c的同二聚體結(jié)構(gòu)。14-3-3c同二聚體沒有限制性殘基信息,但其建模用的高同源模板(煙草14-3-3c),有同二聚體晶體結(jié)構(gòu),因此可利用該同源復(fù)合結(jié)構(gòu)進(jìn)行起始位置的初猜,經(jīng)過ZDOCK對接,模擬的14-3-3c同二聚體復(fù)合結(jié)構(gòu)與報道也基本一致(圖片也不再展示)。
??然后,就是Hd3a/14-3-3c、14-3-3c/14-3-3c兩個二元結(jié)構(gòu)的疊加,用SPDBV載入兩個結(jié)構(gòu),選中全部原子,執(zhí)行“Fit”菜單的“Magic Fit”,可以快速進(jìn)行結(jié)構(gòu)疊加(或者叫擬合),經(jīng)過反復(fù)擬合結(jié)果展示如下圖,與文章報道幾乎一模一樣。
??接下來,到了最關(guān)鍵的OsFD1的疊加。這一步非常困難,由于OsFD1的結(jié)構(gòu)是不準(zhǔn)的,報道中的晶體僅包含了OsFD1 189-195的7個殘基,也無法與AlphaFold2的預(yù)測結(jié)果擬合,疊加的方法完全行不通。因此,只能依靠酵母雙雜的限制性信息,使用HADDOCK強行對接。最終全部疊加的結(jié)果如下圖,Hd3a/14-3-3c部分與真實結(jié)構(gòu)基本一致,OsFD1部分與文中的推測有較大差異。(注:Taoka等也是靠推測得到的結(jié)果,他們的OsFD1是用小鼠的同類蛋白疊加的,可能也不是真實結(jié)構(gòu))
??至此,“劇情”已經(jīng)不能完全按“編劇”的設(shè)想發(fā)展了,這場“愛情故事”到此結(jié)束!
??僅僅依靠模擬,就走到這種程度已經(jīng)非常不容易了。當(dāng)然要承認(rèn)的是,小編所選的目標(biāo)蛋白都有高同源模板,并且有相關(guān)的實驗結(jié)果做指導(dǎo)。如果沒有這些,預(yù)測的方法是有很大局限性的。本文提供的方法大多是在線版本的,復(fù)現(xiàn)很容易,若需用于研究,建議采用本地版,靈活調(diào)整參數(shù),不斷篩選、重復(fù),并配合一定實驗驗證,才能取得更為可靠的結(jié)果。
四、小結(jié)
??其實從Taoka等的文章中可以看出,發(fā)Nature也并不是多么神秘或困難的事情,研究的內(nèi)容并不是說非得多么具有開創(chuàng)性或者走在技術(shù)的前沿。文章一開始介紹的水稻開花調(diào)控通路,其實就是參考擬南芥的成花素表達(dá)調(diào)控通路進(jìn)行的,實驗所涉及的技術(shù)手段也都是常用的,并且也都很成熟。但文章結(jié)構(gòu)十分清晰,實驗設(shè)計的科學(xué)性、嚴(yán)謹(jǐn)性極高,對照充分,多種技術(shù)手段相互驗證,讓人信服且放心。可貴的是,文章對復(fù)合體三維結(jié)構(gòu)及其機理的分析,使其又提升了一個檔次。
??只通過同源蛋白分析,找到與已知物種可能類似的信號通路,然后利用各類蛋白互作驗證和亞細(xì)胞定位技術(shù),研究他們之間的相互作用關(guān)系,并由此推測兩個物種的調(diào)控通路可能一致,估計只能發(fā)一篇3分以內(nèi)的SCI;再加上通過基因敲除或干擾,論證通路與表達(dá)性狀間的關(guān)聯(lián),發(fā)表一篇5分以內(nèi)的文章沒太大問題。如果能夠加上本文介紹的三維結(jié)構(gòu)模擬,從結(jié)構(gòu)機理上進(jìn)行一翻推測、分析及驗證,再在行文結(jié)構(gòu)、圖文潤色上下足功夫,那么一篇10分的文章就指日可待了。其中,蛋白質(zhì)結(jié)構(gòu)與功能的機理分析,可以通過突變、示差掃描量熱、光譜學(xué)等手段分析佐證,不是都要求晶體解析的喲,如果能夠在這方面做些工作,那么“CNS”級的不好說,領(lǐng)域內(nèi)頂刊級別不是不可能。
五、討論
??最后,請大家思考一個問題,為什么要做那么多不同的實驗來驗證蛋白間的互作呢?估計有的同學(xué)會回答,可以讓論文內(nèi)容看起來更豐富,容易發(fā)表。我只能說,你真是個小機靈鬼!
??實際上每種技術(shù)都存在自己的局限性,如果只通過一、兩種驗證方式,可能無法了解事實的真相,也可能得到相悖的結(jié)果,這是完全正常的。在Taoka等的研究中,也出現(xiàn)了酵母雙雜的結(jié)果與GST pull-down及核磁共振化學(xué)位移結(jié)果不一致的情況,這主要是由于OsFD1的192號氨基酸磷酸化導(dǎo)致的,GST pull-down及核磁共振是使用原核表達(dá)的高純蛋白,沒有磷酸化修飾,而酵母內(nèi)是有磷酸化修飾的。但作者同時采用BiFC對其結(jié)果進(jìn)行驗證,表明OsFD1與Hd3a可能存在互作關(guān)系。
??酵母雙雜、BiFC、FERT 、CoIP、GST pull-down、核磁共振,包括本文未涉及的其他技術(shù),如蛋白-蛋白相互作用陷阱、生物膜干涉等技術(shù),都會因胞內(nèi)、胞外,有無蛋白質(zhì)修飾,亞細(xì)胞定位是否相同,是否有第三方參與,互作強弱等問題產(chǎn)生差異,解決的辦法就是設(shè)置嚴(yán)謹(jǐn)?shù)膶φ铡⒉捎帽M可能多的方法進(jìn)行驗證。
參考文獻(xiàn)
【1】Wigge PA, Kim MC, Jaeger KE, et al. Integration of spatial and temporal information during floral induction in Arabidopsis. Science. 2005, 309(5737): 1056-9.
【2】Taoka K, Ohki I, Tsuji H, et al. 14-3-3 proteins act as intracellular receptors for rice Hd3a florigen. Nature. 2011, 476(7360): 332-5.
【3】Lyskov S, Gray JJ. The RosettaDock server for local protein-protein docking. Nucleic Acids Res. 2008, 36(Web Server issue):W233-8.