https://onlinelibrary.wiley.com/doi/full/10.1111/tpj.13073
總結:
- 植物可以通過各種機制在轉錄和翻譯水平上對環境變化做出反應。到目前為止,人們對植物在轉錄水平上的脅迫反應已有了較為廣泛的認識,而在翻譯水平上對植物的脅迫反應知之甚少。為了揭示植物在干旱脅迫下的翻譯情況,我們對
正常
和干旱
條件下生長的玉米幼苗
進行了Ribo-seq
測序。對Ribo-seq
數據和RNA-seq
數據的比較分析表明,在轉錄水平上,基因表達的倍性變化
與翻譯水平的變化
呈中度相關(R2=0.69)。然而,在干旱條件下,只有不到一半的響應基因被轉錄和翻譯所共享,這表明干旱脅迫可以獨立地引起轉錄和翻譯反應
。我們發現在干旱脅迫下,931個基因的翻譯效率發生了明顯的變化。進一步分析表明,基因的翻譯效率受其序列特征(GC含量、編碼序列長度和歸一化最小自由能)
的影響較大。此外,我們在2558個基因上檢測到3063個上游開放閱讀框架(uORFs)
的潛在翻譯,這些uORFs
可能影響下游主要開放閱讀框架(mORFs)
的翻譯效率
。我們的研究表明,植物對干旱脅迫的反應具有高度動態的翻譯機制,并與轉錄反應具有協同作用。
關鍵詞:maize
, ribosome profiling
, RNA-seq
, drought stress
, translational efficiency
, uORF
簡介
Ribosome profiling
該方法可通過對核糖體結合的mRNA片段(RPF)的深度測序提供蛋白質合成的單核苷酸分辨率測量
-
技術來源于2009的一篇sicence
Genome-Wide Analysis in Vivo of Translation with Nucleotide Resolution Using Ribosome Profiling
image.png -
建庫流程,簡單的來說就是只將核糖體結合的RNA(即正在翻譯的RNA)拉下來進行建庫,而不同于RNA-seq建庫(將所有的RNA進行建庫)
image.png -
詳細視頻講解見翻譯組介紹與應用
在植物中首先運用于擬南芥中研究光形態問題
涉及縮寫
- uORF:upstream open reading frame
- WW:well-watered
- DS :drought-stressed
Result
一、 數據的產生以及Ribo-seq數據的特征
-
本文Ribo-seq建庫方法
image.png
測序量
如下,可以明顯看到Ribo-seq
所需要的測序量很高,而且由于大量的rRNA最終比對上的有效的Reads大約只有12%。
-
Ribo-seq測序量
:-
WW seedlings
:240 million reads -
DS seedlings
: 150 million reads
-
-
RNA-seq測序量
:-
WW seedlings
:32 million reads -
DS seedlings
: 48 million reads
-
-
數據的重復性高達0.9+
- 進一步分析RFP長度分析,發現都主要分布在30bp(Fig2 a)左右, 與之前的報道基本一致,但是與酵母中報道的
28nt
略長。在翻譯過程中,核糖體一次推進三個核苷酸
,同時作者本文中也在開始密碼子后
和終止密碼子前
也觀察到了一個很強的三核苷酸周期性(Fig2 b)。在WW幼苗中RPF
主要位于CDS區
(97.5%),其次是5'UTR
(2.1%)和3'UTR
(0.4%) (Fig2 d)。而在經歷drought
后DS中,RPF
主要位于CDS區
(95.9%),其次是5'UTR
(3.6%)和3'UTR
(0.5%) (Fig2 d)。表明在UTR
中特別是5'UTR
上有潛在的翻譯能力
。
Fig 2
二、干旱脅迫改變翻譯水平和轉錄水平的表達
- 差異基因數目統計(Fig3 a)
-
轉錄水平
: 1646 up 2870 down -
翻譯水平
: 1779 up 3832 down -
為了進一步確認轉錄水平在干旱脅迫后受到抑制,與WW苗相比,DS苗中的多體比例從49.9%下降到33.9%,單體比例從34.9%上升到48%,說明DS幼苗中的翻譯受到全基因組的抑制。
Fig 3 - 作者計算了轉錄組數據和Ribo-seq數據兩者的相關性為
0.69
。進一步將基因分類,發現59%
響應的基因屬于C
類和G
類(轉錄水平與翻譯水平變化一致
)(Fig 4)
Fig 4
三、干旱脅迫導致大量基因的翻譯效率發生顯著變化
- TE(Translational efficiency) = FPKM
ribosome-profiling
/ FPKMRNA-seq
, 翻譯效率TE
代表RNA的使用率。 - 全基因組分析
TE
, 發現基因的TE
變幅達4000倍以上,表明大量基因經歷了高度動態的翻譯調控(Fig5 a), 作者觀察到與光合作用有關的基因的轉錄豐度
(P值=6.45e-13)和TE
(P-值=2.64e-08)都比在幼苗中表達的所有其他基因的轉錄豐度
高(P值=6.45e-13)和更高的TE
(P-值=2.64e-08)(圖5a)。這些光合作用相關基因的表達增加,表明它們除了具有較高的活性外,還具有更高的翻譯效率。
Fig 5 - 作者猜想植物是否能夠通過翻譯效率的變化來對干旱脅迫做出反應?干旱處理后,作者檢測到538個
TE
降低的基因(小于2.8倍,z評分<2)和393個TE
增加的基因(大于2.7倍,z評分>2)(Fig5 b),說明調節基因翻譯效率可能是植物逆境反應的重要途徑。
四、基因的翻譯效率受其序列特征的影響。
- 據報道,
基因的序列特征
有助于增加與多核糖體體相關的mRNAs的比例,并進一步影響蛋白質的豐度。作者研究了CDS
、3'UTR
和5'UTR
基因的三個序列特征(序列長度、歸一化最小自由能(NMFE)和GC含量),并估計了它們對相應基因翻譯效率的潛在影響。- 對于
CDS
: 翻譯效率較高(log2(TE)>1)的基因具有較短的長度、較高的GC含量和較低的NMFE。 - 對于
3'UTR
: 較高的翻譯效率基因和較低的翻譯效率基因之間的差異相對較小。在3'UTR中,只有最高翻譯效率組(Log2(TE)>1)的基因具有較短的長度、較高的GC含量和較低的NMFE。 - 對于
5'UTR
:翻譯效率較高
的基因(log2(TE)>1)具有較短的長度、較低的GC含量和較高的NMFE。
- 對于
- 接下來,作者檢查具有一致和不一致表達模式的基因的序列特征是否不同。基于Kolmogorov-Smirnov檢驗(KS檢驗),累積曲線表明,與非協調組(Fig 3c 中非重疊部分的基因)相比,位于同一組(Fig 3c 中重疊部分的基因)的基因在CDS中的GC含量(P值=3.7e-11)趨向于
較高的GC含量
(P-value=1.6e-12)和低NMFE
(P-value=1.6e-12)(圖3c中的非重疊部分的基因)(Fig 6b、c).。此外,50個UTR中GC含量較低的基因往往受到一致的調控(P-值=1.2e-4;圖S9j)。
Fig 6
五、廣泛的上游開放閱讀框架(UORF)
- 缺水使
5'UTR
中RPFs
的比例增加了1.7倍(Fig 2d),暗示著5'UTR
的某些元件
可以參與脅迫的應答。而uORF
(位于5'UTR
區的小ORF)已報道能夠抑制下游主要的ORFs(mORFs
)的翻譯(by reinitiation and leaky scanning and have been identified in several organisms
)。在玉米中之前只有兩個經典的含uORF
的基因被報導。而通過Ribo-seq
可以從全基因組上去鑒定這種含有uORF的基因
。 - 作者首先基于玉米基因組中存在
AUG
起始密碼子的基因,進行了uORF
預測。為了更準確地鑒定含有uORF的基因,我們對過濾得到的基因集(FGS)中的26 971
個玉米基因進行了研究,這些基因與其他4個草種(水稻(Oryza Sativa)、短腿草(Braqupodium Distthon)、谷子(Setaria Italica)和高粱(Sorghum Bicolor)是共線性的。得到7927
個含有uORF
的基因(平均每個基因含有2個uORF, 長度平均為36bp
)。進一步進行過濾,得到2558
(including 45 classical genes like Lc
)個基因,這些基因包含3063
個平均長度為105bp
的核糖體結合的uORF
。
六、翻譯后的uORF抑制了mORF的翻譯
- 作者為了鑒別
翻譯的
和未翻譯的
uORF之間的特征差異,比較了與mORF重新啟動有關的三個參數:uORF長度
、5'uTR的長度
和NMFE
。作者發現翻譯后的uORF
比未翻譯的
具有更長的長度(P值<2.2e-16)和更強的折疊能力(P值<2.2e-16) (Fig 7a、c)。然而,帶有翻譯的uORFs
的基因顯示出較短的5'UTR長度
(Fig7 b)。翻譯的uORFs
從uORF到mORFs起始密碼子
的相對距離(P<2.2e-16)和從uORF到轉錄起始位點
(TSS)(轉錄起始位點,P=1.4e-9)的相對距離都較短(Fig7 d、e)。 - 在
翻譯后的uORFs
中,鳥嘌呤
在-3
(P-值=0.02)和+4
(P-值=3.0e-4)位置的概率高于未翻譯的uORF
(P-值=0.02)。 - 與
未翻譯的uORFs
相比,翻譯的uORFs
顯著降低了相應基因的TE
(Fig7 g)。此外,翻譯的uORFs
數量的增加
進一步促進了TE
的減少。 - uORFs被報導響應
糖信號
(Wieseet al., 2004)、光
(Liu et al., 2013)and病原菌的侵染
(Pajerowska-Mukhtar et al., 2012)。作者檢測了在干旱后uORF
的翻譯效率,發現相對于正常的幼苗,uORF
的翻譯效率要高。說明玉米在干旱脅迫
下uORFs
的翻譯在全基因組范圍內都得到了增強(Fig7 h)。TE
效率增加的uORF
的比例與位于5'UTR
中RFPs
增加的比例一致(Fig 2d)。
Fig 7
Ribo-seq分析本文提供圖
Ribo-seq相關分析方法
-
reads
過濾:fastq_illumina_filter
使用參數-keep N -v
保留最佳質量的reads
。 -
Adapter
切除:fastx_clipper
使用參數-Q 33 -a CTGTAGGCACCATCAAT -l 25 -n -v
進行切除,然后在使用fastx_trimmer
使用參數-Q 33 -f 2
去除每次讀取的5'端第一個核苷酸
(原因是它在逆轉錄過程中經常代表一個未模板化的加成。)。 -
rRNA
過濾:從NCBI
下載rRNA
序列信息,然后bowtie
使用參數–chunkmbs 1000 -un -al
去除由于rRNA
造成的污染。 -
Tophat2
比對:將玉米B73
的基因組序列通過Tophat2
使用參數–bowtie1 -N 2 -I 50000 -p 3
進行比對 -
翻譯豐度
的計算:通過Cufflinks
使用參數–p 3 -G -u
來進行計算,只考慮比對到CDS
上的reads,FPKM
最終來衡量每個基因的翻譯豐度。 -
翻譯效率
計算: 只考慮FPKM
≥ 1的基因進行樣本間的重復性和進行后續分析。- TE = FPKM(translational_level) / FPKM(transcriptional_level)
-
3堿基周期性圖
: i =4
*
read number i
/((read number (i - 2)
+read number (i - 1)
+read number (i + 1)
+read number (i + 2)
), 然后繪制每個點對應的圖 -
Normalized minimal free energy (NMFE)
計算:定義二級結構的序列穩定性
,它由RNAfold
計算,并由序列長度
規格化 -
uORF
預測:predict uORFs with the sequence structure of (ATG-3n-TAG|TAA|TGA)
, 通過uORF
的FPKM值是否大于1分類為表達和不表達。 -
motif
圖繪制:Seqlogo