lncRNA:
長鏈非編碼RNA(Long Noncoding RNA,LncRNA)指的是長度在200nt以上、不編碼蛋白、但參與細胞內多種生物學過程的RNA分子。
人類基因組計劃研究發現只有3%的基因組序列是編碼蛋白質的基因,而占人基因組62%的序列轉錄為lncRNA,這一結論提示非編碼區域可能通過表達lncRNA,活躍地參與到生物學功能的調控中。在過去的十幾年中,科學家們已經相繼發現,lncRNA參與了X染色體沉默,染色質修飾、轉錄激活、轉錄干擾、核內運輸等多種重要的調控過程,截至目前,在NONCODE中已經收錄了73370個lncRNA,它們分別來自1239個物種,僅有不到200個進行了功能注釋,人類對lncRNA的研究還知之甚少。
隨著對lncRNA在哺乳動物進化及人類疾病發生發展中作用的日益關注,lncRNA調控機制已成為當前生命科學研究的新熱點。
LncRNA在生物體內的功能主要分為三大類:
生物學功能:LncRNA與表觀遺傳調控、轉錄調控、轉錄后調控、 miRNA 調控、細胞分化及發育等密切相關;
應急功能:LncRNA可作為細胞內各種信號招募蛋白形成復合物參與免疫反應和宿主防御。
LncRNA與疾病:LncRNA與人類的許多疾病,尤其是與衰老相關的疾病有密切關系,例如心血管疾病、阿爾茲海默癥、糖尿病、癌癥等。
因此,lncRNA未來能否作為分子靶標成功應用于臨床診斷和癌癥治療,將是其日后發展的難點與熱點。
lncRNA-mRNA 整合分析
LncRNA簡要:
LncRNA是一類轉錄本長度超過200nt的RNA,它們本身并不編碼蛋白,而是以RNA的形式在多種層面上(表觀遺傳調控、轉錄調控以及轉錄后調控等)調控基因的表達水平。生物體內含量相相當豐富,約占RNA的4-9%(mRNA約占1-2%)。LncRNA的組織特異性及特定的細胞定位,顯示lncRNA受到高度嚴謹的調控,目前已知其與發育、干細胞維持、癌癥及一些疾病相關。雖然近年來隨著基因芯片及第二代高通量測序技術的廣泛運用,lncRNA不斷被發現,但此類轉錄本的確切功能還未知。目前市場上的lncRNA芯片通常將lncRNA與mRNA設計在一起,RNASeq數據中也包含lncRNA, mRNA序列,因此可以通過分析lncRNA與mRNA表達相關性對lncRNA進行功能注釋。
分析流程圖:
分析內容:
①計算LncRNA與mRNA表達相關性,根據設定的域值篩選lncRNA與mRNA關系對,構建LncRNA與mRNA共表達網絡,如下是全局網絡
②基于lncRNA與mRNA表達相關性以及lncRNA與mRNA基因組位置近鄰關系,得到lncRNA的潛在靶標基因,對差異表達的lncRNA靶標基因進行功能注釋以及功能富集分析,如下是功能富集的GO的Barplot圖和差異lncRNA的Heatmap圖。
③研究lncRNA與mRNA的共表達網絡的拓撲學特性,基于度篩選網絡拓撲上重要的lncRNA,這些lncRNA極有可能是與研究背景相關的lncRNA,如下是重要lncRNA與mRNA的局部共表達子網絡。
④客戶提供研究背景相關一組基因,根據表達相關性可以找出與這組基因相關的lncRNA,從而構建出感興趣的共表達網絡。通過構建的共表達網絡能進一步找到感興趣的 hub lncRNA。
lncRNA深度挖掘分析
一、差異lncRNA靶基因預測
lncRNA的靶基因較為復雜,主要分為正式和反式兩種作用機制.lncRNA作用機制與miRNA類似,均可以通過調控相應的mRNA來行使功能,所以靶基因的預測在科學研究中都顯得非常必要。
二、靶基因Gene Ontology分析
我們將靶基因向gene ontology數據庫的各節點映射,計算每個節點的基因數目.
三、靶基因Pathway分析
信號通路分析需要完備的注釋信息支持,通過整合KEGG、Biocarta、Reactome等多個數據庫的信息可以精確檢驗來進行Pathway的顯著性分析。
四、lncRNA與調控基因的表達機制
通過整合lncRNA的信息和靶基因之間的關系,我們可以得到一個lncRNA與靶基因之間的調控網絡圖.
五、 轉錄因子結合位點預測
對于差異表達lncRNA,提取轉錄起始位點上下游序列,使用預測程序對其轉錄因子結合位點進行預測.
六、基因關聯分析
現在市面上的lncRNA芯片均含有mRNA的表達探針,通過將lncRNA的靶基因分析結果與芯片上mRNA的表達結果做關聯分析,可以更進一步的分析lncRNA的功能。
七、信號通路調控網絡構建:
實驗中基因同時參與了很多Pathway,通過構建信號通路調控網絡,從宏觀層面看到Pathway之間的信號傳遞關系,在多個顯著性Pathway中發現受實驗影響的核心Pathway,以及實驗影響的信號通路之間的調控機理。
八、lncRNA的功能分析
根據lncRNA最新的功能數據庫,利用生物信息學工具,做出Function-Tar-Net圖表,從而得出lncRNA與功能的關系
lncRNA功能實驗
LncRNA定量PCR
LncRNA原位雜交
5’-RACE, 3’-RACE實驗(lncRNA全長擴增實驗)
lncRNA干擾實驗
lncRNA過表達實驗
需要先通過5’-RACE實驗找到lncRNA轉錄起始位點
lncRNA細胞功能實驗
細胞增殖、細胞凋亡、細胞周期、細胞遷移
基因豐度和基因表達豐度
基因豐度是指基因組中該基因的拷貝數量。
基因豐度高,即這個基因的數量多,那么可能這個基因的表達量也會多,但是不一定,主要還是要看該基因的啟動子強弱。所以基因豐度高不代表表達豐度也高。
基因表達的豐度是指基因轉錄成mRNA的數量。
基因表達豐度高是指該基因轉錄成mRNA多,那么表達的蛋白也多,對于表型的影響就大。
(基因豐度是某個基因在基因組中的總數量,其中有的能表達,有的不能表達;而能被表達出來的基因占該基因的總數的比例就是該基因的表達豐度。)