limma:微陣列和RNA-Seq數據的線性模型用戶手冊
Gordon K. Smyth, Matthew Ritchie, Natalie Thorne,
James Wettenhall, Wei Shi and Yifang Hu
Bioinformatics Division, The Walter and Eliza Hall Institute of Medical Research, Melbourne, Australia
2002年12月2日第一版
2016年10月16日最后修訂
Limma是一個用于分析由微陣列或RNA-Seq產生的基因表達數據的數據包[33]。核心能力是使用線性模型來評估多因素設計實驗背景下的差異表達。Limma提供了在許多RNA靶點之間同時分析比較的能力。它具有即使利用少量陣列進行實驗也能分析穩定的特點—這是通過跨基因借用信息來實現的。它是專門設計的用于分析擁有多個實驗條件和預測的復雜實驗的。線性模型和差分表達式函數適用于任何定量基因表達技術的數據,包括微陣列、RNA-seq和定量PCR。Limma可以處理單通道和雙色微陣列。
本指南給出了主要功能的教程式介紹,但沒有描述程序包的每個功能。包中每個函數的完整描述由R在線幫助系統提供幫助文檔。要訪問在線幫助,請在R命令行中鍵入help(package=limma)
或使用help.start()
命令啟動HTML幫助系統抑或是使用Windows下拉幫助菜單。
Limma提供了一套強大的函數,用于讀取、探索和預處理雙色微陣列數據。Bioconductor中的marray包提供了讀取和歸一化點狀雙色微陣列數據的替代函數。marray包為來自雙色微陣列數據的對數比率提供靈活的位置和進行縮放歸一化的例程。Limma數據包與marray數據包功能重疊,但是擁有更普遍的陣列內部和陣列之間歸一化的定義,分別設定為單獨的步驟。如果你想要一起使用Limma和marray數據包,請參閱第6.4節。
Limma可以從各種圖像分析軟件平臺讀取輸出數據,包括GenePix、ImaGene等。可以處理單通道或雙通道格式。
Bioconductor中的affy數據包提供了讀取和歸一化Affymetrix微陣列數據的函數。在用戶指南的整個過程中都會提供關于如何使用Limma和affy數據包的建議,例如參見第8.2節以及大腸桿菌和雌激素的案例研究。
讀取和預處理Illumina BeadChips表達數據的函數在limma 3.0.0版本中引進,請參見第17.3節中的案例研究。Limma也可以與vst或者beadarray軟件包一起用于預處理Illumina數據。
從版本3.9.19開始,Limma數據包開始包含分析RNA-Seq實驗的函數,詳情參見案例研究11.8。方法是將序列讀長計數表轉換為表達式對象,然后可以將其作為微陣列數據進行后續分析。
本指南將Limma描述為命令驅動程序包。對于雙色數據,圖形用戶界面中最為常用的limma函數可以通過數據包limmaGUI [48]獲得;對于Affymetrix數據,可以使用affylmGUI數據包[47]。兩個數據包均可從Bioconductor獲得。
本用戶指南針對R版本2.8.0至3.3.1和limma版本2.16.0至3.30.0應是正確的。limma主頁是http://bioinf.wehi.edu.au/limma。