1.簡介
2016年,德國馬普所的Cox和蛋白質組學領域巨擘Matthias Mann合作開發了MaxQuant軟件(MQ),并發表在nbt上,protocol也相應發表在nature protocols上。不足五年,MQ的引用率已高達上萬次,其中不乏CNS級別文章(有大佬的加持果然不一樣)。毫不夸張地說,MaxQuant是業界良心,它的橫空出世沉重地打擊了深惡痛絕的質譜廠商們的囂張氣焰。
主要特點:
- 支持多種質譜儀廠商產生原始數據,如raw/wiff;
- 免費不開源,基于Andromeda搜索引擎;;
- 支持標記定量和非標定量,如labelfree(優勢)/ICAT/SILAC/TMT/iTRAQ等;
- 蛋白鑒定數多,定量準確性高(主要是因為非線性質量校正和Match Between Runs);
- 有較完整的結果查看和分析界面;
- 主要部署在Windows系統(Linux需要mono,MacOS需借助Parallels或Bootcamp);
- 有配套的結果后處理軟件Perseus。
2.下載安裝
官網:https://www.maxquant.org/
MQ的下載需要用郵箱注冊,并填寫注冊碼。
依賴.NET Framework(基于.net框架編寫,有些沒安裝的電腦需要安裝) 和MSFileReader(識別質譜raw文件)。
解壓后無需安裝,點擊MaxQuant.exe即可使用。
3.配置與運行
MaxQuant使用很簡單,參數界面設置也不像PD那么凌亂。
6大參數配置模塊,我這里只選一些重要的參數,大部分默認就好:
- Raw files:導入原始數據和設計實驗,包括組分和樣本,Group(指不同的實驗,如label/SILAC同時進行即為2個Group0和Group1,一般跑一個就好);
- Group-specific parameters:Group參數的設置,一般只是Group0;
- Global parameters:全局參數配置;
- Performance:顯示正在運行的具體步驟和動態;
- Viewer:數據可視化模塊, 能在labelfree定量中呈現三維圖形。我認為沒啥用,無需設置,拖慢速度;
- Andromeda configuration:用于配置修飾、酶,以及數據庫ID規則設置等,一般無額外需求,無需設置。
所以,實際需要配置的就是前面三項,我這里以Labelfree定量為例,寫下Group-specific parameters和Global parameters中一些重要的參數:
模塊 | 選項 | 值或動作 |
---|---|---|
Group-specific parameters | Variable modifications | 增加Deamidation(NQ)、Gln->pyro-Glu |
Label-free quantification | 選LFQ | |
Global parameters | Fasta files | 添加數據庫文件(可加入多個) |
Match between runs | 打勾 | |
iBAQ | 打勾 | |
Min.unique peptides | 1 |
其他選項基本上用默認就好,具體項目具體分析。配置完后設置線程數,點擊Start。(若中間暫停,可在Partial processing選中中間步驟運行。
MQ的主要運行步驟如下:
- feature信息的提取(定量信息)
- 最初的搜庫(first search)
- 質量校正
- 搜庫鑒定(main search)
- 峰處理
- 第二次搜庫(second peptide search)
- 定量和鑒定結果合并
- 導出結果
更多參數可查看官方文檔:http://coxdocs.org/doku.php?id=maxquant:start
也可以查看我分享的兩個文檔:MaxQuant_Infos_and_Tutorial_07(中間每個參數都介紹得很詳細)
MaxQuant_Introduction_112409
4.結果
如果參數中路徑沒有額外設置,那么在原始數據同級目錄下會得到搜庫結果:
combined文件夾包含了搜庫結果,如果是DIA建庫,導入的即是這個文件夾。里面包含了txt文件夾,即鑒定和定量的全部結果。
mqpar.xml是所有參數配置文件,若二次搜庫,可直接導入MaxQuant中,無需重復設置。所以,一般建議保留下來,這樣也可對結果的設置進行追溯。
在combined/proc/#runningTimes.txt中包含了每一步運行的時間。
combined文件夾中的txt文件夾包含很多結果:
msms.txt、peptides.txt、proteinGroups.txt即為譜圖、肽段和蛋白結果文件。其他比較重要的文件如evidence.txt,summary,modificationSpecificPeptides等。每個表都很大,樣品數多的話可達上百列。每個文件的每一列(即表頭)在tables.pdf文檔中都有詳細解釋。
Linux運行:
需要mono調用MQ,參數配置文件mqpar.xml同Windows系統,注意輸入原始文件(譜圖和數據庫)的路徑。一般是先通過Windows生成mqpar.xml,再來Linux運行。但這樣的話,又需要在兩個系統間來回轉移原始數據,非常低效。所以現在也有一些小工具來專門生成mqpar.xml。MaxQuant的Linux試運行
/path/to/bin/mono /path/to/MaxQuant/bin/MaxQuantCmd.exe mqpar.xml
5.Perseus后處理
Perseus也是上面兩位大佬開發的軟件,發在nature methods上。一開始是專門針對MQ數據處理的。后來對所有矩陣類型的表達數據,甚至是多組學數據都適合。
對于蛋白質組學常規的統計分析和可視化(不太友好)都能實現,而且大佬團隊也持續開發了基于調用本地R或Python解釋器的插件,使得功能更加豐富。
這里不做過多介紹了。因為我如果不是有授課的需求的話,也不會用這個軟件。為有需要的朋友提供了一些教程可參考:
MQ團隊幾乎每年都會舉辦暑期學校,Youtube上很多視頻。不過中文教程近乎于無。
6.小結
蛋白質組學鑒定和定量系列軟件說明到此結束,還有很多沒有介紹的,比如國產軟件pFind,MSFragger,OMSSA,SEQUEST等都是常用的蛋白鑒定軟件。有些我自己也沒用過,也沒必要一一使用,適合自己的才是好的。而且,目前也有很多平臺是整合了多個鑒定軟件的綜合結果,比如SearchGUI,PeptideShaker,TPP等等。
蛋白質組學鑒定定量軟件總結:
【1】蛋白質組學鑒定軟件之X!Tandem
【2】蛋白質組學鑒定軟件之Comet
【3】蛋白質組學鑒定軟件之Mascot
【4】蛋白質組學鑒定軟件之MSGFPlus
【5】蛋白質組學鑒定定量軟件之PD
【6】蛋白質組學鑒定定量軟件之MaxQuant