一、何為 SSR ?
SSR ( simple sequence repeats ) 即簡單重復序列,也稱為微衛星 DNA(microsatellite DNA ),在真核生物基因組中廣泛存在,一般是以1-bp 組成較低程度的重復序列,主要以2-3個核酸為重復單位如(GA)n、(AC)n 和(GAA)n 等。
從進化角度看物種間重復序列的差異是自然選擇的結果。因此鑒定SSR在基因組分析中有重要意義。微衛星在原核生物和真核生物基因組中隨機分布,而且該標記呈共顯性,符合孟德爾遺傳模式,易于操作,具有高度重復性和可靠性,顯示出較強的多態性等優點,使其在遺傳連鎖圖譜構建、遺傳多樣性檢測、基因定位及分子標記輔助選擇等領域有重要應用
SSR 通常可以分為基因組 SSR 和 EST-SSR 兩大類。GenomicSSR 是基于基因組序列開發的,開發起來費時費力,而且因為探針的緣故,種類比較局限,EST-SSR是指存在于表達的基因序列內的SSR,不包括存在于內含子及非表達的調控區等之中的SSR,通常三個堿基重復的占多數,與不引起基因翻譯過程中移碼現象的發生相一致,EST-SSR有更強的種屬轉移性。不過一般EST-SSR的重復序列要短于基因組中的SSR,而且從EST中篩選的微衛星要比從基因組中篩選的微衛星多態性低。
二、使用 Misa 結合 Primer3 來批量設計 SSR 引物
MISA,英文全稱為Micro Satellite identification tool,即微衛星識別工具。
MISA是使用 perl 編寫的一支程序,能識別出序列中的微衛星和復合微衛星(兩個微衛星之間由由不多于100bp的堿基對隔開),并給出其所在位點。
MISA下載網址:http://pgrc.ipk-gatersleben.de/misa/misa.html
1. MISA 用法:
misa.pl filename
其中,fastfile是序列文件,同時在運行程序的工作目錄下必須有一個名稱為“misa.ini”
的文件。該文件內容為:
definition(unit_size,min_repeats): 1-10 2-6 3-5 4-5 5-5 6-5
interruptions(max_difference_for_2_SSRs): 100
該文件指定了misa的參數,即1個堿基重復10次及10次以上;2個堿基重復6次及6 次以上;
3個堿基重復5次及5次以上;4個堿基重復5次及5次以上;5個堿基重復5 次及5次以上;6堿
基重復5次及5次以上,這樣的堿基重復序列才算是微衛星序列。 同時,兩個微衛星之間的距離小于100bp的時候,兩個微衛星組成一個復合微衛星。
MISA的輸出結果:
MISA會在 fastafile 所在的文件夾下生成兩個文件,分別是 “.misa” 和 “.statistics”
-
.misa
:以表格的形式列出微衛星的類型和位點; -
.statistics
:統計微衛星的類型和頻數。
在MISA的下載頁面中,提供了3個附加的 perl 腳本,分別是:Get_est_trimmer.pl
,p3_in.pl
和 p3_out.pl
。
由于 MISA 程序讀取 fasta 文件中的序列 ID,將序列 ID 中的空格用下劃線 ”_” 填補了,所以在fasta文件中,其序列ID最好不要有空格。否則運行接下來的程序時,會出問題。
Get_est_trimmer.pl
針對EST序列,可以除去EST序列中短的序列和兩端不明確的堿基。
2.第二步:
p3_in.pl
輸入 misa.pl 的輸出結果,將引物設計的參數文件(模板,產物長度,目標區域等)導入到一個以“p3in”為后綴的文件中。
p3_in.pl filename.misa
3.第三步:
primer3主設計引物腳本
primer3_core -default_version=1 -output=filename.p3out filename.p3in
4.第四步:
p3_out.pl對primer3產生的文件進行提取合,得到最后的結果文件 filename.result
p3_out.pl filename.p3out filename.misa
tips: p3_in.pl 和 p3_out.pl 這兩個程序可能需要修改才能正常使用。
參考:http://www.chenlianfu.com/?p=255
(19條消息) 使用Misa結合Primer3來批量設計SSR引物_misa安裝_awk_bioinfo的博客-CSDN博客