16s rRNA結構
大體結構如下:
摘自聯川生物
不同物種高變區域起始和終止位置稍有不同。
16s rRNA二級和三級結構,doi: 10.1186/s12859-016-0992-y
16s rRNA序列提取
根據gff,基因類型只保留rRNA,剔除exon和CDS。github找到一個腳本.
16S rRNA預測工具barrnap.
注意16s rRNA多拷貝問題。
提取高變區
16S rRNA高變區計算參考doi: 10.1016/j.mimet.2007.02.005。文章大意是下載target species所有16S rRNA序列進行ClustalW多比對。