2023-07-21 IsoSeq3利用pacbio測序數據進行全長轉錄本序列分析

使用IsoSeq3利用pacbio測序數據進行全長轉錄本序列分析,為了得到更準確的基因注釋作準備,但價格昂貴,且無法進行表達量分析

mkdir -p /home/train/08.RNA-seq_analysis_by_trinity
cd /home/train/08.RNA-seq_analysis_by_trinity

# 對PacBio轉錄組測序數據進行全長轉錄本序列分析
# https://isoseq.how/clustering/schematic-workflow.html
mkdir -p /home/train/08.RNA-seq_analysis_by_trinity/IsoSeq
cd /home/train/08.RNA-seq_analysis_by_trinity/IsoSeq

#將subreads轉換成ccs數據
PATH=/opt/biosoft/miniconda3_for_pbbioconda/bin/:$PATH
samtools view -h ~/00.incipient_data/data_for_gene_prediction_and_RNA-seq/m54086_170204_081430.subreads.bam | head -n 10000 | samtools view -b > m54086_170204_081430.subreads.bam
pbindex m54086_170204_081430.subreads.bam #對pacbio測序結果的bam建立索引
# ccs的正常運行需要提供chemistry.xml測序試劑信息;在運行ccs數據之前配置文件chemistry.xml 
# wget https://raw.githubusercontent.com/PacificBiosciences/pbcore/develop/pbcore/chemistry/resources/mapping.xml -O chemistry.xml
cp ~/00.incipient_data/data_for_genome_assembling/chemistry.xml .
perl -p -i -e 's/<SoftwareVersion>5.0/<SoftwareVersion>4.0/' chemistry.xml
export SMRT_CHEMISTRY_BUNDLE_DIR=$PWD#將當前目錄寫到環境變量
# 運行ccs命令將Subreads轉換為CCS數據。默認參數--min-passes為3表示至少有3條全長的subreads;--min-snr為2.5表示信噪比,即SSubreads的準確率至少為2.5/3.5=71.4%。
ccs --min-rq 0.9 m54086_170204_081430.subreads.bam m54086_170204_081430.ccs.bam
#使用samtools對結果進行查看
[train@MiWiFi-R3P-srv IsoSeq]$ samtools view m54086_170204_081430.ccs.bam | les

# 去除引物和barcode堿基信息。
echo '>NEB_5p
GCAATGAAGTCGCAGGGTTGGG
>Clontech_5p
AAGCAGTGGTATCAACGCAGAGTACATGGGG
>NEB_Clontech_3p
GTACTCTGCGTTGATACCACTGCTT' > barcoded_primers.fasta
lima m54086_170204_081430.ccs.bam barcoded_primers.fasta m54086_170204_081430.lima.bam --isoseq --peek-guess

統計篩選后的條數
[train@MiWiFi-R3P-srv IsoSeq]$ samtools view m54086_170204_081430.lima.Clontech_5p--NEB_Clontech_3p.bam | wc -l
656


# 去除PolyA和合體序列,得到FLNC序列
isoseq refine m54086_170204_081430*lima*.bam barcoded_primers.fasta m54086_170204_081430.flnc.bam --require-polya

# 對FLNC reads進行聚類,得到全長轉錄本序列信息: hq.fasta.gz with predicted accuracy ≥ 0.99; lq.fasta.gz with predicted accuracy < 0.99。
isoseq cluster m54086_170204_081430.flnc.bam clustered.bam --verbose --use-qvs

[train@MiWiFi-R3P-srv IsoSeq]$ samtools view m54086_170204_081430.flnc.bam | wc -l
646
[train@MiWiFi-R3P-srv IsoSeq]$ samtools view clustered.bam | wc -l
41
[train@MiWiFi-R3P-srv IsoSeq]$ ll -t
total 37784
-rw-r--r-- 1 train train     8588 Jul 21 14:36 clustered.cluster
-rw-r--r-- 1 train train    15327 Jul 21 14:36 clustered.hq.fasta.gz
-rw-r--r-- 1 train train     2752 Jul 21 14:36 clustered.lq.fasta.gz
-rw-r--r-- 1 train train      404 Jul 21 14:36 clustered.bam.pbi
-rw-r--r-- 1 train train    21560 Jul 21 14:36 clustered.bam
-rw-r--r-- 1 train train      381 Jul 21 14:36 clustered.hq.bam.pbi
-rw-r--r-- 1 train train    18707 Jul 21 14:36 clustered.hq.bam
-rw-r--r-- 1 train train      109 Jul 21 14:36 clustered.lq.bam.pbi
-rw-r--r-- 1 train train     3352 Jul 21 14:36 clustered.lq.bam
-rw-r--r-- 1 train train     1568 Jul 21 14:36 clustered.transcriptset.xml
-rw-r--r-- 1 train train     6505 Jul 21 14:36 clustered.cluster_report.csv
-rw-r--r-- 1 train train     8195 Jul 21 14:33 m54086_170204_081430.flnc.bam.pbi
-rw-r--r-- 1 train train  1509378 Jul 21 14:33 m54086_170204_081430.flnc.bam
-rw-r--r-- 1 train train     1611 Jul 21 14:33 m54086_170204_081430.flnc.consensusreadset.xml
-rw-r--r-- 1 train train      821 Jul 21 14:33 m54086_170204_081430.flnc.filter_summary.report.json
-rw-r--r-- 1 train train    50339 Jul 21 14:33 m54086_170204_081430.flnc.report.csv
-rw-r--r-- 1 train train     1990 Jul 21 14:29 m54086_170204_081430.lima.Clontech_5p--NEB_Clontech_3p.consensusreadset.xml
-rw-r--r-- 1 train train     3826 Jul 21 14:29 m54086_170204_081430.lima.consensusreadset.xml
-rw-r--r-- 1 train train      639 Jul 21 14:29 m54086_170204_081430.lima.json
-rw-r--r-- 1 train train      108 Jul 21 14:29 m54086_170204_081430.lima.lima.counts
-rw-r--r-- 1 train train      845 Jul 21 14:29 m54086_170204_081430.lima.lima.summary
-rw-r--r-- 1 train train     8342 Jul 21 14:29 m54086_170204_081430.lima.Clontech_5p--NEB_Clontech_3p.bam.pbi
-rw-r--r-- 1 train train  1564566 Jul 21 14:29 m54086_170204_081430.lima.Clontech_5p--NEB_Clontech_3p.bam
-rw-r--r-- 1 train train   101927 Jul 21 14:29 m54086_170204_081430.lima.lima.clips
-rw-r--r-- 1 train train   183452 Jul 21 14:29 m54086_170204_081430.lima.lima.report
-rw-r--r-- 1 train train      118 Jul 21 14:29 m54086_170204_081430.lima.lima.guess
-rw-r--r-- 1 train train      119 Jul 21 14:29 barcoded_primers.fasta
-rw-r--r-- 1 train train      862 Jul 21 14:17 m54086_170204_081430.ccs.ccs_report.txt
-rw-r--r-- 1 train train    61814 Jul 21 14:17 m54086_170204_081430.ccs.zmw_metrics.json.gz
-rw-r--r-- 1 train train     8030 Jul 21 14:17 m54086_170204_081430.ccs.bam.pbi
-rw-r--r-- 1 train train  1694358 Jul 21 14:17 m54086_170204_081430.ccs.bam
-rw-r--r-- 1 train train     8366 Jul 21 14:15 chemistry.xml
-rw-r--r-- 1 train train    89364 Jul 21 14:10 m54086_170204_081430.subreads.bam.pbi
-rw-r--r-- 1 train train 33228366 Jul 21 14:09 m54086_170204_081430.subreads.bam
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,563評論 6 544
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,694評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,672評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,965評論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,690評論 6 413
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 56,019評論 1 329
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,013評論 3 449
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 43,188評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,718評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,438評論 3 360
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,667評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,149評論 5 365
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,845評論 3 351
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,252評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,590評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,384評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,635評論 2 380

推薦閱讀更多精彩內容