原文bioRxiv preprint https://doi.org/10.1101/2020.02.20.957936.
Terms
1.Support Vector Machine (SVM),支持向量機
基本模型是在特征空間上找到最佳的分離超平面使得訓練集上正負樣本間隔最大,用來解決二分類問題的有監督學習算法,在引入了核方法之后SVM也可以用來解決非線性問題。參考[機器學習] 分類 --- Support Vector Machine (SVM)_人工智能_曾先森 --- 學習不止于抵達,而在于遠航-CSDN博客
2.ERCC,External RNA Controls Consortium
為Spike in標準化RNA而使用的內參定量,其他標準化方法參考RNA-seq中的那些統計學問題(二)FPKM/RPKM之外的那些標準化方法 - 簡書
3.silhouette score,輪廓系數,一種聚類指標,取值-1~1,越大越相似
4.random forest,一種算法,隨機取行列,避免過度擬合。
5.differential gene expression (DGE) analysis,表達譜分析
重視差異基因分析,沒有轉錄組詳細
框架
1.背景
HSC分化經典的hierarchical model已經逐漸被HSC compartment model取代,理由如下:(1)LMPP(mouse),MLP(human)早期就喪失了向Meg、Ery分化的能力;(2)小鼠確實存在MK-primed HSC且表達MK/PLT特征性的VWF和CD41;(3)形態學定義的HSC中可以找出MK-progenitor。這些互相包容交互的關系顯然不支持具有明確層級關系的經典理論。
在compartment的理論下,從HSC到MK研究存在一定困難,(1)HSC和MK progenitor共享nich和轉錄因子,一般手段很難將二者區分開;(2)MK占骨髓MNC不到0.01%,體積大,細胞脆弱,很難取得樣本;(3)體外培養的MK從形態學上就明顯不同于體內的MK。
2.問題
(1)HSC里是否存在MK-primed HSC cluster
(2)不同染色體倍數的MK有什么不同
(3)stress對MK和HSC有什么影響
3.解答
(1)存在MK-primed HSC
取樣:5 sternal BM sample,884 HSCs(CD34+CD38-CD45RA-CD90+CD49f+),index sorting
filter:support vector machine,ERCC spike-in
cluster:119 cells,5 cluster
? ? ? ? ? ? ? 其中,cluster 1和cluster 4于表達與PLT功能相關的基因
(增加證據:
取樣:20 sternal BM sample,1106 single MKs and 188 pools of 20-100 MKs(CD41+CD42+)
filter:random forest,training group:20-MK pools,ERCC spike-in
projection:TOP 2000 genes 依然分布在與cluster 1、4相似的位置
)
trajectory:MK相關兩群基本集中在point 2之后,用Novershter的資料映射,可以看出MK分布位置重疊,而MEP分布在cluster 1位置
function:轉錄組不同的cluster在cell surface maker intensity水平也可以分為不同cluster,結合Belluschi的index及細胞培養結果,本文中的cluster 1、4即Belluschi形成MK的HSC
(2)low ploidy(2N-4N)與high ploidy(8N-32N)
取樣:10 sternal BM sample,1106 single MKs and 32 pools of 20-50 MKs(不懂為什么這里要再取新的MK pools并且較前188少那么多)
GO:
1)low poidy:PLT function
上調degranulation,coagulation,hemostasis,would healing
2)high ploidy:PLT release
下調translational initiation,elongation and termination,protein localization and cellular protein complex disassembly
且high ploidy下調的基因可以映射到cluster 1,再次說明HSC確實存在MK-primed cell,point 2之后的基因下調使得細胞向成熟分化。
目前的基于體外培養MK的認知是coagulation和hemostasis在染色體倍數多的MK(2N-16N)上調,但是這篇文章從fresh human BM sample的結論看并非如此。
電鏡:
1)low ploidy:血小板特異性顆粒,線粒體,smooth ER,核糖體
2)high ploidy:血小板特異性顆粒,線粒體,rough ER,smaller nucleoi,heterochromatin
作者認為電鏡結果符合轉錄組的結論,對于high ploidy的血小板特異性顆粒,用了formed這個形容詞,可能是認為這些與coagulation相關的顆粒都在high ploidy前形成了,如果把high ploidy分為更多組來看,8N,16N,32N血小板相關顆粒數目都沒有再變化可能更能說服我這是formed顆粒;smooth/rough ER這里應該是針對下調cellular protein complex disassembly,一直以為smooth ER合成激素類物質,可能是smooth→rough蛋白合成增加,disassembly下降,但是感覺這倆并沒有多大聯系,合成增加就一定降解減少嗎?不得告訴我原來有多少,現在剩多少,怎么拆解的嗎?熒光標記特定得蛋白去在高內涵harmony看蛋白的動態變化會不會更直觀?對于下調translational initiation只能贊同heterochromatin,核仁縮小或消失一般不是分裂的標志?難道意思是準備復制分裂的時候轉錄水平下降?
(電鏡這部分感覺有點牽強,我好累。)
Annotation:
將隨ploidy增加而上調的基因通過Ensemble注釋,發現于跨膜蛋白相關的基因較多,明顯不同于in vitro MK,推測這些跨膜蛋白在in vivo MK起到胞外信號傳遞的作用。
(3)不同的Stress及PLT環境下MK是明顯不同的兩個分化狀態
取樣:CAD或MI患者7人,101 pools;瓣膜置換術患者8人,55 pools。
DGE analysis:上調的基因大多與PLT激活和α顆粒增多有關,且map到cluster 1上。
小結
本文定義了人in vivo MK的轉錄圖譜,進一步確證HSC中有MK-primed HSC(cluster 1 和cluster 4),HSC中如此高比例的MK-primed HSC也符合“MK在HSC compartment中首先分化”的假說。同時,通過對比不同染色體倍數的MK,說明MK 通過ploidy胞內分裂切換自己的兩種狀態。
cluster 1和HSC功能、MK生成、MEP克隆形成等相關,cluster 4和血小板功能更加相關(但是為什么MI患者上調的基因map到cluster 1?說明stress和PLT的影響涉及到HSC?)cluster1 在MK-priming HSC和早期MK發育中有重要作用,對于cluster 4的說明尚有欠缺。