《Cell》非洲肺魚基因組揭示了脊椎動物從水到陸地的轉變
作者:王坤,1,17王軍,2,3,17朱成龍,1,4,17楊連東,5,17任艷東,1,4,17阮玨,6,17范廣義,7,8,17胡江,9,17徐文杰,1畢旭鵬,8朱友安,10宋越,7陳華濤,11馬甜甜,11趙若平,4蔣海峰,5張斌,12馮晨光,1袁媛1甘曉妮,5李永新,1曾宏輝,5劉群,7張耀磊,7邵峰,13郝世杰,7張賀,7徐迅,8劉鑫,7王德鵬,9朱敏,10張國杰,8,4,14,15趙文明,12,*邱強,1,*何順平,5,14,16,*和王文4,14,18,19
簡要
介紹了大規模非洲肺魚基因組的基因組組裝和分析,揭示了從水到陸地的轉變所需的遺傳
創新
1. 迄今為止報道的最大脊椎動物基因組的染色體水平組裝
2. 轉座子的持續擴展促成了巨大的肺魚基因組
3. 遺傳變化增強了呼吸、運動和抗焦慮能力
4. 從硬骨魚到肺魚,再到四足動物經歷了三個遺傳創新步驟
? 總結
? 肺魚是現存的四足動物的近親,并保留了與水向陸地過渡有關的祖先特征。 然而,它們巨大的基因組規模阻礙了對進化中這一關鍵轉變的理解。在此,我們報道了非洲肺魚(Protopterus annectens)基因組的40GB染色體水平的組裝,這是迄今為止報道的最大的基因組組裝,其重疊群和染色體N50分別為1.60 MB和2.81 GB. 肺魚基因組的大尺寸主要是由于反轉錄轉座子。具有超長長度的基因表現出與其他基因相似的表達水平,表明肺魚已經進化出高轉錄效率以保持基因表達平衡。結合轉錄組和實驗數據,我們鑒定了與陸地適應性狀相關的潛在基因和調控元件,如肺表面活性物質、抗焦慮能力、五指肢和咽部重塑。我們的研究結果為理解從魚類到人類的進化途徑提供了見解和關鍵資源。
? 介紹
? 古生代地球大氣中氧氣含量的持續增加為陸生動物的出現創造了條件(Hsia et al,2013)。 在硬骨魚類的祖先首次表現出呼吸空氣的能力之后(Bi et al,2021;Liem,1988),四足動物的祖先成功遷移到陸地上。脊椎動物從水到陸地的轉變需要一系列身體創新的進化(Ashleyross等人,2013) 呼吸、感覺、運動、循環和其他系統必須被改造以適應陸地(Long和Gordon,2004)。 近幾十年來,古生物學研究逐步闡明了脊椎動物出現在陸地上的過程(Clack,2012)。作為一種重要的補充方法,對四足動物及其現存姐妹譜系的比較基因組學研究將為揭示其轉變過程和潛在的分子機制提供關鍵視角。四足動物在四足魚類中筑巢,四足魚類是現存的三種肉鰭魚類(葉鰭魚)譜系之一,還包括腔棘魚和肺魚(Lu et al,2012)。 肺魚作為四足動物的近親,突出了留在水中的葉鰭魚的祖先狀態(Amemiya et al,2013),代表了理解這些轉變的遺傳基礎和進化過程的橋梁。然而,肺魚基因組的巨大尺寸,從40-130千兆堿基(GB)(Metcalfe et al,2012),在相關研究中提出了巨大的挑戰。在這項研究中,我們成功地獲得了非洲肺魚(Protopterus annectens)的40GB染色體水平的基因組組裝,具有高度的完整性和連續性,并進行了系統分析,從基因組序列、跨越大多數組織的表達譜,到一些基因和調控元件的實驗驗證,以探索4.2億年前(Ma)從水到陸地的進化遺傳過程(Zhu et al,2009)。
? 結果
? 染色體水平組裝
? 根據短讀長序列的KMER分析(圖S1A)和流式細胞術(圖S1B),非洲肺魚基因組的大小估計約為40GB。 我們對長讀長序列進行測序,(503次覆蓋,N50讀數長度28.48kb)使用牛津納米孔測序技術(ONT)(圖S1c;表S1)。 結合短讀序列測序、光學圖譜和Hi-C技術,我們得到了17條染色體的染色體集合(圖S1D),范圍從862Mb到5.28 GB和12640個未放置的小支架(總共126 MB).組件的最終長度為40.05 GB,N50為2.8 GB(表1). 組裝染色體的數目和長度與肺魚核型一致(圖S1E)(Suzuki和Yamanaka,1988). 超過97.3%和95.2%的基因組區域可分別被長讀數和短讀數覆蓋20倍(圖S1F) 此外,對于短對讀數,96.6%可以正確配對,表明裝配的連續性較高.然后使用硬骨魚類中總共178個超保守元件(UCEs)來評估組裝的完整性,171個(96.07%)可以與組件對齊.通過比較,169和158可以與腔棘魚(Amemiya et al,2013)和美西螈(Nowoshilow et al,2018)基因組進行比對.
? 我們進一步對來自兩個個體的14個樣本的120GB的PacBio全長cDNA數據和227GB的短讀RNA測序(RNA-Seq)數據進行測序,并將它們組裝成轉錄本數據集,包括分別來自全長和短讀RNA-seq的150Kilo和4.1百萬轉錄本(表S1)。 基于轉錄本數據集和脊椎動物的同源蛋白質,我們在基因組中鑒定了19,457個蛋白質編碼基因,包含95.4%脊椎動物中完全保守直向同源物和Busco分析(表1)(Seppey等人,2019),四足動物中92.0%的完全保守直向同源物. 肺魚和腔棘魚/美西螈/青蛙之間相似的基因數量和KS分布(圖S1g;表S2)表明,除了祖先脊椎動物共有的兩輪WGD外,最近沒有發生全基因組復制(WGD),轉座因子(TES)的擴增可能是導致非洲肺魚基因組大小較大的主導力量,我們將在下文中說明. 然后,我們在肺魚和西方爪蛙之間鑒定了11,837個1:1直向同源基因(Hellsten et al,2010),其具有高質量的染色體水平基因組組裝,以檢查兩個物種之間的染色體關系. 共線性圖顯示,兩個物種的同源染色體片段可以清楚地識別(圖1A)。
? 從8個脊椎動物物種的5,149個1:1直向同源基因重建的系統發育關系證實,肺魚是與四足動物最接近的姐妹譜系(圖1B)。 盡管串聯基因樹的Bootstrap值得到了100%的支持,但在單基因樹的拓撲結構中存在廣泛的異質性(圖S1h),這表明在葉鰭動物的早期分化過程中存在一定程度的不完全譜系分類.肺魚和四足動物的分歧時間估計為419Ma(圖1b),大約是泥盆紀的開始。通過對近期人口歷史的推斷,我們發現這種非洲肺魚的數量在1Ma左右經歷了快速下降(圖1C),這與之前的一項研究一致,該研究報告了南非林波波流域在過去1Ma的長期干旱化,該流域是非洲肺魚的重要棲息地(Caley等人,2018)。 我們還對另一個肺魚個體進行了重新測序,并驗證了人口動力學結果.
? 基因組擴增
? 肺魚基因組的擴增主要是由TES的增殖引起的。 共61.7%的肺魚基因組被注釋為重復序列,代表24.7 GB(圖2a).大約15GB的整個基因組被注釋為既沒有功能也沒有重復序列. 這些區域最有可能代表一次古老的轉座爆發,隨后是長時間的退化,產生大量獨特的序列,即所謂的“ TES墓地”(Sirijovski et al,2005)。 最豐富的TE類型是長散在核元素(LINEs,11.5GB),長末端重復序列(LTR,7.7GB)和DNA轉座子(3.7 GB)。 其中,LINE/CR1(7.8 GB)和LTR/DIR(6.1GB)是構成最高比例的兩個子類. 然后,我們通過分析Kimura距離(Chalopin et al,2015)估計了歷史上的TE擴展活動,結果表明TE,特別是反轉錄轉座子,在過去7000萬年(MYR)內一直活躍(圖S2a)。 這些工商業污水附加費的近期活動占 9GB,峰值擴增速率為433Mb/MYR,表明非洲肺魚的基因組大小在過去的100MYR中逐漸增加,這與以前的工作一致,表明細胞大小在顯生宙逐漸增加(Thomson,1972)。
? TES的持續插入可能對基因組內容和基因調控產生影響。 非洲肺魚的平均和中值內含子長度非常長,并且幾乎16GB的基因組是內含子區域 肺魚的最長基因為18Mb,比美西螈(6的基因長得多。 7MB)和人類(2 5 MB)。 人類基因組中只有91個長度超過1Mb的基因,但肺魚中有5000多個。 相反,肺魚和其他脊椎動物的平均外顯子數和外顯子長度相似,非洲肺魚的物種特異性基因家族擴展與其他脊椎動物相似(表S2)。 通過對轉錄組數據的檢測,我們發現基因表達水平與基因長度之間沒有明顯的相關性;即使長度大于1Mb的基因也表現出與其他較短基因相似的表達水平(圖S2b)。 我們還發現,與其他物種相比,基因長度的變化對非洲肺魚的基因表達沒有任何大的影響(圖S2c)。 這些結果表明,為了保持基因表達平衡,肺魚中超長基因的轉錄效率可能有所提高。
? 非洲肺魚的TE含量與美西螈的情況非常不同,美西螈的基因組大小為32GB(圖2A)。 一致地,它們的域內容也是不同的(圖S2d). 當我們仔細觀察HOXA基因簇的不同基因之間的距離時,很明顯,基因間/內含子延伸在非洲肺魚和美西螈中是獨立發生的,因為它們是由不同類型的TES增殖引起的(圖2B)。 這些觀察結果與先前的比較系統發育分析一致,表明它們的基因組大小是獨立增加的(Organ et al,2016)。 盡管非洲肺魚和美西螈具有獨立的基因組擴增,但它們都具有大量的RVT_1結構域(圖2C),編碼逆轉錄酶,該酶總是由反轉錄轉座子攜帶. 在266種脊椎動物中,RVT-1的數量與基因組大小呈正相關(表S3),在非洲肺魚中有超過5.2百萬個,而在小鼠中只有61631個,這意味著反轉錄轉座子是基因組擴增的主要驅動力。這些RVT_1結構域被發現廣泛分布在整個非洲肺魚基因組中(圖S2e),這意味著積累過程已經持續了很長時間。
? 然后,我們通過檢查直向同源基因的內含子長度來研究跨物種的基因組擴展。 首先,我們觀察到肺魚基因內含子長度的增加與RVT_1結構域的數量呈線性相關(圖2D),反映了反轉錄轉座子在基因組擴增中的重要作用。 其次,我們觀察到非洲肺魚內含子長度的增加與美西螈直向同源基因的增加呈正相關(圖2e),表明較長的內含子積累了更多的TES。 一致地,我們觀察到內含子長度的增量與初始內含子長度之間的正相關性(圖2F)。 然而,具有較長初始內含子長度的基因傾向于具有較小的擴展率(圖2g),盡管它們的絕對增量較大(圖2F),這表明對基因長度的極端擴展的選擇。
? 先前的研究提出,紅皇后假說可以解釋TE活性與抑制策略之間的關系(Bruno et al,2019;麥克勞林和馬利克,2017年;Rogers等人,2018年)。 基于PFAM-A數據庫(El-Gebali et al,2019),我們在40種脊椎動物中檢測到16,826個結構域。 其中,只有54個結構域的數量與基因組大小呈顯著正相關(表S4)。 在非洲肺魚的54個領域中,有12個領域的數量超過1000。 12個結構域中有7個與TES相關,3個是鋅指蛋白結構域,1個是纖絲結構域,1個是KRAB結構域。 有趣的是,KRAB結構域和其中一個鋅指蛋白結構域(ZF-C2H2)一起形成了Kruppel相關的盒式鋅指蛋白,其已被證明在胚胎干細胞中轉座因子的沉默中發揮重要作用(Imbeault et al,2017)。 此外,在分析的266種脊椎動物中,肺魚具有最高數量的KRAB結構域(圖2C;表S3),并且含有KRAB結構域的基因(KZFPS)也傾向于在肺魚的卵巢中高度表達(圖S2F)。 這在很大程度上不同于含有RVT_1的擴展基因家族,后者傾向于在包括卵巢在內的所有組織中具有低表達水平(圖S2F)。 這表明紅皇后假說可能適用于肺魚的情況,因為在肺魚中進化出了更多的KRAB結構域和含有KRAB結構域的基因的高表達,可能是為了抑制TE活性。 總之,上述結果表明,非洲肺魚基因組在進化出更高的TE抑制和長基因轉錄能力的同時,也具有去除垃圾DNA的能力。
? 硬骨魚類的祖先核型
? 通過使用6個物種的染色體信息,包括白斑竹鯊(Zhang et al,2019),Bichir(Bi et al ,2021),斑點雀鱔(Braasch et al,2016),非洲肺魚(P Annectens)、西方爪蛙(Hellsten et al,2010)和雞(Warren et al,2017),代表了脊椎動物的主要譜系,共重建了32條原染色體(圖3A;表S5硬骨魚類最后共同祖先(LCA)的),這與之前的估計一致(Nakatani等人,2007年) 雖然從硬骨魚的LCA到輻鰭魚的LCA觀察到了兩次分裂事件(表S5),但在從硬骨魚的LCA到四足動物的LCA的進化過程中,沒有觀察到主要的染色體融合/分裂事件(圖3A)。
? 此外,我們注意到原始染色體11-20和13-28在肺魚和斑點雀鱔中應該是獨立融合的,因為它們在雞、蛙、比希爾或鯊魚中沒有融合(圖3B和3C)。 在斑點雀鱔和西爪蛙之間以及肺魚和比希爾之間也觀察到類似的獨立融合(圖S3a和S3b;表S5) 不同譜系中共享融合事件的存在表明,染色體融合事件可能與原始染色體本身的某些特征有關。
? 從硬骨魚類到四足動物高度保守元件、基因和特異表達基因的進化分析
? 我們利用12種硬骨魚類(包括軟骨魚類、輻鰭魚類和肉鰭魚類)的基因組,鑒定了不同譜系的高度保守元件(HCEs)。 肉鰭魚類、肺魚-四足動物和四足動物的CA分別獲得2,157、1,191和4,916個HCE。此外,在肉鰭魚類、肺魚-四足魚類和四足魚類的CA中分別丟失了388、559和394個HCEs,但在軟骨魚類和鰭魚中存在。 這些HCE包含保守的非編碼元件(CNEs)和編碼元件 此外,從5個物種的9個組織的220個樣品的轉錄組中,包括鱷雀鱔、比奇魚、肺魚、青蛙和小鼠(等。 ,2021),我們觀察到40個基因在四足動物、肺魚和輻鰭魚中經歷了組織特異性的表達模式變化(表S6) 這些HCE和特異性表達基因的最重要的情況將在以下章節中討論。
? 呼吸系統的進化
? 肺表面活性劑被認為是肺進化的關鍵(Liem,1988)。 它們能降低肺泡的表面張力,有利于呼吸時肺的擴張和收縮。 先前的一項研究表明,表面活性劑中的膽固醇/磷脂比率(mg/mg)在輻鰭魚中要高得多,(0.2–0.27)而非洲肺魚和四足動物(0.05–0.075)(Daniels和Orgeig,2003年) 膽固醇的作用是微妙的,因為它可以賦予肺表面活性物質正確的液體和粘度(Orgeig和Daniels,2001),而過量的膽固醇抑制表面活性物質的功能(Leonenko等人,2007). 為了緩解這一矛盾,表面活性劑蛋白C(SP-C)有助于維持表面活性劑中膽固醇的存在,而不會造成功能損傷(Gogo mez-Gil et al,2009;Roldan等人,2016年)。 編碼SP-C的基因SFTPC被發現起源于重復,因為肉鰭魚類的MRCA和進一步的重復在非洲肺魚中產生了三個拷貝(圖4A)。 我們的原位雜交結果清楚地表明,它們確實在肺魚的肺中表達(圖4B),因此可能在調節肺表面活性物質中發揮作用.
? 與新進化的SFTPC基因一致,有三個基因在非洲肺魚、非洲爪蛙和小鼠的肺中高度表達,但不在比希爾和鱷雀鱔的魚鰾中表達,并且在功能上都與肺表面活性物質相關。其中之一(圖S4A),SLC34A2,在肺表面活性物質循環過程中運輸磷脂釋放的磷酸鹽中起關鍵作用(Izumi等人,2017)。 我們的原位雜交結果證實,SLC34A2在輻鰭魚的魚鰾中幾乎不表達,但在肺魚和四足動物的肺中高度表達(圖4C)。 先前的研究表明,SLC34A2在硬骨魚的腸道和腎臟中表達,以提高磷利用效率(Chen et al,2016,2017)。 SLC34A2在肉鰭魚類肺中的募集可以滿足對肺表面活性劑的更大需求。 另外兩個肺高表達基因(圖S4A),NKX2-1和NRP1,與肺表面活性物質的上調有關(Attarian et al,2018;Joza等人,2012年)。 我們鑒定了一種位于NRP1上游的肉鰭魚類特異性CNE(圖S4B)。 我們的體外報告基因分析實驗表明,CNE具有增強子活性(圖S4C),這可能改變了NRP1基因從輻鰭魚到肉鰭魚類的表達模式 總之,SFTPC的出現和肺表面活性物質循環能力的增強可能有助于非洲肺魚和兩棲動物之間的肺氧擴散能力(Jorgensen和Joss,2011)。
? 在導致四足動物LCA的譜系中發現了肺表面活性蛋白的進一步改變。在表面活性蛋白(SPS)的其余成員中,編碼SPb的sFTPb是家族中最古老的成員;它存在于所有硬骨魚中,但在軟骨魚中不存在(圖S4D)。 我們觀察到,雖然SFTPB基因在四足動物的肺中特異性表達,但它往往在輻鰭魚和肺魚的多種組織中更廣泛地表達(圖S4E)。 親水性表面活性蛋白SP-A和SP-D主要參與肺先天宿主防御系統(Haagsman和Diemel,2001)。 我們觀察到SP-A和SP-D編碼基因起源于四足動物LCA以來MBL2基因的重復(圖4D、S4F和S4G)。 此外,先前的研究表明FOXP1/2轉錄因子在肺發育中是必需的(Shu等,2007)。 我們觀察到位于FOXP1基因內含子區的兩個肉鰭特異性CNE和一個四足特異性CNE(圖4E),以及靠近FOXP2的一個四足特異性CNE(圖4F)。 我們的報告基因分析結果表明,這些CNE具有潛在的增強子活性(圖4G)。
? 所有這些結果表明,肺呼吸能力的進化可能經歷了三個階段。 第一步是硬骨魚類的共同祖先已經具有了最初的呼吸空氣的能力,正如Liem(1988年)和(Bi等人所揭示的。 2021)這也被本研究中觀察到的所有硬骨魚中存在的SFTPB所證實。 第二步是通過基因創新增加空氣呼吸能力,例如在肉鰭魚類的生命周期評價中,在FOXP1附近出現了SFTPC和CNES。 第三步可能源于進一步的基因創新,包括在FOXP2附近出現SFTPA、SFTPD和CNE,為四足動物譜系中的高級呼吸系統提供了最后的關鍵基礎。
? 五指肢的起源與陸地運動
? 五個手指的出現是脊椎動物從水到陸地轉變的標志性事件(Clack,2009)。先前的研究表明,HOXA13和HOXD13是手指形態發生所必需的(Za′ka′NY和Duboule,1999)。 HOXA11和HOXA13在四足動物肢體中的排他性表達(Davis et al,2007),而它們在鰭中有很大程度的重疊表達(Metscher et al,2005),可能在這一過程中發揮關鍵作用(Kherdjemil et al,2016)。 有趣的是,我們觀察到長度為67bp的四足特異性CNE,位于HOXA11上游200bp(圖5A),其與反義轉錄物HOXA11AS204和HOXA11AS205重疊。 先前的一項研究表明,HOXA11AS205的表達模式負責HOXA11和HOXA13的排他性表達,并有助于從多指肢轉變為五指肢(Kherdjemil et al,2016)。 我們的研究結果支持這一推論,這種四足動物特異性CNE可能是五趾肢起源的關鍵遺傳創新。 然后,我們在不同的四足動物譜系中研究了這種CNE(表S7)。 雖然它在兩棲動物、鱷魚、海龜和哺乳動物中高度保守,但它在蛇和鳥類的基因組中發生了相當大的改變(圖5B),這進一步表明它可能與手指的起源有關
? 從鰭到肢的轉變導致了四足動物肢的三個部分,從近端到遠端分別是莖足、軛足和自足。 通過確定頂端外胚脊(AER)的命運,發現兩種古老的放線菌蛋白(由AND1/2和AND3編碼)對鰭到肢的轉變至關重要(Zhang et al,2010),有趣的是,腔棘魚有兩個拷貝,而肺魚只有一個(AND1/2),四足動物失去了兩個拷貝(圖S5a) 轉錄組數據(Biscotti et al,2016)暗示了放線菌蛋白的進行性丟失,現在我們的基因組數據也證實了這一點 這一發現與之前的觀察結果一致,即橈骨也存在于現代肺魚和化石肺魚中(Johanson等人,2007;Jude等人,2014年)。 此外,我們發現HOXB13開始的約40個連續氨基酸(AAS)在非四足脊椎動物中高度保守,而在四足動物中已經丟失(圖5C)。 先前的研究表明,該基因在發育中的后肢的遠端間充質中表達(Carlson等,2001)。 HOXB13在蛋白水平上的改變可能與鰭肢轉換有關。
? 除了形態發生的變化外,四足動物還需要它們的軸突,特別是運動神經元,離開脊髓來支配四肢的肌肉。 前肢的軸突產生頸部擴大,而后肢/尾巴的軸突產生腰部擴大(Butler和Hodos,2005)。 HOXC10和HOXD10已被證明在建立小鼠腰椎運動神經元柱狀、分區和運動區身份中起關鍵作用(Wu et al,2008)。 兩個四足特異性CNE(圖5D)位于上游(3kb和2 HOXC10的5kb)可能與四足動物的陸地運動有關,我們的報告基因分析表明它們是候選增強子(圖S5b)。
? 潛在增強的抗焦慮能力
? 在脊椎動物從水到陸地的轉變過程中,大腦內發生的眾所周知的變化之一是在邊緣系統中,其中杏仁核的基本細分和連接在四足動物(布魯斯和尼瑞,1995年)中建立,也可能在肺魚(岡薩雷斯和諾斯卡特,2009年;諾斯卡特,2009年)。 通過全基因組掃描,我們鑒定了兩個新基因,NPSR1和NPS,它們出現在肺魚和四足動物的LCA譜系中(圖6A)。 這兩個基因分別編碼神經肽S受體(NPSR)和神經肽S(NPS),可以促進覺醒和抗焦慮樣作用(Xu et al,2004UNK6,適度的應激處理,并增加杏仁核UNK7的突觸抑制Dannlowski et al,2011;Medina等人,2014年;Streit等人,2014年)。 它們以前被認為只是四足動物特異性基因(Reinscheid,2007)。 我們的研究結果表明,NPSR1基因起源于肉鰭魚類中催產素受體基因的復制,并且主要在腦和脊髓中表達(圖6B)。 NPS從肉鰭魚類的前體序列重新起源(圖S5c)。 我們還觀察到它們在該物種的腦和脊髓樣本中表達的證據(圖6B),表明肺魚具有原始的NPS/NPSR系統 證據還表明,NPS是由杏仁核產生的(Xu等人,2007)。 結合這些結果,這對新起源的基因可能暗示了肺魚和四足動物譜系中抗焦慮能力的增強。
? 除NPS/NPSR外,杏仁核內的γ-氨基丁酸(GABA)是另一種用于控制恐懼和焦慮感的關鍵抑制性神經遞質(Babaev等人,2018b) 位于GABA相關基因編碼區的兩個硬骨魚類HCEs在譜系中缺失或插入,導致四足動物和肺魚的LCA。 第一個基因,IGSF9B,其產物具有6個氨基酸缺失(圖6C),被證明在GABA能中間神經元中強烈表達,并與NLGN2形成復合物作為抑制性突觸組織(Babaev et al,2018a;Woo等人,2013年)。 第二個基因,ARFGEF1,可以維持膜表面突觸后GABAA受體(Teoh等人,2020),具有含有兩個-AA插入的產物(圖S5D) 此外,在四足動物和非洲肺魚(表S6)的大腦中觀察到的唯一特異性表達的基因GH編碼生長激素 研究發現,杏仁核中GH的上調與恐懼記憶的建立有關(Gisabella et al,2016)。 總體而言,肺魚和四足動物共有的這些遺傳創新與先前的觀察結果一致,即四足動物樣杏仁復合體起源于導致肺魚和四足動物CA的譜系(Gonzagon lez et al,2010;Maximino等人,2013年)。
? 咽部重塑
? 隨著陸生脊椎動物的主要呼吸功能從鰓轉移到肺,鰓弓不再產生鰓。 鰓弓數量減少,從肉鰭魚類的5個減少到四足動物的4個或3個(Graham和Shone,2019) 基因HOXB3被認為在調節咽弓的發育中是重要的(Tomotsune等,2000)。 在大多數脊椎動物中,位于HOXB3上游4kb的CNE在四足動物中不再保守(圖S5E),這可能是兩個咽弓缺失導致選擇松弛的結果 同時,人類和其他四足動物胚胎發育中的第二弓被重塑以覆蓋更多的尾弓,這導致了后弓的內化和后端外部開口的喪失(Graham和Shone,2019)。 自從四足動物出現后,甲狀旁腺就從咽后囊出現;這些腺體負責調節體內儲存的鈣的釋放(Graham和Shone,2019),這一功能是通過輻鰭魚的鰓實現的(Okabe和Graham,2004) 研究發現,PAX1基因與第二弓后方的咽囊(Okada et al,2016)和甲狀旁腺(Su et al,2001)的發育直接相關。 我們鑒定了PAX1上游的四足特異性CNE,其可作為增強子(圖S5F和S5G)。 GCM2基因對于甲狀旁腺的分化和存活至關重要(Liu等,2007)。 我們注意到,該基因在輻鰭魚和非洲肺魚的鰓中高表達,而在爪蛙的鰓中低表達(圖S5h),這表明在四足動物中,相應的功能已經從鰓轉移到了甲狀旁腺。
? 肺魚的特化特征
? 非洲肺魚可以在泥地里夏眠幾個月甚至幾年,以度過干熱季節(Filogonio et al,2017)。 對6條非洲肺魚(進行夏眠處理。 Annectens)個體,收集并分析了6個夏眠個體和3個非夏眠個體的11個組織的轉錄組數據 我們發現夏眠和非夏眠個體之間的總體表達譜高度相似(圖S6A和S6B)。 在腦(超幾何檢驗中,下調的基因在激素活性中富集,調整后的P值=8.431013)和皮膚中含膠原的細胞外基質(調整后的P值=8 03103)(圖S6B) 在10個或更多組織中上調的10個基因中,有8個是熱休克蛋白基因(圖S6c)。 熱休克蛋白的全球表達增加可能在干燥和炎熱季節保護肺魚。 齒系模式是肺魚的另一個獨特特征,被認為在肉鰭魚類中高度衍生(喬和朱,2009)。 它們的單個牙齒呈放射狀排列,與牙板融為一體,不會因脫落而丟失。 在某種程度上,它們與盾皮魚的齒狀齒系相似,盾皮魚也從不脫落(Zerina和Smith,2005)。 我們在18種脊椎動物中檢測了51個已報道與牙齒發育相關的基因(Bei,2009 在大多數脊椎動物中存在的基因中,沒有一種在肺魚中缺失。 只有一個基因,PAX9,被發現在除肺魚以外的脊椎動物中保守的區域中具有顯著的特異性突變(圖S6D)。 此外,我們還在肺魚的PAX9基因中檢測到陽性選擇信號(圖S6E)。 PAX9決定了牙胚外觀的確切位置,該基因的突變與人類少牙有關(Suda et al,2011)。 肺魚中的特定突變可能導致其特定的齒系。
? 討論
? 肺魚基因組龐大,導致其基因組序列長期缺失,成為研究脊椎動物從水到陸的進化機制的巨大障礙。 結合ONT單分子測序技術、光學作圖和HI-C技術,我們成功獲得了高質量的非洲肺魚染色體水平的基因組組裝,這是迄今為止報道的最大的測序基因組.與最近發布的澳大利亞肺魚基因組(Meyer et al,2021)相比,其缺失了21%-35%的基因組序列,我們的組裝幾乎是完整的,并且更加連續,染色體N50大小加倍.我們的組裝也為非洲肺魚帶來了更好的基因注釋,并且在脊椎動物中的1:1直向同源物數量比澳大利亞肺魚高出7倍以上。 然而,這兩個可用的肺魚基因組為理解脊椎動物從陸地到水域的轉變和神秘的肺魚物種的進化提供了重要的資源。
? 我們的比較基因組分析顯示,脊椎動物向陸地的轉變涉及不同種類的基因創新。 有趣的是,除了四足動物的單系群外,沒有一個脊椎動物譜系成功地出現在陸地上。 考慮到非硬骨魚的輻鰭魚仍然保留著原始的呼吸系統(Liem,1988),并且它們已經擁有了陸地生命所必需的大部分基因(Bi et al,2021),我們提出了水到陸地進化的三步方案:首先,硬骨魚的共同祖先進化出了最初的呼吸空氣的能力;然后,與空氣呼吸能力相關的遺傳創新(E。 G 新基因SFTPC和SLC34A2的募集),神經系統(E G 新基因NPS和NPSR)以及其他改進使得肺魚和四足動物的CA能夠暫時離開水;最后,四足動物的CA獲得了適應陸地生活的呼吸和運動系統。 值得注意的是,犁鼻受體(VR)基因在肺魚中的擴增可能并不像Meyer等人所認為的那樣是四足動物中的獨特創新。 (2021)因為盲鰻、一些輻鰭魚和一些四足動物也具有顯著擴大的VRS(Bi et al,2021),并且SALL1基因附近的HS72增強子不是肉鰭魚類的起源,因為它存在于除斑馬魚以外的輻鰭魚中 顯然,需要進行更多的研究,以揭示在這兩個最初的肺魚基因組學研究中觀察到的遺傳變化的具體功能作用。