長鏈非編碼rna(lncRNAs)已經成為多種生物過程和疾病的關鍵調控因子。雖然高通量測序使lncRNA的發現成為可能,但功能表征仍然有限。EVLncRNAs數據庫是第一個也是唯一的存儲庫,包含來自不同物種的所有經過實驗驗證的功能性lncRNAs。
繼2018年EVLncRNAs-V1.0和2021年EVLncRNAs-V2.0的版本之后,這次更新標志著從2020年5月15日至2023年5月15日對近25 000份出版物的重大擴展:
- 它包含了所有類別lncRNA數量的實質性增長:功能性lncRNA增加154%,相關疾病增加160%,lncRNA-疾病關聯增加186%,相互作用增加235%,結構增加138%,環狀RNA增加234%,耐藥lncRNA增加235%,exosomal lncRNAs增加4724%。
- 更重要的是,它納入了其他信息,包括功能分類、詳細的相互作用途徑、同源lncRNA、lncRNA位置、COVID-19、相分離和類器官相關的lncRNA。
- 網頁界面在瀏覽、可視化和搜索方面得到了實質性的改進
- 對ChatGPT進行了信息提取和功能概述測試,并指出了其局限性
EVLncRNAs 3.0代表了實驗驗證的功能lncRNA的最廣泛的策劃資源,將作為揭示新興lncRNA功能不可或缺的平臺。
數據庫官方網址:https://www.sdklab-biophysics-dzu.net/EVLncRNAs3/#/
數據統計
新版本的EVLncRNAs-V3.0包括:162個species,6195 EVlncRNAs。
還加入了當下最熱門的話題:CHatGPT 以及類器官 Organoid 相關詞條。
CHatGPT:利用ChatGPT(https: //chat.openai.com)從文獻摘要中提取有用信息的可能性。
看了一下不同物種的EVlncRNA,貌似只有人的最多,其他的基本都在1k以下:
不同版本的比較
圖A:在三個版本的數據庫中,經過實驗驗證的功能性lncRNA數量的前10個物種
圖B:在該數據庫的三個版本中,報道最常見的功能性lncRNA
lncRNA與疾病的相關性
圖A:條目數量最多、相關lncRNA最多的前15種疾病
圖B:數據庫中與疾病、癌癥或非癌癥相關的前15個lncRNA
新增內容:功能分類
通過基于基因本體論功能類別的分類,可以更好地闡明lncRNA的多種功能作用。
下圖為:每個功能類別中的前10個功能。(A)生物過程。(B)細胞組件。(C)分子功能。(D)臨床應用程序。
數據庫主要界面
數據下載
好像非常簡單:https://www.sdklab-biophysics-dzu.net/EVLncRNAs3/#/download
直接是一個壓縮包:
文獻信息:
作者單位為:山東省生物物理重點實驗室,德州大學生物物理研究所 聯合 系統與物理生物學研究所(深圳Bay實驗室)
Nucleic Acids Research, gkad1057, https://doi.org/10.1093/nar/gkad1057
EVLncRNAs 3.0: an updated comprehensive database for manually curated functional long non-coding RNAs validated by low-throughput experiments