基因家族是最近比較火的一個研究話題,被稱為打開生物學問題百寶箱的鑰匙,接下里幾周抽時間和大家簡單分享一些我最近學到的東西。
基本概念介紹
基因家族(gene family),是來源于同一個祖先,由一個基因通過基因重復而產生兩個或更多的拷貝而構成的一組基因,它們在結構和功能上具有明顯的相似性,編碼相似的蛋白質產物, 同一家族基因可以緊密排列在一起,形成一個基因簇,但多數時候,它們是分散在同一染色體的不同位置,或者存在于不同的染色體上的,各自具有不同的表達調控模式。
按功能劃分:把一些功能類似的基因聚類,形成一個家族,例如GH家族(糖苷水解酶家族)等。
按照序列相似程度劃分:一般將同源的基因放在一起認為是一個家族,一般使用orthoMCL進行聚類
motif是蛋白質分子具有特定功能的或者作為一個獨立結構域一部分相近的二級結構聚合體
常見的基因家族例子(以植物的為例)
NBS-LRR抗病基因家族: NBS-LRR(nucleotide-binding site and leucine-rich-repeat)是植物中最大類抗病基因家族之一。
MADS-box基因家族是植物體內的重要轉錄因子,它們廣泛地調控著植物生長、發育和生殖等過程。在植物中參與花器官的發育,開花時間的調節,在果實、根、莖、葉的發育中都起著重要的作用。
熱激蛋白70家族(HSP70)是一類在植物中高度保守的分子伴侶蛋白,在細胞中協助蛋白質正確折疊。
鈣依賴蛋白激酶(CDPK)是一類僅依賴Ca2+而不依賴鈣調素的蛋白激酶,參與調控多種信號轉導途徑,而膜結合脂肪酸脫氫酶(membrane-bound FAD)是一類不飽和脂肪酸合成途徑的關鍵酶。
這兩類基因分別在低溫環境脅迫下的信號轉導和穩定質膜性質中起著非常重要的作用。
WRKY基因家族是植物前十大蛋白質家族之一,大量研究表明, WRKY 基因家族的許多成員參與調控植物的生長發育、形態建成與抗病蟲等。
常規的基因家族分析流程

在這些常規的生信分析后,一般的文章還會加上一些濕實驗去驗證,例如不同非生物條件下基因家族的表達等(PCR為主)。
最近發表的基因家族文獻
如果你想研究基因家族,閱讀別人的文獻,從中體會其研究的思路與方法是必不可少的,下面給大家推薦一些近期發表的文章。
auxin response factor gene family
這周主要是熱一熱身,后面會按照每個生信分析的點,結合實例詳細給大家介紹如何進行基因家族的生物信息分析。敬請期待!
參考鏈接:https://www.zhihu.com/question/59831019/answer/180395918
繼續和大家分享在推特上看到的有趣的內容:
很多人都沒有意識到安裝生信工具并沒有那么簡單,并且就算你安裝好了該工具,你用該工具運行你自己的數據遠遠沒有想象那么簡單。就像下圖提到的,作為一個生信工作者,你是否也遇到這一系列頭痛的經歷?
歡迎大家在評論區留言,分享一些你在生信中所遇到的頭痛經歷。
