錯義突變的位點危害性分析(一)

2021-02-25 大水讀書筆記

對某種特定疾病進行遺傳學篩查時,總會得到一些新突變。最近在對這些突變進行功能學上的討論,用在論文裡面,做一些筆記給大家分享,大佬有更好的辦法歡迎留言。

致病突變熱點分析

如果希望比較完整的收集pubmed中報導過的致病突變,最近試了一個很好用的工具mastermind,它把pubmed中文章正文和附錄表格中涉及到突變的欄位全部抓取出來形成一個表格,可以把它貼出來。註冊後有三天的免費試用期。無奈我的試用期用完了,只好用clinvar資料庫的位點,雖然這個位點是不全的,我們是要看致病突變喜歡聚集在哪裡,全不全也沒關係。

首先,下載clinvar資料庫中pathogenic、likely pathogenic的錯義突變位點。至於剪切、無義、移碼突變這些功能喪失突變(loss of function,LOF),出現在結構域任何位置都會導致後面蛋白截短,所以沒有必要討論。

把左邊的pathogenic、likely pathogenic和missense點上,可以看到有66條結果,右邊Download下載,得到一個txt文件。

在linux或者Mac電腦的終端下面,用腳本處理得到的clinvar_result.txt文件,把胺基酸變化的信息拿出來:

sed '1d' clinvar_result.txt | cut -f 1 | sed 's/.*(p.\(.*\))/\1/' | tr "\n" " " >out.txt

之所以輸出一個out.txt,是為了可以檢查一下,作為棒棒糖圖 lollipops 的輸入文件。偶爾會混進來一些不是胺基酸信息的東西,手動刪掉就可以了。棒棒糖圖可以從https://github.com/joiningdata/lollipops下載。

用clinvar的致病位點信息,加上自己發現的新突變,跑一個lollipops,這步需要網絡。自己的突變加上一個顏色,如果有多個突變就一直往後面貼。

./lollipops -legend FGFR1 把out.txt裡的東西貼到這裡 自己的新突變#7f3333

可以得到一個svg的文件,可以用Adobe Illustrator編輯。如果嫌麻煩,直接末尾加參數-o=filename.png -dpi=300,導出png格式。

兩個棕色的位點是我自己的,其它紅色是資料庫裡的位點。說明兩個新突變附近是已經有致病突變支持的。

可惜clinvar不能抓出來位點出現頻率的信息,有哪位會搞請給我留言。

位點保守性

很多文章裡會放一個位點在多個哺乳動物中同源基因的序列比對結果,如果這個位點所在區域非常保守,它通常預示著有比較重要的功能。這個序列可以從UCSC網站中拿到。比如說我需要FGFR1基因的 V793I 這個位點的情況,需要把基因組坐標輸入到網站搜索欄,注意注釋版本,我的是hg19。網址如下:https://www.genome.ucsc.edu/cgi-bin/hgTracks?db=hg19

搜索欄輸入:chr8:38271232

會直接跳到你要的這個鹼基。在右上角的zoom out中縮小100倍範圍,直接就可以得到結果。可以看到這個位點在小鼠、狗、雞、大象什麼的都是保守的。

然而這個圖寫文章肯定是用不了的。接下來我們要拿到這一段fasta序列。

點擊Table Browser工具。

使用Table Browser工具,照下面參數填好。可以position填FGFR1基因的坐標區域,也可以在genome選項中,點擊identifiers,在裡面輸入FGFR1,是一樣的。output file取一個下載的文件名。

下一步是選擇需要哪些物種,在multiz46way這個資料庫裡隨便選一些就好了。

然後點擊get output,fasta文件就下載好了,使用MEGA打開。MEGA下載地址:https://www.megasoftware.net/

用MEGA打開的比對序列是不是好看很多了呢。

找到想找的位點很容易,在左下角輸入V793I裡面對應的數字793,就找到了。

或者看到上面UCSC瀏覽器裡紅框圈出來的序列了吧,搜索DSVFS這五個字母去查找。至於為什麼不是按照圖片裡的順序SFVSD去找呢?因為FGFR1讀碼順序和參考基因組是反向互補的,UCSC上面會有密密麻麻的朝左箭頭來提示。

好了今天就搞這麼多。

相關焦點

  • 文獻中關於錯義突變的簡寫如何解讀?
    至於其他的癌症,CHEK2突變基因攜帶者罹患結腸癌風險往往較高,ATM突變攜帶者被認為患胰腺癌風險較高,但此觀點下的數據尚未令人信服。, an elevated risk of colon cancer was present for carriers of the missense mutation I157T in CHEK2 but not the common deletion c.1100delC in CHEK2.在波蘭的一項研究中,CHEK2第57位的異亮氨酸突變為蘇氨酸的人患結腸癌的風險升高
  • BRCA突變類型及位點影響乳腺癌、卵巢癌風險
    根據4月7日發表在JAMA的一項研究,BRCA1和BRCA2基因上特定位點的特定類型的突變,可改變乳腺癌或卵巢癌的風險。醫脈通對此進行了報導。特別有害的突變是無義突變,當無義突變介導的衰變未能破壞局部轉錄時,可使其產生過早的終止密碼子,會導致有毒的部分蛋白質的合成。錯義突變是這基因非常罕見的突變方式。研究人員使用的數據來自多國協作BRCA修飾基因組研究計劃(CIMBA),該研究根據突變類型、功能、其相關的位點,評估了癌症風險。首要研究終點是明確了乳腺癌或卵巢癌的診斷。
  • 如何查找並確定關注基因的SNP位點?
    經過近年檢測技術的發展,科研人員可以通過NGS或SNP晶片篩選與疾病關聯基因或區段,進而針對這個特定區段或基因上的SNP進行更為仔細研究,也有科研人員會通過已發表文章查詢到與其研究相關的基因,再通過對該基因的DNA序列變化分析遺傳機制,但如何查詢特定區段或基因上的有用SNP位點呢?
  • 《科學》:發現錯義突變的P53沒有促癌活性,但能促進腫瘤發展
    有人懷疑,可能這些突變讓P53蛋白從抑癌蛋白變成了促癌蛋白,不過,一直沒有證實。 為了搞清楚這些突變的作用。研究人員先是挑出了p53基因上最常見的6個錯義突變,在AML細胞中進行了研究。
  • 腫瘤全外的點突變有哪些分類呢?| 腫瘤全外專題
    這裡邊最常見的分類就是基因區同義突變和非同義突變,然後就是promoter區的SNP突變。另外,農學中取樣的植物組織往往是葉片,也不存在體細胞這一說。醫學相關研究中對突變的分類更加細緻,什麼是體細胞突變(somatic mutation)?|腫瘤全外一文也闡述了體細胞突變(somatic mutation)和胚系突變(germline mutation)的概念。
  • 基因表達+突變分析利器
    小夥伴們大家好呀,今天要為大家介紹的是於2020年9月1日發布的資料庫muTarget(http://www.mutarget.com/),分析實體瘤中基因表達變化和突變狀態的資料庫。muTarget資料庫的分析是基於R v3.5.2統計環境,從而進行數據處理步驟和算法開發。使用MAFtools R Bioconductor程序進行匯總。
  • 靶向外顯子組測序成功鑑定SMARCA4突變體功能特徵
    研究發現,在9,434名患者中存在一個或多個SMARCA4基因突變。其中,SMARCA4純合子突變在某些腫瘤類型中非常普遍,並與患者存活率降低有關。此外,該研究揭示了SMARCA4解旋酶結構域中以前未曾描述的熱點錯義突變,一些SMARCA4錯義突變部分或完全擺脫了旁系同源基因依賴。
  • 哈佛大學團隊發現白血病中TP53突變的功能
    哈佛大學團隊發現白血病中TP53突變的功能 作者:小柯機器人 發布時間:2019/8/9 12:59:18 美國哈佛大學Benjamin L. Ebert研究團隊在研究中取得進展。
  • 第五節 基因突變
    基因突變是指基因的核苷酸順序或數目發生改變。僅涉及DNA分子中單個鹼基改變者稱點突變(point mutation)。涉及多個鹼基的還有缺失、重複和插入。   2.體細胞突變和生殖細胞突變 基因突變可發生在個體發育的任何階段,以及體細胞或生殖細胞周期的任何分期。如果突變發生在體細胞中,突變的變異只能在體細胞中傳遞。因此體細胞突變不能直接遺傳下代。
  • 警惕,這些基因突變,癌症術後易復發
    圖3 與早期肺癌預後相關的基因突變位點研究者分析了這些基因的突變頻譜,進行了相關分層分析。最後僅發現TP53基因與I期肺腺癌患者是存在顯著相關的。如上圖所示,相比其他基因TP53存在很嚴重的截短突變(就是基因只能翻譯表達一半的蛋白質,沒有了實際的功能)。此外還有很長的錯義突變區域,這些地方的突變都嚴重改變了基因的功能。而其他幾個基因都是一些拷貝數的擴增。所以抑癌基因TP53的突變失活是與早期肺癌術後有顯著關係的。三、TP53基因的突變,如何識別與解讀?
  • 新冠病毒太狡猾 突變不讓人類察覺?這可能是誤解了
    論文對目前為止最大規模的 103 個新冠病毒全基因組分子進化分析,發現病毒株已發生了 149 個突變點,其中 101 個可歸類為 L 和 S 兩個亞型。:有媒體所稱的「新冠病毒已突變」系誤讀,正確理解應該為:新冠病毒可根據基因組不同的突變位點分為 L 、S 兩個類型,但這兩個突變型在病毒爆發的早期可能就已存在,並非近期突變而成。
  • 11326冰島人群的探究揭示:原來是這個基因發生了突變
    P值顯著的位點用紅色標表1 GWAS分析P值顯著結果首先,TAAR5基因上一個錯義突變位點p.Ser95Pro 與魚腥味的感知相關(pdiscovery= 1.3 x 10-11, b = -0.34 SD, 95% CI = -0.44, -0.24 )。
  • 一文解讀
    一般,原癌基因突變只有在特定的點發生突變,才能使蛋白具有更強的活性,不是隨便哪個位點或者哪種形式突變都可以的。如EGFR的19del、L858R這些位點,只有這些位點的特定突變形式才能造成EGFR蛋白特定的構象改變,蛋白持續激活.所以,針對這些特定的突變位點開發靶向藥物稍微容易些。
  • 土家族中一個先天性無虹膜家系的臨床特點和PAX6基因突變位點分析
    目的確認土家族中一個先天性無虹膜家系的PAX6基因致病突變並分析其臨床特點。方法實驗研究。詳細詢問家族病史並對該家系中所有7 例成員(4 例患者,3 例正常人)進行詳細的眼部檢查,採集家系成員及100例(50例土家族人和50例漢族人)正常對照者的外周靜脈血,提取DNA;對先證者PAX6基因的全部外顯子進行PCR擴增及測序;對家系中所有成員和正常對照者進行PAX6基因突變位點的驗證檢測。
  • 關於TP53基因突變和缺失,您需要知道的......
    TP53蛋白可分為多個功能區域,每個都有特殊的功能(http://p53.fr/):1)N末端(胺基酸1-100)包含兩個獨立的轉錄激活域(TAD,胺基酸 1-42和43-62)和mdm2蛋白結合位點(胺基酸13-29)。氨基末端也包含高度保守區域I(CHD I),另外,一個核輸出信號(NES)和脯氨酸富集區域(PRD,胺基酸64-92)也位於氨基末端。
  • 低頻突變在複雜疾病中的研究——精神疾病
    common variant常發現於非編碼區或編碼區的同義突變,而Rare variant常發現於編碼區,表現為錯義突變或無義突變。如上文提到,目前的研究重點逐漸轉向有害的Rare variant,而GWAS研究所基於的百萬計SNP晶片,這些SNP位點的MAF的頻度通常較高。因此通過SNP晶片很難找到Rare variant,那麼Rare variant的發現就要通過重測序的方法來發現。
  • PNAS:隱藏於HER2陰性乳腺癌中的HER2突變
    據近期發表在美國科學院院報上的文章稱,並非所有的HER2基因都會造成癌細胞的增殖與擴散,因此這種突變也不能用來預測HER2靶向藥物是否能夠產生緩解。大約5%的乳腺癌患者攜帶HER2錯義突變,錯義突變一般發生於無HER2基因擴增的情況下。
  • 「乳腺癌」P53基因突變導致亞裔乳腺癌患者預後不佳
    三陰性乳腺癌在非裔美國女性中更為常見,最近對194個腫瘤的基因組分析顯示,HR缺乏症的特徵增加,P53突變及結構變化更大,表明生物學更具侵略性。亞洲人的乳腺癌往往發生在年輕年齡段,絕經前,雌激素受體(ER)陰性和人表皮生長因子受體2(HER2)受體陽性的比例更高。最近對187例亞洲早髮乳腺癌的基因組分析表明,P53突變的患病率更高,免疫信號豐富。
  • 2021年中考生物知識點:突變分類
    獲得功能的突變   獲得功能的突變是指發生的突變讓原本應該是不表現的基因產生活性,進而影響細胞功能,這樣的突變多半需要染色體程度的突變較有可能產生,而最常發生獲得功能的突變就是癌細胞。   以突變機理分類   點突變   DNA序列中涉及單個核苷酸或鹼基的變化稱為點突變。
  • 食用菌誘變育種和基因突變指的是什麼?基因突變具體分為哪幾點?
    突變所引起的遺傳信息改變,既可能是不同胺基酸相互置換的錯義突變,也可能是突變胺基酸與野生型胺基酸相同的同義突變,還可能鹼基突變後形成終止密碼子,它是使蛋白質合成提前終止的無義突變。基因突變是生物進化的原動力。具有某種染色體畸變型或基因突變型的細胞或個體,被稱為突變體。