科學家將蛋白質序列轉化為曲譜,寫首歌就能創造蛋白質

2020-11-29 騰訊網

視頻來源 / 《自然》 譯 / 魏昕宇 編寫 / 小貝

視頻時長2分21秒,請在WiFi處觀看。

大自然有7個音階,作曲家們將它們自由組合,通過將一系列音調和長短不同的音符連接起來創造出優美動聽的音樂。

人體內有20種不同的胺基酸,細胞將不同特徵的胺基酸連接起來,就合成了人體必須的蛋白質。

最近,一個研究小組通過將蛋白質的序列轉化為音樂曲譜,再利用人工智慧將聲音轉換為全新的蛋白質,他們將藝術和生物這兩種完全不同的門類巧妙地銜接了起來。

這項實驗也被雜誌《美國化學會·納米》進行了報導。

我們都知道,為了合成蛋白質,細胞中名為核糖體的細胞器根據DNA確定下的序列,然後將20種胺基酸中的一種添加到不斷增長的分子鏈段上。

而胺基酸的屬性,以及最終形成的蛋白質摺疊成的複雜形狀,決定了蛋白質分子如何在生物體內起作用。

為了更好地理解蛋白質的結構,並可能設計出具有人們期待的屬性的新的蛋白質,Marcus Beuhler和同事們想到可不可以將蛋白質的胺基酸序列和音樂聯繫起來呢?

如果將每一種胺基酸都設置的按照特定的頻率振動,研究人員就可以將這些頻率轉換為人類可以聽到的聲音。

通過這種方法,他們產生了由20個獨特音符組成的一個體系。

不過,與音樂中的音符不同的是,每個胺基酸的「音符」是由許多不同的頻率疊加而來,與和弦類似。

Beuhler和同事們隨後將多個蛋白質的胺基酸轉化成樂譜,每個音符的長短取決於組成蛋白質分子的不同3D結構。

然後,研究人員利用人工智慧來識別出與特定蛋白質結構對應的音樂旋律,電腦隨後創作出曲譜,再將曲譜轉化成自然界從未存在過的蛋白質。

研究人員表示,這種方法除了為蛋白質設計和研究與疾病有關的變異提供工具,還有助於向更廣泛的公眾解釋蛋白質。

他們甚至開發了一個安卓手機應用,讓使用者可以創造出屬於他們自己的基於生物的樂曲。

- END -

本文中的視頻來源於《美國化學會》,文章由科海識貝編寫。

相關焦點

  • 哼唱一段旋律,AI就能創造一種「全新」蛋白質
    蛋白質在生命中的重要作用不言而喻,它是生命的基石。而我們機體內合成蛋白質的過程也是相當複雜,不僅涉及到胺基酸活化等一系列過程,還受體內各種生化物質的調控。此外,蛋白質複雜的三維摺疊結構,讓想要人工合成蛋白質的科學家們望而卻步。
  • 哼唱一段旋律,AI就能創造一種 「全新」 蛋白質
    而我們機體內合成蛋白質的過程也是相當複雜,不僅涉及到胺基酸活化等一系列過程,還受體內各種生化物質的調控。此外,蛋白質複雜的三維摺疊結構,讓想要人工合成蛋白質的科學家們也望而卻步。當地時間 3 月 17 日,麻省理工學院科學家們給帶來了一個新成果,他們通過將蛋白質的複雜結構轉化成樂譜,隨後給予電腦一個種子序列,人工智慧系統就能設計出一種自然界中從未見過的 「全新」 蛋白質。
  • 把蛋白質序列編碼成樂譜,會奏出怎樣的音樂?
    如何創造出全新的蛋白質?麻省理工學院(MIT)的研究人員可能會告訴你:哼首小曲兒就能行!在將科學與藝術完美結合的道路上,MIT的研究人員開發出了一套非常厲害的系統,它能將所有生物的基本組成——蛋白質的分子結構,轉換成類似於音樂段落的聲音。然後,他們可以讓音樂發生一些變化,再逆轉這一過程,就將音樂轉化成了自然界中從未見過的新蛋白質。
  • 科學家腦洞大開,將胺基酸序列轉化為音樂
    化學者在前文曾介紹到,周期表、DNA雙螺旋和化學光譜圖裡隱藏的天籟之音,都被科學家發掘出來。最近美國化學學會在介紹一個蛋白質設計中的應用研究時,提出將胺基酸序列轉化為音樂成分的方法,一起來了解一下。研究人員將蛋白質序列翻譯成音樂作品作曲家將不同音高和持續時間的音符串在一起以創作音樂。類似的,細胞將具有不同特徵的胺基酸連接在一起以製備蛋白質。
  • MIT新研究:用AI把胺基酸序列編碼成曲子,還能「創造」新蛋白質
    在科學和藝術的有機結合下,麻省理工學院(MIT)的研究者開發出了一套系統,用於將蛋白質的分子結構(所有生物體的基本構成物質)轉化為一小段音樂片段。然後,將這個過程反轉過來,如果你改變幾個音符,還能「創造出」一些自然界中從未見過的全新蛋白質。
  • 將分子結構轉換成聲音,可深入了解蛋白質結構,並創造出新變化!
    想要創造一種全新蛋白質,有用的性質?沒有問題!麻省理工學院研究人員將科學與藝術驚人地結合起來,開發出一套系統,可以將蛋白質的分子結構(所有生物基本組成部分)轉換成類似於音樂段落的可聽聲音。然後,通過逆轉這一過程,可以在音樂中引入一些變化,並將其轉化為自然界中從未見過的新蛋白質,雖然這並不像哼唱一種新蛋白質存在那麼簡單,但這個新系統已經很接近了。
  • 弗雷德裡克·桑格(圖)|蛋白質|序列|諾貝爾化學獎_網易新聞
    1958年,因完整定序胰島素內的胺基酸序列,且證明蛋白質具有明確構造,桑格獲得首個諾貝爾化學獎;1970年代,桑格又提出了快速測定脫氧核糖核酸(DNA)序列的 「雙脫氧鏈終止法」,除了對生物技術藥物的發展至關重要,也為之後的科學家解碼人體所有基因提供了最基本的解讀工具。11月19日,桑格在英國劍橋郡阿登布魯克醫院離世,享年95歲。
  • ...界AlphaGo」更厲害,MIT:給我一個胺基酸序列,就能告訴你蛋白質...
    然後,將蛋白質結構與胺基酸序列編碼成嵌入(embedding)這種數字表示,隨機組對送入模型中。 這種嵌入與NLP中的上下文表示類似,兩種嵌入越相似,單詞出現在同一個句子中的概率就越大。 像單詞對語義的影響一樣,胺基酸是蛋白質的「單詞」,蛋白質就是整個「句子」,嵌入包含著每個胺基酸序列與另一個胺基酸序列的相似性信息,機器學習模型可以根據嵌入預測每個胺基酸對整個蛋白質功能的影響。
  • 生命的起源:原始蛋白質怎麼來的
    近日,以色列魏茨曼科學研究所和耶路撒冷希伯來大學的科學家在《美國國家科學院院刊》發表論文稱,他們重建了與現代蛋白質的祖先非常相似的蛋白質序列,並且這些原始蛋白質可能已經能夠形成活細胞。蛋白質是活細胞的重要組成成分,科學家們一直認為最早的蛋白質出現在細胞和生命之前。
  • 【逝者】弗雷德裡克·桑格(圖)|諾貝爾化學獎|蛋白質|序列_網易新聞
    1958年,因完整定序胰島素內的胺基酸序列,且證明蛋白質具有明確構造,桑格獲得首個諾貝爾化學獎;1970年代,桑格又提出了快速測定脫氧核糖核酸(DNA)序列的 「雙脫氧鏈終止法」,除了對生物技術藥物的發展至關重要,也為之後的科學家解碼人體所有基因提供了最基本的解讀工具。11月19日,桑格在英國劍橋郡阿登布魯克醫院離世,享年95歲。
  • 最早的蛋白質,是怎麼產生的?
    實驗中重構的蛋白質(HhH)2與現代DNA分子的結合丨[2] 他們設計了一系列實驗來檢驗這種可能性,他們重構了一種蛋白質序列,這些蛋白質序列很可能與失散多年的祖先蛋白質非常相像
  • 比「生物界AlphaGo」更厲害,MIT:給我一個胺基酸序列,就能告訴你蛋白質功能
    他們的論文《Learning protein sequence embeddings using information from structure》將在今年5月的ICLR學術會議上公布。如何預測蛋白質功能研究人員先讓模型學習一些特定蛋白質的功能,將蛋白質結構編碼成表示,用不同蛋白質結構相似性來監督模型。
  • 困擾科學家近半個世紀的蛋白質摺疊難題破了!這回又是AI揭的秘
    蛋白質在人體中含量如此之高並不奇怪,因為蛋白質是生命活動的主要承擔者,沒有蛋白質就沒有生命。人類的生命活動須臾都離不開蛋白質的參與。無論是身體收縮肌肉、眼睛感知光亮,還是消化系統將食物轉化為能量,我們身體的每一項功能之所以能夠正常行使,幾乎都依賴於蛋白質。目前地球上已知的蛋白質大約有兩億種,每一種蛋白質都有獨特的空間結構。
  • Current Opinion in Structural Biology:從蛋白質序列到功能的預測
    然而,這些序列信息還沒有被很好的註解。例如,只有不到1%的蛋白質序列有已知的功能。如果我們能夠利用計算生物學的方法,大量註解這些序列信息,就能夠積累很多對於蛋白質結構的認識,最終達到從量變到質變的飛躍。來自美國紐約霍華德醫學中心的科學家們討論了基於蛋白質功能注釋結構的新方法。
  • 新的深度學習方法從胺基酸序列預測蛋白質結構
    生命所必需的幾乎所有基本生物過程都是由蛋白質完成的。它們創造並保持細胞和組織的形狀;構成催化維持生命的化學反應的酶;充當分子工廠,運輸工具和電機;用作蜂窩通信的信號和接收器;以及更多。現在,哈佛醫學院的一位科學家使用了一種稱為深度學習的人工智慧來預測基於其胺基酸序列的任何蛋白質的三維結構。系統生物學家Mohammed AlQuraishi於4月17日在Cell Systems上在線報導,詳細介紹了一種計算確定蛋白質結構的新方法 - 實現與當前最先進方法相當的精確度,但速度提高了一百萬倍。
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    如今,該公司已將人工智慧技術應用到最具挑戰性的科學研究問題中,其剛剛推出的 AlphaFold 可以僅根據基因「代碼」預測生成蛋白質的 3D 形狀。DeepMind 表示,AlphaFold 是「該公司首個證明人工智慧研究可以驅動和加速科學新發現的重要裡程碑」。
  • 蛋白質序列分析和結構預測
    >(5)點擊序列接受號NP_004788 (adiponectin precursor; adipose most abundant gene transcript 1 [Homo sapiens])後顯示序列詳細信息;(6)將序列轉為FASTA格式保存(參考上述步驟使用SRS信息查詢系統檢索人脂聯素蛋白質序列);2、使用BioEdit軟體對人脂聯素蛋白質序列進行分子質量、胺基酸組成和疏水性等基本性質分析
  • 科學家將冠狀病毒蛋白質結構轉換成了音樂
    他們的研究成果可能有一天能幫助科學家找出能阻止病毒傳播的最好方法,從而開發出潛在的治療方法,並希望預防未來的致命爆發。Buehler認為,音樂創作的層次元素(如音高、音域、力度和節奏等)類似於蛋白質結構的層次元素。
  • 除了下圍棋 AI還能預測"難纏"的蛋白質結構
    蛋白質在人體中含量如此之高並不奇怪,因為蛋白質是生命活動的主要承擔者,沒有蛋白質就沒有生命。人類的生命活動須臾都離不開蛋白質的參與。無論是身體收縮肌肉、眼睛感知光亮,還是消化系統將食物轉化為能量,我們身體的每一項功能之所以能夠正常運轉,幾乎都依賴於蛋白質。目前地球上已知的蛋白質大約有兩億種,每一種蛋白質都有獨特的空間結構。
  • 科學家揭開人體內能量轉化奧秘 蛋白質能量轉移
    首頁 » 科學家揭開人體內能量轉化奧秘 蛋白質能量轉移 科學家揭開人體內能量轉化奧秘 蛋白質能量轉移 來源:雅虎科技 2006-11-29 10:40