想要創造一種全新蛋白質,有用的性質?沒有問題!麻省理工學院研究人員將科學與藝術驚人地結合起來,開發出一套系統,可以將蛋白質的分子結構(所有生物基本組成部分)轉換成類似於音樂段落的可聽聲音。然後,通過逆轉這一過程,可以在音樂中引入一些變化,並將其轉化為自然界中從未見過的新蛋白質,雖然這並不像哼唱一種新蛋白質存在那麼簡單,但這個新系統已經很接近了。
它提供了一種將蛋白質胺基酸序列轉換成音樂序列的系統方法,利用分子的物理特性來確定聲音。雖然這些聲音是為了讓人類能夠聽到而被調換的,但是這些音調和它們之間的關係是基於每個胺基酸分子本身實際振動頻率,這些振動頻率是用量子化學理論計算出來。該系統由麻省理工學院(MIT)土木與環境工程系系主任、McAfee工程學教授馬庫斯·比勒(Markus Buehler)、博士後遲華宇(Chi Hua Yu)和另外兩人共同開發。
該系統將20種胺基酸轉化成20個音調的音階,胺基酸是組成蛋白質鏈的組成部分,任何蛋白質的胺基酸長序列都會變成音符序列。對於習慣了西方音樂傳統的人來說,這樣的音階聽起來並不熟悉,但是當聽眾熟悉了這些聲音之後,很容易就能辨別出它們之間的關係和區別。在聽了這些旋律後,現在能夠分辨出特定的胺基酸序列,這些胺基酸序列與具有特定結構功能的蛋白質相對應,這是一個貝塔表,或者是一個阿爾法螺旋。
整個概念是為了更好地理解蛋白質及其大量的變異,蛋白質構成了皮膚、骨骼和肌肉的結構材料,同時也是酶、信號化學物質、分子開關和許多其他功能材料,構成了所有生物的機械。但是它們的結構,包括摺疊成決定蛋白質功能的形狀方式,是極其複雜的。蛋白質有自己的語言,而我們不知道它是如何運作的,不知道是什麼使絲蛋白成為絲蛋白,也不知道什麼樣的圖案反映了什麼樣酶的功能。
通過將這種語言翻譯成人類特別熟悉的另一種形式,並允許信息的不同方面以不同的維度編碼(音高、音量和持續時間)布勒和團隊希望能收集到關於不同蛋白質家族之間關係和差異及其變化的新見解,並以此作為探索蛋白質結構和功能的許多可能調整和修改的一種方式。與音樂一樣,蛋白質結構也是分層的,在不同的長度或時間尺度上有不同的結構層次,然後,研究小組使用人工智慧系統來研究由多種不同蛋白質產生的旋律。
讓人工智慧系統在音樂序列中引入微小的變化,或者創造出全新序列,然後將聲音翻譯回與修改過或新設計版本相對應的蛋白質。通過這個過程,能夠創造出現有蛋白質的變體(例如在自然界最強物質之一蜘蛛絲中發現的一種蛋白質)從而製造出不同於任何進化產生的新蛋白質。儘管研究人員自己可能不知道潛在的規則,人工智慧已經學會了蛋白質是如何設計的語言,它可以對其編碼,創造現有版本的變體,或全新的蛋白質設計,有「數萬億種」潛在的組合。
通過使用這樣一個系統,用一組特定種類蛋白質的數據來訓練人工智慧系統可能需要幾天的時間,但它可以在幾微秒內設計出一種新蛋白質變體,沒有其他方法能與之媲美,缺點是這個模型沒有告訴我們裡面到底發生了什麼,只知道它管用。這種將結構編碼到音樂中的方式確實反映了更深層次的現實,當你在教科書上看到一個分子,它是靜態的,但它根本不是靜止的。它在運動和振動。每一點物質都是一組振動,我們可以用這個概念來描述物質。
該方法還不允許任何形式的定向修改——任何性質的變化,如機械強度、彈性或化學反應性,本質上將是隨機的。但仍然需要做這個實驗,當一種新的蛋白質變異產生時,沒有辦法預測它會發生什麼。該團隊還創作了由胺基酸聲音發展而來的音樂作品,這些胺基酸定義了這種新的20音音階,藝術品完全由胺基酸產生的聲音組成。目前還沒有使用合成或天然的樂器來證明這種新聲音來源可以被用作一個創造性的平臺。
博科園|研究/來自:麻省理工學院
參考期刊《ACS Nano》
DOI: 10.1021/acsnano.9b02180
博科園|科學、科技、科研、科普