Structura Biotechnolog 的突破性軟體可以迅速分析 2D 顯微鏡數據,了解分子結構。
在這場 COVID-19 疫苗研發的全球競賽中,科研人員和製藥公司首先要做的就是了解這種病毒的蛋白質結構。
然而,了解它們的前提是建立詳細的蛋白質分子 3D 模型,但迄今為止這項工作一直是項及其耗時的工程。Structura Biotechnology 開創性的軟體加速了這一進程。
這個加載了 Structura 軟體的 GPU 驅動機器學習算法,為一種叫做「冷凍電子顯微鏡」或「cryo-EM」 的圖像處理技術提供了動力,這項技術也是生化領域的一項革命性突破,曾獲得過 2017 年諾貝爾化學獎。
Cryo-EM 使強大的電子顯微鏡能夠捕獲接近自然狀態的生物分子的詳細圖像。這些圖像可被用於重建生物分子的 3D 模型。
利用 cryo-EM 提供的有價值的 2D 圖像數據,Structura 的 AI 驅動軟體 cryoSPARC 可以快速分析所得的顯微鏡數據,用於解決嵌入式蛋白質分子的 3D 原子結構。而這也使研究人員可以更快地評估藥物與這些分子結合的有效程度,從而大大加快了藥物發現的過程。
全世界已有上百個實驗室使用了這家在剛在多倫多成立三年公司的軟體。在 2020 年期間,使用該軟體的用戶數量激增,但並不令人驚訝。事實上,這家公司的執行長 Ali Punjani 指出,科學家們使用 Structura 的軟體來可視化 COVID -19 蛋白質的研究已經被發表在多本刊物中。
Punjani 說:「我們的軟體能夠幫助科學家了解蛋白質的外觀與一些剛被提出療法如何結合。對目標結構的了解越多,設計或識別鎖定在該結構上並阻止它的分子就越容易。」
Structura 的想法來自 Punjani 在多倫多大學工作時聽到的一次對話,這場對話關於如何使用顯微圖像解決蛋白質結構。他認為這個主題會成為他對機器學習研究的濃厚興趣的一個有趣的測試案例。
Punjani 於 2017 年組建了他的團隊,Structura 在大規模推理和計算機視覺算法的支持下構建的軟體,有助於從 2D 圖像數據中恢復 3D 模型。他說,關鍵是要以提高的準確性收集和分析足夠數量的微觀數據,以實現高質量的 3D 重建。
Punjani 說:「這是一個高度科學的領域,對錯誤的容忍度為零,弄錯了可能會浪費大量時間和金錢。」
Structura 的軟體通常在客戶的硬體上部署,必須完成處理實時 3D 顯微鏡數據的任務。Punjani 說,實驗室通常會在 NVIDIA Quadro RTX 6000 GPU 或類似設備上運行這項工作,而許多大型製藥公司已經投資了 NVIDIA V100 Tensor Core GPU 集群以及各種 NVIDIA 顯卡。
Structura 在運行 V100 GPU 的多 GPU 節點的機器上進行了所有的模型訓練和軟體開發。Punjani 說,由於問題的特殊性和特殊性,他的團隊從頭開始編寫了所有 GPU 內核。在 Structura 的 GPU 上運行的代碼是用 CUDA 編寫的,cuDNN 則用於一些高端計算任務。
鑑於 Structura 創新技術的價值以及 cryo-EM 的重要性,Punjani 並沒有抑制他對公司的雄心壯志。最近該公司加入了 NVIDIA Inception,這是一項初創加速計劃,旨在通過人工智慧和數據科學的發展培育初創公司,使行業發生革命性變化。
Punjani 說,與生物有關的任何研究現在都可以利用 cryo-EM 提供 3D 蛋白質結構信息,因此,業界對 Structura 軟體能完成的工作給予了廣泛關注。
他說:「我們正在構建的是 Cryo-EM 的基本構建塊,他們可以更好地實現基於結構的藥物發現。Cryo-EM將在所有生物學研究中無處不在。」
NVIDIA 首席科學家 BILL DALLY 通過 GTC 中國線上大會 2020 主題演講,為您解讀 NVIDIA 新科技如何助力解決當今世界的巨大挑戰。速速掃描下方海報中的二維碼觀看演講視頻!