Nature|手把手教你搭建大規模藥物虛擬篩選平臺

2020-12-14 中大唯信

簡介

目前,一個上市的藥物平均需要花費20-30億美元,並且需要10年左右的研發時間。大部分經費都花費在了昂貴且耗時的溼實驗部分,初始Hits陽性率太低以及(臨床前)階段的高損耗率。使用基於結構的虛擬篩選,Hits質量隨著篩選化合物的數量而提高。儘管存在大量的化合物資料庫,但是缺乏有效的靈活的方式使用計算機集群進行大規模的SBDD的手段。本文介紹VirtualFlow,這是一個高度自動化的開源平臺,可以有效的準備化合物庫並進行超大規模的虛擬篩選。VirtualFlow能夠使用各種強大對接程序。本文準備了目前已知的最大的免費使用的配體庫,配體庫包含了超過14億個可商業購買的分子。VirtualFlow可以探索廣闊的化學空間,並可以準確的識別與目標蛋白具有高親和力的分子。

VirtualFlow的特徵

VirtualFlow可以在任何資源管理器上使用,例如:SLURM(https://slurm.schedmd.com),Moab / TORQUE(http://www.adaptivecomputing.com),PBS(http:// www.pbspro.org),LSF(https://www.ibm.com/us-zh/marketplace/hpc-workload-management)和SGE(http://gridscheduler.sourceforge.net)。VirtualFlow還可以理想地配置用於雲計算平臺,例如亞馬遜的Web服務(AWS),微軟的Azure和Google的雲平臺(GCP)。VirtualFlow能夠在流程中自主計算配體庫中的所有分子,該功能可通過自動提交批處理系統作業來實現,可以在運行時監視和控制流程。VirtualFlow程序包由兩個可無縫協作的應用程式組成:VFLP(用於配體準備的模塊)和VFVS(用於虛擬篩選的模塊)。配體準備和虛擬篩選的過程是分離的。

VirtualFlow在藥物發現過程中的應用

圖片來源 Nature

VFLP 模塊

VFLP通過將配體資料庫從SMILES格式轉換為任何所需的目標格式(例如,基於AutoDock的對接程序所需的PDBQT格式)。VFLP使用ChemAxon的JChem軟體包以及Open Babel來將處理配體分子,可以將配體分子進行脫鹽處理,中和處理,生成互變異構體,計算特定pH狀態下的配體質子化狀態,計算其三維坐標並將分子轉換成所需的格式。

市售化合物是化學領域中最令人感興趣的空間,因為這些化合物很容易購買。目前可用的最大供應商庫之一是Enamine的REAL庫,其中包含約14億個按需定製化合物。我們使用VFLP將REAL庫中約14億種化合物轉換為PDBQT格式,並使該庫可在VirtualFlow主頁上免費使用,可通過圖形界面進行訪問。整個資料庫具有六維屬性,每個維對應於化合物的物理化學性質(分子量,分配係數,氫鍵供體,受體的數量,可旋轉鍵的數量以及拓撲極性表面積)。

VFVS模塊

使用VFVS進行虛擬篩選,用戶需要指定一組對接方案。通過選擇對接程序,受體結構和對接參數(包括受體上的預定義對接表面,受體上柔性殘基)的嚴格性來定義對接方案對接例程。當前,VirtualFlow支持以下對接程序:AutoDock Vina,QuickVina ,Smina,AutoDockFR,QuickVina-W,VinaXB和Vina-Carb。由於VFVS支持各種不同的對接程序,可以重逢利用每個程序的獨特優勢。VFVS可以對每個配體執行多種對接方案,從而實現共對接以及集成對接。VirtualFlow還可以集成其他對接程序。VFVS還可以用於進行多階段的虛擬篩選,以用於提高篩選的質量。在多階段方案中,連續執行幾個虛擬篩選。從前一個階段前進到下一個階段中的化合物數量將依次減少。隨之而來的是對接精度和計算成本的增加。

多階段虛擬篩選的示意以及超大規模虛擬篩選的優勢

圖片來源 Nature

案例:VFVS 從13億個分子中虛擬篩選

為了驗證VFVS的性能,本文針對KEAP1靶點篩選了13億種市售化合物的虛擬文庫(ZINC 15資料庫中約3.3億種化合物11和Enamine REAL庫中的約10億種化合物)。這兩個庫之間存在一些重疊的化合物。這項工作使用異構Linux群集上的8,000個核,大約在4周內完成。

為了闡明超量規模虛擬篩選的優勢,本文從REAL庫的約10億個化合物篩選中隨機選擇了不同規模的配體子集(0.1、1、10和1億個化合物)。隨著虛擬篩選規模的增加,對接後的平均得分也在增加,從而提高了篩選出具有更高結合親和力的分子的機率。這會導致更高的真實命中率和實驗結合親和力,這是由本文計算出的概率模型所預測所得,並且已經通過實驗證明了這一點。

為了演示多階段虛擬篩選,本文將初次篩選中獲得的排名前300萬化合物進行rescore。在第2階段,允許KEAP1與NRF2相互作用界面的的13個殘基具有柔性。這種柔性設置可以解釋胺基酸在蛋白結合界面上的動力學。在rescoring過程中,本文使用了兩個不同的對接程序(Smina Vinardo和AutoDock Vina),並進行了兩次重複,以進一步增加對接過程中採樣的構象空間。多階段篩選取決於選定的靶標和可用的計算資源。

兩個Hits(iKeap1和iKeap2)的對接Pose和實驗驗證

圖片來源 Nature

手把手教您搭建virtual-flow

復現步驟

官網:https://virtual-flow.org/

1. 下載VFVS的算例

算例地址:https://virtual-flow.org/sites/virtual-flow.org/files/tutorials/VFVS_GK.tar

解壓:tar -xvf VFVS_GK.tar

解壓之後的文件

2. 進入input

README.md

Readme

smina_rigid_receptor1:配置文件信息

ligand-library 配體文件庫

receptor 受體文件:內部為pdbqt格式

qvina02_rigid_receptor1 :配置文件信息

receptors

3. 進入tools文件

進入templates文件夾

配置文件信息都儲存在all.crtl , todo.all中

todo.all中主要儲存的是配體信息,按照下面的提示,等於cellections.txt中信息

如果你想要自己下載

a:下載配體文件庫:

網站:https://virtual-flow.org/real-library

打開網站後,可以選擇部分配體,也可以選擇整個庫下載,拖動圖中紫色小球進行選擇,本文選擇的配體庫如下圖,點擊Download,兩個全部點擊下載,本次選擇wget

b:下載後的文件:

兩個文件tranches.sh(第一個download),collections.txt(第二個download)

c:在終端下運行tranches,會下載一系列的文件

指令:sh tranches.sh/source tranches.sh

配體文件

collections.txt

信息:

4. all.crtl中修改配置信息

其中信息配置信息很多

這裡挑幾個重點講:

文件中有標註,我這裡就直接按照思維導圖的方式標記出來了

備註:選擇集群調度指令,對接軟體可以使用多個中間要以『:』號分割

5. 運行全部設置好了之後運行

進入tools文件夾

運行:./vf_start_jobline.sh 1 12 templates/template1.slurm.sh submit 1

其中12代表著12個節點

6. 運行完成之後可以使用以下指令查看前10化合物

./vf_report.sh -c vs -d qvina02_rigid_receptor1 -n 10

7. 運行完成之後進行的分析

7.1從github上下載VFtools

下載:wget https://github.com/VirtualFlow/VFTools/archive/master.tar.gz

解壓:tar -xvzf master.tar.gz

重命名:mv VFTools-master VFTools

VFTools中的文件:

將bin文件夾加入到環境路徑中:

命令:export PATH="Path/to/VFTools/bin:$PATH"

註:這只是一個臨時變量,儘可能修改bashrc文件,並加入上面的命令

7.2安裝openbabel

提供兩種安裝方式

a:使用conda

conda install openbabel -c conda-forge

b:直接從原網下載並進行安裝

http://openbabel.org/wiki/Main_Page

7.3 首先將篩選完成的化合物進行排名

cd <VFVS root directory>

#進入VFVS目錄

mkdir -p pp/ranking

#新建pp/ranking

cd pp/ranking

#進入目錄

vfvs_pp_ranking_all.sh ../../output-files/complete/ 2 meta_collection

#排序

輸出文件/文件夾:

直接查看clean為後綴的文件:

head -10 *.clean

7.4 提取排名前列的化合物pose

在pp文件夾中新建docking_poses文件夾

mkdir -p docking_poses/qvina02_rigid_receptor1

cd docking_poses/qvina02_rigid_receptor1

查看前100化合物,重定向為compounds

head -n 100 ../../ranking/qvina02_rigid_receptor1/firstposes.all.minindex.sorted.clean > compounds

然後,提取前100個化合物的結構

vfvs_pp_prepare_dockingposes.sh ../../../output-files/complete/qvina02_rigid_receptor1/results/ meta_collection compounds dockingsposes overwrite

docking_poses中的文件以及文件夾:

直接進入dockingsposes.plain文件夾中

cd dockingsposes.plain

文件夾內容裡面就是每個ligand排名第一的pose:

Pymol打開:

將pdb文件作為文本文件打開:

pdbqt格式,排名第一的model,對接得分為-8.3.有smiles格式以及一些標註,後續還有坐標格式

參考文獻

Gorgulla, C., Boeszoermenyi, A., Wang, Z. et al. An open-source drug discovery platform enables ultra-large virtual screens. Nature 580, 663–668 (2020).

相關文章

Nature | 從1.5億分子庫中虛擬篩選發現調節晝夜節律的褪黑素受體激動劑JMC | 資源有限的小型藥企如何利用計算方法加速藥物發現JMC | 820萬化合物庫中虛擬篩選發現高效腫瘤免疫靶點IDO1抑制劑JCIM | 從百萬化合物庫中虛擬篩選發現新型PPARα激動劑

相關焦點

  • 全球最大免費公開新冠藥物虛擬篩選資料庫, 華為雲「神農項目」登...
    該期封面刊出的正是華為雲EI醫療智能體團隊主導的抗疫課題——「神農項目」前期成果:新冠病毒藥物虛擬篩選在線交互Web服務。「神農項目」也是迄今為止全球最大的完全免費公開的新冠藥物虛擬篩選資料庫。計算機輔助藥物篩選根據病毒靶點和小分子藥物的3D結構,計算病毒蛋白與藥物之間的結合能量,實現從成千上萬的小分子庫中篩選出與病毒結合最緊密的候選藥物,從而快速為藥物研究和臨床試驗提供方向。
  • Nature:大規模篩選發現21種現有抗新冠病毒藥物!
    僅在不考慮新冠病毒SARS-CoV-2變異的情況下,開發針對性的疫苗需要12到18個月,而從頭開發並批准新型的抗病毒治療藥物保守估計可能需要超過10年。因此重新篩選測試已經過臨床評估的藥物以治療COVID-19成為目前可行有效的策略之一。
  • JCIM|算力大增的時代考慮絕對自由能計算提高虛擬篩選準確率
    文章簡介藥物發現中的虛擬高通量篩選(vHTS)是一種識別苗頭化合物的有效方法,它可以比實驗性高通量篩選方法更快,更便宜。ABFE計算對於當前的藥物發現十分有用,尤其是現在大規模基因組學數據和化學生物學方法的融合揭示了許多有希望的但還沒有小分子藥物發現的疾病靶標,而這恰恰是包括基於配體的篩選方法以及傳統的對接方法目前所不能真正發揮作用的地方。
  • Nature|新冠病毒水解酶結構!多種病毒抑制作用小分子!
    攻關團隊快速表達了2019-nCoV水解酶(Mpro)並獲得了高解析度晶體結構,在此基礎上,聯合小組綜合利用虛擬篩選和酶學測試相結合的策略,重點針對已上市藥物以及自建的「高成藥性化合物資料庫」和「藥用植物來源化合物成分資料庫」進行了藥物篩選,迅速發現了30種可能對2019-nCoV有治療作用的藥物、活性天然產物和中藥(詳見此前1月25號BioArt報導:緊急攻關!
  • Nature:應對瘧疾的數千種藥物化合物發現
    由蚊子攜帶的瘧原蟲導致的瘧疾每年導致數百萬人死亡,撒哈拉以南非洲的這種疾病的負擔最高,而且對現有藥物的耐藥性可能讓它變得更加致命。 但是如今《自然》(Nature)雜誌上的兩篇論文報告了一批化學物質,它們的每一種都能有效抵抗瘧原蟲,因此也就具有了開發成未來藥物的潛力。
  • 當AI從虛擬走向現實:大規模行業應用加速 開放AI平臺成趨勢
    不過,當AI從虛擬走向現實,從實驗室走向產業之時,困難也隨之而來。「我們當前遇到比較大的問題應該是應用場景的碎片化和垂直性比較強。」騰訊優圖實驗室總監吳永堅告訴記者,「所以我們需要把當前工程和研究的能力往AI平臺化方向走,從數據的準確、算法模型的選擇和訓練,到大規模訓練,然後再到整個模型的部署和實施,將整個AI的流程標準化。
  • 據報導:目前已初步篩選出三種治療藥物!
    其他 據報導:目前已初步篩選出三種治療藥物!   2020年2月2日,湖北省召開新聞發布會,湖北省科技廳廳長王煒在會上表示,目前已初步篩選出三種治療藥物,在細胞層面能有效地抑制新型冠狀病毒的複製,其在人體上的作用有待臨床試驗。
  • 我的世界帆船圖文製作教學 手把手教你帆船怎麼做
    我的世界帆船圖文製作教學 手把手教你帆船怎麼做時間:2020-01-14 17:19   來源:小皮手遊網   責任編輯:沫朵 川北在線核心提示:原標題:我的世界帆船圖文製作教學 手把手教你帆船怎麼做 一帆風順常常寓意著給予朋友美好的祝福,那麼在此新的一年祝大家一帆風順,接下來諸葛教科書就給大家帶來我的世界帆船製作步驟教學
  • 清華藥學院和GHDDI免費開放藥物研發資源
    在抗擊新冠疫情的後方,清華大學藥學院和全球健康藥物研發中心(GHDDI)的多位科學家團隊假期留守崗位,積極投入針對新型冠狀病毒的藥物研發中,同時免費高效地開放資源給全社會科研人員,共同加速新型冠狀病毒藥物研發。
  • GHDDI啟動「未雨計劃」,以推動新冠藥物及疫苗研發工作
    記者7月14日在全球健康藥物研發中心(GHDDI)舉辦的「探索全球健康」系列線上研討會上獲悉,為進一步推動新冠藥物及疫苗的研發工作,GHDDI啟動「未雨計劃」,圍繞小分子抗病毒藥物研發、抗體藥物研發和疫苗研製3大方向啟動6-8個研發項目,達成至少1款創新藥物和1類疫苗分別進入臨床I期試驗階段的階段性目標。
  • GHDDI與清華藥學院開放資源 助力新型肺炎藥物研發
    GHDDI與清華大學藥學院除在內部積極投入針對新型冠狀病毒的藥物研發外,還將相關技術平臺向具有新型冠狀病毒研究基礎或已有可行性研究方向的外部合作夥伴免費開放,中心研發團隊也將提供全方位的技術支持與研究合作,共同加速新型冠狀病毒藥物研發。初步措施: 1.
  • 中國教育「線上遷徙」,中教雲集團為「信息化教學」搭建平臺
    中國教育「線上遷徙」,中教雲集團為「信息化教學」搭建平臺 2020-08-07 11:34:31   來源:網絡
  • 專注人工智慧藥物發現平臺,「星藥科技」完成數千萬美金A輪融資
    所募集資金將用於擴大研發團隊規模和建設專業的生化檢測實驗室,形成創新藥物生成、篩選、評價和檢測流程閉環。「星藥科技」成立於2019年,是一家以AI技術支持新藥研發的解決方案提供商,意在將人工智慧技術與藥學、化學、生物學等技術相結合,搭建人工智慧藥物發現平臺,降低科學家在藥物研發過程中的開發周期和成本,從而推動新藥研發各個流程。
  • 手把手教你為電商搭建購物車推薦系統!
    本篇文章將利用機器學習技術,手把手教你如何通過分析顧客的購買行為並構建購物車推薦系統來為顧客提供量身定製的購物體驗,從而提高顧客的參與度。1. 目標營銷:通過分析客戶在網站/應用程式上的虛擬足跡可以把你的目標營銷提升到一個新的水平。比如,你可以根據用戶的購買歷史,向他們精準推送他們最喜歡的商品的特價活動。2.
  • 手把手教你用Django搭建博客(二)
    作者:楊學光博客:http://zmrenwu.com/往期精彩連載:Django之簡化版Pinterest手把手教你用Django搭建博客(一)3、建立 Django 博客應用建立博客應用我們已經建立了
  • 《我的世界手遊》小型城堡建造圖文流程 手把手教你小型城堡怎麼建
    《我的世界手遊》小型城堡建造圖文流程 手把手教你小型城堡怎麼建時間:2020-06-18 18:50   來源:遊俠網   責任編輯:沫朵 川北在線核心提示:原標題:《我的世界手遊》小型城堡建造圖文流程 手把手教你小型城堡怎麼建 我的世界手遊城堡怎麼建?
  • 內蒙古包頭:為培養學習型放心型專家型人才搭建平臺
    1帶N提素能補短板共成長內蒙古包頭:為培養學習型放心型專家型人才搭建平臺內蒙古自治區包頭市檢察機關聚焦基層人才短缺、能力不足難題,推進「1帶N提素能補短板共成長」人才培養工作向基層延伸,為培養學習型、放心型、專家型人才搭建平臺,指導推進基層檢察工作創新發展。
  • GHDDI加入歐洲最大冠狀病毒藥物研發聯盟,加速開發新冠治療方案
    記者從全球健康藥物研發中心(GHDDI)獲悉,由歐洲創新藥物計劃(IMI)支持的冠狀病毒歐洲加速研發聯盟(CARE)今日宣布正式成立,旨在加快針對當前新型冠狀病毒(SARS-CoV-2)以及未來潛在冠狀病毒威脅的藥物研發。
  • 手把手教你
    手把手教你 2020-10-01 17:54 來源:澎湃新聞·澎湃號·政務
  • 《我的世界手遊》甜品餐車建造圖文攻略 手把手教你甜品餐車怎麼建
    《我的世界手遊》甜品餐車建造圖文攻略 手把手教你甜品餐車怎麼建時間:2020-11-18 16:46   來源:遊俠網   責任編輯:沫朵 川北在線核心提示:原標題:《我的世界手遊》甜品餐車建造圖文攻略 手把手教你甜品餐車怎麼建 我的世界手遊甜品餐車怎麼建?