Nature | 手把手教你搭建大規模藥物虛擬篩選平臺

2020-09-12 中大唯信

簡介

目前,一個上市的藥物平均需要花費20-30億美元,並且需要10年左右的研發時間。大部分經費都花費在了昂貴且耗時的溼實驗部分,初始Hits陽性率太低以及(臨床前)階段的高損耗率。使用基於結構的虛擬篩選,Hits質量隨著篩選化合物的數量而提高。儘管存在大量的化合物資料庫,但是缺乏有效的靈活的方式使用計算機集群進行大規模的SBDD的手段。本文介紹VirtualFlow,這是一個高度自動化的開源平臺,可以有效的準備化合物庫並進行超大規模的虛擬篩選。VirtualFlow能夠使用各種強大對接程序。本文準備了目前已知的最大的免費使用的配體庫,配體庫包含了超過14億個可商業購買的分子。VirtualFlow可以探索廣闊的化學空間,並可以準確的識別與目標蛋白具有高親和力的分子。


VirtualFlow的特徵

VirtualFlow可以在任何資源管理器上使用,例如:SLURM(https://slurm.schedmd.com),Moab / TORQUE(http://www.adaptivecomputing.com),PBS(http:// www.pbspro.org),LSF(https://www.ibm.com/us-zh/marketplace/hpc-workload-management)和SGE(http://gridscheduler.sourceforge.net)。VirtualFlow還可以理想地配置用於雲計算平臺,例如亞馬遜的Web服務(AWS),微軟的Azure和Google的雲平臺(GCP)。VirtualFlow能夠在流程中自主計算配體庫中的所有分子,該功能可通過自動提交批處理系統作業來實現,可以在運行時監視和控制流程。VirtualFlow程序包由兩個可無縫協作的應用程式組成:VFLP(用於配體準備的模塊)和VFVS(用於虛擬篩選的模塊)。配體準備和虛擬篩選的過程是分離的。

VirtualFlow在藥物發現過程中的應用

圖片來源 Nature


VFLP 模塊

VFLP通過將配體資料庫從SMILES格式轉換為任何所需的目標格式(例如,基於AutoDock的對接程序所需的PDBQT格式)。VFLP使用ChemAxon的JChem軟體包以及Open Babel來將處理配體分子,可以將配體分子進行脫鹽處理,中和處理,生成互變異構體,計算特定pH狀態下的配體質子化狀態,計算其三維坐標並將分子轉換成所需的格式。


市售化合物是化學領域中最令人感興趣的空間,因為這些化合物很容易購買。目前可用的最大供應商庫之一是Enamine的REAL庫,其中包含約14億個按需定製化合物。我們使用VFLP將REAL庫中約14億種化合物轉換為PDBQT格式,並使該庫可在VirtualFlow主頁上免費使用,可通過圖形界面進行訪問。整個資料庫具有六維屬性,每個維對應於化合物的物理化學性質(分子量,分配係數,氫鍵供體,受體的數量,可旋轉鍵的數量以及拓撲極性表面積)。

VFVS模塊

使用VFVS進行虛擬篩選,用戶需要指定一組對接方案。通過選擇對接程序,受體結構和對接參數(包括受體上的預定義對接表面,受體上柔性殘基)的嚴格性來定義對接方案對接例程。當前,VirtualFlow支持以下對接程序:AutoDock Vina,QuickVina ,Smina,AutoDockFR,QuickVina-W,VinaXB和Vina-Carb。由於VFVS支持各種不同的對接程序,可以重逢利用每個程序的獨特優勢。VFVS可以對每個配體執行多種對接方案,從而實現共對接以及集成對接。VirtualFlow還可以集成其他對接程序。VFVS還可以用於進行多階段的虛擬篩選,以用於提高篩選的質量。在多階段方案中,連續執行幾個虛擬篩選。從前一個階段前進到下一個階段中的化合物數量將依次減少。隨之而來的是對接精度和計算成本的增加。

多階段虛擬篩選的示意以及超大規模虛擬篩選的優勢

圖片來源 Nature


案例:VFVS 從13億個分子中虛擬篩選

為了驗證VFVS的性能,本文針對KEAP1靶點篩選了13億種市售化合物的虛擬文庫(ZINC 15資料庫中約3.3億種化合物11和Enamine REAL庫中的約10億種化合物)。這兩個庫之間存在一些重疊的化合物。這項工作使用異構Linux群集上的8,000個核,大約在4周內完成。


為了闡明超量規模虛擬篩選的優勢,本文從REAL庫的約10億個化合物篩選中隨機選擇了不同規模的配體子集(0.1、1、10和1億個化合物)。隨著虛擬篩選規模的增加,對接後的平均得分也在增加,從而提高了篩選出具有更高結合親和力的分子的機率。這會導致更高的真實命中率和實驗結合親和力,這是由本文計算出的概率模型所預測所得,並且已經通過實驗證明了這一點。


為了演示多階段虛擬篩選,本文將初次篩選中獲得的排名前300萬化合物進行rescore。在第2階段,允許KEAP1與NRF2相互作用界面的的13個殘基具有柔性。這種柔性設置可以解釋胺基酸在蛋白結合界面上的動力學。在rescoring過程中,本文使用了兩個不同的對接程序(Smina Vinardo和AutoDock Vina),並進行了兩次重複,以進一步增加對接過程中採樣的構象空間。多階段篩選取決於選定的靶標和可用的計算資源。

兩個Hits(iKeap1和iKeap2)的對接Pose和實驗驗證

圖片來源 Nature


手把手教您搭建virtual-flow

復現步驟

官網:https://virtual-flow.org/

1. 下載VFVS的算例

算例地址:https://virtual-flow.org/sites/virtual-flow.org/files/tutorials/VFVS_GK.tar

百度雲地址:連結: https://pan.baidu.com/s/1X0Ge3pcM3K_rYN-0h9Dqyw 密碼: s6q5

解壓:tar -xvf VFVS_GK.tar

解壓之後的文件

2. 進入input

README.md

Readme

smina_rigid_receptor1:配置文件信息

ligand-library 配體文件庫

receptor 受體文件:內部為pdbqt格式

qvina02_rigid_receptor1 :配置文件信息

receptors


3. 進入tools文件

進入templates文件夾

配置文件信息都儲存在all.crtl , todo.all中

todo.all中主要儲存的是配體信息,按照下面的提示,等於cellections.txt中信息

如果你想要自己下載

a:下載配體文件庫:

網站:https://virtual-flow.org/real-library

打開網站後,可以選擇部分配體,也可以選擇整個庫下載,拖動圖中紫色小球進行選擇,本文選擇的配體庫如下圖,點擊Download,兩個全部點擊下載,本次選擇wget

b:下載後的文件:

兩個文件tranches.sh(第一個download),collections.txt(第二個download)

c:在終端下運行tranches,會下載一系列的文件

指令:sh tranches.sh/source tranches.sh


配體文件


collections.txt

信息:


4. all.crtl中修改配置信息

其中信息配置信息很多

這裡挑幾個重點講:

文件中有標註,我這裡就直接按照思維導圖的方式標記出來了

備註:選擇集群調度指令,對接軟體可以使用多個中間要以『:』號分割


5. 運行全部設置好了之後運行

進入tools文件夾

運行:./vf_start_jobline.sh 1 12 templates/template1.slurm.sh submit 1

其中12代表著12個節點

6. 運行完成之後可以使用以下指令查看前10化合物

./vf_report.sh -c vs -d qvina02_rigid_receptor1 -n 10

7. 運行完成之後進行的分析

7.1從github上下載VFtools

下載:wget https://github.com/VirtualFlow/VFTools/archive/master.tar.gz

解壓:tar -xvzf master.tar.gz

重命名:mv VFTools-master VFTools

VFTools中的文件:


將bin文件夾加入到環境路徑中:

命令:export PATH=&34;

註:這只是一個臨時變量,儘可能修改bashrc文件,並加入上面的命令


7.2安裝openbabel

提供兩種安裝方式

a:使用conda

conda install openbabel -c conda-forge

b:直接從原網下載並進行安裝

http://openbabel.org/wiki/Main_Page


7.3 首先將篩選完成的化合物進行排名

cd <VFVS root directory>

新建pp/ranking

cd pp/ranking

排序

輸出文件/文件夾:


直接查看clean為後綴的文件:

head -10 *.clean


7.4 提取排名前列的化合物pose

在pp文件夾中新建docking_poses文件夾

mkdir -p docking_poses/qvina02_rigid_receptor1

cd docking_poses/qvina02_rigid_receptor1

查看前100化合物,重定向為compounds

head -n 100 ../../ranking/qvina02_rigid_receptor1/firstposes.all.minindex.sorted.clean > compounds

然後,提取前100個化合物的結構

vfvs_pp_prepare_dockingposes.sh ../../../output-files/complete/qvina02_rigid_receptor1/results/ meta_collection compounds dockingsposes overwrite

docking_poses中的文件以及文件夾:

直接進入dockingsposes.plain文件夾中

cd dockingsposes.plain

文件夾內容裡面就是每個ligand排名第一的pose:


Pymol打開:

將pdb文件作為文本文件打開:

pdbqt格式,排名第一的model,對接得分為-8.3.有smiles格式以及一些標註,後續還有坐標格式

參考文獻

Gorgulla, C., Boeszoermenyi, A., Wang, Z. et al. An open-source drug discovery platform enables ultra-large virtual screens. Nature 580, 663–668 (2020).


中大唯信頭條號與中大唯信公眾號、唯信計算訂閱號均由中大唯信科技有限公司運營,歡迎關注轉發,未經授權禁止轉載

相關焦點

  • 上海藥物所開發抗新冠肺炎藥物靶標預測及虛擬篩選網絡應用平臺
    據中國科學院上海藥物研究所網站消息,近日,《藥學學報》英文刊(Acta Pharmaceutica Sinica B)發表了中科院上海藥物研究所開發的基於網際網路的抗新冠肺炎(COVID-19)藥物靶標預測及虛擬篩選平臺(D3Targets-2019-nCoV)的介紹文章。
  • Nature Biotechnology:利用CRISPR系統篩選癌症藥物靶向目標
    2015年5月13日訊 /生物谷BIOON/ --近日,來自美國冷泉港實驗室的研究人員在國際學術期刊nature biotechnology在線發表了一項最新研究進展,他們應用CRISPR-CAS9技術靶向編碼蛋白功能性結構域的外顯子對癌症藥物作用靶點進行大規模篩選
  • ...海洋試點國家實驗室開放共享多個抗新型冠狀病毒藥物篩選虛擬模型
    齊魯網·閃電新聞2月2日訊(記者 劉洋)當前,正值防控新型冠狀病毒疫情的關鍵時期,尋找靶點藥物是科研攻關的重要工作之一。海洋試點國家實驗室及時啟動應急研發任務,利用實驗室學科、平臺、團隊、機制優勢,組織科研人員,主動出擊,針對多個重要抗病毒靶點開展了藥物虛擬篩選,力爭為疫情防控貢獻力量。
  • 全球最大免費公開新冠藥物虛擬篩選資料庫,華為雲「神農項目」登上...
    該期封面刊出的正是華為雲EI醫療智能體團隊主導的抗疫課題——「神農項目」前期成果:新冠病毒藥物虛擬篩選在線交互Web服務。「神農項目」也是迄今為止全球最大的完全免費公開的新冠藥物虛擬篩選資料庫。新型冠狀病毒的出現在全球範圍影響了人類健康,尋找有效治癒新冠肺炎的治療方式是臨床醫生和藥物研發人員最緊迫的工作。
  • 22考研|點擊查看,手把手教你查資料~
    沒關係,考研幫手把手教你查詢各方考研信息~
  • 手把手教你搭建微信支付寶聚合支付接口
    ,手把手教您輕鬆搭建自己的支付系統,從而實現對微信支付寶的支付接口接入.有了支付通道當然自己就可以賺錢了.(6) 接下來需要開通開放平臺商戶,請訪問螞蟻金服開放平臺.(7) 請選擇入駐身份為自研開發者,實際上<原力支付>是整套支付系統,已經開發完畢.
  • 全球最大免費公開新冠藥物虛擬篩選資料庫, 華為雲「神農項目」登...
    該期封面刊出的正是華為雲EI醫療智能體團隊主導的抗疫課題——「神農項目」前期成果:新冠病毒藥物虛擬篩選在線交互Web服務。「神農項目」也是迄今為止全球最大的完全免費公開的新冠藥物虛擬篩選資料庫。計算機輔助藥物篩選根據病毒靶點和小分子藥物的3D結構,計算病毒蛋白與藥物之間的結合能量,實現從成千上萬的小分子庫中篩選出與病毒結合最緊密的候選藥物,從而快速為藥物研究和臨床試驗提供方向。
  • 我的***煙花炮竹圖文教程 手把手教你煙花炮竹怎麼做
    :原標題:我的****煙花炮竹圖文教程 手把手教你煙花炮竹怎麼做 除夕時我們都會用炮竹驅趕年魔,也叫夕,那麼如果想在我的****中建造一個煙花炮竹應該怎麼做呢?想必各位玩家對此存在許多疑惑,接下來我們一起來跟隨諸葛教科書看看我的****煙花炮竹教程吧。
  • JCIM|基於雲平臺探索虛擬篩選化合物庫的極限
    虛擬篩選虛擬篩選是利用計算機模擬藥物篩選過程,對化合物的活性做出預測,可從大型化合物庫中迅速篩選出有潛在活性的候選藥物。目前用到的虛擬篩選方法包括基於結構的藥物設計(SBDD)、二維指紋相似性、三維形狀的相似性,其在準確性、速度和新穎性方面都有優缺點(如圖1)。
  • 手把手教你如何篩選基金
    一、初步篩選 基金篩選是個層層篩選的活兒,對於我來說我會先做一個初篩,現在第三方平臺(天天基金/晨星網)做一個初步的篩選,比如說今天我要篩選股票型醫藥基金,選擇股票型的醫藥基金之後,然後發現總共給出了95隻基金,首先我會按照排名刪除掉排名在四分之一之後的,選擇前面的基本上也就是25隻基金,然後根據基金的,進一步的排除掉一部分基金,其實剩下的也就沒有多少了,那麼我的初篩工作就完成了,接下來就是進一步的進行細緻的篩選了。
  • 藥物設計 | 基於虛擬篩選策略發現FLT3的不可逆抑制劑
    隨著共價不可逆結合抑制劑在藥物研究領域掀起了一股熱潮,研究人員對如何利用有效合理的方法來快速發現共價類型的新藥進行了思考。本次分享的文章中介紹了基於虛擬篩選策略發現了與急性髓性白血病發病相關的FMS樣酪氨酸激酶3(FLT3)的不可逆抑制劑,並且研究人員認為該篩選策略適用於許多藥物靶標,可被應用於共價藥物的合理設計。
  • Nature:大規模篩選發現21種現有抗新冠病毒藥物!
    僅在不考慮新冠病毒SARS-CoV-2變異的情況下,開發針對性的疫苗需要12到18個月,而從頭開發並批准新型的抗病毒治療藥物保守估計可能需要超過10年。因此重新篩選測試已經過臨床評估的藥物以治療COVID-19成為目前可行有效的策略之一。
  • 梁晗組報導大規模腫瘤藥物蛋白擾動效應篩選數據集
    不過,現存的各類大規模基因或化合物篩選數據集均缺少以蛋白表達水平為核心的響應指標,這主要是由於蛋白質大規模定量仍較為困難,因而將諸如定量蛋白質組學技術考慮到蛋白質是細胞功能的主要載體和大部分抗腫瘤藥物的直接作用靶標,其表達水平和修飾狀態對外界刺激作出的響應是反映細胞狀態轉變的關鍵指標,亦是抗腫瘤機制的重要線索。因此,如何將對蛋白水平的監測納入大規模癌症擾動生物學研究,是亟待解決的課題。
  • 梁晗課題組報導大規模腫瘤藥物蛋白擾動效應篩選數據集
    不過,現存的各類大規模基因或化合物篩選數據集均缺少以蛋白表達水平為核心的響應指標,這主要是由於蛋白質大規模定量仍較為困難,因而將諸如定量蛋白質組學技術(quantitative proteomics)等應用至大規模擾動生物學研究中並非一條可行的路徑。
  • Nature:利用體內CRISPR-Cas9篩選技術發現新的藥物靶標來增強癌症...
    圖片來自Nature, doi:10.1038/nature232702017年7月20日/生物谷BIOON/---在一項新的研究中,來自美國達納-法伯癌症研究所和波士頓兒童醫院癌症與血液疾病中心等研究機構的研究人員開發出一種新的篩查方法,即利用CRISPR-Cas9基因組編輯技術在小鼠體內測試上千個腫瘤基因的功能。
  • 基於液滴微流控平臺的高通量光化學反應篩選
    在這項工作中,作者們結合微流控平臺和電噴霧-質譜實現了納升液滴尺度的光化學反應篩選,具有樣品消耗少、高通量 (0.3樣品/s)的優點。近年高通量自動化反應篩選技術的發展助力有機方法學發展,有助於快速篩選反應條件。
  • Nature Med:諾華新研究應用PDX模型進行抗癌藥物高通量篩選
    2015年11月16日訊 /生物谷BIOON/ --最近,來自諾華生物醫學研究院的研究人員在國際學術期刊nature medicine上發表了一項最新研究進展,他們建立了大量PDX動物模型用於抗癌小分子化合物篩選,這項研究表明PDX模型在藥物的臨床前評估以及臨床效果預測方面具有非常好的應用前景
  • 華為雲主導抗疫藥物篩選科研成果「神農項目」登上國際化學頂刊封面
    該期封面刊出的正是華為雲EI醫療智能體團隊主導的抗疫課題——「神農項目」前期成果:新冠病毒藥物虛擬篩選在線交互Web服務。「神農項目」也是迄今為止全球最大的完全免費公開的新冠藥物虛擬篩選資料庫。
  • 手把手教你學ELISA、PCR、免疫組化
    1.手把手教你學ELISAELISA的基礎是抗原或抗體的固相化及抗原或抗體的酶標記。結合在固相載體 表面的抗原或抗體仍保持其免疫學活性,酶標記的抗原或抗體既保留其免疫學活性,又保留酶的活性。2.手把手教你學PCR實時螢光定量PCR,簡稱RT-QPCR,屬於Q-PCR的一種,目前該技術已得到廣泛應用,如:擴增特異性分析、基因定量分析、基因分型、SNP分析等。
  • 手把手教你6種吊瓶繩子打結方法,簡單非常實用,學會受用
    手把手教你6種吊瓶繩子打結方法,簡單非常實用,學會受用 2020-09-03 15:54 來源:繩藝守望者