諾華生物醫學研究所(NIBR)高通量篩選平臺
諾華生物醫學研究所(NIBR)高通量篩選平臺最早的是所有可用化合物的集合。在2015年,我們設計了第一代篩選平臺以方便訪問具有優化屬性的各種子化合物庫。我們將這些化合物分配為2D網格上的plated子集,在一個維度上基於屬性的排名在另一個維度上增加了結構豐富性。從2015年篩選平臺獲得的經驗應用於2019年下一代產品的設計。
我們發現,使用傳統的類先導化合物標準(主要是分子量、clogP)會降低子集篩選中有吸引力的化學起始結構的命中率。因此,2019年的篩選平臺主要依靠溶解性和滲透性來選擇首選化合物。除了結構多樣性外,2019年的平臺設計還使用NIBR的實驗分析數據和推斷的生物學活性概況來定義整個化合物庫的豐富性。
基於平板的高通量篩選(HTS)仍然是藥物發現中小分子化合物命中的主要來源,儘管出現了無板編碼的篩選方法,例如DNA編碼文庫和基於微流體的方法,以及計算方面的虛擬篩選方法。因此,許多製藥公司繼續投資於平板型低分子量(LMW)篩選平臺並將其視為關鍵資產。NIBR項目團隊通常以迭代方式篩選總化合物集合的子集(超過200萬種獨特的化合物)。通過去除低質量的樣品或具有不良化學結構的化合物,「全篩選平臺」已減少到不足150萬個樣品。
在過去的十年中,表型篩選在藥物發現中再次變得越來越重要,其實際結果是測定和篩選級聯變得越來越複雜,從而限制了可以篩選的化合物的數量。迭代篩選可以減少總體篩查化合物的數量,節省化合物庫存,縮短時間表和成本,更重要的是在進行大規模篩查之前先驗證或優化測定形式。在經典的HTS中,所有化合物均經過測試,化合物在平板篩板上的分布對結果影響不大。但是在迭代多樣性驅動的子集篩選中(如NIBR所實踐),正確的分配對於獲得合理的結果至關重要。
本文章綜述了我們如何設計和實施一個篩選平臺,該平臺最初用於2015年在NIBR進行的多樣性驅動的子集篩選,並在2019年進行了修訂。
篩選平臺設計原則
一個「理想的」多樣性驅動的篩選平臺,兩個最重要的標準是:首先,它應包含在最小的子集內擁有所有可能的靶標和作用機理的化合物;其次,物質和實體樣品的特性應具有最高的質量(即沒有不希望的性質的陽性化合物,例如,誘導蛋白質沉澱的化合物樣品)。我們的篩選平臺的設計是基於以下兩個主要特徵:第一,生物多樣性能夠以儘可能少的化合物解決儘可能多的靶標,第二,最佳的化合物樣品特性以將不希望有的性質的陽性化合物限制在最低。同時我們要知道篩選平臺的設計依賴於歷史篩選產生的經驗,因此,我們定義了一個篩選平臺設計過程(見圖1),並且每3到4年進行重新設計和優化。
圖1 NIBR的篩選平臺設計是一個迭代過程
圖片源自JMC.
化合物處理技術是讓設計的篩選平臺工作的基礎
將化合物溶解並接種到384孔平板中,按順序進行初次篩選,這些篩板作為所有進行HTS的源頭,並在約6年的循環時間內從固體樣品中不斷更新,其自動揀選功能允許每周最多揀選幾千個樣品。NIBR的化合物管理小組從2008年到2012年在重建其化合物流通能力方面作了重要的努力,主要包括兩個方面:(a)從LC-MS質量控制的固體樣品中為所有化合物樣品(>1.2M)生產10 mM儲備溶液,以及(b)安裝自動化系統以實現從試管中進行揀選和處理,並且在24小時內可吸附多達40k管的微量滴定板(見圖2)。憑藉10 mM的庫存收集和圖2中描述的自動化設置,在2015年誕生了第一版NIBR篩選平臺。在2019年,基於進一步的設計迭代(包括學習和經驗),在2015年的基礎上誕生了第二個版本。
圖2 自2015年以來,化合物管理設置專為多樣性驅動的子集篩選而設計
圖片源自JMC.
創建篩選平臺多樣性網格
如上文針對篩選平臺的設計所述,我們主要考慮了兩個目標:第一個目標是最大化篩選平臺子集的多樣性。生物活性空間的多樣性是我們的主要目標。對於化合物,存在大量的描述符和多樣性指標,其中有些是部分多餘的。沒有簡單的方法可以將它們組合為一個統一的指標。因此,我們做出的選擇是獨立使用幾個相關度量,以通過聚類為每個度量定義複合類。其他化合物的分類由現有的離散化合物注釋產生。一旦將化合物分為生物活性和化學結構類別,多樣性選擇過程的目的就是生成最小尺寸的子集,確保每個類別的預設最小覆蓋率。第二個目標是優化化合物的特異性和主要的理化性質,由於要考慮多種此類屬性,因此需要將它們組合成一個多目標得分。這樣的打分是每種化合物的單獨屬性,允許在單獨的基礎上對化合物進行比較和排名。
為了設計具有最大多樣性和最佳屬性的子集,我們開發了以下過程:給定一個已定義用於分層的化合物類別,以及基於多目標屬性的排名,然後從每個類別中對最佳排名的化合物進行抽樣就得到具有最佳屬性的子集,該子集可以滿足必須覆蓋所有類別的約束條件。重複此過程,直到最終選擇了所有化合物,從而跟蹤選擇化合物的選擇過程。最終,每種化合物具有兩個關聯的屬性:屬性等級和選擇該化合物的選擇回合。通過適當的裝箱策略,可以將該2D空間劃分為一個或多個板塊,將它們堆疊成一個或多個板塊,將2D網格劃分為一組,從而使科學家可以從該網格中選擇用於檢測的板塊組。通過選擇與N個選擇回合中的第一個回合相對應的網格單元,可以獲得最大覆蓋範圍的子集。通過集中在具有最高性能等級的網格單元上,可以獲得良好性能的子集。整個流程在圖3中概述。
圖3 多樣性網格的生成
圖片源自JMC.
化合物個體屬性排名
圖4中展示了分配給2019篩選平臺中化合物樣品的所有警告標誌的概述。根據表1中所述的屬性,可以將化合物分為三個屬性類別:由於「高溶解度和高滲透性」,最上面的類別「高溶解度和滲透性」包含正標記的化合物;第二類「中性」涵蓋所有沒有負標記的化合物;所有剩餘的帶有一個或多個警告標記的化合物都被添加到「屬性警告標記」類別中。在每個類別中,按照表1的定義應用優先級排序。
圖4 2019篩查平臺考慮的化合物樣品的排除原因和警告標誌(多個標誌可以應用於一個樣品)
圖片源自JMC.
表1.2019篩選平臺的化合物排名標準
圖片源自JMC.
生物活性和化學結構空間覆蓋
在對網格的X軸進行屬性排名的情況下,我們需要為拾取回合定義一種覆蓋多樣性的方法,以生成Y軸。我們使用了幾種分類方法,這些方法可以分為以下幾類:單個生物靶標類、生物化合物輪廓空間類和化學空間覆蓋類。
1) 單個生物靶標類。有關單個生物靶標的生物活性數據是從我們的內部系統「hithub」中提取的,該系統包含所有內部生物活性數據,並定期通過來自主要公共數據源(ChEMBL,Clarivate Integrity,GOSTAR)的生物活性數據進行更新。
2)生物化合物輪廓空間類。按單個靶標對化合物分組的一種補充方法是跨多個靶標或分析使用生物學譜數據。預測配置文件是在單個目標基礎上計算的,以基於pfam資料庫中的蛋白質域注釋獲得貝葉斯活性指紋(BAFP)以及每個蛋白質家族來獲得貝葉斯域指紋(BDFP)。
3)化學空間覆蓋類。NIBR開發了一種化合物骨架分類方法,稱為「骨架樹」,隨後擴展到了「骨架網絡」。該網絡用於純粹基於化學結構來定義類別。
4)手動分類。以上所有分類都是通過計算得出的,還需要有根據化學家們的經驗知識來指定的分類。所有分類總結與表2。
表2.化合物空間覆蓋分類
圖片源自JMC.
迭代化合物選擇過程
如上所述,現在的目標是對定義為空間覆蓋目標的類進行迭代,從每個類中選擇排名最好的化合物樣本,然後重複此循環多次。一旦所有化合物均已按屬性進行了排序並分配給不同類型的空間覆蓋類別,並且已定義了每次迭代的最小簇大小,則可以運行選擇算法以生成多樣性網格。該算法的流程圖如圖5所示。
圖5 選擇算法的流程圖
圖片源自JMC.
2015篩選平臺和2019篩選平臺的比較
圖6(分子量)和圖7(clogP)展示了2015年和2019年平板子集的特性曲線。2015年的篩選平板網格顯示,MW <350 Da的偏差很大,A和B類的clogP範圍為1-3,使這些化合物幾乎呈碎片狀。我們還發現,2015年篩查平板的A和B類命中率大大低於C類,即分子量和clogP範圍受限會導致整個篩選的化合物多樣性失衡。基於這些觀察,我們決定更改2019版網格的排名標準:引入高溶解度和高滲透性作為A列的正選擇標準,而MW和clogP不再直接考慮。
但是,為了同時獲得良好的滲透性和溶解性,較低的MW和clogP仍然是有利的。如圖9和圖10所示,與其他兩列相比,2019版第一條高溶解度和滲透率色譜柱的MW和clogP分布已移至較低值。更重要的是,2019版的新設計還似乎對前兩列和前三行中的化學起始點產生了積極影響。
圖6 2015年和2019年篩板的分子量分布
圖片源自JMC.
圖7 2015年和2019年篩板的clogP分布
圖片源自JMC.
總結
目前,2019年的篩選平臺網格是NIBR基於平板多樣性驅動的子集篩選的主要來源,它可用於50-100個子集篩選,每年在NIBR中有超過5萬種化合物用於生化和細胞測試。二維多樣性網格基於篩選化合物集合的關鍵特徵:針對儘可能多的靶標的多樣性覆蓋範圍以及根據需要幹擾靶標的適當化合物屬性。這種大小合適的化合物板組的網格為迭代和子集篩選提供了靈活性,從而允許基於分子特性以及化學和生物多樣性標準選擇板組。
從2015年篩選平臺獲得的一項重要經驗是,將溶解度和滲透性作為決定化合物是否有價值的主要決定因素,而不是MW和clogP範圍。此外,最新可用的機器學習模型在基於2019版推斷的生物活性的分類基礎上擴大分類選擇中發揮了關鍵作用,從而減少了化學骨架分類在分類選擇中的主導地位。
具體而言,添加基於化合物庫的參考活性概況聚類,使我們能夠在選擇過程中增加生物活性信息的權重。總體而言,我們認為我們的2019年基於平板的篩板可以實現多樣性驅動的子集和迭代篩選,並且當前的設計在篩板中提供了均衡的化合物分布。
參考文獻
Evolution of Novartis』 Small Molecule Screening Deck Design.Ansgar Schuffenhauer,* Nadine Schneider, Samuel Hintermann, Douglas Auld, Jutta Blank, Simona Cotesta, Caroline Engeloch, Nikolas Fechner, Christoph Gaul, Jerome Giovannoni,Johanna Jansen, John Joslin, Philipp Krastel, Eugen Lounkine, John Manchester, Lauren G. Monovich,Anna Paola Pelliccioli, Manuel Schwarze, Michael D. Shultz, Nikolaus Stiefl, and Daniel K. Baeschlin*. J. Med. Chem. 2020, DOI: 10.1021/acs.jmedchem.0c01332