新藥分子發(fā)現(xiàn)提速1200倍!MIT的最新AI模型是如何做到的?

以下文章來源于:藥明康德

在介紹今天的主角之前,想先問大家一個問題:宇宙中存在著數(shù)不清的分子,其中有多少具有潛在的類藥物特征,可用于藥物開發(fā)?


答案是:10^60,與之相比,銀河系中存在的恒星數(shù)量只有10^11顆。

如此龐大的潛在藥物分子數(shù)量使得研究人員們在開發(fā)新藥分子時需要更長的時間,因為它遠遠超出了現(xiàn)有藥物設(shè)計模型所能計算的范圍,這也一直是新藥研發(fā)中的痛點之一。那么,是否有方法可以改善這個現(xiàn)狀呢?

還真有!近期,在一篇即將發(fā)表在國際機器學習會議(ICML)雜志上的論文中提到,MIT的研究人員開發(fā)了一種被稱為“EquiBind”的幾何深度學習模型,可以極大程度提升發(fā)現(xiàn)潛在新藥分子的速度,從而降低藥物試驗失敗的概率,并減少新藥研發(fā)的成本。

微信圖片_20220718170720.png


下面我們來看看EquiBind具體是如何做到的。

在藥物開發(fā)的最早期,研究人員首先要做的是針對目標蛋白找到那些能夠恰當?shù)嘏c其靶點區(qū)域結(jié)合或“對接”的潛在配體,這些配體可以通過阻止蛋白質(zhì)發(fā)揮功能而實現(xiàn)藥用作用。

目前,找到這些候選類藥分子的計算過程是這樣的:最先進的計算模型依賴于大量候選采樣、結(jié)合評分、排序和微調(diào)等方法來找到配體和蛋白質(zhì)之間的最佳“匹配模式”。以一個形象的例子來說明,典型的配體與蛋白質(zhì)結(jié)合的方法就像“將一把鑰匙插入有許多鑰匙孔的鎖”,現(xiàn)有的典型計算模型需要將鑰匙插入每一個鎖孔并對其匹配度逐一進行評分和排序,從而才能選出最佳模型,這將花費大量的時間。

微信圖片_20220718170723.png

▲EquiBind想要解決的問題(圖片來源:參考資料[2])


而EquiBind內(nèi)置了能夠幫助模型學習分子的基本物理信息的幾何推理算法,在遇到此前沒有見過的新數(shù)據(jù)時能夠成功地進行歸納,作出更好的預測。也就是說,EquiBind無需事先了解鎖有哪些鎖孔,在一個步驟中就可以直接預測到精確的鎖孔位置,這被稱為”盲對接”。正是這種方法使EquiBind在成功將配體與蛋白質(zhì)結(jié)合方面比現(xiàn)存最快的計算分子對接模型“QuickVina2-W”還要快1200倍。

那么EquiBind在實際應用中的效果是否如研究者所描述的那般神奇呢?Relay Therapeutics的首席數(shù)據(jù)官Pat Walters先生對EquiBind產(chǎn)生了極大的興趣,并建議其團隊用這一模型模擬一種已經(jīng)用于治療肺癌、白血病和胃腸道腫瘤的藥物與靶點蛋白的結(jié)合。結(jié)果是,當大多數(shù)傳統(tǒng)的對接算法沒有成功預測出這一配體/蛋白的相互結(jié)合時,EquiBind卻做到了。

Walters先生表示:“EquiBind為對接問題(包括姿勢預測和結(jié)合位點識別提供了一種獨特的解決方案。這種借助數(shù)千種公開可用的晶體結(jié)構(gòu)信息的方法將通過全新的方式在計算分子對接模型領(lǐng)域開拓自己的一片天地。”

該論文主要作者麻省理工學院電氣工程和計算機科學系的研究生Hannes St?rk先生也表示,已從行業(yè)專業(yè)人士中收到了大量對EquiBind的反饋,將繼續(xù)改進模型,更好地發(fā)揮該計算模型的實際應用。


參考資料:

[1] Artificial intelligence model finds potential drug molecules a thousand times faster. Retrieved July 12, 2022,from https://news.mit.edu/2022/ai-model-finds-potentially-life-saving-drug-molecules-thousand-times-faster-0712

[2] St?rk et al., (2022). EquiBind: Geometric Deep Learning for Drug Binding Structure Prediction. arXiv, https://doi.org/10.48550/arXiv.2202.05146