醫(yī)藥投資:人工智能遇上新藥研發(fā),它能給醫(yī)藥行業(yè)帶來(lái)什么?

兩年前,將人工智能(AI)用于藥物研發(fā)的初創(chuàng)公司只有30家左右,而現(xiàn)在這個(gè)數(shù)目已經(jīng)飆升到了148家。這一統(tǒng)計(jì)雖然還不完全,但是它反映了AI在藥物研發(fā)中的迅猛發(fā)展。今年,美國(guó)著名的硅谷銀行(Silicon Vally Bank, SVB)第一次推出了對(duì)數(shù)字健康領(lǐng)域的投資統(tǒng)計(jì),在今年上半年,對(duì)這一領(lǐng)域的投資已達(dá)到52.6億美元,超過(guò)了2017年全年的投資總數(shù),2019年全年投資總數(shù)有望超過(guò)100億美元!

可以說(shuō),AI技術(shù)的成熟出現(xiàn)在醫(yī)藥產(chǎn)業(yè)發(fā)展的關(guān)鍵節(jié)點(diǎn)上,由于新藥物靶點(diǎn)和作用機(jī)制越來(lái)越少,醫(yī)藥公司需要更多的投入和精力才能產(chǎn)出和以前相當(dāng)?shù)摹癴irst-in-class”藥物。克服這一障礙的方法包括提升研發(fā)效率,和深耕已有數(shù)據(jù)來(lái)發(fā)現(xiàn)新的洞見(jiàn)。AI在這兩個(gè)方面都可以大展身手。
然而,業(yè)界資深人士也表示,在AI迅猛發(fā)展的同時(shí),我們需要警醒AI的研究方向是否走偏了。對(duì)AI能力的過(guò)度炒作可能會(huì)為這一領(lǐng)域帶來(lái)“AI的冬天”。今天藥明康德內(nèi)容團(tuán)隊(duì)將結(jié)合公開(kāi)資料,探討AI在藥物研發(fā)中的潛力和局限。

1566789120(1).jpg

圖片來(lái)源:Pixabay


理解復(fù)雜的規(guī)則


給予足夠多的數(shù)據(jù),機(jī)器學(xué)習(xí)算法能夠從中發(fā)現(xiàn)規(guī)律,然后利用這些規(guī)律來(lái)作出預(yù)測(cè)或者對(duì)新的數(shù)據(jù)進(jìn)行分類(lèi)。它們?cè)谶@方面的表現(xiàn)遠(yuǎn)遠(yuǎn)快于任何人類(lèi)。當(dāng)代的藥物研發(fā)團(tuán)隊(duì)面對(duì)的挑戰(zhàn)是需要系統(tǒng)性地對(duì)海量數(shù)據(jù)進(jìn)行分析,這些挑戰(zhàn)已經(jīng)不是可以單靠人腦來(lái)完成的工作。AI尤其擅長(zhǎng)處理應(yīng)用復(fù)雜的規(guī)則對(duì)大量數(shù)據(jù)進(jìn)行分析。麻省理工學(xué)院(MIT)計(jì)算機(jī)科學(xué)家,楊森(Janssen)公司的科學(xué)顧問(wèn)Regina Barzilay博士表示:“例如,當(dāng)我們?cè)趯W(xué)習(xí)化學(xué)的時(shí)候,我們學(xué)習(xí)了很多規(guī)則并且理解了化學(xué)反應(yīng)的機(jī)制,然而有些時(shí)候,這些規(guī)則非常非常的復(fù)雜。如果我們能夠?yàn)橛?jì)算機(jī)算法提供很多數(shù)據(jù),并且將需要解決的問(wèn)題正確地呈現(xiàn)出來(lái),它們有可能捕捉到人類(lèi)無(wú)法捕捉到的規(guī)律
以藥物毒性為例,在過(guò)去50年里,世界范圍內(nèi)有超過(guò)450款藥物在獲批上市之后因?yàn)槎靖弊饔贸肥?,其中肝臟毒性是最常見(jiàn)的原因。例如在1993年上市的治療皮膚真菌感染的特比萘芬(terbinafine)在上市之后被發(fā)現(xiàn)可能導(dǎo)致肝臟毒性。截至2008年,已經(jīng)有3例因?yàn)楦喂δ芩ソ叨劳龅牟±?0例其它肝臟毒性被證明是由于特比萘芬造成的。然而,藥物在肝臟中的代謝過(guò)程非常復(fù)雜,也非常難于預(yù)測(cè)。
這是機(jī)器學(xué)習(xí)可能幫助解決的典型問(wèn)題,而且我們已經(jīng)擁有了訓(xùn)練AI的數(shù)據(jù)。美國(guó)聯(lián)邦政府的Tox21項(xiàng)目,通過(guò)美國(guó)環(huán)保局(EPA)、國(guó)家衛(wèi)生研究院(NIH)和FDA的合作,構(gòu)建了一個(gè)包含大量分子和它們對(duì)人類(lèi)關(guān)鍵性蛋白毒性的數(shù)據(jù)庫(kù)。這一數(shù)據(jù)庫(kù)可以被用來(lái)訓(xùn)練AI,發(fā)現(xiàn)化合物結(jié)構(gòu)、特征和功能與可能出現(xiàn)的毒副作用之間的關(guān)系。

1566789153(1).jpg

名為Cloud Pharmaceuticals的生物技術(shù)公司已經(jīng)將這些數(shù)據(jù)整合到該公司的化合物篩選過(guò)程中。這家公司去年與大型藥企葛蘭素史克(GSK)達(dá)成一項(xiàng)研發(fā)合作協(xié)議。“使用這一數(shù)據(jù)集訓(xùn)練機(jī)器學(xué)習(xí)算法之后,當(dāng)新分子出現(xiàn)時(shí),AI能夠預(yù)測(cè)它是不是會(huì)具有毒性?!?/span>Cloud公司聯(lián)合創(chuàng)始人兼首席科學(xué)官Shahar Keinan博士說(shuō)。


設(shè)計(jì)更好的新藥


除了發(fā)現(xiàn)潛在毒性以外,機(jī)器學(xué)習(xí)算法還可以預(yù)測(cè)候選化合物在不同物理和化學(xué)環(huán)境下的反應(yīng),從而幫助藥物研發(fā)人員理解它們?cè)谌梭w不同組織中的行為。滑鐵盧大學(xué)(University of Waterloo)的物理化學(xué)家Scott Hopkins博士正在與輝瑞(Pfizer)公司合作,訓(xùn)練算法來(lái)評(píng)估候選分子吸收或者丟失水份的能力。
“如果一個(gè)藥物分子非常迅速地吸收水份并且不會(huì)讓水份流失,這意味著這種藥物在水中很容易溶解,”Hopkins博士說(shuō):“它在胃中會(huì)很快溶解并且進(jìn)入血液循環(huán)。”這一算法通過(guò)分析89種小分子候選藥物結(jié)構(gòu)與可溶性的關(guān)系,能夠準(zhǔn)確預(yù)測(cè)出類(lèi)似分子的關(guān)鍵性特征。這項(xiàng)研究已經(jīng)在Nature Communications上發(fā)表。

1566789178(1).jpg


對(duì)藥物潛在毒性和生化特征的篩查雖然是藥物開(kāi)發(fā)中不可缺少的步驟,但是對(duì)于AI研究人員來(lái)說(shuō),在藥物研發(fā)中的“圣杯”是從頭生成一個(gè)新治療性分子的結(jié)構(gòu)
藥明康德的合作伙伴Insilico Medicine公司,正在使用稱(chēng)為“生成對(duì)抗網(wǎng)絡(luò)“(generative adversarial network, GAN)來(lái)開(kāi)發(fā)全新的小分子化合物,治療癌癥、代謝性疾病和神經(jīng)退行性疾病等嚴(yán)重疾病。這一算法由兩個(gè)互相對(duì)抗的深度神經(jīng)網(wǎng)絡(luò)構(gòu)成。
第一個(gè)深度神經(jīng)網(wǎng)絡(luò)的任務(wù)是根據(jù)一系列化合物應(yīng)該具有的功能和生化特征標(biāo)準(zhǔn)(例如溶解性、靶點(diǎn),或者生物利用度),生成分子結(jié)構(gòu)。而另一個(gè)深度神經(jīng)網(wǎng)絡(luò)的作用是對(duì)第一個(gè)神經(jīng)網(wǎng)絡(luò)輸出的結(jié)構(gòu)進(jìn)行“批評(píng)“。
“它們之間在相互競(jìng)爭(zhēng),“Insilico公司首席執(zhí)行官Alexander Zhavoronkov博士說(shuō):”經(jīng)過(guò)無(wú)數(shù)次的迭代,它們能夠?qū)W會(huì)生成一些全新的結(jié)構(gòu)。
Insilico公司計(jì)劃針對(duì)多個(gè)孤兒藥靶點(diǎn)開(kāi)發(fā)候選藥物分子。

1566789202.jpg

圖片來(lái)源:Insilico公司官網(wǎng)

人工智能的局限性


雖然人工智能在藥物開(kāi)發(fā)領(lǐng)域取得了很大的進(jìn)步,但是它們還無(wú)法取代人類(lèi)的作用。AI在藥物開(kāi)發(fā)中的作用就像一個(gè)智能廚房。“你可以有智能微波爐、咖啡機(jī)和其它智能工具,但是它們都沒(méi)法為你做出一道晚餐,“Barzilay博士說(shuō):”你需要將這些工具整合在一起來(lái)做出一道晚餐,它們只能夠幫助你做的更快更好。
AI的表現(xiàn)受到輸入數(shù)據(jù)質(zhì)量的限制。在今年的藥明康德全球論壇上,業(yè)界的專(zhuān)家也表示,很多時(shí)候,用于訓(xùn)練機(jī)器學(xué)習(xí)算法的高質(zhì)量數(shù)據(jù)并不存在而低質(zhì)量的數(shù)據(jù)可能導(dǎo)致算法從數(shù)據(jù)中獲取虛假的信號(hào),導(dǎo)致了“垃圾進(jìn),垃圾出“的擴(kuò)大化。 現(xiàn)今存在的公開(kāi)數(shù)據(jù)往往由于格式、代表性等多種原因,無(wú)法成為高質(zhì)量的數(shù)據(jù)。對(duì)于有的AI藥物研發(fā)公司來(lái)說(shuō),解決這一難題的辦法是自己生成高質(zhì)量的數(shù)據(jù)。例如,insitro和Recursion公司都在根據(jù)解決特定問(wèn)題的需求,生成自己的數(shù)據(jù)。
藥明康德相關(guān)閱讀:未來(lái)需要怎樣的大數(shù)據(jù)與AI? | 藥明康德全球論壇實(shí)錄

而對(duì)于Gary Marcus博士來(lái)說(shuō),他的擔(dān)憂(yōu)是對(duì)AI能力的過(guò)度炒作可能帶來(lái)與實(shí)際不符的期望值。而看看AI開(kāi)發(fā)的歷史就可以看到,AI領(lǐng)域的開(kāi)發(fā)已經(jīng)在1974-1980年,和1987-1994年,經(jīng)歷過(guò)了兩個(gè)發(fā)展的“冬天“。由于期望不能夠得到實(shí)現(xiàn),AI研究的政府和私人投資都大幅度減少。

1566789235(1).jpg

▲Gary Marcus博士(圖片來(lái)源:Gary Marcus博士個(gè)人網(wǎng)站)


Gary Marcus博士是紐約大學(xué)心理學(xué)和神經(jīng)科學(xué)教授,也是機(jī)器學(xué)習(xí)初創(chuàng)公司Geometric Intelligence的創(chuàng)始人和首席執(zhí)行官。在他看來(lái),深度學(xué)習(xí)(deep learning)是非常出色的算法工具,然而它相當(dāng)于一種超級(jí)記憶。能夠把所有想知道的東西都記下來(lái)當(dāng)然不是件壞事,但是當(dāng)遇到不常見(jiàn)的情況時(shí),它缺乏靈活性,表現(xiàn)并不算好。
他擔(dān)心的是,我們過(guò)于依賴(lài)深度學(xué)習(xí)這一種人工智能的構(gòu)架。即便深度學(xué)習(xí)是一個(gè)完美的“錘子”,但是在醫(yī)藥領(lǐng)域需要解決的問(wèn)題卻不全是“釘子”。試圖使用一種工具來(lái)解決所有問(wèn)題是不恰當(dāng)?shù)模鎸?duì)需要解決的問(wèn)題的多樣性,我們也需要有更為靈活和細(xì)致入微的思考方式?;蛱┛搜邪l(fā)掌門(mén)人Michael Varney博士也在日前的訪談中表現(xiàn)出對(duì)人工智能過(guò)度炒作的憂(yōu)慮。

提供更多的可能性


雖然業(yè)界人士表示,使用人工智能在藥物研發(fā)方面的應(yīng)用存在著過(guò)度的炒作,但是他們?nèi)匀粚?duì)人工智能可能帶來(lái)的可能性非常興奮。無(wú)論是Marcus博士還是Varney博士,都在積極開(kāi)發(fā)和使用人工智能工具,協(xié)助新藥研發(fā)的過(guò)程。
如果能夠?qū)⑺幬锇l(fā)現(xiàn)的效率提高5倍到10倍,從經(jīng)濟(jì)學(xué)角度上講,研究人員可以探索更具風(fēng)險(xiǎn)的研發(fā)項(xiàng)目,因?yàn)槭〉某杀敬蟠蠼档土?/strong>。“華盛頓大學(xué)(Washington University)的S. Joshua Swamidass博士說(shuō)。他帶領(lǐng)的團(tuán)隊(duì)使用機(jī)器學(xué)習(xí),最終在2018年解開(kāi)了特比萘芬導(dǎo)致肝臟毒性之謎。”想像一下,那樣我們可以有能力探索多少種難治疾病的創(chuàng)新療法!


參考資料:

[1] Artificial Intelligence Shakes Up Drug Discovery. Retrieved August 24, 2019, from https://www.the-scientist.com/bio-business/artificial-intelligence-shakes-up-drug-discovery-65787

[2] AI startups are racing into drug development. Here’s 5 burning questions about which will survive. Retrieved August 24, 2019, from https://www.statnews.com/2019/08/22/artificial-intelligence-drug-development-startups-growth/

[3] Machine learning brings cell imaging promises into focus. Retrieved August 24, 2019, from https://www.nature.com/articles/d41573-019-00144-2

[4] Bera et al., (2019). Artificial intelligence in digital pathology — new tools for diagnosis and precision oncology. Nature Reviews Clinical Oncology, https://doi.org/10.1038/s41571-019-0252-y

[5] Warning of an AI winter, a skeptic argues deep learning in medicine needs a reboot. Retrieved August 24, 2019, from https://www.statnews.com/2019/08/21/ai-winter-deep-learning-oversold-in-medicine/