在AI背景下,我們會告別藥物研發(fā)的“十年磨一劍”時代嗎?

PART
0
1.

新藥研發(fā),九死一生


新藥研發(fā)速度慢,失敗率高一直都是全世界的藥物研發(fā)企業(yè)所面臨的問題,俗話說:“新藥研發(fā),九死一生”,研究十個能成一個就不錯了,還得靠運氣。新藥研發(fā)時間長,成功率低已變成醫(yī)藥研發(fā)界的代名詞。藥物從無到有,要經(jīng)歷一個漫長的時間過程,我們誰也不知道在這條曲折的路上還有多少坑要邁過去,因為新藥研發(fā)的不確定性太多了,從實驗室研究到新藥上市要經(jīng)過合成提取、生物篩選、藥理、毒理等臨床前試驗等一系列過程,每一步驟都可能需要若干次的失敗來總結(jié)經(jīng)驗。


如此復(fù)雜的研發(fā)過程再加上過程中無法預(yù)料的情況,使得在研發(fā)的每一個階段都有可能失敗,一旦研發(fā)失敗,巨額投入血本無歸也非罕見。藥物從研發(fā)到注冊,研發(fā)時間周期長平均要經(jīng)歷10年,體系復(fù)雜,總的資金投入至少要10億美元。并且不是說投入了就能夠做出來,因為一個藥物研發(fā)的成功率也只有10%,所以說新藥研發(fā)是一個高風(fēng)險的行動。

 

PART

0
2.

人工智能加入醫(yī)藥研發(fā)領(lǐng)域,頭部藥企入局


近年來,人工智能(英語:Artificial Intelligence,縮寫為AI)參與藥物的研發(fā)過程,被提及的越來越多,網(wǎng)上不時曝出某某制藥巨頭與某互聯(lián)網(wǎng)公司達(dá)成強強合作。醫(yī)藥研發(fā)或告別“十年磨一劍”的舊時代,去年下半年以來,AI藥物研發(fā)迎來投資密集期。


醫(yī)藥界大佬輝瑞(Pfizer )更是于2016年就與IBM Watson合作,以加速免疫腫瘤學(xué)領(lǐng)域的藥物發(fā)現(xiàn)。葛蘭素史克一直是利用人工智能的主要制藥公司之一——葛蘭素史克(GlaxoSmithKline)是“加速醫(yī)療機會療法”聯(lián)盟(ATOM)的創(chuàng)始成員之一。其它入局的還有強生與Benevolent AI、默沙東與Atomwise、武田制藥與Numerate、賽諾菲與Exscientia。


與此同時,非醫(yī)藥出身領(lǐng)域的百度、騰訊、華為、字節(jié)跳動等科技巨頭也紛紛布局AI醫(yī)藥領(lǐng)域。今年年初,百度創(chuàng)始人李彥宏牽頭發(fā)起的百圖生科發(fā)起“百萬領(lǐng)軍計劃”及“百萬青年領(lǐng)軍”計劃,將分別用100萬美元年薪、100萬元人民幣年薪以及其他技術(shù)平臺支持,吸引生物技術(shù)+AI技術(shù)跨界融合人才。


李彥宏預(yù)測,未來人工智能在公共衛(wèi)生監(jiān)測、新藥研發(fā)和疾病診斷等方面大有可為。此前,字節(jié)跳動、華為均開始招聘生物醫(yī)藥相關(guān)崗位,騰訊則發(fā)布了由其自主研發(fā)的首個AI驅(qū)動的藥物發(fā)現(xiàn)平臺云深智藥。在今年人工智能藥物研發(fā)公司英矽智能宣布,以人工智能貫穿藥物發(fā)現(xiàn)環(huán)節(jié)(包括機制發(fā)現(xiàn)、靶點發(fā)現(xiàn)及找到新化合物),成功發(fā)現(xiàn)了全新機制藥物,這在全球尚屬首例。


“研發(fā)中僅用時18個月、研發(fā)經(jīng)費約合200萬美元。相較于傳統(tǒng)藥物研發(fā)10年耗資幾十億美元,AI賦能藥物研發(fā)極大縮短了藥物研發(fā)時間,又大大降低了成本。”無疑讓新藥研發(fā)看到了希望。


PART

0
3.

AI介入醫(yī)藥研發(fā),有望改變未來研發(fā)格局


藥這種東西有一個非常明顯的個體屬性。目前已知的化合物結(jié)構(gòu)空間,數(shù)量相當(dāng)龐大,我們能找到的藥物的分子數(shù)或達(dá)到1060,AI就是幫我們在所研究的化學(xué)空間中找出有用的分子,這也是我們在研究中一直關(guān)注的問題,面對1060的空間,我們怎樣用一個更好的數(shù)學(xué)方法把它們表示出來。


一個分子能夠成為藥,它在多方面是優(yōu)秀的——它既要有很好的藥效,同時也可以被很好的吸收,同時不應(yīng)該有毒性等等,我們的研發(fā)過程中就是要找到這些孤立的小島。通過計算機,我們可以輕易的從化學(xué)結(jié)構(gòu)庫中找到幾十萬個或者幾百萬個相似的分子,讓它具有相似的成藥的可能性,相對于讓人去在紙上去畫出結(jié)構(gòu)再去對比研究(可能你畫一萬個分子就已經(jīng)累夠嗆了),AI可以代替我們?nèi)ニ阉鞲蟮幕衔锟臻g,從而為發(fā)現(xiàn)新藥提供更多的可能性。

 

新藥研發(fā)面臨的第二個難題就是:通常很微觀的東西我們就很難去判斷它。對于化合物本身,它有自己的語言,AI可以學(xué)習(xí)到這種化學(xué)結(jié)構(gòu)的語言。AI可以作曲,可以畫畫,因此AI也可以畫化學(xué)分子,通過去學(xué)習(xí)了大量的分子結(jié)構(gòu)數(shù)據(jù)以后,它學(xué)到了一些化學(xué)知識,然后它開始去產(chǎn)生這些分子結(jié)構(gòu),它可能會畫出化學(xué)家所想象不到的化合物結(jié)構(gòu),這些結(jié)構(gòu)也可能是非常不合理的,這種AI在學(xué)習(xí)了化學(xué)知識以后隨機的產(chǎn)生分布,其中有許多并不是我們想要的。


我們想找到的是那些真正高質(zhì)量的結(jié)構(gòu),就需要通過一定的規(guī)則去告訴它,我們到底需要什么樣的分子結(jié)構(gòu),AI通過實踐學(xué)習(xí),能夠真正的去找到那些可以成藥的結(jié)構(gòu),在虛擬的空間中去發(fā)現(xiàn)一個真正的藥物,從這個角度來看我們其實是利用了化學(xué)知識來嘗試和人自身進(jìn)行一場對話,嘗試讓AI在分子層面上去理解。


我們知道通過堿基可以形成DNA序列,然后DNA通過生物學(xué)的過程可以去指導(dǎo)蛋白質(zhì)的合成,我們告訴AI蛋白質(zhì)是由20種氨基酸按照一定的規(guī)律排列起來的,不同的排列會有不同的功能,當(dāng)AI知道可以用計算的方法去計算蛋白質(zhì)的序列,通過學(xué)習(xí)這些知識讓AI可以知道這些結(jié)構(gòu)是怎么影響生物的功能的,不同的蛋白質(zhì)之間,通過三維結(jié)構(gòu)如何產(chǎn)生對話,從而影響到彼此,我們需要AI做的事情就是把我們對生物學(xué)語言的理解,對化學(xué)語言的理解,讓它把這些語言組合到一起,從而能夠找到與疾病相關(guān)的蛋白質(zhì)最匹配的化學(xué)分子,最后發(fā)展成治愈我們疾病藥物。

 

PART

0
4.

AI研發(fā)還有不確定性,未來還需更深入探索


當(dāng)然AI制藥目前也有一定的局限性,在人工智能參與新藥研發(fā)的路上還是會面臨很多的挑戰(zhàn),比如說如何把各個藥企的數(shù)據(jù)結(jié)合到一起,利用更多高質(zhì)量的數(shù)據(jù)去做好的分子模型。當(dāng)然還有跨學(xué)科合作的問題,我們要匯聚化學(xué)、生物學(xué)、計算機、數(shù)學(xué)、統(tǒng)計等等多學(xué)科的人才,這些不同的技術(shù)人員之間怎樣有效的溝通理解,也是一個需要解決的困難。


目前AI制藥研發(fā)中的現(xiàn)狀是,靶點發(fā)現(xiàn)和藥物設(shè)計最熱,AI賦能的靶點發(fā)現(xiàn)和藥物設(shè)計是極具價值的應(yīng)用方向,也是藥物研發(fā)最大的痛點之一,同樣也是最多公司目前開始布局的環(huán)節(jié)。


AI介入后,更大化學(xué)空間探索的實現(xiàn)和更多分子生成方式的產(chǎn)生,使更新穎分子的獲取成為可能,能快速識別處理繁多的數(shù)據(jù),并找出邏輯關(guān)系從而實現(xiàn)智能推薦更少更優(yōu)的分子,縮減任務(wù)量,使研發(fā)更高效。所以說在任何一個新興科技領(lǐng)域,挑戰(zhàn)和阻礙都將是持續(xù)存在的。


從技術(shù)的視角看,目前在AI醫(yī)藥研發(fā)方向上比較明確的挑戰(zhàn)和阻礙有兩方面:一是認(rèn)知層面,AI+醫(yī)藥橫跨了多個學(xué)科,如何提出具有正確的目標(biāo)導(dǎo)向的問題、用多學(xué)科融合的視角思考解決問題的路徑本身就是最大的挑戰(zhàn)。


另外,數(shù)據(jù)也是當(dāng)下該領(lǐng)域面臨的一大挑戰(zhàn),比如數(shù)據(jù)的量、質(zhì)、標(biāo)準(zhǔn)以及孤島效應(yīng)等。但AI制藥的前景必然是光明的,AI制藥技術(shù)的進(jìn)一步突破和創(chuàng)新定會對整個醫(yī)藥研發(fā)產(chǎn)生重大意義。