ChatGPT熱炒下的AI制藥:不能承受之重

3 月 15 日,OpenAI 發(fā)布 GPT-4,成為公司在ChatGPT之后最先進(jìn)的人工智能系統(tǒng)。

ChatGPT的出現(xiàn),再次讓和AI相關(guān)的一切領(lǐng)域站上風(fēng)口?!?021年那一波AI制藥的投資人又開始活躍起來了,見面就聊ChatGPT能不能帶來什么新的機(jī)會(huì),這也是最近醫(yī)藥寒冬里為數(shù)不多的積極話題了。”一名投資機(jī)構(gòu)人員說到。

而看到這條消息,國內(nèi)最早從事AI行業(yè)的曹翎(化名)在朋友圈留下了一句很“不應(yīng)景”的話:“真正的失落都是無聲的?!?/span>

十幾年來,曹翎一直在AI行業(yè)穿行不歇。他的最后一份工作,是在國內(nèi)某知名大廠背景的AI制藥公司從事AIDD(AI藥物發(fā)現(xiàn)和設(shè)計(jì))。如今退圈的他有一些寫書的計(jì)劃,只想“為這個(gè)行業(yè)做一些基礎(chǔ)建設(shè)工作”。

對(duì)于像曹翎一樣的AI從業(yè)者而言,這個(gè)行業(yè)就像是幸運(yùn)大轉(zhuǎn)盤上的指針,曾經(jīng)定格在電商、游戲、直播等行業(yè)。2021年,這枚指針落到了生物醫(yī)藥領(lǐng)域。一眾國內(nèi)AI制藥初創(chuàng)便像雨后春筍一般崛起。但隨之而來的,還有意料之中的內(nèi)卷、路演,和資本的游戲。

一邊,AI制藥已經(jīng)成為了一個(gè)大型投注箱,其中回蕩著金錢的碰撞聲:如果人類生命科技的未來注定屬于多特異性藥物,那善于分析復(fù)雜分子的AI必定大有可為;另一邊,則是AI制藥的算力、數(shù)據(jù)庫、準(zhǔn)確性問題一直沒有得到突破性解決,現(xiàn)階段AI只能把藥物研發(fā)效率從11%提高到14%。

“制藥行業(yè)其實(shí)根本不在乎AI。”曹翎有點(diǎn)苦澀地說?!澳鉇I做成的數(shù)據(jù)再漂亮,藥企可能只會(huì)花研發(fā)中的5%的權(quán)重去買它。現(xiàn)在大藥企就是看這些AI制藥企業(yè)表演著,等表演得差不多了,再大家一起把這一塊兒買走。”

而在大藥企作壁上觀的另一邊,是這些AI初創(chuàng)人員為了數(shù)據(jù)準(zhǔn)確性能再提升零點(diǎn)幾加班加點(diǎn)、苦不堪談。“AI制藥是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的活兒,產(chǎn)品迭代特別快,但其實(shí)背后的規(guī)律性沒有搞透,真正的生物科學(xué)家又看不上?!薄诓荇峥磥?,如今的AI制藥從所謂的前沿科技漸漸滑落為一種四不像的尷尬產(chǎn)品,這是行業(yè)真正的失落所在。

相比于過去的AI投資人再次燃起的熱情,在二級(jí)市場重新吃香的相關(guān)企業(yè),諸如復(fù)星醫(yī)藥、成都先導(dǎo)、藥石科技等,卻在業(yè)內(nèi)人士看來并不是純粹的AI制藥企業(yè):要么是AI技術(shù)只占公司業(yè)務(wù)很小一部分,要么底子上是制造業(yè)化工的邏輯。而二級(jí)市場的重新繁榮,并沒有帶動(dòng)起整個(gè)投融圈的熱情。業(yè)內(nèi)人士透露,對(duì)于大部分真正只做AI制藥的初創(chuàng)而言,現(xiàn)金流即將在半年之內(nèi)出現(xiàn)巨大黑洞。

如今,大部分的人已經(jīng)認(rèn)清AI制藥的工具屬性,應(yīng)服從制藥業(yè)本身的邏輯。而只要它在行業(yè)中的應(yīng)用程度和作用強(qiáng)度不發(fā)生改變,那么不管是股市的喧囂一片、還是AI技術(shù)的飛馳而過,對(duì)于AI制藥行業(yè)都只是一些遙遠(yuǎn)的消息而已。

-01-2021-2023,AI制藥資本的冷與熱

去年12月,晶泰科技回應(yīng)了港股 18C咨詢文件,這距離它最后一次融資已經(jīng)過去了一年半的時(shí)間。

作為國內(nèi)AI制藥的頭部,晶泰科技在2021年時(shí)也經(jīng)歷過50家國際機(jī)構(gòu)融資競標(biāo)、額度達(dá)到8億美元、投后估值達(dá)到19.68億美元的盛況。然而,隨著2022年生物醫(yī)藥市場環(huán)境的失速,公司不得不擱淺了美股IPO的計(jì)劃。

2021年是AI制藥最好的年頭。DeepMind的深度學(xué)習(xí)算法Alphafold剛剛被驗(yàn)證能夠準(zhǔn)確預(yù)測蛋白質(zhì)的三維結(jié)構(gòu),就遇到了那一年的biotech上升期。AI制藥公司的數(shù)億融資俯拾皆是,與藥企合作捷報(bào)頻傳。“當(dāng)時(shí)我們公司為了挖人,曾經(jīng)開出過100萬美元的天價(jià)高薪。”一名AI制藥企業(yè)員工回憶。

然而,僅僅一年時(shí)間,AI制藥卷起的泡沫就被打得粉碎。醫(yī)藥寒冬一來,錢去人空不可避免。去年一整年,部分美國上市的AI制藥市值已經(jīng)低于1億美元,跌幅超過90%,其中不乏Absci、Schrdinger這樣的獨(dú)角獸。在國內(nèi),風(fēng)口也巔峰不再,去年上半年融資總額同比縮水2/3。

除了突如其來的資本風(fēng)暴以外,AI制藥式微的主要原因還在于:它并沒有像原先人們所料想的那樣,幫藥企解決卡點(diǎn)問題。本質(zhì)上,它只是把藥企目前面臨的問題,用不同的語言再重新書寫一遍。

一名AI制藥領(lǐng)域的專家介紹到,這個(gè)行業(yè)最早是賣軟件的,但是只收服務(wù)費(fèi),上限比較低;如今是在做CRO還是做藥之間產(chǎn)生分歧:晶泰偏CRO,英矽偏biotech——但不管是哪種路線,它都沒有在根本上解決藥物研發(fā)的失敗率和成本問題。

資本市場曾經(jīng)流行著一個(gè)誘人的故事:AI可以將公司的藥物發(fā)現(xiàn)成本降低高達(dá)70%。但事實(shí)上,這只是理想數(shù)據(jù),因?yàn)槟壳笆袌鲞€沒有見證到AI制藥的最終產(chǎn)品——2022年,第一款由AI設(shè)計(jì)、號(hào)稱只用了12個(gè)月便進(jìn)入臨床的分子DSP-1181因I期未達(dá)標(biāo)而折戟。

公司需要在前期打通數(shù)據(jù)、算力、算法,這絕非小數(shù)目;交叉學(xué)科中人才的稀缺問題,造成昂貴的人才成本;生物驗(yàn)證過程中的各種不確定性,造成來來回回的退回和返工——而這一切都讓AI制藥,絕不像它聽上去那么省錢。

最重要的是,大部分AI制藥公司目前并沒有清晰的發(fā)展主線,商業(yè)化通路處于觀望狀態(tài),往往會(huì)在“既要又要”的“嘗試”中損耗精力。曹翎提到,自己的老東家,就因?yàn)橐恍╊A(yù)算以外的投入,導(dǎo)致產(chǎn)出的虎頭蛇尾?!霸谧鏊幹?,公司必須把周邊的東西搞齊或摸排清楚,其中包括不同的生物技術(shù)路線,包括產(chǎn)業(yè)鏈上下游的東西,要保證企業(yè)又能賣產(chǎn)品,又有自己做藥的能力。這部分成本是非常大的?!?/span>

AI制藥同樣面臨著生物醫(yī)藥領(lǐng)域同質(zhì)化競爭的問題。簡單來說,AI的學(xué)習(xí)資料是人類已經(jīng)創(chuàng)造的實(shí)驗(yàn)數(shù)據(jù),對(duì)于那些冷門的靶點(diǎn)信息,AI無法無中生有。“AI制藥公司用的數(shù)據(jù)庫都差不多,算法技術(shù)也沒有太大的技術(shù)壁壘,無非是針對(duì)場景慢慢進(jìn)行優(yōu)化。說到最后,還是拼靶點(diǎn)?!鄙鲜鯝I制藥企業(yè)員工說。

一切似乎都回到了AI制藥出現(xiàn)之前的原點(diǎn),邏輯和難點(diǎn)都沒有改變。

2023年,隨著ChatGPT的大火,不少AI制藥企業(yè)就像殺入18C的晶泰科技一樣,意圖再度抬頭。成都先導(dǎo),皓元醫(yī)藥、藥石科技、泓博醫(yī)藥等醫(yī)藥上市公司先后披露布局AI制藥賽道相關(guān)情況?!巴顿Y人們最關(guān)心的就是,ChatGPT這種生成式AI能不能給制藥行業(yè)帶來什么新的東西?!鄙鲜鐾顿Y機(jī)構(gòu)人員說。

AI制藥不能和ChatGPT比較,因?yàn)橛?xùn)練后者的,是強(qiáng)大的互聯(lián)網(wǎng)工業(yè)和二十年左右的語言模型發(fā)展。相對(duì)而言,AI制藥實(shí)在是太年輕了?!?/span>這名投資機(jī)構(gòu)人員繼續(xù)說道,“甚至可以說,對(duì)于AI制藥公司而言,最難的時(shí)刻還沒有到來。因?yàn)榇笈漠a(chǎn)品還沒有進(jìn)入到臨床階段,真正的大考還沒有到來?!?/span>

-02-ChatGPT給的機(jī)會(huì)在哪里

在這一輪熱度之前,AI制藥還只是生物醫(yī)藥行業(yè)的一個(gè)影子,無法擺脫跟隨式發(fā)展的限制。而ChatGPT這一劑強(qiáng)心針,不僅打在了二級(jí)市場的心坎上,還讓不少投資機(jī)構(gòu)給出觀點(diǎn):ChatGPT給了AI制藥一個(gè)從輔助性向創(chuàng)造性遷移的機(jī)會(huì)。

“ChatGPT是一個(gè)數(shù)據(jù)與經(jīng)驗(yàn)結(jié)合的大模型,而藥物研發(fā)比較重要的是靶點(diǎn)的發(fā)現(xiàn),本來也是對(duì)基因、蛋白組學(xué)的數(shù)據(jù)進(jìn)行分析,建立關(guān)聯(lián),所以比較容易被大模型所替代。短期來看,GPT可以取代初級(jí)和中級(jí)的藥物專家。”上述AI制藥領(lǐng)域?qū)<艺f。

一方面,GPT架構(gòu)的排序訓(xùn)練方式,在理論上可以融合所有藥物研發(fā)的模態(tài)數(shù)據(jù),支持通用的藥物研發(fā)模型;另一方面,它可以成為一個(gè)整合核心,通過API的方式調(diào)用各個(gè)子模塊,而子模塊返回的結(jié)果可以通過核心GPT進(jìn)行整合報(bào)告,從而實(shí)現(xiàn)更加專業(yè)的預(yù)測。

簡單來說,GPT有一個(gè)大底座,可以承載更多的生物信息(小分子結(jié)構(gòu),蛋白質(zhì)序列,化學(xué)反應(yīng),小分子與蛋白質(zhì)對(duì)接,過濾規(guī)則等),也可以在不同步驟進(jìn)行及時(shí)反饋,趨近準(zhǔn)確。

這其實(shí)解決的是AI制藥曾經(jīng)出現(xiàn)過的兩個(gè)問題:第一,是模態(tài)不全,不同維度的生物信息之間無法協(xié)同導(dǎo)出綜合判斷;第二,是運(yùn)算壓力造成的算力問題,經(jīng)常會(huì)導(dǎo)致預(yù)測結(jié)果不夠準(zhǔn)確。

可以說,如果AI制藥是一把槍的話,那么ChatGPT的確讓它彈夾更大、彈道更直了;然而,如今AI制藥最頭疼的數(shù)據(jù)問題——即:子彈該如何被完美地上膛后射出,卻始終沒有得到清晰的答案。

水木未來CEO郭春龍?jiān)硎具^,給數(shù)據(jù)做標(biāo)簽,這是 ChatGPT 能夠突飛猛進(jìn)發(fā)展的一個(gè)前提條件,而AI制藥在這方面還沒有準(zhǔn)備好?!澳憬o一段話加上個(gè)標(biāo)簽,成本最多1分鐘甚至幾秒鐘的事。但是你要希望給一個(gè)蛋白質(zhì)的序列加上標(biāo)簽,往往需要大量的實(shí)驗(yàn),包括電鏡的收數(shù)據(jù)、解數(shù)據(jù),它的成本要高很多?!?/span>

比起貼標(biāo)簽的成本,更嚴(yán)峻的是數(shù)據(jù)來源問題。ChatGPT依托在互聯(lián)網(wǎng)這一共享平臺(tái)上,而在可見的未來,制藥行業(yè)的數(shù)據(jù)壁壘無法被打破。

除去有限的公共數(shù)據(jù)庫外,AI制藥公司只能通過與藥企合作、自有實(shí)驗(yàn)平臺(tái)、委托CRO等形式獲取用以訓(xùn)練系統(tǒng)的信息;同時(shí),因?yàn)椴煌瑢?shí)驗(yàn)室或公司數(shù)據(jù)標(biāo)準(zhǔn)化程度都不一樣,前期輸入的標(biāo)準(zhǔn)化轉(zhuǎn)譯也必須投入大量人力、財(cái)力。

“從數(shù)據(jù)來看,只有蛋白結(jié)構(gòu)這個(gè)事情是可以解決的,其他環(huán)節(jié)的一些定量的、定性的實(shí)驗(yàn)數(shù)據(jù)因?yàn)闃?biāo)準(zhǔn)化問題,80%實(shí)際上都是不可靠的?!辈荇嵴f。

另一個(gè)GPT能做到、而目前AI制藥無法做到的事情同樣和數(shù)據(jù)相關(guān)。GPT的特點(diǎn)之一在于對(duì)信息的理解和篩選,其中涉及到強(qiáng)度和權(quán)重的賦值,可以理解為:人工智能可以決定在海量信息中重點(diǎn)看什么,不去看什么。而目前,生物類數(shù)據(jù)還沒有找到一種有效的方式,可以表現(xiàn)突出關(guān)系或信息的重要性層級(jí)。

“目前大家希望可以通過蛋白序列和基因序列的手段去解決這個(gè)問題。但這些序列在發(fā)生功能的時(shí)候,已經(jīng)是一個(gè)結(jié)構(gòu)化的東西了。相當(dāng)于我們用一維的手段,去研究四維狀態(tài)的現(xiàn)象背后的規(guī)律,然后再去映射它的功能,說實(shí)話挺難的。”曹翎說。

-03-對(duì)AI制藥有期待,錯(cuò)了么?


不管是科學(xué)界還是產(chǎn)業(yè)界,如今越來越多的人正在認(rèn)定:多特異性藥物,將引發(fā)現(xiàn)代制藥工業(yè)的第四次革命性浪潮;那么,似乎沒有什么理由可以指摘人們對(duì)AI制藥的高度期待了。

面向未來的藥物形態(tài),將擁有多重治療機(jī)制和豐富的合成結(jié)構(gòu),其核心就是“以復(fù)雜對(duì)抗復(fù)雜”,其中便給了AI分析和設(shè)計(jì)的廣闊空間。

但同時(shí),“復(fù)雜”也給了AI制藥一種無的放矢、無處著力的困境。一名AI制藥企業(yè)管理人員總結(jié)道:“做藥是個(gè)非常復(fù)雜的系統(tǒng)工程,AI在其中一個(gè)環(huán)節(jié)的加速,可能會(huì)被另一個(gè)環(huán)節(jié)所稀釋。因此,AI制藥必須要找準(zhǔn)最關(guān)鍵的杠桿點(diǎn)。如果在一個(gè)點(diǎn)上能有千倍以上的提升,就會(huì)有一個(gè)從量變到質(zhì)變的過程?!?/span>

簡單點(diǎn)說,AI制藥企業(yè)未來的定位,應(yīng)該是像狙擊槍一樣?!按笏幤缶拖袷泅睆棙?,打擊范圍大,總有那么一兩發(fā)是中的?!辈荇嵴f。不管是AI制藥初創(chuàng),還是傳統(tǒng)藥企,研發(fā)都是一個(gè)幾率問題。大藥企能承擔(dān)巨額的試錯(cuò)成本;相對(duì)而言,AI制藥不能走量,只能在一些細(xì)分方向或步驟上做出四兩撥千斤的效果。

換句話說,如果我們所期待的,是AI在復(fù)雜問題中提供全面而完美的解決方案,那么失望是在所難免的;但如果AI可以在復(fù)雜環(huán)境中,做撬開問題的一個(gè)杠桿,那我們將很可能獲得一個(gè)全新的視角。

一名AI制藥初創(chuàng)的研發(fā)人員發(fā)現(xiàn),AI給人的感覺就像一個(gè)孩子一樣——經(jīng)常出錯(cuò),但也能帶來驚喜?!白罱覀兏粋€(gè)臨床的合作方在做一個(gè)類似于自免罕見病的項(xiàng)目。對(duì)方問:如果給你患者的血液樣本,你能不能分析它特定負(fù)極的bcr組庫,然后去反向找自免抗原?理論上,因?yàn)槿梭w內(nèi)的蛋白是已知的,如果用高通量的結(jié)構(gòu)和親和力模型去做的話,是有機(jī)會(huì)的。我們就用AI試了試,最后給他推薦了4個(gè)。結(jié)果昨天他告訴我,其中一個(gè)挺有希望的?!?/span>

長期和AI打交道的經(jīng)驗(yàn)告訴這名研發(fā)人員,任何時(shí)候都不能高興得太早。但只要有耐心,AI就能不斷在錯(cuò)誤中爬起來、成長起來。

“之前我們用全人源的小鼠篩了一個(gè)相對(duì)復(fù)雜的靶點(diǎn),是非特異性結(jié)合。我們就用AI去優(yōu)化了一下,明顯發(fā)現(xiàn)它在od450的層面的比值下降了很多,相當(dāng)于我獲得了一個(gè)推薦結(jié)合的靶點(diǎn)。但后來測試的時(shí)候,才發(fā)現(xiàn)它沒有blocking function?!彼貞浀?,“后來我們大概又迭代了兩輪,這樣就把分子拿到了,就最終結(jié)果而言還是好的?!?/span>

在這名研發(fā)人員看來,目前AI制藥最受詬病的一點(diǎn),就是沒法一步到位地實(shí)現(xiàn)目標(biāo),這背后涉及的是對(duì)其商業(yè)效率的焦慮。“在沒有找到正確路徑之前,一切都有可能發(fā)生,甚至有可能會(huì)出現(xiàn)迭代以后數(shù)據(jù)準(zhǔn)確性下降的問題。而生物驗(yàn)證那邊的反饋又很慢,效果好不好需要做上15天的實(shí)驗(yàn)才能知道結(jié)果?!?/span>

在AI制藥方興未艾、勢單力薄的當(dāng)下,大部分企業(yè)在面對(duì)藥企客戶時(shí)并不具有議價(jià)權(quán)。業(yè)內(nèi)人士稱,和AI制藥初創(chuàng)合作的藥企,大部分也都是抱著“玩票”的心態(tài),“象征性地”給一些合作款項(xiàng)。

總體而言,AI制藥的服務(wù)報(bào)價(jià)低、周期長,作為一款提供靈感的玩具而言,它顯得實(shí)在太奢侈了;而它什么時(shí)候能升級(jí)為一款成熟的工具,還得依靠“玩”出來的思路和可能性——這也正是AI制藥行業(yè)目前感到矛盾的地方。

李昀丨撰文

王晨丨編輯

來源:深藍(lán)觀