醫(yī)藥投資:40萬(wàn)億GB的醫(yī)療數(shù)據(jù),如何助力新藥研發(fā)?

今年5月,國(guó)家藥品監(jiān)督管理局藥品審評(píng)中心(CDE)發(fā)布《真實(shí)世界證據(jù)支持藥物研發(fā)的基本考慮》(意見(jiàn)稿),意味著“如何將真實(shí)世界證據(jù)(RWE)納入到我國(guó)藥物研發(fā)和監(jiān)管決策中”,開(kāi)始成為監(jiān)管層正式思考以及著手推動(dòng)解決的問(wèn)題。


一時(shí)間,行業(yè)熱議:“RWE究竟能解決哪些臨床問(wèn)題?RWS要整合哪些數(shù)據(jù)?RWD采集及處理流程是否留痕可追溯?其數(shù)據(jù)分析的方法學(xué)又是什么?”......


要回答這些直面從監(jiān)管到落地的“靈魂拷問(wèn)”,讓真實(shí)世界證據(jù)真正“為我所用”,首先要解決的就是醫(yī)學(xué)數(shù)據(jù)庫(kù)的問(wèn)題。


對(duì)此,在7月29日,中國(guó)生物統(tǒng)計(jì)2019年學(xué)術(shù)年會(huì)上,醫(yī)療大數(shù)據(jù)及人工智能企業(yè)零氪科技(LinkDoc)創(chuàng)始人兼CEO張?zhí)鞚梢浴拔覈?guó)醫(yī)學(xué)數(shù)據(jù)庫(kù)現(xiàn)狀和挑戰(zhàn)”的議題,給出了來(lái)自行業(yè)一線探索和實(shí)踐者的思考和經(jīng)驗(yàn)分享。

1564714297(1).jpg


產(chǎn)業(yè)需求是真正的驅(qū)動(dòng)力量


“在過(guò)去一段時(shí)間,有幾種力量在驅(qū)動(dòng)著醫(yī)學(xué)數(shù)據(jù)庫(kù)的發(fā)展。


首先是“技術(shù)驅(qū)動(dòng)”。據(jù)IDC Digital預(yù)測(cè),到2020年,醫(yī)療數(shù)據(jù)量將達(dá)40萬(wàn)億GB,這是2010年的30倍。在過(guò)年十年時(shí)間里,醫(yī)療信息化迎來(lái)大發(fā)展,為人類沉淀了大量的“原始材料”,“就像未經(jīng)冶煉的原油”,而接下來(lái)醫(yī)療數(shù)據(jù)化的階段,是基于海量數(shù)據(jù)信息化,服務(wù)價(jià)值輸出的關(guān)鍵和必由之路。


其次是“政策推動(dòng)”。2016年國(guó)務(wù)院辦公廳發(fā)布《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見(jiàn)》,2017年又發(fā)布《關(guān)于促進(jìn)“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展的意見(jiàn)》,再到2018年國(guó)家衛(wèi)健委發(fā)布《國(guó)家健康醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)、安全和服務(wù)管理辦法(試行)》……簡(jiǎn)單梳理下來(lái),三年左右時(shí)間里,國(guó)家累計(jì)發(fā)布30+政策文件,將健康醫(yī)療大數(shù)據(jù)納入國(guó)家大數(shù)據(jù)戰(zhàn)略布局,加速我國(guó)醫(yī)學(xué)數(shù)據(jù)資源共享利用。


最后,也是最重要的是“需求牽引”。


藥品研發(fā)與評(píng)價(jià)、醫(yī)藥營(yíng)銷與流通、商業(yè)健康險(xiǎn)、輔助診斷與輔助治療、基因數(shù)據(jù)分析、醫(yī)學(xué)專業(yè)繼續(xù)教育、臨床科研服務(wù)、藥品監(jiān)管、公共衛(wèi)生管理……在醫(yī)療的各個(gè)領(lǐng)域,數(shù)據(jù)都可以發(fā)揮巨大價(jià)值。“醫(yī)療數(shù)據(jù)平臺(tái)和資源,處于新醫(yī)療產(chǎn)業(yè)的樞紐位置,在個(gè)體化、精準(zhǔn)診療的時(shí)代意義尤其巨大。


也正在這種強(qiáng)勁需求的牽引下,我國(guó)誕生了一些特定功能數(shù)據(jù)庫(kù)與特定人群數(shù)據(jù)庫(kù),如醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)、生物信息數(shù)據(jù)庫(kù)、臨床醫(yī)療數(shù)據(jù)庫(kù)、保險(xiǎn)支付數(shù)據(jù)庫(kù),等等。


“但產(chǎn)業(yè)的需求和牽引,其實(shí)才是真正的力量。

重大疾病藥物研究需求的大力牽引


今天,尤其在醫(yī)藥研發(fā)領(lǐng)域,這股牽引的力量正拉扯的愈發(fā)劇烈。


有數(shù)據(jù)顯示,腫瘤藥物I期到III期試驗(yàn)的時(shí)間為9.6年,從首次申請(qǐng)專利到上市耗時(shí)10.5年,2018年每種腫瘤新藥的平均成本達(dá)到26億美元,研發(fā)成功率下降至8.0%。


“精準(zhǔn)治療時(shí)代的到來(lái),臨床試驗(yàn)難度加大,患者入組難度加大,藥物研發(fā)的時(shí)間成本和財(cái)務(wù)成本顯著上升,而且藥物適用的患者人群非常細(xì)分、離散,臨床診療難度變高,患者管理難度變大。此外,適應(yīng)癥開(kāi)發(fā)的競(jìng)爭(zhēng)與商業(yè)的競(jìng)爭(zhēng),正在成為兩個(gè)平行的主戰(zhàn)場(chǎng),中長(zhǎng)期直接影響商業(yè)開(kāi)發(fā)的潛力。


可以說(shuō),重大疾病藥物研究需求的快速增加,帶來(lái)專病數(shù)據(jù)庫(kù)的巨大需求。


在美國(guó),ASCO就倡導(dǎo)和推動(dòng)了北美多個(gè)腫瘤RWD數(shù)據(jù)平臺(tái)的發(fā)展,如CancerLinQ、Flatiron等。國(guó)際醫(yī)藥巨頭羅氏分別以21億和24億美元收購(gòu)了?Foundation和Flatrion,以推動(dòng)真實(shí)世界數(shù)據(jù)在醫(yī)藥研發(fā)中的應(yīng)用。從中可見(jiàn)一斑。


我國(guó)也一直在積極探索科研級(jí)醫(yī)學(xué)數(shù)據(jù)庫(kù)的建立。如,中國(guó)隊(duì)列共享平臺(tái)(China Cohort Consortium),但它的開(kāi)放程度較低;全國(guó)腫瘤登記中心(National Central Cancer Registry),它的數(shù)據(jù)每年以報(bào)告形式來(lái)公布,而且不完全以臨床研究或者藥物經(jīng)濟(jì)學(xué)研究為目標(biāo)建立。


整體而言,我國(guó)數(shù)據(jù)庫(kù)普遍缺乏以患者為中心的全景、長(zhǎng)效數(shù)據(jù)。而可應(yīng)用于藥物研發(fā)的專病隊(duì)列要求病歷原件的完整度十分高,病歷原件不僅包括院內(nèi)數(shù)據(jù),還有院外數(shù)據(jù)。院內(nèi)數(shù)據(jù)又包括院內(nèi)信息系統(tǒng)數(shù)據(jù)以及科室沉淀數(shù)據(jù);院外數(shù)據(jù)則包括院外處方數(shù)據(jù)以及隨訪等數(shù)據(jù)。以NSCLC患者的病歷原件為例,需要包涵確診入院、手術(shù)、術(shù)后輔助治療、復(fù)發(fā)轉(zhuǎn)移、基因檢測(cè)、1~n線治療、生存數(shù)據(jù)等全流程數(shù)據(jù)。


“患者治病的過(guò)程,就像一個(gè)孩子在吃面包,面包屑掉了一地,就要跟蹤一路把這個(gè)面包屑收起來(lái),這樣才可能產(chǎn)生高質(zhì)量科研級(jí)數(shù)據(jù)。

期待和現(xiàn)實(shí)的差距


所以,當(dāng)真正撿拾起一塊塊的“面包屑”,拼接完整,價(jià)值就是巨大的。


在2018年世界肺癌大會(huì)上,法國(guó)Brest大學(xué)醫(yī)院的多中心、非干預(yù)的回顧性隊(duì)列研究,評(píng)估了真實(shí)世界中納武單抗治療伴腦轉(zhuǎn)移晚期NSCLC的顱內(nèi)有效性。研究結(jié)果顯示,免疫治療在合并腦轉(zhuǎn)移的NSCLC患者中顯示出非常有前景的療效。


在2019年4月4日,輝瑞乳腺癌新藥Ibrance基于真實(shí)世界數(shù)據(jù),獲批男性乳腺癌適應(yīng)癥,震動(dòng)整個(gè)醫(yī)藥界。


看到真實(shí)世界數(shù)據(jù)在醫(yī)藥研發(fā)領(lǐng)域的潛力,2019年5月,CDE發(fā)布《真實(shí)世界證據(jù)支持藥物研發(fā)的基本考慮》(征求意見(jiàn)稿),確定了RWE在罕見(jiàn)病治療藥物、修訂適應(yīng)癥或聯(lián)合用藥范圍、上市后藥物的再評(píng)價(jià)、中藥醫(yī)院制劑的臨床研發(fā)、指導(dǎo)臨床研究設(shè)計(jì)、精準(zhǔn)定位目標(biāo)人群等場(chǎng)景中的應(yīng)用。引發(fā)行業(yè)熱議。


很多人在期待真實(shí)世界數(shù)據(jù)能解決行業(yè)的需求和痛點(diǎn)。


“然而……期待和現(xiàn)實(shí),總是有一些差距。


在理想情況下,應(yīng)用真實(shí)世界數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)提取、模型建立,就直達(dá)深度學(xué)習(xí)、人工智能。而現(xiàn)實(shí)是,應(yīng)用真實(shí)世界數(shù)據(jù),需要跨過(guò)一個(gè)個(gè)溝溝壑壑,包括需求討論、提取數(shù)據(jù)、數(shù)據(jù)清洗、錯(cuò)失值處理、特征工程、模型評(píng)估……

越過(guò)溝溝壑壑


如何才能越過(guò)真實(shí)世界數(shù)據(jù)應(yīng)用的溝溝壑壑?


“打造出真實(shí)、可信、可用的真實(shí)世界臨床數(shù)據(jù)庫(kù),需解決病歷量大、非結(jié)構(gòu)化、隨訪困難、行業(yè)無(wú)標(biāo)準(zhǔn)、安全性等五大問(wèn)題。


建立疾病模型是首要的,“給每一個(gè)疾病設(shè)定一個(gè)通用式疾病模型,一個(gè)基礎(chǔ)模型中有不同的域,每個(gè)域里有不同的變量,每個(gè)變量要設(shè)計(jì)出相關(guān)的約束。


接下來(lái),可以利用人工+人工智能相結(jié)合的方式,對(duì)海量數(shù)據(jù)進(jìn)行深度結(jié)構(gòu)化處理,可以數(shù)倍、數(shù)十倍甚至百倍地提高數(shù)據(jù)處理速度,大幅度降低數(shù)據(jù)處理成本,并保障質(zhì)量。在極為重要的隨訪數(shù)據(jù)集成過(guò)程中,如零氪(LinkDoc)基于算法分配隨訪任務(wù),隨訪數(shù)據(jù)與臨床數(shù)據(jù)實(shí)時(shí)打通,患者個(gè)人信息脫敏,隱私充分保護(hù),實(shí)現(xiàn)全程100%錄音,隨訪成功率達(dá)80%+。


“做好數(shù)據(jù)的結(jié)構(gòu)化、隨訪,只是起點(diǎn)。”接下來(lái)還需要依據(jù)國(guó)際臨床研究CDISC標(biāo)準(zhǔn) ,建立的數(shù)據(jù)處理流程,最終使得真實(shí)世界原始醫(yī)療數(shù)據(jù),轉(zhuǎn)化為科研級(jí)的標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)。


同時(shí),在數(shù)據(jù)庫(kù)的應(yīng)用過(guò)程中更要嚴(yán)格遵守“數(shù)據(jù)物理隔絕,訪問(wèn)權(quán)限控制,應(yīng)用數(shù)據(jù)分層管理,患者知情授權(quán)”的規(guī)范化路徑。


基于這樣的真實(shí)世界數(shù)據(jù)庫(kù),數(shù)據(jù)的價(jià)值就可以充分兌現(xiàn)。


高質(zhì)量的數(shù)據(jù)庫(kù)可以應(yīng)用于大型的臨床研究,助力中國(guó)癌癥新藥研發(fā);通過(guò)創(chuàng)新的模式,助力創(chuàng)新藥開(kāi)展藥品重點(diǎn)監(jiān)測(cè);建立多中心數(shù)據(jù)平臺(tái),幫助專家在頂級(jí)學(xué)術(shù)期刊上發(fā)表高質(zhì)量的學(xué)術(shù)文章,等等。


最后,張?zhí)鞚烧J(rèn)為,真實(shí)世界數(shù)據(jù)庫(kù)是基于臨床病歷,但遠(yuǎn)遠(yuǎn)不止于臨床病歷。“一個(gè)真實(shí)、可信、可用的臨床數(shù)據(jù)庫(kù),需要清晰的目標(biāo)、整體的設(shè)計(jì)、扎實(shí)的質(zhì)量控制,三者缺一不可。”或許也只有這樣,才可以回答那些“靈魂拷問(wèn)”,讓真實(shí)世界證據(jù)真正為臨床診療、藥物研發(fā)及醫(yī)藥產(chǎn)業(yè)所用,讓真實(shí)世界研究真正落地。