數據體量激增、商業(yè)探索初顯,基因檢測步入智能化時代?

2017年,伴隨Illumina旗下NovaSeq系列基因測序儀上市,全基因組測序成本被進一步拉低到不足1000美元。一時間,全球基因數據體量和解析需求激增。彼時,動脈網曾預測,作為基因科技行業(yè)爆發(fā)的第二曲線,如何更快速、準確地進行基因數據分析和解讀,將會成為關鍵命題。

 

如今,互聯(lián)網和科技巨頭入局推動信息技術(IT)與生物技術(BT)相融合,似乎正在印證當時的推測。在生物信息學家眼里,人體就是一個程序,是由基因組這個程序控制的化學反應與物理變化。測序樣本數據在實驗室中產生,而后與信息系統(tǒng)中沉淀的數據相比對,從而發(fā)現(xiàn)突變點位,并以此為基礎解讀出終端可用的結果。當基因測序數據量仍處于爬坡階段,IT的角色是針對特定問題的各種專業(yè)分析工具。而眼下的數據規(guī)模漸已超出分析工具的承受極限,云計算、超高性能芯片加速、人工智能算法開始定義“IT+BT”的底層邏輯。

 

從科研服務到臨床應用,從腫瘤診療到感染病防治,基因科技的商業(yè)化場景層出不窮,明星產品和公司總在輪換。到底什么才是構筑基因公司之根本的核心競爭力?我們?yōu)楹未藭r重提基因數據話題?多年前設想以信息技術迭代基因科技的圖景是否顯現(xiàn)?本報告將試圖揭曉答案。

 

在報告中,我們通過行業(yè)及產品梳理、專家訪談,總結出關于基因檢測智能化的以下核心觀點,以饗讀者。


核心觀點

1、國內外基因測序上游競爭格局板塊移動明顯,將撬動中游服務商深度洗牌;


2、認知紅利趨盡,基因檢測服務商轉而重視修煉內功,數據能力建設是核心;


3、新藥、科研與臨床基因大數據分析需求井噴,臨床數據挖掘潛力巨大;


4、區(qū)域與企業(yè)平臺建設加速,標準與規(guī)范夠艱難,基因數據庫涉深水區(qū);


5、上游測序與下游應用均趨成熟,數據庫依然掣肘基因科技步入智能化;


6、頭部企業(yè)基因智能化產品與服務頻出,但研發(fā)與應用整體仍處于起步階段。


基因檢測智能化現(xiàn)狀與機遇


基因檢測是指對人類的DNA、RNA、蛋白質及代謝物進行分析,以診斷、預測或預防遺傳性疾病的發(fā)生,指導疾病治療方案的選擇(藥物種類及劑量的選擇),或預測疾病的復發(fā),也可以作為評估個人體質或特質的依據。目前,用于進行基因檢測的技術主要分為PCR技術、基因測序技術、FISH技術和基因芯片技術四種?;诨虼髷祿膽茫瑴y序技術成為最為主流的基因檢測技術。
 
以二代基因測序(NGS)技術為例,基因測序的流程包括樣本采集、數據生產、數據分析、數據解讀與轉化應用等環(huán)節(jié)。如今NGS技術依然依靠人工操作,無法避免人工對于數據生產質量的影響以及人工帶來的數據生產成本和時間限制;需處理的基因數據規(guī)模龐大,最大可達到PB或EB級別,以及數據分析采用的生物信息分析算法十分復雜使得數據分析環(huán)節(jié)繁瑣,效率低,耗時長。

政策法規(guī):新醫(yī)改與生命健康新基建推動基因檢測行業(yè)跑步進入智能化行業(yè)

2017年,《國務院關于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》中提到基于人工智能開展大規(guī)?;蚪M識別、蛋白組學、代謝組學等研究和新藥研發(fā),推進醫(yī)藥監(jiān)管智能化。因此,基因測序的智能化生產體系是必然趨勢,有助于基因數據生產的流程規(guī)范化、數據的全程質控以及測序成本和時間的控制。
 
基因檢測行業(yè)的發(fā)展目前仍由技術驅動,但是相關政策環(huán)境也為基因檢測智能化的發(fā)展提供充足的養(yǎng)料。

生命健康新基建。2020年4月的國務院常務會議中將新型基礎設施(簡稱“新基建”)定義為以新發(fā)展理念為引領,以技術創(chuàng)新為驅動,以信息網絡為基礎,面向高質量發(fā)展需要,提供數字轉型、智能升級、融合創(chuàng)新等服務的基礎設施體系。
 
2020年4月,國務院應對新型冠狀病毒肺炎疫情防聯(lián)控機制發(fā)布《關于進一步做好疫情期間新冠病毒檢測有關工作的通知》:明確三級綜合醫(yī)院均應當建立符合生物安全二級及以上標準的臨床檢驗實驗室,獨立開展新型冠狀病毒檢測;對醫(yī)療資源相對缺乏、檢測能力相對薄弱的地區(qū),選擇1家綜合實力強的縣級醫(yī)療機構予以重點支持,實現(xiàn)縣域內醫(yī)療機構具備核酸檢測能力。

近年來,我國將基因檢測作為國家重點領域,加大了支持力度,先后推出了多項政策、制度進行扶持,為行業(yè)的發(fā)展創(chuàng)造了良好的政策環(huán)境,同時也逐步收緊了對基因檢測的監(jiān)管。
 
2021年3月,《中華人民共和國國民經濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要》正式發(fā)布,明確“基因與生物技術”作為七大科技前沿領域攻關領域之一;“生物技術”作為九大戰(zhàn)略性新興產業(yè)之一,其中“基因技術”為未來產業(yè)。
 
2016年,我國過先后發(fā)布了多條與之相關的關鍵性國家政策,基因檢測經歷了從產業(yè)發(fā)展倒逼政策改革,到以政策引導產業(yè)發(fā)展的階段。2016年4月15日,國家發(fā)改委頒布了《國家發(fā)展改革委辦公廳關于第一批基因檢測技術應用示范中心建設方案的復函》,正式批復建設全國27個基因檢測技術應用示范中心,鼓勵加快基因檢測產業(yè)的快速發(fā)展。
 
2017年,我國啟動十萬人基因組計劃,十三五規(guī)劃將發(fā)展基因技術作為生物醫(yī)藥產業(yè)創(chuàng)新的核心任務,由此,以基因技術為核心的生物產業(yè)獲得快速發(fā)展,并帶動基因測序行業(yè)邁入爆發(fā)期。
 
2019年,《健康中國行動(2019-2030年)》明確提出“加快推動從以治病為中心”轉變?yōu)椤耙匀嗣窠】禐橹行摹保岢鲱A防是最經濟、最有效的健康策略,而基因檢測是最有效的預防手段,隨著“健康中國2030”上升為國家戰(zhàn)略。

市場規(guī)模:精準醫(yī)療需求之井噴態(tài)勢與基因檢測成本之超摩爾定律下降

基因檢測市場空間隨著2015年二代測序技術的上市迅速打開。二代測序技術憑借通量大、準確度高、價格低廉的優(yōu)勢成為當前主流的基因檢測技術,引領行業(yè)迅速發(fā)展。醫(yī)療的未來無疑是精準醫(yī)療,國家鼓勵和支持發(fā)展以基因測序為基礎的精準醫(yī)療。科技部在2015年3月首次召開的“國家精準醫(yī)療戰(zhàn)略專家會議”中提出2030年前政府擬投入600億元發(fā)展精準醫(yī)療。根據預測,全球基因檢測市場規(guī)模將從2019年的122億美元增長至2024年的280億美元,年復合增長率高達18.08%;國內基因檢測市場將從 2019 年的106.54億元增長至2026年的281.34億元,未來市場空間十分可觀。
 
基因測序技術的進步帶動了基因測序成本大幅下降,遠超摩爾定律。根據 National Human Genome Research Insititute 公布的數據,2001年平均每兆堿基的測序成本是5292.4美元,單人類基因組測序成本是9526.3萬美元。2006年美國第二代基因測序企業(yè)454 Life Science 推出超高通量基因組測序系統(tǒng),二代測序技術的產生使得平均每兆堿基的測序成本下降至581.9美元,單人類基因組測序成本下降至1047.5萬美元。隨著新技術和新測序設備的推出,此后基因測序成本以超“摩爾定律”的速度不斷下降,至2020年平均每兆堿基的測序成本低至0.01美元,單人類基因組測序成本低至689美元。

成長階段:疾病關系、算法驗證相對復雜,基因檢測智能化尚處于早期

數字化大潮下,智能化為基因檢測技術賦能,通過將數據分析流程所需的設備、生物信息分析軟件、數據庫與人工智能技術結合在一起,實現(xiàn)自動化數據分析和智能決策系統(tǒng),促進基因檢測行業(yè)高質量發(fā)展,然而數據分析算法、基因組與疾病之間的關系的復雜性使基因檢測智能化處于早期發(fā)展階段。
 
然而,知易行難,基因檢測智能化仍然面臨許多技術壁壘。
 
大數據庫。如今基因檢測技術發(fā)展得十分成熟,很多企業(yè)都能生產基因數據,然而基因數據的解讀卻非常困難,因為基因與疾病的關系復雜,并且依賴于用來解釋不確定遺傳檢測結果的大數據庫,以此才能將基因數據轉化成臨床決策。
 
數據分析算法。隨著基因組數據的迅速增加和所需要分析解讀的突變類型日益復雜,表型和醫(yī)療數據也不斷豐富,對數據分析算法提出了更高的要求。
 
業(yè)務模塊復雜。基因檢測智能化能力的構建是圍繞數據生產、傳輸、分析、應用的全生命周期流程進行,業(yè)務模塊的復雜和對數據安全更敏感等原因,使得基因檢測技術難以完美地與數字技術結合在一起,未來基因檢測智能化還有很長的道路要走。
 
雖然基因檢測智能化還處于早期階段,但發(fā)展迅猛,國內已有產品上市,例如華大基因的生信分析一體機HALOS和諾禾致源的一站式解決方案Falcon柔性智能生產系統(tǒng)等。

資本熱度:計算機、互聯(lián)網、基因測序平臺巨頭紛紛入局撬動行業(yè)變革

截至報告發(fā)布,2021年,中國基因檢測行業(yè)共發(fā)生了106起融資交易事件,披露融資交易總額達213億元,相比2020年增加10%(2020年約193億元)。2021年融資交易事件較2020年增加32起,但融資額相差不多的主要原因是缺少類似華大智造在2020年4月完成超10億美元的超大融資事件。
 
從2015年到2021年的融資額和融資事件來看,2020年是基因檢測行業(yè)融資交易事件的高峰期,年增長率高達153%,而2021年延續(xù)了基因檢測的融資熱潮,資本持續(xù)關注。
 
目前,我國基因檢測行業(yè)的融資集中在測序儀及試劑耗材生產企業(yè)上,而國外同時期的投資方向主要集中在基因數據分析領域,且多數企業(yè)已進入后期階段。另外,國外的產業(yè)結構和資本市場比國內成熟,獨角獸企業(yè)(包括未上市和上市企業(yè))覆蓋基因行業(yè)上、中、下游,主要業(yè)務涉及儀器及試劑研發(fā)、科研和臨床基因檢測服務以及數據分析等。由于測序技術壁壘高,國內僅有幾家公司能夠自主研發(fā)基因測序儀等設備,多數企業(yè)集中于數據分析、試劑耗材生產和中游的檢測服務。而我國2021年獲得融資的企業(yè)大多處于B輪及以前的階段,表明國內基因數據生產及分析還處于早期產品化階段。
 
基因大數據擁有廣闊的應用場景和市場,是醫(yī)療健康領域能最快大規(guī)模轉化應用的行業(yè)。而PB級別的基因大數據的分析與運用離不開云計算、人工智能、大數據、5G、區(qū)塊鏈等數字技術。IT企業(yè)擅長的數字技術的數據規(guī)模大、強大算力和算法以及安全可靠賦能基因行業(yè),為傳統(tǒng)基因檢測行業(yè)帶來生產力的變革。

市場角色:5大角色構筑生態(tài),初代產品已進入市場推動檢測效率提升

基因檢測行業(yè)一般由生命數字化信息的采集、數據生產、分析、解讀與轉化應用等5大環(huán)節(jié)構成,基于大數據實現(xiàn)大規(guī)模人群的精準醫(yī)療和全生命周期管理。
微信圖片_20211124134121.jpg
基因檢測行業(yè)價值鏈

數據分析是運用生物信息分析對下機數據進行處理和分析,涉及數據存儲、計算、管理等基礎設施以及分析所需的軟件、算法以及新的數字技術。
 
布局數據分析的企業(yè)主要圍繞生物信息軟件開發(fā)、基因大數據平臺解決方案、基因大數據增值服務3種業(yè)務展開。軟件方面國內多數為非小細胞肺癌突變基因軟件,獲批的企業(yè)有華大生物、吉因加、燃石以及世和醫(yī)療。
 
數據解讀是將基因檢測結果與臨床表型相結合,挖掘基因與疾病的關系,從而進行基礎研究和指導臨床決策。在科研服務上,諾禾致源采用多組學聯(lián)合分析方法揭示疾病機理并提出潛在治療方法。臨床上,智因東方開創(chuàng)了“生物+遺傳+臨床”三要素分析原則的臨床分析算法,提高了臨床診斷效率。
 
基因檢測目前在醫(yī)療健康領域中廣泛運用于科研級、臨床級和消費級場景。
 
科研領域的基因檢測業(yè)務主要面向科研機構,包括基因組測序、轉錄組學測序、表觀組學測序、宏基因組學系列測序、單細胞測序等。國內基因檢測科研市場相對飽和,提供基礎科研基因檢測服務的企業(yè)主要有諾禾致源、華大基因、貝瑞基因、求臻醫(yī)學、安諾優(yōu)達等。臨床級應用主要是臨床基因診斷,包括出生缺陷防控、腫瘤診斷、傳染病診斷等領域。

基因檢測智能化產業(yè)鏈與應用


基因行業(yè)正在進入大數據時代。
 
人類基因組中蘊藏海量數據。DNA(脫氧核糖核酸)是一種雙鏈聚合物,由4種攜帶不同堿基的脫氧核糖核苷酸(A、T、C、G)排列組合形成。堿基或脫氧核糖核苷酸數量是衡量DNA長度的標準,由1000個脫氧核糖核苷酸組成的DNA長度為1Kb,完整的人類基因組包含約32億對堿基,長度為3Gb左右。同時,基因的相互差異形式十分多樣,例如單核苷酸突變、基因片段重復和缺失、染色體變異、甲基化等不改變DNA序列的表觀遺傳學變異,從而基因信息數量龐大、結構復雜。

隨著基因產業(yè)持續(xù)發(fā)展,基因測序數量逐漸增多,這些海量數據及其治理需求逐漸浮出水面。由此,基因技術與人工智能的融合,從作為基因檢測輔助環(huán)節(jié)的生物信息分析中脫穎而出,成為蓬勃發(fā)展的行業(yè)。
 
在基因科技智能化產業(yè)的最上游,仍然通過專門的設備和試劑獲取下機測序數據,這項工作在當前已經發(fā)展得比較成熟,也已經形成了測序儀和配套試劑相對成熟的供給側結構。從測序儀的型號看,Illumina的HiSeq是目前市場上最主流的測序儀。
 
不過,受制于有限的生物信息技術水平,對海量的測序數據的正確解讀其實是基因檢測中亟待解決的難題。越來越多企業(yè)開始布局上游測序平臺。例如,Pac Bio所展開的對端讀長測序技術的收購、菲鵬生物收購高通量測序平臺等。
 
基因數據原始狀態(tài)是以ATCG為標識的堿基序列。從基因測序儀運行下來提取的原始數據類似計算機二進制數字序列,不能直接提供關于疾病的信息,最終轉化為人們可理解的生物學數據,為疾病診斷和治療提供指導。還需要借助專業(yè)知識分析。
 
當前,基因表達調控網絡、信號傳導網絡、蛋白-蛋白相互作用網絡以及代謝網絡的出現(xiàn)與發(fā)展更使生物信息學進入系統(tǒng)生物學時代,如果說生物信息學發(fā)展初期面對的主要是序列數據,隨基因組領域研究在質與量上的提高,特別在第二、第三代高通量測序技術的推動下,生物信息學面對的數據在類型、本質、數量上都得到了極大豐富,生物信息學也作為基因組分析不可或缺的工具而得到迅速發(fā)展,并快速向包括人類健康在內的很多領域滲透。

測序數據處理和分析的技術壁壘較高,并且因為其重要性,也成為掣肘基因測序行業(yè)中游發(fā)展的關鍵因素,更是各大測序公司的核心競爭力所在。目前,測序數據處理流程基本已經標準化,但對于數據處理過程中的核心步驟,各家公司都有自己的一套分析方法,即使是相同的原始數據,各方不同同算法對細節(jié)的處理不盡相同,輸出的結果也不同,最終反映在測序數據解讀質量上。
 
基因數據正在形成巨大的數據庫,它的終極形態(tài)是,每一個健康人或者患者都可以將自己的基因數據進行上傳分析,通過比對得出自己的健康狀況,獲得健康建議。不過,這需要很長一段時間的積累來達到理想的可靠性與穩(wěn)定性,基因檢測成長為越來越類似血常規(guī)、尿常規(guī)等常規(guī)臨床檢驗項目,在一定程度上加速了這個過程。
 
基因檢測的下游應用可以分為臨床應用和非臨床應用兩個大類,兩者各自又可以進一步細分為生育健康、病原感染檢測、腫瘤基因檢測、基礎醫(yī)學研究、新藥研發(fā)等垂直板塊。其中,非臨床應用中的基礎醫(yī)學研究是基因測序最早實現(xiàn)商業(yè)化的領域,也是當前發(fā)展最為成熟的應用場景,其次便是臨床場景中的腫瘤基因檢測、生育健康、病原感染監(jiān)測等應用。
 
在這個過程中,生物信息學不僅是一門學科,更是一種重要的研究開發(fā)工具,且生物信息學工具幾乎是未來生物研究/生物醫(yī)藥開發(fā)所必須的,并且生物信息學作為強大的生物數據解讀工具,正是連接基因序列和個性化醫(yī)療的關鍵紐帶。當今,生物信息學界的研究人員主要將注意力集中在基因組、蛋白質組、轉錄組、 RNA 組等組學以及與這些組學密切相關的藥物設計上,測序、數據庫資源、序列對比、基因芯片&表達譜分析、分子進化分析、蛋白質結構分析、藥物設計輔助是生物信息學最常見的相關應用。

基因檢測智能化探索之臨床應用


  • 腫瘤


基因科技的臨床應用,行至腫瘤診療,才算真正點燃了產業(yè)界的熱情。也正因如此,紅海競爭之下積累的豐富樣本和數據,使得腫瘤診療成為基因大數據治理開發(fā),甚至基于人工智能技術做解析的排頭兵。
 
早期的蒙眼狂奔之后,臨床上可茲采用的基于中國人群的腫瘤基因數據庫已經越來越多,但整個基因信息大數據領域仍然缺乏統(tǒng)一標準,多個數據孤島并存,大數據價值不能充分被挖掘用于滿足臨床需求。換言之,國內基因行業(yè)也亟需建立一套基因檢測樣本采集、運輸、儲存、檢測、生物信息分析和遺傳咨詢解讀等標準化流程,用以規(guī)范多基因Panel檢測流程,同時解決臨床數據支持及共享機制的項目。
 
隨著國內大眾對基因科技認知不斷加深,和供給側的基因測序行業(yè)生態(tài)不斷完善,大規(guī)模人群基因數據庫的建設節(jié)奏明顯加快。大多數腫瘤NGS廠商都將建立和開發(fā)腫瘤基因大數據庫作為自身的第二增長曲線,例如華大基因、求臻醫(yī)學、吉因加、仁東醫(yī)學、至本醫(yī)療等紛紛布局了針對不同癌種、納入不同體量人群的腫瘤基因數據庫。
 
現(xiàn)階段,在一些特定的垂直領域,已經有零星基于人工智能的腫瘤基因組解讀產品被嘗試推出。例如,志諾維思旗下的志諾醫(yī)珀(iGenome? Reporter)就是一款NGS基因檢測數據分析系統(tǒng)。它基于GVC基因變異探測算法、醫(yī)學解讀知識庫,快速精準分析和解讀腫瘤樣本NGS數據,只需極簡操作就可以從原始測序數據獲得全面的臨檢報告和/或科研報告,輔助用戶進行臨床診療決策和科研產出。
 
由此,腫瘤基因組學研究的門檻進一步被降低,而從事下游產品開發(fā)的小型基因公司再生產和研發(fā)能力得以加強。
 

  • 感染疾病及遺傳病


實際上,大多數基因測序公司只是擅長做基礎測序和基本的分子生物學注釋,對疾病、遺傳機制缺乏深入了解,與醫(yī)生、研究者這類終端用戶的需求存在差距,輸出結果也缺少靈活性,在一定程度上增加用戶成本。對于非生信專業(yè)的人而言,原始測序數據幾乎毫無實際意義。
 
遺傳疾病多為多基因導致的復雜疾病。全基因組關聯(lián)分析是一種和基因測序密切相關的,近幾年來研究中非常熱門的高通量分析方法。遺傳學與分子生物學實驗室常規(guī)分析是將關心的DNA或蛋白序列與庫比對,這些序列長度大多數情況比整個基因組的量級小得多,進行的分析通量也低。但近年來,隨生物數據量的增加以及單基因研究的局限性,生物信息學相關高通量分析方法已越來越成為必須,特別測序成本的快速下降,以及生物信息學的快速發(fā)展,高通量分析方法的應用門檻進一步降低,全基因組關聯(lián)性分析正是研究中最為常見的、應用越來越常規(guī)化的生物信息學高通量分析手段之一。
 
對人類基因組研究而言,全基因組關聯(lián)分析(GWAS)是指在人類全基因組范圍內找出單核苷酸多態(tài)性(SNP)數據,并從中篩選出與目標特征(如胖瘦、高矮、特定疾病、藥物敏感性等)相關的SNPs。在GWSA中,研究人員通常先收集到足夠多的患者基因組數據,再將其中的SNP位點與對照組進行比較,并將相關數據進行關聯(lián)性分析,嘗試建立序列數據與目標性狀之間的關聯(lián),從而篩選出同目標性狀相關性密切的潛在基因。往往在這一步干試驗完成之后,還需要采用實驗生物學的方法做驗證和深入研究。這種方式將更多維的海量數據納入研究,已經幫助研究者發(fā)現(xiàn)了許多未知基因以及染色體區(qū)域,為復雜疾病的發(fā)病機制提供了更多的線索。

  • 消費級基因檢測


消費級基因檢測是指通過廣告、電商、線下店可被消費者認知且直接購買的基因檢測產品,主要以低通量檢測為主,技術手段包括 PCR 和基因芯片。在中國消費基因發(fā)展相對早期,產品主要圍繞健康管理等維度展開。
 
中國消費級基因檢測服務市場成立相對美國來講晚了20年,目前處于初期發(fā)展階段。但是中國消費者如今還未完全認可并采用消費級基因檢測服務作為健康管理的手段,然而基于中國的人口眾多和老齡化及個性化健康管理的趨勢,這意味著未來中國消費級基因檢測市場廣闊。
 
學界對于基因與疾病的關系,更多還停留在關聯(lián)性研究的階段,而非確證性研究。相對于嚴肅醫(yī)學領域的基因檢測,消費級基因檢測公司普遍面臨著基因檢測深度不夠高、規(guī)模化盈利難、消費者認知不足的問題。尤其是目前國內消費級基因檢測主要服務是健康管理,健康管理則要將臨床數據、用戶的健康數據與基因數據結合起來。然而目前臨床數據和用戶的健康數據都比較薄弱,以及現(xiàn)在消費基因檢測產品結果并無專業(yè)的醫(yī)療人員進行診斷,在這種狀況下,即使基因數據量很大,也無法有效指導健康管理。
 
針對消費級基因檢測行業(yè)整體大環(huán)境不容樂觀的情況下,已有多家企業(yè)做出戰(zhàn)略調整推動消費基因檢測智能化以提高基因檢測穩(wěn)定性和準確性。
 
自動化是智能化的基礎,美因基因運用自動化水平的生產體系提高基因檢測水平,成為了中國首個及唯一一個日檢測能力超過5萬次的基因檢測平臺。而美因未來將進一步結合基因技術和信息技術,實現(xiàn)基因檢測高水平的自動化和智能化,將更具性價比的產品和服務推向市場,推動消費級基因檢測的市場普及。

基因檢測智能化探索之非臨床應用


基因信息學和藥物開發(fā)的交集也越來越多,不少藥企都開始成立自己的基因組學部門,來為新藥開發(fā)提供方向。如今我們所熟知的CD系列靶點,很多都是誕生于這波浪潮之中?;蚪M學里測出來的數據都是海量級別,如何進行清洗和利用,把它用到藥物開發(fā)中去,總歸離不開計算機和大數據技術。
 
對于靶向藥而言,生物標志物(biomarker)舉足輕重,它與藥物敏感性、反應率相關。傳統(tǒng)上,藥物開發(fā)者根據已有的知識尋找生物標志物,常見的做法是將藥物靶點本身作為生物標志物。這種模式直觀、并已有不少成功案例,但局限性也顯而易見。人類對自身和疾病的已有知識有限,絕大多數臨床試驗實際上沒能用上生物標志物,到三期失敗的臨床試驗尤其如此。
 
實際上,肺癌明星藥易瑞沙初始的臨床三期也曾失敗,原研廠阿斯利康并沒有找到生物標志物,而最終由哈佛大學的兩家試驗室發(fā)現(xiàn)EGFR突變是易瑞沙的生物標志物。
 

有分析認為,基因信息規(guī)模最大的市場來自制藥公司藥品研發(fā)的臨床數據需求。2014年美國制藥公司的藥品研發(fā)總費用為約1400億美元,只有3~4%用于購買臨床數據,包括基因信息、用藥記錄、病歷等其他數據。盡管基因信息在現(xiàn)階段占藥品研發(fā)費用比例較低,但預計未來幾年會逐步上升。


文章來源:動脈網