何謂大數(shù)據(jù)?顧名思義,就是體量特別大且數(shù)據(jù)類型復(fù)雜多樣的數(shù)據(jù)集,其特征是數(shù)量大、類別多、真實(shí)性高、速度快,因而難以用傳統(tǒng)數(shù)據(jù)庫(kù)工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理。如今,隨著現(xiàn)代科技的發(fā)展,人們對(duì)數(shù)據(jù)處理的能力也在明顯提高,以往一團(tuán)迷霧一樣的大數(shù)據(jù)成為新的科研富礦,從中人們可以科學(xué)地存儲(chǔ)、研發(fā)、利用、分析數(shù)據(jù),并得到精確的結(jié)果。
大數(shù)據(jù)讓科研更具針對(duì)性
北京市神經(jīng)外科研究所 張亞卓
我們正處在一個(gè)醫(yī)學(xué)信息爆炸的時(shí)代。據(jù)統(tǒng)計(jì),醫(yī)學(xué)信息資源占據(jù)約30%以上互聯(lián)網(wǎng)信息資源,醫(yī)學(xué)文獻(xiàn)的數(shù)量正以驚人的速度增長(zhǎng)。全球醫(yī)藥類期刊近3萬(wàn)種,每年發(fā)表論文200多萬(wàn)篇并且以每年7%速度遞增。臨床醫(yī)生平均每天必須閱讀大量的專業(yè)文獻(xiàn),才可能跟上現(xiàn)代醫(yī)學(xué)發(fā)展的速度。2012年,美國(guó)政府發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》,旨在利用大量復(fù)雜數(shù)據(jù)集合獲取知識(shí)和提升洞見能力,投入金額高達(dá)2億美元。與此同時(shí),醫(yī)學(xué)科技的發(fā)展也離不開大數(shù)據(jù)。在科研的過(guò)程中,大數(shù)據(jù)的利用、開發(fā)和整理,可以顛覆我們以往很多研究結(jié)果,為我們帶來(lái)意想不到的效益。
大數(shù)據(jù)時(shí)代下的醫(yī)學(xué)科研,應(yīng)該具有三個(gè)主要特點(diǎn)。第一,臨床醫(yī)學(xué)資源發(fā)掘、收集、整理和利用(標(biāo)準(zhǔn)化、科學(xué)化)。第二,大樣本、多中心的臨床研究(病因、診斷、治療及藥物開發(fā))。第三,依托臨床信息的生物醫(yī)學(xué)資源的整理、利用及研究(基因、蛋白及代謝)。那么,大數(shù)據(jù)時(shí)代下的腫瘤研究的特征就更具針對(duì)性了。主要有臨床信息、腫瘤生物學(xué)特性、基因蛋白等數(shù)據(jù)庫(kù),個(gè)體基因測(cè)序和數(shù)據(jù)快速處理,分子標(biāo)記、藥物靶標(biāo)的鑒定和特征描述,新型藥物的設(shè)計(jì)。
大數(shù)據(jù)時(shí)代下的傳染病控制
中國(guó)疾病預(yù)防控制中心傳染病預(yù)防控制所生物信息室負(fù)責(zé)人 陳 晨
公共衛(wèi)生安全是全民討論的熱點(diǎn)和關(guān)心的話題,例如2011年的德國(guó)大腸桿菌O104事件,引起全世界人的關(guān)注。在細(xì)菌性傳染病領(lǐng)域,新發(fā)、突發(fā)細(xì)菌性傳染病尤為引人注目,不斷引起嚴(yán)重的公共衛(wèi)生威脅;同時(shí),既往曾經(jīng)被控制的傳染病因?yàn)樯鐣?huì)經(jīng)濟(jì)因素的變化,又造成新的暴發(fā)流行。這些暴發(fā)流行不僅造成了大量的經(jīng)濟(jì)資源的浪費(fèi),更是造成了人們心里的恐慌。
傳統(tǒng)的細(xì)菌性傳染病的防控在微生物學(xué)、分子生物學(xué)的檢測(cè)與分析上,已形成了一系列的檢測(cè)技術(shù)手段。近些年,生物基因組學(xué)和網(wǎng)絡(luò)大數(shù)據(jù)分析技術(shù)的獲得突破性發(fā)展。基因組學(xué)在傳染病的篩查確認(rèn)、疫情傳染來(lái)源的追蹤、以及病原變異等方面,提供了新的強(qiáng)有力的技術(shù)手段,而大數(shù)據(jù)分析對(duì)于傳染病的預(yù)測(cè)、疫情傳染來(lái)源的追蹤提供了新的手段。這兩項(xiàng)新的技術(shù)的共同點(diǎn)都是:大數(shù)據(jù)。
有關(guān)大數(shù)據(jù)分析中的核心數(shù)據(jù)庫(kù)的建立、標(biāo)準(zhǔn)大數(shù)據(jù)分析流程和網(wǎng)絡(luò)數(shù)據(jù)挖掘三個(gè)方面,陳晨主任會(huì)在生物醫(yī)療大數(shù)據(jù)會(huì)議中和大家共同探討。
我理想中的醫(yī)療大數(shù)據(jù)
北京大學(xué)腫瘤醫(yī)院肝膽外科 錢紅綱
我國(guó)的醫(yī)療信息化建設(shè)用了十年,經(jīng)歷了數(shù)字化、35212及36312工程等不同階段。大數(shù)據(jù)從提出到現(xiàn)在也有4年多了。很多人更是看了麥肯錫2011年報(bào)告中一年3000億美元的附加值而躍躍欲試。然而,醫(yī)療大數(shù)據(jù)在醫(yī)生眼中是怎樣的呢?
目前,只有大醫(yī)生或大醫(yī)院才關(guān)注大數(shù)據(jù),而臨床工作的繁重讓絕大多數(shù)一線醫(yī)生無(wú)暇顧及身邊默默發(fā)生的變化,他們更需要的是提高效率、簡(jiǎn)單易行的臨床輔助工具,而不是在原有基礎(chǔ)上再增加額外的負(fù)擔(dān)。因此,如何讓作為醫(yī)療服務(wù)主體的醫(yī)生接受大數(shù)據(jù)理念,心甘情愿地運(yùn)用大數(shù)據(jù)是讓其從浮云上落地的前提。大數(shù)據(jù)的收集者需要解決數(shù)據(jù)錄入和訪問(wèn)的快捷問(wèn)題,才能得到作為使用者之一的醫(yī)生的擁護(hù)。另外,多年來(lái)各個(gè)醫(yī)院開發(fā)了各自的病歷系統(tǒng),如何兼容各個(gè)數(shù)據(jù)接口也是一大難題。當(dāng)很多統(tǒng)計(jì)數(shù)據(jù)來(lái)源于患者時(shí),他們能否提供準(zhǔn)確的醫(yī)療信息?大數(shù)據(jù)開發(fā)過(guò)程中,醫(yī)學(xué)工作者如何與網(wǎng)絡(luò)專家通力合作?這些都需要慢慢解決。
盡管醫(yī)療大數(shù)據(jù)仍面臨不少困難,但廣闊的市場(chǎng)前景是毋庸置疑的。作為一個(gè)醫(yī)者,我很關(guān)注大數(shù)據(jù)在以下幾個(gè)方面的應(yīng)用:
臨床決策支持
讓誤診誤治大幅減少
臨床中遇到的疑難雜癥,有時(shí)即便專家也缺乏經(jīng)驗(yàn),做出正確的診斷和治療更加困難。臨床決策支持系統(tǒng)可以通過(guò)海量文獻(xiàn)的學(xué)習(xí)和不斷的錯(cuò)誤修正,給出最適宜診斷和最佳治療。以IBM Watson為代表的臨床決策系統(tǒng)在開發(fā)之初只是用來(lái)進(jìn)行分診的工作。而如今,通過(guò)建立醫(yī)療文獻(xiàn)及專家數(shù)據(jù)庫(kù),Watson已經(jīng)可以依據(jù)與療效相關(guān)的臨床、病理及基因等特征,為醫(yī)生提出規(guī)范化臨床路徑及個(gè)體化治療建議,不僅可以提高工作效率和診療質(zhì)量,也可以減少不良反應(yīng)和治療差錯(cuò)。在美國(guó)Metropolitan兒科重癥病房的研究中,臨床決策支持系統(tǒng)就避免了40%的藥品不良反應(yīng)事件。世界各地的很多醫(yī)療機(jī)構(gòu)(如英國(guó)的NICE,德國(guó)IQWIG等)已經(jīng)開始了比較效果研究(CER)項(xiàng)目并取得了初步成功。
試想有一天,大數(shù)據(jù)系統(tǒng)成為診斷和治療建議的提供者,內(nèi)科醫(yī)生是否還能坐的安穩(wěn)?因?yàn)樗莆盏男畔⒘恳热硕嗟亩啵袛嗟臏?zhǔn)確性要比非經(jīng)驗(yàn)得出結(jié)論更可靠。不過(guò),外科大夫也不要笑得太早。對(duì)手術(shù)路徑和流程的大數(shù)據(jù)采集配合機(jī)器人等的程序化操作,也許有一天也會(huì)取代已經(jīng)成為圖騰的柳葉刀。
遠(yuǎn)程監(jiān)控診療
提高家庭護(hù)理質(zhì)量
從遠(yuǎn)程監(jiān)控系統(tǒng)收集數(shù)據(jù),并將分析結(jié)果反饋給監(jiān)控設(shè)備及人員,從而實(shí)時(shí)診斷并確定治療方案。目前已有醫(yī)院通過(guò)結(jié)合手機(jī)App軟件等方式,進(jìn)行心率、體溫及血糖等的檢測(cè),但檢測(cè)的內(nèi)容仍很單一。臨床上希望針對(duì)不同病種開發(fā)一些診治后輔助系統(tǒng),可以減少病人住院時(shí)間或門診復(fù)診次數(shù),提高家庭護(hù)理的比例及質(zhì)量,也幫助醫(yī)院和醫(yī)生鎖定患者群。北京大學(xué)腫瘤醫(yī)院目前正在開發(fā)此類軟件,并有望和IBM、希捷等公司進(jìn)一步合作。
公共衛(wèi)生監(jiān)管
快速檢測(cè)傳染病等
衛(wèi)生主管部門可通過(guò)監(jiān)控?cái)?shù)據(jù)庫(kù),實(shí)時(shí)統(tǒng)計(jì)分析,快速檢測(cè)傳染病、院內(nèi)感染等情況,并進(jìn)行快速響應(yīng)。同時(shí)也利于網(wǎng)絡(luò)覆蓋地區(qū)發(fā)病及診治情況的數(shù)據(jù)匯總。如果將整個(gè)數(shù)據(jù)系統(tǒng)整合,不僅有利于整個(gè)體系內(nèi)的醫(yī)療資源分布和供給,也便于實(shí)時(shí)監(jiān)管和調(diào)控。
大數(shù)據(jù),尤其是公共衛(wèi)生的大數(shù)據(jù)從本質(zhì)上說(shuō)應(yīng)該是國(guó)家資源,它的安全也應(yīng)該納入國(guó)家安全。開發(fā)者應(yīng)該認(rèn)識(shí)到這一點(diǎn),國(guó)家也應(yīng)該認(rèn)識(shí)到這一點(diǎn),盡快出臺(tái)相應(yīng)的制度和規(guī)范來(lái)規(guī)避風(fēng)險(xiǎn),讓大數(shù)據(jù)更符合國(guó)家的利益、人民的利益。