《辦法》從醫療大數據標準、醫療大數據安全、醫療大數據服務、醫療大數據監督四個方面提出指導意見,直擊目前醫療大數據領域的痛點,未來對數據的統籌標準管理、落實安全責任、規范數據服務和管理具有重要意義。
蛋殼研究院從醫療大數據行業的市場出發,收集了國內參與醫療健康大數據的561家企業的資料,從細分領域、大數據價值、大數據作用等維度進行梳理,分析醫療大數據的發展階段和行業現狀。
通過分析,我們得出了如下的關鍵數據和結論:
1、從產業層面來看,全球大數據領域的相關公司都在快速發展,中國信息通信研究院預估我國大數據領域2017年的產業規模為4700億元,增長率約30%。其中,大數據軟硬件的產值約為234億元人民幣,增長率約為39%。
2、EMC和IDC發布的報告顯示,2013年全球醫療保健數據量為153 EB,預計年增長率為48%。這意味著到2020年,這個數字將達到2314EB(2.26ZB)。
3、國家從2014年以來密集制定和推出醫療大數據相關政策,頂層設計已經初步完成,國家隊性質的醫療大數據公司也批量出現,都意味著醫療大數據行業正進入快速發展階段。
4、醫療大數據來源的豐富性和準確性,是相關產業鏈條發展的關鍵因素,電子病歷是醫療大數據的第一大來源,也是產業發展競爭的必爭之地,這個領域將會最快跑出獨角獸。目前排名前三的數據來源是電子病歷、檢驗數據、影像。
5、醫療大數據的5大應用方是醫生、醫療機構、個人、藥企、保險,分別對應著相應的產業鏈和市場空間。
6、以阿里為代表的數據處理供應商,也將產生巨大的市場機會,同時這也是對大數據進入整合、治理的象征,孤島型的數據將會被納入到清理的產業鏈條當中。
7、在新的標準化醫療大數據的產生過程中,基因成為了最大的贏家,圍繞基因鏈條將產生巨大的醫療大數據市場。
8、我們第一次梳理了數據產生的沙漏圖,并據此描繪出了相關的行業地圖,歡迎拿走。
醫療大數據迎來最好的時代
人類的任何表現和行為都可以產生數據,只是之前這些體征和行為并沒有被合適的設備數字化,并收集和存儲起來。21世紀初,隨著信息化技術的普及,人們已經關注到數據所能帶來的價值。此時所產生的數據,局限于計算機平臺和互聯網。此時所能收集的,也只是人類在互聯網環境中所產生的部分數據。
從上世紀80年代開始,每隔40個月,世界上存儲的數據容量就會翻倍(Hibert & Lopez,2011)。
IDC在2014年的一份報告中提供了一份數據,2013年全球數據總量達到了4.4ZB,而從2013年發展到2020年,全球數據總量將會增長10倍,達到44ZB。
越來越多的數據產生設備通過互聯網傳至數據存儲商。數據量的爆發增長,首先為數據存儲商帶來了商業機會,營收也大幅度增加。其次,大數據在經過價值挖掘之后,還能為經濟發展提供顯著的動力。
數據來源:IDC
從產業層面來看,全球大數據領域的相關公司都在快速發展,中國信息通信研究院預估我國大數據領域2017年的產業規模為4700億元,增長率約30%。其中,大數據軟硬件的產值約為234億元人民幣,增長率約為39%。
而如今,醫療大數據領域也已經開始進入到價值輸出時代,在診療、醫院管理的過程中發揮著重要的價值。
現階段電子病歷的廣泛應用,使得有價值的醫療大數據實現了快速增長,可供醫生、研究者和患者使用的數據量極大地提升。EMC和IDC發布的報告顯示,2013年全球醫療保健數據量為153 EB,預計年增長率為48%。
這意味著到2020年,這個數字將達到2314EB(2.26ZB)。因此,我們計算出醫療數據的總量約占到全球所有數據容量的5.1%。
原國家衛計委副主任、中國衛生信息與健康醫療大數據學會會長金小桃預測,在我國人口總量峰值達到15億的時候,僅是我國的健康醫療大數據總量就會達到ZB以上。他認為,醫療健康大數據,因其宏大的數據總量,將產生宏大的產業規模,取得宏大的經濟效益。
2014年以來,國家已陸續出臺關于扶持醫療大數據發展的相關政策,初步做好頂層設計并構建出醫療大數據發展的宏偉藍圖。
2014年國家衛計委制定“46312”工程,即建設國家級、省級、地級市、縣級4級衛生信息平臺,依托于電子健康檔案和電子病歷,支撐公共衛生、醫療服務、醫療保障、藥品管理、計劃生育、綜合管理等6項業務應用,構建電子監控檔案數據庫、電子病歷數據庫、全員人口個案數據庫3個數據庫,建立一個安全的衛生網絡,加強衛生標準體系和安全體系建設。
在此之后,國家又制定了數十條醫療大數據相關政策,推動醫療大數據行業的發展。
醫療大數據的發展邏輯
動脈網從醫療大數據的數據采集、數據治理和數據應用三個方面描述了醫療大數據的發展流向,繪制了醫療大數據的沙漏模型。數據的采集、治理和應用這三步,反映了大數據的狀態變化,從數據形成知識,從知識指導行動的過程。
動脈網蛋殼研究院制圖
更細分一些,大數據領域可以分成數據采集、數據存儲、數據治療、數據分析、數據應用五個方面。醫療大數據的輸入端,是各種信息化系統、傳感器、智能設備所產生的醫療健康數據。
龐大的醫療大數據在收集完成后存儲在數據中心,然后經過清洗加工之后,挖掘其內在有用的數據。最后,通過大數據分析之后產生的知識來指導醫療行為,從而產生價值。
通常,人們只認識到醫療大數據的數據來源越來越豐富,也認識到醫療大數據可以為醫療服務提供有價值的參考意見。前面我們提到,大數據量雖大,但是垃圾數據居多,有價值的數據比例不高。
醫療大數據如果能夠經過中間步驟的清洗和加工,那么醫療大數據所能發揮的價值會越大。所以,醫療大數據從輸入、加工到應用三個步驟缺一不可。
我們所繪制的醫療大數據沙漏模型,描繪了醫療大數據從數據形成知識,再形成行動指導的三個重要步驟。
動脈網蛋殼研究院制圖
醫療大數據行業不是一開始就形成的,在大數據解決方案出現之前,醫療大數據所能發揮的價值很低。
隨著信息化、物聯網、云計算、人工智能等技術的發展,大數據的利用價值在增大。我們從數據獲取時代,逐步向信息挖掘時代和價值輸出時代過渡。而數據的價值,也從醫療行為的總結,逐步升級為醫療決策的支持和全方位醫療輔助決策。
醫療大數據企業市場分析
蛋殼研究院從動脈網企業數據庫中篩選了一共561家和醫療大數據相關的企業數據,從企業融資階段、數據類型、應用方向等維度進行統計,然后根據統計數據洞察醫療大數據行業的趨勢。而在這561家企業中,包含了243家基因行業的測序企業。
一、醫療大數據企業市場布局
動脈網蛋殼研究院制圖
數據來源:動脈網蛋殼研究院
大部分醫療大數據企業都沒有融資或者未公開融資狀態,融資企業的比例不到50%。完成融資的其中有8家企業是已經在二級市場中上市。其中既有創業軟件、衛寧健康這樣的傳統醫療信息化企業,通過信息化系統采集、集成醫療大數據,也有華大基因、貝瑞基因這樣的基因測序企業。
在已經融資的企業中,天使輪和A輪企業相對較多,這也符合一級市場的情況。而融資到B輪階段的企業也比其他細分領域較多,其中絕大部分是基因行業的創業企業,占到了32家,還有部分是同屬于人工智能的醫療影像企業。而在臨床數據集成、挖掘為主要業務的醫療大數據企業融資到B輪或后期其他輪次的仍然偏少。
數據來源:動脈網蛋殼研究院
從醫療大數據企業的數量氣泡圖來看,圍繞基因大數據做文章的企業數量最多,目前該領域的發展也非常快。
但是,直到現在臨床對基因大數據的需求并不強烈,只有很少部分的產品得到了普及。基于臨床數據的醫療大數據企業數量排第二,因為患者體征數據、病種數據、治療方案與治療效果等臨床所產生的大數據輔以應用場景后,是可直接應用到診斷、治療過程中的,醫療機構有很強烈的數據需求。