近年來,醫療大數據炙手可熱。那么何為醫療大數據?
與醫療健康相關的信息,均可被歸入醫療大數據的范疇,數據來源可以是醫療和科研機構,亦可來源于個人甚至政府。其應用場景十分廣泛,如藥品研發,精準醫療,醫保控費,個人健康管理,個性化用藥,甚至分級診療、遠程醫療等。從以太的經驗來看,中國醫療大數據的應用各環節有一些共同的痛點。
數據孤島
首先從機構層面看,在政府政策主導下,當前已經有70%以上的醫院實現了醫療信息化,基礎設施建設層面已經初見成果。
然而當前僅有不到3%的醫院實現了數據互通:傳統系統廠商數量眾多,據不完全統計,當前國內HIS系統廠商超過500家,PACS系統廠商超過200家,廠商為醫院單獨設計實施系統,且不同系統會出現不同版本。使用傳統方式聚合一家系統需耗時2-6個月,對醫院數據采集和聚合耗時費力。盡管有移動醫療、遠程醫療的一些創業公司會部署新的系統獲取數據,然而眾多互聯網醫療產品的接入,造成了醫患雙方的額外負擔。
其次,從個人角度來看,當前常見的直接獲取個人數據的渠道主要有兩個:可穿戴設備的佩戴或移動設備的使用,上門檢測獲取用戶數據。然而這兩種獲取渠道對于用戶來說都處于市場導入期,存量市場微乎其微,導入和說服成本巨大。
比如2016年中國的可穿戴設備僅有200億市場規模,從使用習慣的角度而言,即使是美國2015年的數據,也僅有3%的美國人保有可穿戴設備。此外,用戶的使用習慣和意愿也是數據獲取的大敵,2015年美國市場研究公司NPD Group的一份調研指出,超過40%的運動手環用戶會在半年內棄用該設備,無法獲得周期性可持續的數據。
上門檢測用戶數據當前常見的是血液檢測和基因檢測,從服務切入,未來通過數據積累應用到科學研究、醫藥用品研發、用戶個人健康管理等場景,然而由于該類服務成本高,用戶接受度低,數據獲取也受到諸多限制。
事實上,針對前文提出的機構數據痛點,當前已經有一部分創業公司開始對數據進行整合,打造數據中間件。然而由于醫療機構之間的壁壘、檢測水平、試劑選取等原因,數據口徑和相關指標無法直接使用的情況依舊存在。個人數據源層面,不同數據分析廠商也會造成標準不統一的問題。
在具體實施層面,對于這些稀缺的個人數據如何整合,如何對不同領域和議題下的主題進行定義以及統計口徑的協調將成為應用前的重要環節。在商業環境當中,這也將面臨利益分配、如何分工合作以及倫理問題。
工具的缺失
醫療大數據能夠發揮作用,還要看實際的應用和解讀,如何正確解讀數據,讓數據對臨床、個人健康、公共衛生、醫療保險等領域進行指導是醫療大數據最終落地的必備環節。
在任何垂直應用場景中,“know-how”都是很重要的一環。好的醫療數據領域的分析師也應當兼具垂直領域的專業知識和數據分析的基本能力,能夠將業務和數據實現有效的整合。然而作為最匹配的復合型學科生物統計學在國內尚屬起步階段,由于數據市場上整體數據分析人才的缺失,能夠落地到垂直領域的人數愈發受到限制。
其次是工具層面的短板,筆者在做數據工作的時候,有一個定性的發現:SAS、R、MATLAB等相對高門檻的工具在醫療行業里應用非常廣泛,學科的限制導致了對工具的高要求,然而可視化的報表,直觀的展現方式,能夠有效提升分析的效率,“讓專業的人做專業的事”。
隱私的邊界
數據分析之后,如何落地,如何對患者體現價值也是當前數據應用的問題。對政府的部分數據更多反推至政策的制定當中,藥品研發數據的最終落地和驗證周期會更長。數據的價值如何對個體患者的體現,可否是個體用戶可感知的輸出,實際的作用如何去評估和衡量都是醫療大數據面臨的問題。
此外,醫療數據采集、加工和應用的過程中,對于用戶隱私的保護也十分重要,基于患者的屬性,如檢測指標和結果等,可直接對用戶行為進行預判,如個人信息泄露帶來的虛假推銷等問題,因此,關注數據如何應用到個人層面的同時,信息泄露問題也是留意的重點之一。
第三方數據廠商打入醫療機構,并且使數據能夠得以有效應用也面臨推廣的壓力:高度資源導向型的醫療行業,行業、院校、機構、地域均面臨重重壁壘,即使是上市公司也依舊無法打入某些區域,商務拓展難度和落地難度極大,一方面難以獲取有效數據源,另一方面也沒有足夠的場景訓練自身的模型。
對于這種情況,一些創業者采取了兩條腿走路的方式:比如以太協助融資成功的“數聯易康”,其一方面整合自身資源,不斷與衛計委和醫院進行商務拓展;另外一方面有效借助商業機構的網絡,打破地域限制,快速實現自身的成長。或者如“永數”,直接通過產品創新,獲取全國性標桿機構的支持,綁定進行推廣。