2014年10月28日,由中國工程院、美國國家工程院、EMC公司、VMware公司、浪潮集團及聯想集團共同舉辦的以云計算和大數據為主題的IT行業學術研討會——IT 2020高端論壇在京舉行,此次論壇聚焦未來數年內影響中國乃至全球行業和經濟發展的大數據、云計算和新興IT趨勢,來自中國、美國及全球各地的學術界和產業界的領導者及專家學者參與了此次盛會。
IT 2020高端論壇上,在醫療行業具有權威話語權的中南大學湘雅醫院副院長胡建中,為大家帶來《醫療大數據的思考與探索》的主題演講,用實際案例生動的講述了湘雅的大數據之路,以下是演講實錄:
胡建中:各位專家,各位來賓,大家下午好!我叫胡建中,來自湖南中南大學湘雅醫院,我是外科大夫。我們校長帶領團隊在百年湘雅基礎上,做了醫療大數據探索和思考,今天在這里,我把我的團隊做了一些工作,給各位專家和領導做一個簡要的匯報。
我從以下四個方面就我們對大數據的考慮一些行動簡要匯報一下。首先談談國內外有關醫療大數據的有關工作,其實走到今天,大數據目前最大的問題,所有的這些數據經過百年歷史走過來,這些數據封閉在自己的家里,怎么樣把這些數據分別拿出來應用,這是數據財富所在。今年6月,美國FDA開放了數據庫,供有條件的人士使用,谷歌也起動用相關項目,對疾病預防防治,英國、德國發達國家過來也在做這樣的工作。醫療軟件公司搜集了全美范圍內專家,進行癌癥機理進行分析,希望找到治療癌癥條件。
醫療整個過程總結起來,對疾病發生發展進行預測。我們國家醫療大數據的探索,起步時間不長,沒有現成的數據。我們國家上世紀90年代醫療在自主發展情況下一步一步去做,今天為止形成這樣的狀態,采用不同的數據結構,形成不同的數據模式,很難把數據拿出來共享和協同服務,所以有一個條塊分割。這些系統和采用系統采用不同標準,也是不同的建設模式,在這種情況下可能導致我們廣大的病患以及健康數據隱私保護。像上午有專家提出來,可能有大量保護沒有得到很好的機制。最重要的是,互聯網、可穿戴技術、大數據發展到今天,醫療數據的應用和使用,還缺乏一個大數據的思維。我們還在按照醫學走到今天,我們走的是群眾醫學的路徑,我們必須每個病癥要發生一個證據,證明這一點,不斷地進行推演來證明我的診斷、我的治療方式是正確的。醫生是依據整個在學習過程中間,人類對疾病的認識所積累的經驗,以及它本人在這個行醫的一輩子中間所積累的經驗,來進行綜合分析和判斷,對一個疾病進行診斷以及拿出治療方案,然后治療過程當中,不斷地更新它的治療手段。
大數據的今天,很有可能這種技術產生要顛覆醫療模式,這是很多專家曾經談到,我們也在進行探索的一個工作。我們的國家已經明確地提出來了,醫療的信息化是我們的建設重點,我們要以認可信息、電子病例、電子健康檔案三大數據庫為基礎,提供通用平臺,提供六大項醫療衛生保障服務,同時把標準體系建設、數據安全作為重點工作來做。湘雅和中南大學、教育部、衛計委支持下,做了大數據應用到工作當中嘗試。我們這個項目基于云計算、透明計算的技術,基于跨區域、跨醫院全流程的醫療數據的數據咨詢建議,基于這樣一種目標,第一期建設希望建設輻射到湖南省,以及周邊地區。它的健康受眾和病人范圍,大概應該接近于1800萬人口,不是所有病人,病人人口。目前,上網醫院有11家,第一期主要面對的服務對象是我們的病人受眾和我們的大夫、醫生,以及醫院,提供一些基于大數據的服務。
同時,在這種建設的情況下,我們試圖去解決兩個對于醫學信息、醫療數據很關鍵的問題,一個是各個醫院、各個區域之間,各個系統的數據,解決醫療過程中間電子病例文檔,自然書寫語言,醫學影像這些非結構化數據,怎么樣結構化,得到我們的挖掘、利用。利用大數據服務平臺,我們能夠綜合到全流程、全數據的基礎上,我們能夠為我們的社會提供一些什么樣的服務呢?這張PPT能夠看到一些端倪,在面對個體的病人,能夠提供更加精準個性化服務,對于整個人生健康狀況管理起來,能夠在目前狀況下,醫療資源相對稀缺,大量人口面對得救醫狀況下,能夠更快就醫,同時醫療機構,我們的醫務人員,能夠不斷地提高它的診斷能力,提高我們的診斷標準,并且不斷地更新它的治療方案。對于我們的國家衛生行政部門,它能夠更好地了解預期人口健康的狀況,以及對費用的控制,同時不言而喻的科研機構,藥品、研發部門、經營機構、保險機構,以及智能可穿戴供應商,都會利用這個平臺做進一步工作,開發他們的產品,做好他們的工作。
這一點醫療大數據能夠形成的話,第一具有非常大的社會價值,我們國家有接近15億巨大人口,相對于全球醫療資源配備來說,相對優質醫療是稀缺的,怎么樣能夠把國家這些好的資源,能夠更好地服務于老百姓,服務于廣大人民群眾,大數據把所有的資源整合起來,在這個平臺上提供優質、便捷、高質量服務,可能通過目前手段,解決目前看病難、看病貴的難題。同時利用大數據,有可能使醫學、科學發展,在疾病的預防、診斷治療和研究水平提高到一個更高的高度。同時,像上一張片子所敘述的,醫療大數據的建設和形成,有可能拉動整個行業發展,這些行業是圍繞醫療大數據、發掘運用大數據形成產業。這些大數據建設,對于整個社會經濟和發展,不言而喻具有巨大的推動力。
根據目前公開的資料,我們國家到2020年健康產業市場發展8萬億人民幣規模,到那個時候,現在我們關于在醫院病人治療費用,占到整個健康產業75%,當我們預計到2020年,在醫院治療費用降到35%的水平,其他65%的水平,都會在醫院之外產生,這是對我們整個社會經濟科學發展,都是巨大的、潛在的市場和推動力。湖南地區為例,兩萬家基本醫療機構,我們假設有600萬的慢性患者,1800萬需要利用我們的數據。湖南在智能醫療、慢性病管理、醫藥研發、個性化醫療、其他網絡、可穿戴設備,將形成兩百億市場,針對全國來說更加不言而喻,我們國家現有的醫療機構的基礎上,我們能夠產生一個巨大的自費醫療決策支持服務的市場。
慢性病管理,這應該是大數據、區域醫療所面臨的一個非常有效的管理知識,能夠降低醫療的成本,能夠擴大一個更大的市場。目前我們國家有2.6億的慢性病病人,他們占到整個目前醫療資源70%花費。在未來可以預見這些內,整個互聯網、移動可穿戴、醫療大數據結合,拉動和產生巨大的市場,這些市場工具,以糖尿病為例,可能達到2000億規模,同時運用大數據能夠加快藥物的研發。下面這張圖能夠明確地看到,在全球范圍內,真正應用于臨床藥物的開發、研究,是一個漫長而復雜的過程,因為我們的研究都是基于小樣本抽樣調查進行一步一步演算和推算,大樣本原樣推送到目前的數據機構,很有可能能夠加快藥物研發的進程,使這些投入更快地服務于人類,有益于我們健康事業的發展。
公共衛生醫療大數據應用不言而喻,公共衛生預期、公共衛生狀況、基本藥物運用、保險費用能夠及時地展現出來,特別是我們展望的基于自己的基因、家族史、DNA不同,使用不同的藥物,像高血壓,像治感冒,我可能吃白加黑,可能吃泰勒,可能產生不同效果,需要每個個體不同情況產生不同的應用。
湘雅大數據目前在做的工作,平臺架構,左邊是數據采集提供商,包括醫院、醫療診所、智能可穿戴設備各個用戶或者個體怎么應用,移動互聯網大數據怎么形成,端對端做起來,形成這樣服務。采集端、數據形成、處理、加工,同時云平臺上會提供面對病人、醫生,以及面對所有要使用醫療數據需要者的服務。
這張PPT是使用云平臺目前很多技術進行構造和建設。同時大數據運用了知識圖譜,兩百多種結構化的資料指南,四萬多種疾病癥狀描述,以及接近5萬種診斷的標準,和接近三千多種實驗室檢查的標準結果、正常結果、兩千多種手術治療方案,18000多種對于疾病藥物治療方案,到疾病治療中心。利用圖譜技術,關聯計算,快速搜索方法,為智能診斷提供一些基礎。
下面這張圖是我們對于非結構化的醫學影像投入,研究、實施中心,能夠做到我們的機器能夠自動識別,在我們的圖像中間出現得異常部分,跟我們以往的異常圖像進行比對,得出診斷。最不能忘掉的是數據安全,上午已經有人談到這個問題。為什么全球、醫院,甚至美國,全球數據,保留系統中間,各個系統之間的交流,隱私數據安全擺在第一位,在座的每一位,包括站在這里的我,不希望我的健康數據變成網絡上公開的東西,怎么去保護,目前能夠做,我們建設湘雅大數據同時,考慮到個人隱私保護。數據到了中心以后,在云平臺上,對于個人隱私的保護,數據加密以后,對于數據系統外的安全問題,總體來說采用角色訪問控制,安全技術運用目前市場上成熟的應用的技術,應用到這里面來。
前期基于IT技術發展和一些理念,我們在湘雅、湖南做了一些探索,在這里有一些案例,給各位做簡要報告。首先我們這些探索,在做湘雅大數據建設同時,推出一些應用,首先是面對我們的病人,面對我們的醫生,我們希望利用大數據,能夠給我們的患者提供便捷的醫療服務,不要像去大醫院,有長長的排隊、擁擠的人群、掛號多么難。我們面對病人和大夫,做了一部分工作,同時把數據歸攏了以后,進行梳理、開發,變成中心數據以后,可以協助科研人員,能夠快速地像互聯網上面,搜索我所需要的資訊一樣,搜索我需要的醫學資源進行研究。
我們利用機器學習知識圖譜這些技術,讓智能診斷,也就是機器診斷,讓電腦也變成一個醫生,我們也在做一些工作。首先我展示的一款是在我的醫院開始應用的一款簡單的面對病人的APP,這款APP里面能夠智能分組,能夠用手機掛號,能夠取報告單,能夠咨詢大夫,能夠在網上進行支付,同時在數據庫里面,還有與健康有關的數據庫進行應用。如果感覺身體某一個部位的不適,可以在我的圖片上點擊,咽部不適、喉嚨痛,有部位定位,我的系統會自動地告訴你,這個部位疼痛是咽部不適。我是老百姓,沒有很好的醫學知識。到醫院就診掛號,系統告訴你,你可能是咽痛,吞咽不好,是還是不是,可能犯的是咽驗。得了咽炎,要到醫院看病,系統告訴你應該看耳鼻咽喉科,這個醫院里哪個教授最能看這種病,自動告訴你應該看這個教授,手機上能夠掛上號,醫院自動排隊。哪天某個時間段告訴大夫,大夫在那里等著。很明確掛號、做,提示你掛號成功,回去進行掛號,掛號做完檢查以后,檢驗結果自動推送到移動終端上面來。這是利用大數據、數據繼承做的一款應用,目的為了方便病人快速就醫,減少排隊、時間浪費。
通過IT設備的溝通,能夠得到醫生咨詢,中國還沒有開始,希望慢慢通過大數據走到這個環節。我們建筑一個建筑連體28萬平方米,里面很難走,我們利用數據功能,給患者進入以后去導航,能夠很自動地出發,站在某個點,到哪里去,告訴你,前面圖像是怎么樣,怎么去走路。這個系統里面能夠提供相關的、健康的知識,如果有興趣可以點擊看,同時獲得相關疾病知識。如果有咽痛有很多咽痛相關知識,少抽煙、喝酒,少高聲唱歌,能夠保護咽部。很多數據庫,數據中心能夠隨意搜索到病情,推送服務。
數據開放完成以后,能給醫務人員干什么,如果做過體驗,所有數據提供到你面前,系統為你的健康狀況做評估,告訴你的健康狀態是健康狀態、亞健康狀態還是疾病狀態。我們也同樣提供患者與醫生之間的互動咨詢,和院后慢性病管理,這張PPT展示了通過移動互聯網、智能可穿戴設備,數據傳上系統以后,跟大夫能夠可看見、可咨詢、可指示,構成了一個患者和醫生之間的閉環,使互聯網、移動智能設備在醫療行業的應用得以實現。這是科研,醫學科研,抽樣調查,樣本分析,大量的樣本調查以后形成大樣本調查,大數據、全數據給我們全樣本的調查研究提供這樣的可能。大數據就是把整個在這個區域范圍之內,在某個時間之內,疾病的狀態是完整地推送到你們面前。所以我們試圖在這個數據運用移動互聯觀念,給醫生提供一個檢查檢驗方便平臺,這個平臺是高級智能的搜索,這個界面像谷歌通過互聯網搜索任何需要關鍵詞,搜胡建中名字,在系統里與我有關的任何條款都會集中起來。同時我們有高級搜索,你把所需要的關鍵詞盡可能限定范圍、研究熱點,得到資料,快捷地完成研究。
同時,我們能夠對患者群在醫院之間進行協同的管理,把這些患者去管理好,同時也能夠進行統計信息的分析,這張圖基于我們前面那么多種醫療資源的整合,我們根據指數,根據系統里各種數據整合,由機器得出可能的手段,這個診斷出來以后,會提示進一步做哪些檢查,檢查的數據再次整合以后,得出下一個診斷。同時根據數據庫里面幾十年、上百年、上萬個醫生的經驗,治療的方式,給一個治療的提示。所以這一點是我們做的智能輔助診斷探索。這是使用界面,一個人輸進來,告訴你他的癥狀,他有什么不舒服,電腦告訴你可能是哪一類疾病,進一步輸癥狀,醫生檢查結果輸進去以后,縮小范圍,進一步告訴你有可能是什么樣的診斷,這一塊不但輔助診斷,對于年輕醫生培訓和學習是非常好的結果。
在我的講話最后,拿這樣一張圖,講述我們醫療大數據可能發生的事情。首先,我們的大數據來自于什么地方,來自于醫院,這是醫療數據最大的來源,不但有在我們今天無時無刻新產生的數據,還有整個醫學社會現在沉睡在各個醫院數據庫里大量的、海量的數據,這些數據能夠為我們的病人、大夫提供很多醫療服務,這些服務由病人來診斷。同時可能是這些人拿著這些數據進行研究,同時為醫院、醫療機構管理和改善服務提供很多服務,BI能夠做到這一點。同時我們國家行政管理部門和衛生發展,醫療行業是非常好的應用。大數據的產生是智能可穿戴設備和醫院之間通過移動互聯方式連接起來,構成云醫院、網上醫院的可能性很大。這些數據上傳數據中心,數據主動提供給醫生面前,離開醫院,搬到醫院之外,互聯網上的醫院。
互聯網上所有數據能夠進入我們的平臺,互聯網大家貢獻結果,產生結果,數據中間加以分析利用,對于整個醫療事業發展提供方向。更加與醫療健康相關的企業、產業和市場,會得到更好的發展,像醫療機械的這些公司,藥品研發開發部門,醫學、科學的研發機構,以及健康保險相關機構,他們能夠在這個中間得到、了解狀況,發展產業。
在這個外圍,波及到互聯網所有生活,涉及到食品安全、水的安全,就像銀行里面應該向哪部分去投,第三方開發者提供的云平臺,能夠任意地開發運用。同時資本市場的走向,在這個中間少不了網絡、電信、媒體的支持和幫助。這由于大數據給我們展現的未來,特別是在健康方面展現的未來。我的演講到這里,謝謝大家!
關于IT 2020:
IT 2020高端論壇是由中國工程院、美國國家工程院、EMC公司、VMware公司、浪潮集團及聯想集團共同舉辦的一場僅面向受邀人員的世界級的高端論壇。論壇聚焦未來數年內影響中國乃至全球行業和經濟發展的大數據、云計算和新興IT趨勢。來自中國、美國及全球各地的學術界和產業界的領導者及專家學者都將參與此次盛會。
本屆論壇將進一步探索云計算和大數據的架構、應用和對主要行業的影響。屆時中國工程院和美國國家工程院的頂尖科學家、學術界的知名專家以及產業界著名的思想領袖將匯聚一堂,與您共同探討宏觀IT趨勢的話題。聚焦云計算和大數據的基礎架構,兩者對中國IT策略、經濟發展和城市可持續化發展的影響,以及大數據在中國可持續化發展進程中至關重要的三個行業中的應用:醫療、能源變革和綜合交通。