醫療人工智能技術與應用白皮書(2018)
▌前 言
2017 年醫療人工智能發展迅速,產業格局風起云涌。人工智能在醫療領域中的應用已非常廣泛,包括醫學影像、臨床決策支持、語音識別、藥物挖掘、健康管理、病理學等眾多領域。人工智能技術呈現與醫療領域不斷融合的趨勢,其中數據資源、計算能力、算法模型等基礎條件的日臻成熟成為行業技術發展的重要力量。在新形勢下,我國醫療人工智能的發展面臨著機遇和挑戰,技術能力不斷增強,但產品和服務仍需完善。
本白皮書梳理和研究國際、國內醫療人工智能的發展狀況,總結醫療人工智能行業及基礎設施領域國內外的技術發展特點和趨勢,分析我國醫療人工智能產業面臨的政策環境,為政府及產業界決策提供參考。
▌一、人工智能的發展
(一)人工智能的技術演變
從上世紀八九十年代的 PC 時代到二十一世紀的互聯網時代,信息技術改造了人類的生產方式,提高了生產效率,改善了我們的生活。在進入移動互聯網時代后,萬物互聯成為趨勢,但技術的限制導致移動互聯網難以催生出更多的新應用和新業態。如今,人工智能儼然已經成為這個時代最炙手可熱的技術,甚至將成為未來十年內信息技術產業發展的焦點。
人工智能的概念誕生于上世紀 50 年代,從最初的神經網絡和模糊邏輯,到現在的深度學習、圖像搜索,人工智能技術經歷了一系列的起伏。在 1956 年的一次科學會議上,人工智能的概念被首次確立:讓機器像人那樣思考和認知,用計算機實現對人腦的模擬。上世紀50 年代至 70 年代是人工智能的早期發展階段,該階段人工智能主要用于解決一些小型的數學問題和邏輯問題。此時人工智能出現了一些代表性應用,如機器定理證明、機器翻譯、專家系統、模式識別等,但是該階段人工智能仍可以被歸納為“弱人工智能”時代,其發展和應用還遠遠不能達到人類的智慧水平。
1972 年,用于傳染性血液診斷和處方的知識工程系統 MYCIN 研發成功,該事件標志著人工智能進入“專家系統”時期。專家系統的出現使得計算機可以和人進行結合,通過對數據的分析解決一些實際的問題。但是專家系統的發展并不順利,也并未得到廣泛的應用。其原因主要有兩個方面。一是專業知識的獲取需要行業內長時間的積累,大量的行業數據在彼時難以全部植入專家系統。二是專家系統的程序主要由解釋性語言“LIPS”編寫,其開發效率和易用性較低,難以實現實際應用。人工智能技術發展在彼時陷入的瓶頸使得人類開始思考,如何讓計算機自發理解和歸納數據,掌握數據間的規律,即“機器學習”。
上世紀 90 年代末,IBM“深藍”計算機擊敗國際象棋大師卡斯帕羅夫再次引發了全球對人工智能技術的關注。但是受限于當時的技術條件,人工智能尚無法支撐大規模的商業化應用。2006 年,Geoffrey Hinton教授發表的論文《A Fast Learning Algorithm for Deep Belief Nets》中提出了深層神經網絡逐層訓練的高效算法,使當時計算條件下的神經網絡模型訓練成為了可能。
(二)人工智能發展的三大因素
人工智能的概念雖然在上世紀已經出現,但由于彼時軟硬件條件的不成熟,數據資源的短缺,人工智能并未實現廣泛的應用。如今,隨著算法、算力等基礎技術條件的日漸成熟,行業數據的積累,人工智能得以應用在各個領域。
算力。GPU(圖形處理器)顯著提升了計算機的性能,擁有遠超CPU 的并行計算能力。由于處理器的計算方式不同,CPU 擅長處理面向操作系統和應用程序的通用計算任務,而 GPU 擅長完成與顯示相關的數據處理。CPU 計算使用基于 x86 指令集的串行架構,適合快速完成計算任務。GPU 擁有多內核處理并行計算,適合處理 3D 圖像中上百萬的圖像像素。此外,FPGA 也在越來越多地應用在 AI 領域。FPGA(Field Programmable Gate Array)是在 PAL、GAL、CPLD 等可編程邏輯器件的基礎上進一步發展的產物。它是作為專用集成電路領域中的一種半定制電路而出現的,既解決了全定制電路的不足,又克服了原有可編程邏輯器件門電路數有限的缺點。
一方面,FPGA 是可編程重構的硬件,相比 GPU 有更強大的可調控能力;另一方面,與日增長的門資源和內存帶寬使得它有更大的設計空間。由于深層神經網絡包含多個隱藏層,大量神經元之間的聯系計算具有高并行性的特點,具備支撐大規模并行計算的 FPGA 和 GPU 架構已成為了現階段深度學習的主流硬件平臺。FPGA 和 GPU 架構能夠根據應用的特點定制計算和存儲的結構,方便算法進行微調和優化,實現硬件與算法的最佳匹配,獲得較高的性能功耗比。
算法。深度學習是當前研究和應用的熱點算法,也是人工智能的重要領域。深度學習通過構建多隱層模型和學習海量訓練數據,可以獲取到數據有用的特征。通過數據挖掘進行海量數據處理,自動學習數據特征,尤其適用于包含少量未標識數據的大數據集。深度學習采用層次網絡結構進行逐層特征變換,將樣本的特征表示變換到一個新的特征空間,從而使分類或預測更加容易。
深度學習驅動圖像識別精度大幅度提升。2012 年, 深度學習模型首次被應用在圖像識別大賽(ImageNet),將錯誤率降至16.4%,一舉奪冠。2015 年,微軟通過152 層的深度網絡,將圖像識別錯誤率降至 3.57%,而人眼的辨識錯誤率約在 5.1%,Deep Learning 模型的識別能力已經超過了人眼。在2017 年的 ImageNet 挑戰賽中,Momenta 團隊利用 SENet 架構奪魁,他們的融合模型在測試集上獲得了 2.251% 的錯誤率,對比于去年第一名的結果 2.991%,獲得了將近 25% 的精度提升。
自 Hinton 提出 DBN(深度置信網絡)以來,深度學習的發展經歷了一個快速迭代的周期,其中卷積神經網絡(Convolutional Neural Network,CNN)目前已成為圖像識別領域應用最廣泛的算法模型。在利用卷積神經網絡(CNN)進行圖像理解的過程中,圖像以像素矩陣形式作為原始輸入,第一層神經網絡的學習功能通常是檢測特定方向和形狀的邊緣的存在與否,以及這些邊緣在圖像中的位置;第二層往往會檢測多種邊緣的特定布局,同時忽略邊緣位置的微小變化;第三層可以把特定的邊緣布局組合成為實際物體的某個部分;后續的層次將會通過全連接層來把這些部分組合起來,實現物體的識別。目前,CNN 已廣泛應用于醫療健康行業特別是醫療影像輔助診斷,用以實現病變檢測和特定疾病的早期篩查。
大數據。機器學習是人工智能的核心和基礎,而數據和以往的經驗是機器學習優化計算機程序的性能標準。隨著大數據時代的到來,來自全球的海量數據為人工智能的發展提供了良好的基礎。據 IDC 統計,2011 年全球數據總量已經達到 1.8ZB,并以每兩年翻一番的速度增長,預計到 2020 年全球將總共擁有 35ZB 的數據量,數據量增長近20 倍;數據規模方面,預計到 2020 年,全球大數據產業規模將達到2047 億美元,我國產業規模將突破萬億元 。
隨著電子病歷的實施,CT 影像、磁共振成像等放射圖像的普及,醫療行業的數據量已呈現指數級增長。據統計,2013 年全球醫療健康數據量為 153EB,預計年增長率為 48%。通過自然語言理解、機器學習等技術,大量文本、視頻、圖像等非結構化數據得以分析利用。來源于三甲醫院的電子病歷數據庫,基層醫院和體檢機構的健康檔案數據庫,國家各統計部門的人口數據庫通過大數據技術可以實現互聯互通,形成個人完整生命周期的醫療健康大數據,為人工智能技術在醫療健康行業的應用提供了有力的支撐。
(三)人工智能上升為我國國家戰略
2017 年 7 月 20 日,國務院正式印發《新一代人工智能發展規劃》(以下簡稱《規劃》),提出了面向 2030 年我國新一代人工智能發展的指導思想、戰略目標、重點任務和保障措施,部署構筑我國人工智能發展的先發優勢,加快建設創新型國家和世界科技強國,描繪了我國新一代人工智能發展的藍圖。《規劃》指出以提升新一代人工智能科技創新能力為主攻方向,構建開放協同的人工智能科技創新體系,把握人工智能技術屬性和社會屬性高度融合的特征,堅持人工智能研發攻關、產品應用和產業培育“三位一體”推進。
其中,對于涉及民生需求的醫療、養老等方面,《規劃》重點提出應加快人工智能創新應用,為公眾提供個性化、多元化、高品質服務,包括:推廣應用人工智能治療新模式新手段,建立快速精準的智能醫療體系;探索智慧醫院建設,開發人機協同的手術機器人、智能診療助手,研發柔性可穿戴、生物兼容的生理監測系統,研發人機協同臨床智能診療方案,實現智能影像識別、病理分型和智能多學科會診;基于人工智能開展大規模基因組識別、蛋白組學、代謝組學等研究和新藥研發,推進醫藥監管智能化;加強流行病智能監測和防控。同時,國家也從重大科技專項角度支持醫療人工智能發展,醫學人工智能成為了 2018 年科技部重大專項的重點。
2017 年 5 月份,我國科技部發布《“十三五”衛生與健康科技創新專項規劃》,提出加快引領性技術的創新突破和應用發展,攻克一批急需突破的先進臨床診治關鍵技術。重點部署生命組學、基因操作、精準醫學、醫學人工智能、疾病早期發現、新型檢測與成像、生物治療、微創治療等前沿及共性技術研發,提升我國醫學前沿領域原創水平,增強創新驅動源頭供給,加快前沿技術創新及臨床轉化。《“十三五”衛生與健康科技創新專項規劃》對推進醫學人工智能的技術發展指明了具體方向:開展醫學大數據分析和機器學習等技術研究,開發集中式智能和分布式智能等多種技術方案,重點支持機器智能輔助個性化診斷、精準治療輔助決策支持系統、輔助康復和照看等研究,支撐智慧醫療發展。
▌二、醫療人工智能的寶貴價值
醫療行業長期存在優質醫生資源分配不均,診斷誤診漏診率較高,醫療費用成本過高,放射科、病理科等科室醫生培養周期長,醫生資源供需缺口大等問題。隨著近些年深度學習技術的不斷進步,人工智能逐步從前沿技術轉變為現實應用。在醫療健康行業,人工智能的應用場景越發豐富,人工智能技術也逐漸成為影響醫療行業發展,提升醫療服務水平的重要因素。與互聯網技術在醫療行業的應用不同,人工智能對醫療行業的改造包括生產力的提高,生產方式的改變,底層技術的驅動,上層應用的豐富。通過人工智能在醫療領域的應用,可以提高醫療診斷準確率與效率;提高患者自診比例,降低患者對醫生的需求量;輔助醫生進行病變檢測,實現疾病早期篩查;大幅提高新藥研發效率,降低制藥時間與成本。
(一)輔助醫生診斷,緩解漏診誤診問題
醫療數據中有超過 90%的數據來自于醫學影像,但是對醫學影像的診斷依賴于人工主觀分析。人工分析只能憑借經驗去判斷,容易發生誤判。據中國醫學會數據資料顯示,中國臨床醫療每年的誤診人數約為 5700 萬人,總誤診率為 27.8%,器官異位誤診率為 60%。以心肌絞痛病癥為例,其早期臨床表現輕微,除胸口痛外,常會伴隨出現肩部到手部內側疼痛,精神焦慮,血壓異常等尋常體征現象,對于門診醫生而言很容易發生誤診。對于病理醫生而言,從眾多細胞中依靠經驗找到微小的癌變細胞難度較大,診斷錯誤現象時有發生。人工智能技術的出現已經在一定程度上緩解了以上問題。
利用圖像識別技術,通過大量學習醫學影像,人工智能輔助診斷產品可以輔助醫生進行病灶區域定位,有效緩解漏診誤診問題。
(二)提高診斷效率,彌補資源供需缺口
據統計,我國每千人平均醫生擁有量僅為 2.1 人 2,醫生資源缺口問題較為嚴重。醫生資源缺口問題在影像科、病理科方面尤為嚴重。
目前我國醫學影像數據的年增長率約為 30%,而放射科醫師數量的年增長率僅為4.1%。放射科醫師數量的增長遠不及影像數據增長。這個現象意味著放射科醫師在未來處理影像數據的壓力會越來越大,甚至遠遠超過負荷。供需不對稱的問題在病理方面表現尤甚。據統計,我國病理醫生缺口達到 10 萬,而培養病理醫生的周期卻很長,這意味著此問題短期內將無法解決。面對嚴重的稀缺資源缺口問題,人工智能技術或將帶來解決這個難題的答案。人工智能輔助診斷技術應用在某些特定病種領域,甚至可以代替醫生完成疾病篩查任務,這將大幅提高醫療機構、醫生的工作效率,減少不合理的醫療支出。
(三)疾病風險預警,提供健康顧問服務
多數疾病都是可以預防的,但是由于疾病通常在發病前期表征并不明顯,到病況加重之際才會被發現。雖然醫生可以借助工具進行疾輔助預測,但人體的復雜性、疾病的多樣性會影響預測的準確程度。人工智能技術與醫療健康可穿戴設備的結合可以實現疾病的風險預測和實際干預。風險預測包括對個人健康狀況的預警,以及對流行病等公共衛生事件的監控;干預則主要指針對不同患者的個性化的健康管理和健康咨詢服務。
(四)支持藥物研發,提升制藥效率
利用傳統手段的藥物研發需要進行大量的模擬測試,周期長、成本高。目前業界已嘗試利用人工智能開發虛擬篩選技術,發現靶點、篩選藥物,以取代或增強傳統的高通量篩選(HTS)過程,提高潛在藥物的篩選速度和成功率。通過深度學習和自然語言處理技術可以理解和分析醫學文獻、論文、專利、基因組數據中的信息,從中找出相應的候選藥物,并篩選出針對特定疾病有效的化合物,從而大幅縮減研發時間與成本。
(五)手術機器人,提升外科手術精準度
智能手術機器人是一種計算機輔助的新型的人機外科手術平臺,主要利用空間導航控制技術,將醫學影像處理輔助診斷系統、機器人以及外科醫師進行了有效的結合。手術機器人不同于傳統的手術概念,外科醫生可以遠離手術臺操縱機器進行手術,是世界微創外科領域一項革命性的突破。
目前達芬奇機器人是世界上最為先進的微創外科手術系統之一,集成了三維高清視野、可轉腕手術器械和直覺式動作控制三大特性,使醫生將微創技術更廣泛地應用于復雜的外科手術。相比于傳統手術需要輸血,會帶來傳染疾病等危險,機器人做手術則出血很少。此外,手術機器人可以保證精準定位誤差不到 1 毫米,對于一些對精確切口要求非常高的手術實用性很高。
▌三、國內外醫療人工智能發展狀況及分析
(一)市場規模及發展趨勢
據統計,到 2025 年人工智能應用市場總值將達到 1270 億美元,其中醫療行業將占市場規模的五分之一。我國正處于醫療人工智能的風口:2016 年中國人工智能+醫療市場規模達到 96.61 億元,增長37.9%;2017 年將超過 130 億元,增長 40.7%;2018 年有望達到 200億元。投資方面,據 IDC 發布報告的數據顯示,2017 年全球對人工智能和認知計算領域的投資將迅猛增長 60%,達到125億美元,在2020年將進一步增加到 460 億美元。其中,針對醫療人工智能行業的投資也呈現逐年增長的趨勢。其中 2016 年總交易額為 7.48 億美元,總交易數為 90 起,均達到歷史最高值。
(二)國內外行業發展熱點分析
國內外科技巨頭均重視人工智能技術在醫療領域的布局與應用。IBM 在2006年啟動Watson項目,于2014年投資10億美元成立Watson事業集團。Watson 是一個通過自然語言處理和機器學習,從非結構化數據中洞察數據規律的技術平臺。Watson 將散落在各處的知識片段連接起來,進行推理、分析、對比、歸納、總結和論證,獲取深入的洞察以及決策的證據。
2015 年,沃森健康(Watson Health)成立,專注于利用認知計算系統為醫療健康行業提供解決方案。Watson 通過和一家癌癥中心合作,對大量臨床知識、基因組數據、病歷信息、醫學文獻進行深度學習,建立了基于證據的臨床輔助決策支持系統。目前該系統已應用于腫瘤、心血管疾病、糖尿病等領域的診斷和治療,并于 2016 年進入中國市場,在國內眾多醫院進行了推廣。
Watson 在醫療行業的成功應用標志著認知型醫療時代的到來,該解決方案不僅可以提高診斷的準確率和效率,還可以提供個性化的癌癥治療方案。此外,谷歌、微軟等也都紛紛布局醫療 AI。2014 年谷歌收購DeepMind 公司,后開發知名的人工智能程序 AlphaGo。在基礎技術層面,谷歌的開源平臺 TensorFlow 是當今應用最廣泛的深度學習框架。
在醫療健康領域,Google 旗下的 DeepMind Health 和英國國家醫療服務體系 NHS(National Health Service)展開合作,DeepMind Health可以訪問 NHS 的患者數據進行深度學習,訓練有關腦部癌癥的識別模型。微軟將人工智能技術用于醫療健康計劃“Hanover”,尋找最有效的藥物和治療方案。此外,微軟研究院有多個關于醫療健康的研究項目。Biomedical Natural Language Processing 利用機器學習從醫學文獻和電子病歷中挖掘有效信息,結合患者基因信息研發用于輔助醫生進行診療的推薦決策系統。
國內科技巨頭也紛紛開始在醫療人工智能領域布局,各家公司均投入大量資金與資源,但各自的發展重點與發展策略并不相同。例如,阿里健康以云平臺為依托,結合自主機器學習平臺 PAI2.0 構建了堅實而完善的基礎技術支撐。同時,阿里健康與浙江大學醫學院附屬第一醫院、浙江大學第二附屬醫院等醫院、上海交通大學醫學院附屬新華醫院以及第三方醫學影像中心建立了合作伙伴關系,重點打造醫學影像智能診斷平臺,提供三維影像重建、遠程智能診斷等服務。
此外,阿里云聯合英特爾、零氪科技聯合舉辦了天池醫療 AI 大賽。該大賽面向全球第一高發惡性腫瘤——肺癌,以肺部小結節病變的智能識別、診斷為課題,開展大數據與人工智能技術在肺癌早期影像診斷上的應用探索。大賽基于阿里云天池大數據平臺,邀請全球生物、醫療、人工智能等眾多領域的校內團隊、專家學者、醫療企業參賽。參賽者使用大賽提供的數千份胸部 CT 掃描數據集進行預訓練,在此基礎上開發算法模型,檢測 CT 影像中的肺部結節區域。準確率排名靠前的參賽者將進入決賽,決賽要求參賽者提交診斷結果的 CSV 文件,并標記檢測到的結節坐標,最終根據參賽者給出的坐標信息判斷結節是否檢測正確,如果結節落在以參考標準為中心半徑為 R 的球體中,則認為檢測正確。
大賽通過探索早期肺癌精確智能診斷的優秀算法,提升早期肺癌檢測的準確度,降低臨床上常見的假陽性的誤診發生,實現“早發現,早診斷,早治療”。同時,本次大賽能夠激發傳統醫學與機器學習的碰撞與融合,為整體學科發展進行探路與思辨,推動了人工智能技術在醫療影像診斷上的應用。
騰訊在人工智能領域的布局涵蓋基礎研究、產品研發、投資與孵化等多個方面。騰訊在 2016 年建立了人工智能實驗室 AI lab,專注于 AI 技術的基礎研究和應用探索。2017 年 11 月,在“2017 騰訊全球合作伙伴大會”上騰訊宣布了自己的“AI 生態計劃”,旨在開放AI 技術,并結合資本機構孵化醫療 AI 創業項目。2017 年 4 月,騰訊向碳云智能投資 1.5 億美元。
碳云智能由原華大基因 CEO 王俊牽頭組建,致力于建立人工智能的內核模型,并對健康風險進行預警、進行精準診療和個性化醫療。在產品研發方面,騰訊在 2017 年 8 月推出了自己首個應用在醫學領域的 AI 產品騰訊覓影。騰訊覓影把圖像識別、深度學習等領先的技術與醫學跨界融合,可以輔助醫生對食管癌進行篩查,有效提高篩查準確度,促進準確治療。除了食管癌,騰訊覓影未來也將支持早期肺癌、糖尿病性視網膜病變、乳腺癌等病種的早期篩查。
在國際上權威的肺結節檢測比賽 LUNA 中,中國企業參賽隊伍阿里云 ET 和科大訊飛均取得了優異的成績。科大訊飛醫學影像團隊以92.3%的召回率刷新了世界記錄。召回率是指成功發現的結節數在樣本數據中總節結數的占比。
召回率是評測診斷準確率的重要指標,召回率低代表遺漏了患者的關鍵病灶信息,因此科大訊飛團隊采用了多尺度、多模型集成學習的方法顯著提升了召回率,同時針對假陽性導致的醫生重復檢測問題,創新性地使用結節分割和特征圖融合的策略進行改善。在診斷效率方面,科大訊飛團隊采用 3D CNN 模型來計算特征圖,并在特征圖上進行檢測,并通過預訓練大幅提升了檢測效率,實現薄層 CT 的秒級別處理。
▌四、我國醫療人工智能細分領域
人工智能與醫療的結合方式較多,就醫流程方面包括診前、診中、診后;適用對象方面包括醫院、醫生、患者、藥企、檢驗機構等;從賦能醫療行業的角度分析,包括降低醫療成本,提高診斷效率等多種模式。我國醫療人工智能企業聚焦的應用場景集中在虛擬助理、病歷與文獻分析、醫療影像輔助診斷、藥物研發、基因測序等領域。
(一)虛擬助理
虛擬助理是指通過語音識別、自然語言處理等技術,將患者的病癥描述與標準的醫學指南作對比,為用戶提供醫療咨詢、自診、導診等服務的信息系統。智能問診是虛擬助理廣泛應用的場景之一。
智能問診是指機器通過語義識別與用戶進行溝通,聽懂用戶對于癥狀的描述,再根據醫療信息數據庫進行對比和深度學習,對患者提供診療建議,包括用戶可能患有的健康隱患,應當在醫院進行復診的門診科目等。通用型的虛擬助手如蘋果 Siri、微軟 Cortana 等與用戶溝通時,用戶可以自由輸入,由虛擬助手進行語義理解。醫療領域的虛擬助手與通用型的虛擬助手和用戶的溝通方式不同,因為普通用戶難以使用準確的醫學用語去描述自己的問題。因此,醫療虛擬助手在幫助用戶進行智能問診時通常采用選擇題的形式。
智能問診在醫生端和用戶端均發揮了較大的作用。在醫生端,智能問診可以輔助醫生診斷,尤其是受限于基層醫療機構全科醫生數量、質量的不足,醫療設備條件的欠缺,基層醫療成為了我國分級診療發展的瓶頸。人工智能虛擬助手可以幫助基層醫生進行對一些常見病的篩查,以及重大疾病的預警與監控,幫助基層醫生更好地完成轉診的工作,這是人工智能問診在醫生端的價值體現。
在用戶端,人工智能虛擬助手能夠幫助普通用戶完成健康咨詢、導診等服務。在很多情況下,用戶身體只是稍感不適,并不需要進入醫院進行就診。人工智能虛擬助手可以根據用戶的描述定位到用戶的健康問題,提供輕問診服務和用藥指導。2017 年,康夫子、大數醫達等公司研發的智能預問診系統得到了在多家醫院的落地應用。預問診系統是基于自然語言理解、醫療知識圖譜及自然語言生成等技術實現的問診系統。患者在就診前使用預問診系統填寫病情相關信息,由系統生成規范、詳細的門診電子病歷發送給醫生。
預問診系統采用層次轉移的設計架構模擬醫生進行問診,既能有邏輯地像醫生一樣詢問基本信息、疾病、癥狀、治療情況、既往史等信息,同時可以圍繞任一癥狀、病史等進行細節特征的問診。除問診外,預問診系統基于自然語言生成技術自動生成規范、詳細的問診報告,主要包括:患者基本信息、主訴、現病史、既往史和過敏史五個部分。此外,語音識別技術為醫生書寫病歷,為普通用戶在醫院導診提供了極大的便利。當放射科醫生、外科醫生、口腔科醫生工作時雙手無法空閑出來去書寫病歷,智能語音錄入可以解放醫生的雙手,幫助醫生通過語音輸入完成查閱資料、文獻精準推送等工作,并將醫生口述的醫囑按照患者基本信息、檢查史、病史、檢查指標、檢查結果等形式形成結構化的電子病歷,大幅提升了醫生的工作效率。
科大訊飛的智能語音產品“云醫聲”為了應對醫院科室內嘈雜的環境,達到更好的語音處理效果,開發了醫生專用麥克風,可以過濾掉噪音及干擾信息,將醫生口述的內容轉換成文字。目前,訊飛醫療的語音轉錄準確率已超過 97%,同時推出了 22 種方言的版本,并已在北大口腔、瑞金醫院等超過 20 家醫院落地使用。科大訊飛的另一款產品“曉醫”導診機器人利用科大訊飛的智能語音和人工智能技術,能夠通過與患者進行對話理解患者的需求,實現智能地院內導診,告訴患者科室位置、應就診的科室,并解答患者就診過程中遇到的其他問題,實現導醫導診,進一步助力分診。“曉醫”機器人目前已在安徽省立醫院、北京 301 醫院等多家醫院投入使用。
(二)病歷與文獻分析
電子病歷是在傳統病歷基礎上,記錄醫生與病人的交互過程以及病情發展情況的電子化病情檔案,包含病案首頁、檢驗結果、住院記錄、手術記錄、醫囑等信息。其中既有結構化數據,也包括大量自由文本輸入的非結構化數據。對電子病歷及醫學文獻中的海量醫療大數據進行分析,有利于促進醫學研究,同時也為醫療器械、藥物的研發提供了基礎。人工智能利用機器學習和自然語言處理技術可以自動抓取來源于異構系統的病歷與文獻數據,并形成結構化的醫療數據庫。
大數醫達、惠每醫療、森億智能等企業正是基于自己構建的知識圖譜,形成了供醫生使用的臨床決策支持產品,為醫生的診斷提供輔助,包括病情評估、診療建議、藥物禁忌等。
構建醫療知識圖譜的過程需經過醫學知識抽取、醫學知識融合的過程。在醫學知識抽取過程中,傳統的基于醫學詞典及規則的實體抽取方法存在諸多弊端。首先,目前沒有醫學詞典能夠完整地囊括所有類型的生物命名實體,此外同一詞語根據上下文語境的不同可能會指代的是不同實體,因此簡單的文本匹配算法無法識別實體。近年來,深度學習開始被廣泛應用于醫學實體識別,目前實驗結果表明基于BiLSTM-CRF 的模型能夠達到最好的識別效果。
由于數據來源的多樣性,在醫學知識融合的過程中存在近義詞需要進行歸類,目前分類回歸樹算法、SVM 分類方法在實體對齊的過程中可以實現良好的效果。和其他行業相比,分散在醫療信息化各個業務系統中的數據包含管理、臨床、區域人口信息等多種數據,復雜性更高,隱藏價值更大。
新華三等企業在 2017 年大力推進利用大數據技術挖掘醫療數據價值,助力人工智能與精準醫療。通過大數據平臺充分挖掘各種類型數據的價值,幫助實現輔助診斷、精準醫療、臨床科研等多種目標。大數據平臺通過自然語言處理技術,對電子病歷中的自由文本進行分詞、實體識別、依存句法分析、信息提取等操作,實現自由文本結構化。在實現病歷結構化的基礎上,利用機器學習聚類分析建立診斷建議模型,從而為醫生的臨床決策提供支持。
對電子病歷的結構化和數據挖掘,可以幫助一線人員及科研人員挖掘疾病規律,進行疾病相關性分析、患病原因分析、疾病譜分析等,并建立新的研究課題。例如,新華三在協助醫院進行關于卵巢癌的相關課題研究時,得出血小板與淋巴細胞的關系對卵巢癌診斷具有重要價值。
(三)醫療影像輔助診斷
醫療影像數據是醫療數據的重要組成部分,從數量上看超過 90%以上的醫療數據都是影像數據,從產生數據的設備來看包括 CT、X 光、MRI、PET 等醫療影像數據。據統計,醫學影像數據年增長率為 63%,而放射科醫生數量年增長率僅為 2%,放射科醫生供給缺口很大。
人工智能技術與醫療影像的結合有望緩解此類問題。人工智能技術在醫療影像的應用主要指通過計算機視覺技術對醫療影像進行快速讀片和智能診斷。人工智能在醫學影像中應用主要分為兩部分: 一是感知數據,即通過圖像識別技術對醫學影像進行分析,獲取有效信息;二是數據學習、訓練環節,通過深度學習海量的影像數據和臨床診斷數據,不斷對模型進行訓練,促使其掌握診斷能力。目前,人工智能技術與醫療影像診斷的結合場景包括肺癌檢查、糖網眼底檢查、食管癌檢查以及部分疾病的核醫學檢查和病理檢查等。利用人工智能技術進行肺部腫瘤良性惡性的判斷步驟主要包括:數據收集、數據預處理、圖像分割、肺結節標記、模型訓練、分類預測。
首先要獲取放射性設備如 CT 掃描的序列影像,并對圖像進行預處理以消除原 CT 圖像中的邊界噪聲,然后利用分割算法生成肺部區域圖像,并對肺結節區域進行標記。數據獲取后,對 3D 卷積神經網絡的模型進行訓練,以實現在肺部影像中尋找結節位置并對結節性質進行分類判斷。
食管癌是常見惡性腫瘤之一,據統計,我國 2015 年新發食管癌人數為 47.7 萬,占全球患病人數的 50%。針對食管癌的早期治療是診療的關鍵,食管癌早期五年內治療的生存率超過 90%,而進展期/晚期五年生存率則小于 15%。但是由于基層醫療機構醫生缺乏足夠的認知以及篩查手段,導致我國對早期食管癌的檢出率較低。
利用人工智能技術輔助醫生對食管癌進行篩查,可以有效提高篩查準確度與檢測效率。騰訊公司研發的覓影 AI 針對食管癌的早期篩查準確率可超過 90%,并且完成一次內鏡檢查的時間已經可控制在數秒之內。阿爾茨海默病,俗稱老年癡呆癥,是一種發病進程緩慢、隨著時間不斷惡化的持續性神經功能障礙,該疾病的真正成因至今仍不明確,沒有可以阻止或逆轉病程的治療。在我國,對該病癥的重視程度不高,現已造成就診率低、診斷率低、治療率低的“三低”局面。根據國際阿爾茨海默病聯合會報告,2015 年中國阿爾茨海默病患者超過 950 萬,患病人數已居世界第一,且仍在快速增長,2050 年或將達到 3000 萬。
阿爾茨海默癥在患病早期是可以干預的,但檢測卻相對困難,越早檢測出這種病癥,患者就越有機會提早尋求治療,減緩病情的影響。阿爾茨海默病的臨床診斷需要通過神經心理學測驗、血液學檢查、結構影像學或功能影像學檢查、腦電圖等方式綜合判斷。
阿爾茨海默病的診療難點在于癥狀以及檢查指標等的非特異性,較難實現早期診斷。雅森科技等企業通過輸入核磁、腦電圖和量表三種不同類型的數據,綜合運用機器訓練、統計分析和深度學習的方法,找出患者是否患病與輸入信息之間的關系。對于阿爾茨海默病診斷所用到的人工智能,已不只是傳統意義上的深度學習對醫學影像的識別,而是在此基礎上找出多種信息源之間的聯系,并基于這三種數據訓練多模態神經網絡訓練模型,從而提前兩至三年預測老年癡呆發病的可能性以及病情發展的階段。
糖網病是糖尿病引起的視網膜病變。據統計,我國約 5 億人處于糖尿病前期,糖尿病患者約有 1.1 億人,糖網病患者約有 3000 萬。
對糖尿病患者進行眼底篩查具有重要意義,因為糖網病患者通常早期難以發覺患有疾病,癥狀表現不明顯,只有經過眼底早期篩查,及時發現糖網病,及早干預,才能有效抵制疾病的發生。相較于其他疾病的診斷需要結合臨床信息,人工智能在糖網眼底領域的檢查具備更高的可操作性,因為僅針對眼部圖像的檢查就具備較高的診療價值。針對滲出或者出血等病變,AI 系統也可以實現較高的準確率。在 2017年,眾多企業、科研機構均進行了關于此方面的研究。
例如,中國移動通信有限公司研究院與沈陽何氏眼科醫院有限公司深度合作,研發眼底圖像質量評估、糖尿病視網膜病變嚴重程度分級、糖網病變病灶位置檢測等智能算法。首先對所采集的眼底圖像質量是否合格(即是否滿足病理分析要求)進行評估,并對質量合格的眼底圖像,分析其為左眼或右眼、是否存在眼底疾病、糖網病變嚴重程度的分級(如有糖網),并檢測眼底圖像中出現微動脈瘤、出血、滲出等糖網病變病灶的具體位置,最終自動生成結構化篩查報告,為患者提供轉診建議。
中國移動研究院面向基層醫院、眼視光中心、社區服務站、鄉村診所等基層篩查場景,將專業眼科影像設備采集的眼底圖像通過固網或移動蜂窩網上傳至云端,利用先進的人工智能、深度學習技術進行分析,實現眼底致盲疾病的自動篩查、糖尿病視網膜病變(如有)嚴重程度分級以及病灶位置檢測和跟蹤,其結果供臨床醫生參考,施行必要的干預、治療,使廣泛、低成本、快速響應的規模化篩查成為可能。病理是醫學界的金標準,也是許多疾病診斷的最終確定指標。
但是,病理醫生通常必須花費大量的時間檢查病理切片,因為病理醫生需要在上億級像素的病理圖片中識別微小的癌細胞。對于同一種疾病的病理診斷,不同的醫生往往會得出不同的判斷結論,足見病理診斷存在的誤診問題。人工智能技術為數字病理診斷帶來了技術革新,幫助病理醫生提高效率避免遺漏。相較于 CT、X 光等影像的人工智能輔助診斷,病理人工智能輔助診斷難度更大,因為病理的診斷既要觀察整體,還要觀察局部;不只要學習細胞特征,還要學習其生物行為。
我國已有蘭丁高科、泰立瑞、迪英加科技等眾多企業開始研究利用人工智能輔助數字病理診斷,他們開發的人工智能輔助診斷系統針對乳腺癌、宮頸癌等疾病的病理檢查已實現較高的準確率。
(四)藥物研發
人工智能正在重構新藥研發的流程,大幅提升藥物制成的效率。傳統藥物研發需要投入大量的時間與金錢,制藥公司平均成功研發一款新藥需要 10 億美元及 10 年左右的時間。藥物研發需要經歷靶點篩選、藥物挖掘、臨床試驗、藥物優化等階段。目前我國制藥企業紛紛布局 AI 領域,主要應用在新藥發現和臨床試驗階段。
靶點篩選。靶點是指藥物與機體生物大分子的結合部位,通常涉及受體、酶、離子通道、轉運體、免疫系統、基因等。現代新藥研究與開發的關鍵首先是尋找、確定和制備藥物篩選靶—分子藥靶。傳統尋找靶點的方式是將市面上已有的藥物與人體身上的一萬多個靶點進行交叉匹配以發現新的有效的結合點。人工智能技術有望改善這一過程。AI 可以從海量醫學文獻、論文、專利、臨床試驗信息等非結構化數據中尋找到可用的信息,并提取生物學知識,進行生物化學預測。據預測,該方法有望將藥物研發時間和成本各縮短約 50%。
藥物挖掘。藥物挖掘也可以稱為先導化合物篩選,是要將制藥行業積累的數以百萬計的小分子化合物進行組合實驗,尋找具有某種生物活性和化學結構的化合物,用于進一步的結構改造和修飾。人工智能技術在該過程中的應用有兩種方案,一是開發虛擬篩選技術取代高通量篩選,二是利用圖像識別技術優化高通量篩選過程。利用圖像識別技術,可以評估不同疾病的細胞模型在給藥后的特征與效果,預測有效的候選藥物。
病人招募。據統計,90%的臨床試驗未能及時招募到足夠數量和質量的患者。利用人工智能技術對患者病歷進行分析,可以更精準的挖掘到目標患者,提高招募患者效率。
藥物晶型預測。藥物晶型對于制藥企業十分重要,熔點、溶解度等因素決定了藥物臨床效果,同時具有巨大的專利價值。利用人工智能可以高效地動態配置藥物晶型,防止漏掉重要晶型,縮短晶型開發周期,減少成本。
(五)基因測序
基因測序是一種新型基因檢測技術,它通過分析測定基因序列,可用于臨床的遺傳病診斷、產前篩查、罹患腫瘤預測與治療等領域。單個人類基因組擁有 30 億個堿基對,編碼約 23000 個含有功能性的基因,基因檢測就是通過解碼從海量數據中挖掘有效信息。目前高通量測序技術的運算層面主要為解碼和記錄,較難以實現基因解讀,所以從基因序列中挖掘出的有效信息十分有限。人工智能技術的介入可改善目前的瓶頸。通過建立初始數學模型,將健康人的全基因組序列和RNA序列導入模型進行訓練,讓模型學習到健康人的 RNA剪切模式。
之后通過其他分子生物學方法對訓練后的模型進行修正,最后對照病例數據檢驗模型的準確性。
目前,IBM 沃森,國內的華大基因、博奧生物、金域檢驗等龍頭企業均已開始自己的人工智能布局。以金域檢驗為例,金域檢驗利用其綜合檢驗檢測技術平臺,以疾病為導向設立檢測中心,融合生物技術與人工智能等新一代信息技術為廣大患者提供專業化的臨床檢驗服務。金域檢驗的基因組檢測中心擁有全基因組掃描、熒光原位雜交、細胞遺傳學、傳統 PCR 信息平臺,并利用基因測序領域中最具變革性的新技術之高通量測序技術(HTS)為臨床提供高通量、大規模、自動化及全方位的基因檢測服務。同時,金域檢驗依托覆蓋全國 90%以上的人口所在地區、年服務醫療機構 21000 多家和年標本量超 4000萬例的覆蓋全國不同地域、不同民族、不同年齡層次的海量醫療檢測樣本數據,創建了具有廣州特色的“精準醫療”檢驗檢測大數據研究院。
▌五、面臨的問題與挑戰
(一)數據是行業發展的瓶頸,積累與創新是解決問題的關鍵
數據是人工智能技術最重要的因素之一。對于機器學習而言,模型越復雜、越具有強表達能力越容易降低對未來數據的解釋能力,而專注于解釋訓練數據。這種現象會導致訓練數據效果很好,但遇到未知的測試數據預測效果會大幅降低,即發生過擬合現象,從而也就需要更多的數據來避免該問題的發生,以保證訓練的模型對新的數據也能有良好的預測表現。對于醫療人工智能而言,數據的重要性更為明顯。以醫療影像輔助診斷公司為例,企業訓練模型的數據來源通常是公開數據集,或者企業與個別醫院合作獲取的影像數據。
這種模式在企業創業初期可以維持,但是當企業發展到一定階段時弊端會開始出現。以肺結節 CT 篩查為例,企業通常與個別醫院展開合作,獲取該醫院 CT 設備的數據。但是,目前市面上廣泛流通的 CT 設備商有七到八家,機型則達到了上百種,企業在與醫院合作時是針對某一機型的設備進行的數據訓練,該模型在適用于其他機型時,如果一些諸如層厚、電流、電壓、掃描時間等參數不同,模型需要重新針對新機型進行數據預訓練。除此以外,病人受檢測時的姿勢(平躺或者趴窩),CT 長寬 512 像素或者 768 像素的差別,不同排數機器的層厚差異以及薄層重構算法都是會對模型訓練產生影響的因素。
因此,數據問題的解決是保證醫療影像輔助診斷產品是否能夠廣泛應用的關鍵,廣泛開展合作,加深數據的積累以及技術上的創新或是下一步行業發展的重點。
(二)醫療 AI 產品需要實現從試驗向臨床應用的突破
目前,業內針對肺結節、糖網病檢查等場景的醫療人工智能產品診斷準確率普遍很高,但是真實情況并非如此樂觀。企業在訓練自己模型時通常都有自己的數據庫,各自的算法都是按照自己的數據進行訓練,然后以自己的數據來驗證準確性。在沒有得到臨床驗證前,基于標準或特定數據集的實驗室測試結果并不具備較大的意義,因為實際臨床應用的場景是非常復雜的。具體體現在以下幾個方面:
1.數據采樣
以糖網病篩查為例,瞳孔較小、晶狀體渾濁等人群的免散瞳眼底彩照,圖像質量往往達不到篩查的要求。此外,受限于成本因素,很多基層醫療機構使用的是手持眼底相機,成像質量堪憂。
2.數據格式
在病理方面,數據缺少通用的國際標準,各醫院使用的病理切片掃描儀廠家也并不一致,各掃描儀廠商的掃描文件數據格式多數為私有格式,數據的標準化需要各廠家與醫院積極配合,開放自己的數據存儲格式。
3.診斷標準
目前圖像識別技術在醫療影像輔助診斷上的應用已經取得了比較好的應用,技術上也取得了較大的突破,但是醫療影像輔助診斷產品下一步應當完善自己的算法,避免“就圖論圖”。以甲狀腺結節診斷為例,醫生診斷的依據并非只是彩超的拍片結果,還要結合甲狀腺功能化驗,查看抗體的相關表現。因此,將臨床表征信息、患者基本信息、LIS 指標、隨訪記錄等都作為預測模型的因子,實現多模態的診斷體系將是醫療影像輔助診斷產品下一步重點突破的方向。
(三)加深合作,可持續的商業模式亟待建立
現在的醫療人工智能企業多數是依靠單點醫療機構開展工作,合作方式較為單一,數據作為醫院資產也難以供企業放置于院外使用。
此外,醫療人工智能產品想以銷售軟件的形式讓醫院付費,不論從計費方式、軟件資質等方面都較為困難。因此,建立可持續的商業模式是醫療人工智能行業長久發展的關鍵。與政府、醫院開展合作,向醫療機構提供服務或是解決方案之一。例如,四川華西醫院與希氏異構醫療科技有限公司聯合成立華西-希氏醫學人工智能研發中心,在消化內鏡人工智能技術研發方面開展了合作。
正如華西醫院院長李為民所言:“華西-希氏醫學人工智能研發中心,既是四川大學華西醫院產學研用協同創新的重大科技轉化平臺,也是華西醫院以開放姿態釋放醫院資源的重要標志”。目前華西醫院與公司的合作已取得了進展,醫生可以上傳胃鏡圖像,通過在云端進行數據分析,可以對胃癌、靜脈曲張、息肉等常見胃鏡檢查結果進行篩查,目前準確率超過 90%。基于 AI 的消化胃鏡智能系統可以提供高質量的檢測結果,提高醫生診斷效率,提升基層醫療機構的服務水平。另外一個案例是,一款用于肺癌早期篩查的 APP 與上海某區政府簽署合作協議,企業進入社區基層為廣大居民提供疾病篩查服務,政府給予相應補貼。
(四)明確醫療責任主體,劃清權責范圍
人工智能不論在學習能力還是成本控制方面,都具備發揮能力的空間,可以為普通用戶和醫生帶來幫助。但是,人工智能幫助進行輔助診斷在醫療責任認定方面也存在問題和挑戰。例如,用戶在使用醫療虛擬助手表達主訴時,可能會漏掉甚至錯誤地進行描述,導致虛擬助手提供的建議是不符合用戶原本的疾病情況的。因此,目前監管部門禁止虛擬助手軟件提供任何疾病的診斷建議,只允許提供用戶健康輕問診咨詢服務。
我國監管部門對于利用人工智能技術提供診斷功能是審核要求非常嚴格。在 2017 年 CFDA 發布的新版《醫療器械分類目錄》中的分類規定,若診斷軟件通過算法提供診斷建議,僅有輔助診斷功能不直接給出診斷結論,則按照二類醫療器械申報認證;如果對病變部位進行自動識別并提供明確診斷提示,則必須按照第三類醫療器械進行臨床試驗認證管理。未來,應進一步明確針對 AI 診斷進入臨床應用的法律標準,做出 AI 診斷的主體在法律上是醫生還是醫療器械,AI 診斷出現缺陷或醫療過失的判斷依據等問題。
(五)制定人才培養計劃,搶占戰略制高點
人才專業水平是人工智能發展的關鍵因素之一。目前,我國從事人工智能行業的從業人員數不足 5 萬人,每年通過高校培養出來的技術人員也不足 2000 人,人工智能人才缺口較大。相比于數據資源較為充足,我國的人工智能人才儲備較發達國家差距較大。據統計,在人工智能行業從業者當中,美國擁有 10 年以上工作經驗的人才占比接近 50%,而我國只有不到 25%。此外,我國同時掌握醫療與人工智能知識的復合型人才更是匱乏。
因此,只有解決人才問題,我國才能突破醫療人工智能行業發展的瓶頸。基于此背景,我國高度重視人工智能培養,并制定《新一代人工智能發展規劃》國家戰略,指出要把高端人才隊伍建設作為人工智能發展的重中之重。2017 年 11 月,科技部在京召開新一代人工智能發展規劃暨重大科技項目啟動會,科技部、發改委、財政部等聯合成立人工智能規劃推進辦公室,宣布首批四個專項開放創新平臺的依托單位,其中包括依托騰訊公司建設醫療影像國家人工智能開放創新平臺。我國現已通過建設國家級開放平臺集聚高端人才,通過鼓勵深度交叉學科研究,推進產學研合作的新模式加速人才培養。