1. 肺結節影像AI技術的發展現狀
受環境、吸煙、油煙及遺傳等因素的影響,肺癌的發病率、致死率已位列我國常見惡性腫瘤的第1位,且隨著我國人口老齡化,罹患肺癌的總人數呈現持續升高態勢。循證醫學數據顯示,早期肺癌5年生存率顯著高于中晚期肺癌,早發現、早診斷及早治療是改善預后的重要途徑。肺癌防治的重要手段是早期篩查,其中胸部低劑量CT是國際公認的有效手段。
但是隨著胸部CT篩查人群的日益增多,影像科醫師的壓力也日趨增大。一方面影像科醫師缺口較大,不能匹配日益增長的工作量;另一方面隨著薄層低劑量CT的應用,圖像數量的倍增、小結節顯示率的提高及結節的定量測量等使得讀片的難度顯著增加。此外,繁重、枯燥的閱片工作使影像科醫師的疲勞度增加,同時漏診、誤診的風險也在增加。
近年來,計算機硬件水平的提升和深度學習等核心技術的發展推動了AI向社會各領域滲透。在我國,醫療領域是AI發展相對蓬勃的領域之一。基于深度學習的AI應用目前已經覆蓋病灶檢測、病理診斷、放療規劃和術后預測等各臨床階段。鑒于在中國肺癌的高發病率、高病死率和高篩查率的現狀,影像醫生人員匱乏和勞動疲勞度等需求端的存在,以及國外的胸部公開數據集給了創業者起步的機會,利用公開數據集建立各自模型,并在中國大數據集下進行訓練等技術端的便利,使得肺結節人工智能技術如火如荼地發展起來,肺結節篩查模型也成為大多數人工智能創業公司的標配。
在早期的研究中,AI算法模型能自動分割胸腔區域,快速準確地定位疑似肺結節的病灶,從大數據集學習所得到的算法模型可以避免主觀偏差,雖然部分模型篩選的結果中包含了一些假陽性結節,但明顯降低了假陰性的發生,大大減輕了影像科醫師的工作量。除此之外,AI算法模型不僅能提取肺結節的位置、形態信息,還能進一步提供肺結節分類(實性、亞實性及鈣化等)乃至腫瘤良惡性分級等一些決策意見供醫師參考。據文獻報道,一些模型的篩查結果從統計學上看要優于經驗豐富的影像科醫師。多家三級甲等醫院已經合作研發了各種肺結節AI模型,并將其應用于臨床工作中,均取得了較好的效果。
盡管深度神經網絡在診斷問題的有效性上已初步得到驗證,但是醫學影像臨床工作中往往交織著多種不同任務。以肺結節的篩查為例,醫師需要在影像上識別出所有的肺結節,對結節的大小、密度及形態等進行完整的描述,并且根據指南對所發現的結節采取不同的隨訪方案。在隨訪過程中,醫師需要對比觀察結節大小、密度的變化,判斷結節的生長規律與良惡性,為臨床干預做決策準備。
從肺結節的篩查與診斷方面不難看出,AI需要在發現異常、量化測量、隨訪跟蹤和鑒別診斷中發揮可靠作用,最終才能具有臨床應用價值。除了將深度神經網絡應用于醫學影像的分類問題(診斷),研究者們還需要繼續探索AI技術在醫學影像檢測問題(發現異常)、分割問題(量化測量)及配準問題(隨訪跟蹤)中的應用。
2. 正確看待肺結節影像AI技術的價值
肺結節AI技術依靠強大的圖像識別和深度學習技術,極大提高了數據分析的效率和準確性,減輕了醫師的壓力,同時提高了診療的效率和準確性。近年來,不同醫學專業紛紛舉辦了各類人機競賽,結果顯示AI技術在這類競賽中表現優異,能夠快速準確地識別病變。也有初步的應用體驗顯示,肺結節影像AI技術在發現5 mm以上磨玻璃結節、鈣化結節及0~3 mm結節篩查方面要優于影像科醫師。姑且不論人機大賽的測試集、金標準等賽制設計問題,單論技術本身,影像AI技術目前在個別單項任務的確彌補了醫師的先天不足。如小結節的檢出,醫師因為精力、視力等有限,確實不如模型找得準、找得快;對病灶體積的測量,模型可以做得更快、更精準。
AI作為放射科醫師的助理,能夠在影像閱片中起到多重審核的作用,減少漏診的發生,為臨床醫師及患者提供更高水平的服務,使得影像科醫師有望從一些枯燥、繁瑣的工作中解脫出來,將精力投入到疑難病例的會診等需要人類智慧的工作中。目前,肺結節人工智能模型已經能夠實現極高的靈敏度,對于微小結節的檢出達到了瞬間全識別。與此并行的是特異度的平衡,怎樣的靈敏度和特異度之間的平衡是臨床所認可的,可能是影像界需要形成應用共識的一個方面,也是技術公司需要了解并為之改進的一個方面。
合適的醫療流程的改變能幫助緩解當前醫療資源發展不平衡的現狀,解決影像科醫師匱乏與龐大病患人群日益增長的醫療需求矛盾。那么是否意味著影像科醫師將要被AI技術取代了呢?答案顯然是否定的,除去倫理和法律問題,僅就技術本身而言,現在的單一任務模式取代醫師日常工作還有很長的路要走。
3. 肺結節影像AI技術的核心要素
AI技術立足于深度學習神經網絡,與以往傳統的算法相比,這一算法并無多余的假設前提,而是完全利用輸入的數據自行模擬和構建相應的模型結構。這一算法特點決定了AI是更為靈活的技術,且具有根據不同的訓練數據進行自我優化的能力。高速并行運算、海量數據及更優化的算法共同促進了AI發展的突破。對影像AI技術來說,除了算法、算力之外,現階段最核心的是大數據,尤其是規范標注的大數據。如果將AI看成一個嬰兒,影像數據就是喂養這個嬰兒的奶粉。奶粉的數量決定了嬰兒是否能長大,而奶粉的質量則決定了嬰兒后續的智力發育水平。
然而,海量的規范標注數據恰是目前影像AI發展的瓶頸,數據的獲取及標注都存在很多困難。① 數據的獲取方面:以肺結節為例,數據是深度學習算法所需的核心資源,僅掌握算法而缺乏數據無法獲得較好的訓練效果。但是目前醫院之間的數據共享和互通程度較低,獲取大規模的多樣性數據對研發公司是一個考驗。來自于單一醫院的訓練集無疑會導致模型的過擬合現象,使得產品在其他醫院難以直接應用。同時,由于疾病的多樣化,發病率低的病變集數量可能過少,出現模型診斷偏倚。② 在數據標注方面:深度學習要結合先驗知識對模型進行訓練,訓練集需要事先標注,而大多數標注依賴人工識別,因此數據標注將耗費大量的人力、物力和時間。除此之外,醫學影像標注的標準往往存在較多爭議,不同的國家、國際組織、學會和醫院可能執行各自的體系,不同的醫師對征象的認識也不夠統一。因此,建立中國的標準影像數據庫勢在必行,只有建立標準數據庫才能在質量上解決圖像的臨床代表性、圖像多樣性、標注的權威性與規范性及數據的可溯源性等問題,提高產品的魯棒性,加速AI醫療器械產品的研發和應用。
4. 肺結節影像AI技術的困境與思考
從新技術落地的角度看,新的技術需要得到醫師反復使用和反饋從而逐步優化模型,因此必須適應醫院的日常流程,如產品是否與醫院信息化系統無縫銜接、產品自身是否包含了完整的信息化處理單元。相對而言,大型醫療企業具有豐富的市場經驗和醫療信息化系統整合能力,互聯網企業能借助自身的網絡平臺為基層醫院、社區衛生服務中心等提供遠程醫療影像檢測和診斷服務。但許多初創公司在快速推出產品搶占市場與優化產品性能間陷入兩難境地。
從臨床應用角度看,僅僅單一的肺結節篩查模型甚至肺癌診斷模型都不能滿足臨床診斷場景的需求。日常影像診斷工作中,影像科醫師需要對一份肺部影像資料進行全面的評估和診斷,包括判斷是否有肺結節、肺氣腫、肺炎、支氣管病變、縱隔淋巴結腫大及心臟大血管病變等,進而做出綜合評價。單一任務的肺結節AI技術顯然不能勝任全方位的臨床工作需求,需要進一步研發多任務、多線程的真實場景診斷模型。
從技術創新的角度看,一種新的技術必須源自臨床的迫切需求,來自醫療場景的融入。如果,模型研究人員只懂算法,不了解臨床的流程和需求,不熟悉診斷的基本知識,無疑會造成閉門造車、自娛自樂。因此,醫療影像AI技術的發展需要“AI+醫療”跨學科人才的培養和匯聚。在較為專業的診療領域,應用及平臺開發者不僅要研究AI算法,更要對醫療影像識別深入了解。
當然,肺結節AI技術帶來的一系列社會問題和法律問題也是需要關注的重要部分,例如,AI進入臨床進行應用的標準是什么,是達到人類醫生的準入資格水平還是當時最高的醫療診斷水平?做出AI診斷的主體在法律上是醫生還是診斷模型?利用AI模型診斷發生的醫療損害,應由誰來承擔法律責任?是醫生或醫療機構還是AI產品的責任人?這些都是在AI產品被準予應用于臨床時需要我們考慮的問題。目前,這項技術在臨床工作中扮演何種角色仍需要深入探討。
綜上所述,目前深度學習AI已經在肺癌發現、診斷及隨訪工作中,在減輕醫師的工作負擔、降低漏診風險及多因素綜合的預測判斷等方面逐步體現出自身的價值和優越性。但需要規范標注的數據進行提升和評價,需要結合臨床需求研發多任務模式的AI技術,只有這樣,才能實現輔助醫師診療的最終目標。