備受關注的神經影像領域“人機大戰”,日前在北京落下帷幕。大賽由國家神經系統疾病臨床醫學研究中心、首都醫科大學人腦保護高精尖創新中心和中國卒中學會聯合主辦。人工智能(AI)選手“BioMindTM天醫智”以高出20%的正確率,戰勝了來自全球神經系統疾病診斷的25名醫界“最強大腦”。醫療AI將給腦科醫學帶來哪些改變?
比拼速度電腦更快
當場內大屏幕上的倒計時還有14分鐘30秒的時候,答題完畢的提示音響了。現場數百名觀眾不禁發出唏噓聲。原來,需要獨立完成225道題目的“BioMind天醫智”提前了將近15分鐘“交卷”,這時的“人類戰隊”仍在緊張作答。
正式比賽分為AB兩組。A組的一方是15名“人類戰隊”醫生成員,由全國線上預賽產生的優勝者6名、國內神經疾病排名前列的專家7名及國外知名醫院專家2名組成。每位醫生需要在30分鐘內對15張顱內腫瘤的CT、MRI影像進行判讀及血腫預測。另一方人工智能BioMind同樣需要在30分鐘內完成15名醫生的工作,即完成總計225道題的判讀。B組共有10名醫生,全部是副主任級別以上,他們進行的是腦血管疾病CT、MRI影像判讀,B組每名醫生需要在30分鐘內判讀3張片子,允許醫生們進行判讀結果討論,而BioMind需要在30分鐘內判讀30張片子。
“人類戰隊”選手面前都是一臺顯示題目的電腦、一張紙質版的答題卡以及一支筆,答題時選手們緊緊盯著屏幕,撥動鼠標查看影像圖,不時托著下巴思考。另一側,“BioMind天醫智”的屏幕上,飛快地掃過一張張片子,并快速顯示出在它看來每組片子反映的腦部腫瘤疾病。
參賽的人工智能機器,由北京天壇醫院與北京安德醫智科技有限公司合作研發。拜師北京天壇醫院神經影像學中心主任高培毅教授后,“BioMind天醫智”已成為天壇醫院神經影像團隊最“年輕”的入室弟子。
北京天壇醫院放射科副主任荊利娜是14號選手。她答題與平時看片子狀態一樣。15道題目里有一兩道拿不準,平時如果遇上這種情況,她會寫出兩個答案,然后向高年資的專家請教,或者大家一起討論一下。比賽的時候只能寫一個答案,當時想了比較久。
大量樣本瞬時掌握
到底是“最強大腦”勝出,還是這個剛剛問世不久的醫療AI勝出?
此次比賽中,A組試題為高培毅從天壇醫院腦腫瘤病例庫中隨機挑選,B組為北京天壇醫院常務副院長王擁軍教授從國家神經系統疾病臨床醫學研究中心腦出血病例庫隨機挑選,兩組試題均非AI訓練試題,為保證試題的保密性,來自北京市長安公證處的公證人員為試題挑選、封存進行了公證。
最終現場比賽結果是: A組的225例判讀,AI用時15分鐘準確率87%、15位醫生用時30分鐘準確率66%;B組:AI用時15分鐘準確率83%,10位醫生用時30分鐘準確率63%,無論時間還是準確率,AI完勝。
荊利娜對它的速度是有心理準備的,天壇醫院多年的病例匯總分析都錄入了它的系統里,樣本量超級大,而且是瞬時掌握,速度方面肯定比不過它。但真的沒想到在準確率方面會輸。
面對“BioMind天醫智”兩輪勝出的成績,它的老師高培毅說,通過對北京天壇醫院近十年來接診的數萬神經系統相關疾病病例影像的系統學習,“BioMind天醫智”在腦膜瘤、膠質瘤等常見病領域的磁共振影像診斷能力相當于一個高級職稱醫師級別的水平,實力不容小覷。每種腫瘤背后,它都學習了1000個病例,目前基本上已經掌握了50種顱腦腫瘤,這是任何一名醫生都難以實現的。
“對它的比賽成績不夠滿意,我認為它的準確率應該在90%以上。”高培毅說,接下來他們將對AI的“丟分”原因進行研究分析。
“機器訓練時間不夠,如果能夠再多給AI一些學習時間,它將會表現更好。”王擁軍說,如果AI對于血腫預測的準確率能夠超過85%,國家神經系統疾病臨床醫學研究中心就計劃啟動臨床驗證研究。
人工智能前景如何
速度快、準確率高,醫療AI表現令人贊嘆的同時,更多人關心的是它未來將給神經醫學帶來哪些改變,人腦疾病可以實現電腦診斷嗎?
高培毅介紹,天壇醫院一個影像大夫每天讀片診斷的時間達到18個小時。按照“BioMind天醫智”目前的速度,一個大夫一天的工作量,它只需要400—500秒,也就是不到10分鐘的時間。現在患者到醫院做核磁,結果都要等第二天以后才能拿到。如果讓AI來做,那么核磁結果基本上立等可取,幾分鐘就行。
“醫生工作強度非常大,希望未來AI能把醫生解放出來,讓醫生有更多時間做研究、給病人溫暖,也讓患者節省看病成本。”高培毅說。
對于“BioMind天醫智”在神經影像輔助診斷領域取得的飛速發展和驚人成績,王擁軍說,它在短短幾個月的時間內,不斷提升疾病診斷效率和準確率;可以學到很多醫院多年都見不到的罕見、疑難病例,在神經領域的研究開發和學習深度上,擁有先天優勢和大數據基礎。目前已經向國家藥監局提交申請,希望在臨床中應用這款AI產品,提高基層醫院影像診斷準確率,同時也提高影像判讀速度,為患者節約時間。
本次決賽的評委之一、重慶醫科大學神經科學中心主任謝鵬教授表示:“對已有知識的診斷來說,從大數據深度學習的角度上看,AI獲勝的幾率要大得多,它應該是了然于胸的。但在一些新的、特定的、目前醫學界也還沒有太多共識的疾病領域,AI可能還‘搞’不過人類。”
“我覺得將來它贏不了我。”荊利娜說,它不了解醫學的復雜性,影像判讀不是單純看片子,對患者的病史也要有了解,包括實驗室檢查等。不同疾病也會有相同表現,需要醫生通過多年的積累綜合判斷傾向于哪一個,而不是單純通過核磁片子、通過某個征象來判斷。
“我個人并不是很在意這場比賽誰輸誰贏。”王擁軍表示,本次神經影像人工智能人機大賽并非意在挑起人類醫生和AI之間的戰火,希望能夠通過這個比賽,能讓醫生們體驗到人工智能的魅力,特別是讓部分抱有懷疑態度的醫生,進一步對人工智能進行了解。
“大量病例的標準化標注既是AI發展的機遇,又是制約發展的瓶頸。真正的AI技術是一個不斷學習的過程,永遠不會完美。”王擁軍表示,具備“天壇標準”的AI技術漸趨成熟后,將成為輔助基層醫生,特別是偏遠地區基層醫生如何閱讀、診斷、預測片子的學習和培訓工具,方便腦病患者在“家門口”就能獲得高品質、個性化的診療方案。此外,它能夠幫助醫生完成初篩和評定,最終由醫生進行印證判斷,提高工作效率,節省重復機械工作,特別是在判斷結果不一致時,可提醒醫生避免漏診誤診。