備受關(guān)注的神經(jīng)影像領(lǐng)域“人機大戰(zhàn)”,日前在北京落下帷幕。大賽由國家神經(jīng)系統(tǒng)疾病臨床醫(yī)學(xué)研究中心、首都醫(yī)科大學(xué)人腦保護高精尖創(chuàng)新中心和中國卒中學(xué)會聯(lián)合主辦。人工智能(AI)選手“BioMindTM天醫(yī)智”以高出20%的正確率,戰(zhàn)勝了來自全球神經(jīng)系統(tǒng)疾病診斷的25名醫(yī)界“最強大腦”。醫(yī)療AI將給腦科醫(yī)學(xué)帶來哪些改變?
比拼速度 電腦更快
當場內(nèi)大屏幕上的倒計時還有14分鐘30秒的時候,答題完畢的提示音響了。現(xiàn)場數(shù)百名觀眾不禁發(fā)出唏噓聲。原來,需要獨立完成225道題目的“BioMind天醫(yī)智”提前了將近15分鐘“交卷”,這時的“人類戰(zhàn)隊”仍在緊張作答。
正式比賽分為AB兩組。A組的一方是15名“人類戰(zhàn)隊”醫(yī)生成員,由全國線上預(yù)賽產(chǎn)生的優(yōu)勝者6名、國內(nèi)神經(jīng)疾病排名前列的專家7名及國外知名醫(yī)院專家2名組成。每位醫(yī)生需要在30分鐘內(nèi)對15張顱內(nèi)腫瘤的CT、MRI影像進行判讀及血腫預(yù)測。另一方人工智能BioMind同樣需要在30分鐘內(nèi)完成15名醫(yī)生的工作,即完成總計225道題的判讀。B組共有10名醫(yī)生,全部是副主任級別以上,他們進行的是腦血管疾病CT、MRI影像判讀,B組每名醫(yī)生需要在30分鐘內(nèi)判讀3張片子,允許醫(yī)生們進行判讀結(jié)果討論,而BioMind需要在30分鐘內(nèi)判讀30張片子。
“人類戰(zhàn)隊”選手面前都是一臺顯示題目的電腦、一張紙質(zhì)版的答題卡以及一支筆,答題時選手們緊緊盯著屏幕,撥動鼠標查看影像圖,不時托著下巴思考。另一側(cè),“BioMind天醫(yī)智”的屏幕上,飛快地掃過一張張片子,并快速顯示出在它看來每組片子反映的腦部腫瘤疾病。
參賽的人工智能機器,由北京天壇醫(yī)院與北京安德醫(yī)智科技有限公司合作研發(fā)。拜師北京天壇醫(yī)院神經(jīng)影像學(xué)中心主任高培毅教授后,“BioMind天醫(yī)智”已成為天壇醫(yī)院神經(jīng)影像團隊最“年輕”的入室弟子。
北京天壇醫(yī)院放射科副主任荊利娜是14號選手。她答題與平時看片子狀態(tài)一樣。15道題目里有一兩道拿不準,平時如果遇上這種情況,她會寫出兩個答案,然后向高年資的專家請教,或者大家一起討論一下。比賽的時候只能寫一個答案,當時想了比較久。
大量樣本 瞬時掌握
到底是“最強大腦”勝出,還是這個剛剛問世不久的醫(yī)療AI勝出?
此次比賽中,A組試題為高培毅從天壇醫(yī)院腦腫瘤病例庫中隨機挑選,B組為北京天壇醫(yī)院常務(wù)副院長王擁軍教授從國家神經(jīng)系統(tǒng)疾病臨床醫(yī)學(xué)研究中心腦出血病例庫隨機挑選,兩組試題均非AI訓(xùn)練試題,為保證試題的保密性,來自北京市長安公證處的公證人員為試題挑選、封存進行了公證。
最終現(xiàn)場比賽結(jié)果是: A組的225例判讀,AI用時15分鐘準確率87%、15位醫(yī)生用時30分鐘準確率66%;B組:AI用時15分鐘準確率83%,10位醫(yī)生用時30分鐘準確率63%,無論時間還是準確率,AI完勝。
荊利娜對它的速度是有心理準備的,天壇醫(yī)院多年的病例匯總分析都錄入了它的系統(tǒng)里,樣本量超級大,而且是瞬時掌握,速度方面肯定比不過它。但真的沒想到在準確率方面會輸。
面對“BioMind天醫(yī)智”兩輪勝出的成績,它的老師高培毅說,通過對北京天壇醫(yī)院近十年來接診的數(shù)萬神經(jīng)系統(tǒng)相關(guān)疾病病例影像的系統(tǒng)學(xué)習,“BioMind天醫(yī)智”在腦膜瘤、膠質(zhì)瘤等常見病領(lǐng)域的磁共振影像診斷能力相當于一個高級職稱醫(yī)師級別的水平,實力不容小覷。每種腫瘤背后,它都學(xué)習了1000個病例,目前基本上已經(jīng)掌握了50種顱腦腫瘤,這是任何一名醫(yī)生都難以實現(xiàn)的。
“對它的比賽成績不夠滿意,我認為它的準確率應(yīng)該在90%以上。”高培毅說,接下來他們將對AI的“丟分”原因進行研究分析。
“機器訓(xùn)練時間不夠,如果能夠再多給AI一些學(xué)習時間,它將會表現(xiàn)更好。”王擁軍說,如果AI對于血腫預(yù)測的準確率能夠超過85%,國家神經(jīng)系統(tǒng)疾病臨床醫(yī)學(xué)研究中心就計劃啟動臨床驗證研究。
人工智能 前景如何
速度快、準確率高,醫(yī)療AI表現(xiàn)令人贊嘆的同時,更多人關(guān)心的是它未來將給神經(jīng)醫(yī)學(xué)帶來哪些改變,人腦疾病可以實現(xiàn)電腦診斷嗎?
高培毅介紹,天壇醫(yī)院一個影像大夫每天讀片診斷的時間達到18個小時。按照“BioMind天醫(yī)智”目前的速度,一個大夫一天的工作量,它只需要400—500秒,也就是不到10分鐘的時間。現(xiàn)在患者到醫(yī)院做核磁,結(jié)果都要等第二天以后才能拿到。如果讓AI來做,那么核磁結(jié)果基本上立等可取,幾分鐘就行。
“醫(yī)生工作強度非常大,希望未來AI能把醫(yī)生解放出來,讓醫(yī)生有更多時間做研究、給病人溫暖,也讓患者節(jié)省看病成本。”高培毅說。
對于“BioMind天醫(yī)智”在神經(jīng)影像輔助診斷領(lǐng)域取得的飛速發(fā)展和驚人成績,王擁軍說,它在短短幾個月的時間內(nèi),不斷提升疾病診斷效率和準確率;可以學(xué)到很多醫(yī)院多年都見不到的罕見、疑難病例,在神經(jīng)領(lǐng)域的研究開發(fā)和學(xué)習深度上,擁有先天優(yōu)勢和大數(shù)據(jù)基礎(chǔ)。目前已經(jīng)向國家藥監(jiān)局提交申請,希望在臨床中應(yīng)用這款A(yù)I產(chǎn)品,提高基層醫(yī)院影像診斷準確率,同時也提高影像判讀速度,為患者節(jié)約時間。
本次決賽的評委之一、重慶醫(yī)科大學(xué)神經(jīng)科學(xué)中心主任謝鵬教授表示:“對已有知識的診斷來說,從大數(shù)據(jù)深度學(xué)習的角度上看,AI獲勝的幾率要大得多,它應(yīng)該是了然于胸的。但在一些新的、特定的、目前醫(yī)學(xué)界也還沒有太多共識的疾病領(lǐng)域,AI可能還‘搞’不過人類。”
“我覺得將來它贏不了我。”荊利娜說,它不了解醫(yī)學(xué)的復(fù)雜性,影像判讀不是單純看片子,對患者的病史也要有了解,包括實驗室檢查等。不同疾病也會有相同表現(xiàn),需要醫(yī)生通過多年的積累綜合判斷傾向于哪一個,而不是單純通過核磁片子、通過某個征象來判斷。
“我個人并不是很在意這場比賽誰輸誰贏。”王擁軍表示,本次神經(jīng)影像人工智能人機大賽并非意在挑起人類醫(yī)生和AI之間的戰(zhàn)火,希望能夠通過這個比賽,能讓醫(yī)生們體驗到人工智能的魅力,特別是讓部分抱有懷疑態(tài)度的醫(yī)生,進一步對人工智能進行了解。
“大量病例的標準化標注既是AI發(fā)展的機遇,又是制約發(fā)展的瓶頸。真正的AI技術(shù)是一個不斷學(xué)習的過程,永遠不會完美。”王擁軍表示,具備“天壇標準”的AI技術(shù)漸趨成熟后,將成為輔助基層醫(yī)生,特別是偏遠地區(qū)基層醫(yī)生如何閱讀、診斷、預(yù)測片子的學(xué)習和培訓(xùn)工具,方便腦病患者在“家門口”就能獲得高品質(zhì)、個性化的診療方案。此外,它能夠幫助醫(yī)生完成初篩和評定,最終由醫(yī)生進行印證判斷,提高工作效率,節(jié)省重復(fù)機械工作,特別是在判斷結(jié)果不一致時,可提醒醫(yī)生避免漏診誤診。