摘要 : 沃森是誰?它為什么如此聰明?為什么被稱呼為機器人醫生?
沃森是誰?
沃森是自2007年開始,由IBM公司的首席研究員David Ferrucci所領導的DeepQA計劃小組開發的人工智能系統,它是20多名IBM的研究員四年心血的結晶,并以IBM創始人托馬斯 J 沃森的姓命名。因為科學家們的努力,沃森擁有了理解自然語言和精確回答問題的能力。
2011年,沃森在美國一檔老牌綜藝節目“危機邊緣”里打敗了最高獎金得主布拉德·魯特爾和連勝紀錄保持者肯·詹寧斯,從此進入人們的視野。
根據IBM的資料顯示,沃森的硬件方面是由90臺IBM Power 750服務器組成的集群服務器,這里面共計有2880顆Power7處理器,以及16TB內存組成。軟件方面,沃森是由Java和C++寫成,并且采用Apache Hadoop框架做分布式計算,還有Apache UIMA (Unstructured Information Management Architecture) 框架、 IBM DeepQA軟件和SUSE Linux Enterprise Server 11 操作系統。
沃森為什么如此聰明?
沃森竟然可以在比賽中打敗人類,它是如何做到這么聰明的呢?沃森儲存了數百萬的文檔資料,包括字典、百科全書、新聞、文學以及其他可以建立知識庫的參考材料。沃森的硬件配置可以使它每秒處理500GB的數據,相當于1秒閱讀100萬本書。
據IBM中國研究院的張雷博士的介紹,沃森在拿到一個問題后,會進行一系列的計算,包括語法語義分析、對各個知識庫進行搜索、提取備選答案、對備選答案證據的搜尋、對證據強度的計算和綜合等等。沃森的主要技術原理是通過搜尋很多知識源,從多角度運用非常多的小算法,對各種可能的答案進行綜合判斷和學習。其中的一個關鍵步驟就是評價備選答案的可靠性,從關鍵字、地理位置、類型等多個維度對答案的可靠性進行檢測和量化的評價。
沃森的歷程?
2011年,IBM公司說,鑒于“沃森”聽得懂人類語言,可以通過詢問病人的病征、病史,通過使用人工智能技術、對自然語言的處理和分析技術,憑借從各個渠道搜集到的信息和數據,迅速給出診斷提示和治療意見。此后,美聯社的記者親自體會了機器人醫生沃森如何為病人診斷,研發人員向“沃森”逐一提供一名虛擬眼疾患者的情況,視力模糊、有關節炎家族病史、住在康涅狄格州、懷有身孕……“沃森”提出了不同診斷結果,包括葡萄膜炎、白塞氏病、萊姆關節炎等。據測算,沃森的診斷準確率達到73%。
2011年,美國保健服務提供商Wellpoint公司與IBM簽署了一項協議,這是沃森獲得的第一份工作。沃森的主要的任務是幫助wellpoint負責復雜病例的護士完成工作,同時審查醫療服務提供者的醫療請求。以及后期在腫瘤臨床試驗中的應用。Wellpoint 總裁也提到,在未來,沃森也許還可以獲取病人病歷及其他方面的信息,然后綜合反饋給醫生,以提高醫生的診斷速度。
2014年,德州大學安德森癌癥中心與IBM合作打造“登月項目”,該項目通過采用IBM沃森技術來消除癌癥。安德森癌癥中心是美國排名第一且被全球公認的最好的腫瘤醫院,該中心的腫瘤學專家顧問(Oncology Expert Advisor)由沃森認知計算系統驅動,旨在整合安德森癌癥中心的臨床醫生和研究人員的知識。這個OEA系統將幫助臨床醫生制定、觀察和調整癌癥患者的治療方案。IBM沃森技術還將簡化和標準化患者的病歷、實驗室數據和研究數據的收集、整合上提供幫助,使得搜集到數據整合到安德森癌癥中心集中的病人數據庫,然后進行鏈接可以被高級分析技術進行深度分析。
除了安德森癌癥中心外,梅奧診所(Mayo Clinic)也在通過IBM沃森進行概念試驗,以更快速、高效地給患者提供合適的臨床試驗。在任何給定的時間里,梅奧診所都能夠進行超過8000項人體研究試驗。但由于沒有足夠的人參與報名使得很多的臨床試驗都無法完成,不管是在梅奧診所還是在其它地方都如此。IBM和梅奧診所正擴大沃森的知識語料庫,納入梅奧診所及ClinicalTrials.gov等公用數據庫,同時訓練該知識庫分析病人記錄和臨床試驗條件提供合適的匹配。
泰國康民國際醫院采用IBM沃森認知計算在曼谷研究中心提高癌癥治療質量,并在16個國家的機構進行病例評估。醫院承諾未來5年將使用與凱特林癌癥中心(MSK)共同開發的Watson for Oncology技術。該系統將有助醫生利用醫療證據、學術研究、MSK廣泛的臨床技術以及每名患者的記錄給癌癥人制定有效的治療方案。
此外,紐約斯隆-凱特林醫院、克利夫蘭診所也和沃森有著業務合作。
企業方面,Johnson &Johnson通過提供IBM沃森閱讀和理解詳述臨床試驗結果的科研論文,利用獲取結果制定和評估藥物治療方案及其它的治療方式。借助這種知識,Watson Discovery Advisor可以幫助科學家鑒定對于藥物樣本是否有任何不良的基因檔案。相之前比較研究,需要3個人進行平均花10個月來收集準備數據,才能夠開始進行分析。Johnson &Johnson團隊希望能夠通過沃森直接從醫學文獻快速地綜合有用信息,可以開始直接詢問數據方面的問題。
據動脈網創業圈圈友Gamp透露,IBM美國本月剛剛重組,公司劃分為7大部門,其中之一為醫療部門,該部門就是以沃森為核心。
醫療行業人工智能的發展
其實早在沃森之前,有關醫療機構就在開發相關的“電腦醫生”的項目。
上世紀70年代,美國匹茲堡大學的研究人員開發了用于診斷普內科復雜病癥的軟件“快捷醫療參考”,這款醫療診斷專家系統收集了4300種臨床表征,能夠診斷超過600種疾病,經過系統程序運算,提高快速診斷的可能性。
1972年,美國斯坦福大學開始研制MYCIN系統,74年基本完成并投入應用。MYCIN是許多抗生素藥名的后綴,因此這是一個幫助醫生診斷住院的血液感染患者、并選用抗菌素類藥物治療的專家系統,至今仍頗具代表性。
80年代,美國麻省總醫院開始開發和完善DxPlan項目。DxPlan所涵蓋的知識領域包括內科各??频亩鄶导膊〖芭R床表征,主要以IBM的個人電腦為程序開發工具。使用者可向電腦咨詢下一步應作何種檢驗及測試,以最少的花費得到最多的信息。
2010年秋,“伊莎貝爾保健系統”在美國佛羅里達州的奧蘭多保健醫院聯網使用,為醫生提供可靠的診斷和治療建議,一些經驗較少、臨床實踐不多的醫生能從該系統獲得更多幫助。不過,伊莎貝爾只能通過與多功能醫院保健系統聯網才能使用,使用速度較慢,價格也頗為昂貴。
到2013年,電腦醫生沃森登上醫療舞臺,它既是癌癥診斷專家,又是醫療服務利用情況管理的專業人士。從此,計算機輔助診斷翻開新的一頁,正式邁入“沃森時代”。
根據市場研究公司Insight Research的數據,未來6年內,美國衛生保健行業將會在信息產業投入690億美元。有消息稱,英特爾和思愛普已經開始與加州大學伯克利分校的研究人員合作,開發具有競爭力的醫用超級計算機。
電腦醫生真的可靠嗎?
沃森作為電腦醫生,有著與生俱來的優點—它的知識儲藏遠遠超過人類且永遠不會遺忘、診斷準確率高且可以一直出診不用休息,雖然這看起來很振奮人心,但是不免出現各種質疑的聲音?!都~約時報》作家、斯坦福醫生亞伯拉罕-維蓋瑟說:“沃森也許可能成為我們身邊一個聰明的伙伴,但是我從病人以及親戚朋友那里聽到的不是缺乏技術,恰恰相反是技術泛濫。” 沃森項目組的馬蒂-科恩認為,沃森只是一個輔助工具,如果醫生不愿意改變,那么沃森也是無法改變醫療行業的。他說:“有些技術確實改變了醫療,它們提供了從前沒有的治療方法,但是IT不是這樣,我覺得IT只是推動者。”克勞斯-彼得·阿德拉森是維也納醫科大學一名計算機科學家,同時也是《人工智能醫學》雜志的總編。在他看來,類似沃森的電腦醫生,究其本質而言,其實就是一個搜索引擎,可以回答用自然語言提出的各種問題。隨著時間的推移,電腦雖然也會總結自己的錯誤,但它們從醫學文獻和案例研究中獲得的知識很空很泛,對醫務人員來說,這些知識在臨床環境中不一定非常具有價值。
行醫遠遠不是處理數據這么簡單,病人和家屬的情緒撫慰,在實踐中把握細微差別、學習掌握不確定性,無論哪一點,都離不開人類醫生。最廣博的醫學數據和最頂尖的處理能力,都無法教會一臺電腦如何像人類醫生那樣愛護病人。
沃森不是萬能的,雖然他現在已經名聲在外,但是它畢竟只是一個醫生助理的角色,電腦醫生的設想還需要走很長的路?;蛟S今后,人機協作才是發展的最終方向。