AI醫(yī)生“看臉”就能識(shí)疾病
DeepGestalt首先識(shí)別患者面部的五官,然后將圖像裁剪成100×100像素大小的區(qū)域。接下來(lái),使用深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)這些區(qū)域進(jìn)行評(píng)估,分析每個(gè)綜合征的概率。然后它綜合整個(gè)圖像的數(shù)據(jù)給出一個(gè)預(yù)測(cè)。
如今,人工智能在各個(gè)領(lǐng)域迅猛發(fā)展。新的研究表明,在醫(yī)療領(lǐng)域,人工智能可以幫助診斷罕見疾病。
約有8%的世界人口受到遺傳綜合征的困擾,此類患者往往具有可識(shí)別的面部特征。然而,遺傳綜合征的診斷過程卻出奇陳舊,大多數(shù)時(shí)候需要醫(yī)生手工測(cè)量面部特征之間的距離。1月7日,總部位于波士頓的人工智能公司FDNA發(fā)布了一項(xiàng)最新研究,他們發(fā)現(xiàn),通過數(shù)萬(wàn)張真實(shí)患者面部圖像的訓(xùn)練,人工智能能夠以較高的準(zhǔn)確度從人臉照片中識(shí)別出罕見遺傳綜合征。
“這是人們期待已久的醫(yī)學(xué)遺傳學(xué)突破,終于取得了成果,”凱倫·格里普在一份聲明中說,她是一名醫(yī)學(xué)遺傳學(xué)家,也是這篇新論文的合著者。“通過這項(xiàng)研究,我們已經(jīng)表明,在臨床工作流程中添加一個(gè)自動(dòng)的面部分析系統(tǒng)可以幫助實(shí)現(xiàn)早期診斷和治療,有望改善生活質(zhì)量。”
AI醫(yī)生的“診斷”過程
訓(xùn)練算法
每年全球出生的兒童中約有6%患有嚴(yán)重的遺傳綜合征。早期發(fā)現(xiàn)這些綜合征有助于治療,但準(zhǔn)確診斷往往是個(gè)漫長(zhǎng)而昂貴的過程。部分問題在于基因綜合征有數(shù)百種,其中許多非常非常罕見。正確的診斷和早期治療,常常依賴于醫(yī)生的經(jīng)驗(yàn)以及他們以前是否遇到過類似案例。但是機(jī)器學(xué)習(xí)可以改變這種情況。
格里普和她的同事們想創(chuàng)造一種人工智能,能夠通過病人面部圖像識(shí)別基因綜合征。為此,研究小組建立了一個(gè)名為“DeepGestalt”的深度學(xué)習(xí)算法,它可以分析面部特征,找出特定遺傳綜合征日前發(fā)表在《自然醫(yī)學(xué)》雜志上的新研究報(bào)告稱,他們使用了一個(gè)包含15萬(wàn)多名患者的數(shù)據(jù)集來(lái)訓(xùn)練這種算法。
DeepGestalt算法首先識(shí)別患者面部的五官,例如眼睛、鼻子和嘴巴,然后將圖像裁剪成100×100像素大小的區(qū)域。接下來(lái),該技術(shù)使用深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)這些區(qū)域進(jìn)行評(píng)估。深度卷積神經(jīng)網(wǎng)絡(luò)是一種機(jī)器學(xué)習(xí)技術(shù),已經(jīng)成為自動(dòng)圖像分類的領(lǐng)先模型。對(duì)于每個(gè)面部區(qū)域,DeepGestalt分析每個(gè)綜合征的概率,然后它綜合整個(gè)圖像的數(shù)據(jù)給出一個(gè)預(yù)測(cè)。
打敗專家
當(dāng)格里普和她的同事對(duì)DeepGestalt進(jìn)行診斷測(cè)試時(shí),它的表現(xiàn)優(yōu)于臨床醫(yī)生。在一項(xiàng)測(cè)試中,他們對(duì)DeepGestalt進(jìn)行了一系列的訓(xùn)練,給它展示了600多張科妮莉亞德蘭格綜合征(一種導(dǎo)致發(fā)育遲緩和生長(zhǎng)缺陷的遺傳疾病)患者的圖片,以及大約1100張非患者的圖片。研究人員報(bào)告說,DeepGestalt以接近97%的準(zhǔn)確率識(shí)別出了該綜合征患者。相比之下,65名專家在面對(duì)類似的診斷測(cè)試時(shí),準(zhǔn)確率只有75%。
在另一項(xiàng)測(cè)試中,研究人員使用17000多張、涵蓋了200多種不同基因綜合征的患者圖像對(duì)這一算法進(jìn)行了訓(xùn)練。經(jīng)過訓(xùn)練,在一項(xiàng)包含502張新圖像的測(cè)試中,DeepGestalt成功地以91%的準(zhǔn)確率列出了排名前十的綜合征。
“不斷增強(qiáng)的標(biāo)準(zhǔn)化描述(病人特征)的能力,打開了未來(lái)研究和應(yīng)用的大門,”FDNA公司首席技術(shù)官、論文第一作者亞龍·古羅維奇說,“它展示了一個(gè)可以成功地應(yīng)用先進(jìn)的算法,如深度學(xué)習(xí),一個(gè)具有挑戰(zhàn)性的領(lǐng)域。”
AI醫(yī)生的“培養(yǎng)”過程
發(fā)布App收集海量數(shù)據(jù)
要研發(fā)這樣的深度學(xué)習(xí)算法需要相當(dāng)大的訓(xùn)練數(shù)據(jù)集。FDNA通過出版物和公共數(shù)據(jù)集收集了這些數(shù)據(jù),也通過向臨床醫(yī)生發(fā)布一個(gè)名為“Face2Gene”的應(yīng)用程序來(lái)收集數(shù)據(jù)。
去年秋天,F(xiàn)DNA首席執(zhí)行官德克爾·蓋爾布曼是這樣介紹Face2Gene的:這款應(yīng)用實(shí)際上是一個(gè)平臺(tái),可以通過移動(dòng)應(yīng)用商店和網(wǎng)絡(luò)訪問。
使用這款應(yīng)用,醫(yī)生需要拍攝病人的照片,然后將照片上傳到App上。DeepGestalt掃描了這張照片,并從該公司的專有數(shù)據(jù)庫(kù)中為醫(yī)生提供了一份兼容診斷的排名表。這款應(yīng)用還可以幫助醫(yī)生解答問題,添加更多特征的表型數(shù)據(jù),進(jìn)一步完善結(jié)果。如果可能的話,醫(yī)生可以通過增加一個(gè)最終診斷來(lái)結(jié)束這個(gè)循環(huán)。
醫(yī)生輸入的數(shù)據(jù),在蓋爾布曼口中所稱的“良性循環(huán)中”訓(xùn)練了深度學(xué)習(xí)算法。蓋爾布曼說,F(xiàn)ace2Gene的使用一直在增長(zhǎng),許多用戶在涉及基因部的臨床數(shù)據(jù)或病歷時(shí),已經(jīng)開始依賴該應(yīng)用程序。
據(jù)FDNA公司介紹,他們用了三年的時(shí)間在Face2Gene平臺(tái)上收集了15萬(wàn)名患者的面部數(shù)據(jù)。這次研究的17000多張面部圖像正是出自這個(gè)數(shù)據(jù)庫(kù)。
關(guān)鍵是要使用幼兒圖片
西奈山伊坎醫(yī)學(xué)院教授Bruce Gelb博士指出,這篇論文只使用了一組幼兒的圖像,這一選擇可能為算法的成功奠定了基礎(chǔ)。
“面部特征在蹣跚學(xué)步的兒童或幼兒身上最為明顯,這種特征在青春期就會(huì)逐漸消失——在進(jìn)入成年期之前。”他說。
不過,他承認(rèn),該算法的成功率令人印象深刻,對(duì)于那些對(duì)特定遺傳特征沒有高度專業(yè)知識(shí)的臨床醫(yī)生尤其有用。
“使用FDNA這樣的工具可以讓臨床醫(yī)生知道他們應(yīng)該讓實(shí)驗(yàn)室檢測(cè)哪些基因。”古羅維奇說,“如果你正確地考慮表型,你就能增加診斷的幾率。”
他說,人類做不到這一點(diǎn)。“有些遺傳學(xué)家嘗試過這樣做。他們不能,我們可以。”
隱私顧慮
除了令人刮目相看的結(jié)果和新的潛在用戶,論文作者還強(qiáng)調(diào)了一些注意事項(xiàng)和關(guān)注的領(lǐng)域。這些實(shí)驗(yàn)的基本假設(shè)都是病人確實(shí)患有綜合征,如果是正常人,那應(yīng)當(dāng)另外處理。
他們還警告了濫用這項(xiàng)技術(shù)的風(fēng)險(xiǎn)。“表型數(shù)據(jù)是敏感的患者信息,基于此的歧視受到反基因歧視法的限制。與基因組數(shù)據(jù)不同,面部圖像很容易獲取。減輕濫用的有效監(jiān)控策略,可包括通過區(qū)塊鏈技術(shù)向使用DeepGestalt應(yīng)用程序的用戶添加數(shù)字足跡等。”
確實(shí),人臉圖像是敏感且容易獲取的數(shù)據(jù),若使用不慎,看臉識(shí)疾病的技術(shù)將引發(fā)歧視等倫理問題。如果面孔能夠揭示基因的細(xì)節(jié),那么雇主或保險(xiǎn)公司等就可以秘密地利用這些技術(shù),歧視那些可能患有某些疾病的人。
三年前,上海交通大學(xué)教授武筱林訓(xùn)練出了可以看臉識(shí)罪犯的人工智能系統(tǒng),準(zhǔn)確率達(dá)到86%。當(dāng)時(shí),這項(xiàng)研究引發(fā)了廣泛爭(zhēng)議,也遭受了紛至沓來(lái)的批評(píng)。不少學(xué)者認(rèn)為該研究充滿了歧視和誤導(dǎo),將給無(wú)辜的人們帶來(lái)巨大的麻煩。
也許是因?yàn)檫@樣的前車之鑒,F(xiàn)DNA最新研究的作者指出,應(yīng)防止DeepGestalt技術(shù)的歧視性濫用。古羅維奇說,這個(gè)技術(shù)只開放給臨床醫(yī)生運(yùn)用。
格里普說,出版論文的重要性在于激發(fā)想象力,而非其他。
“最重要的是,這是人工智能如何應(yīng)用于病人表型的一個(gè)例子。這個(gè)工具將變得越來(lái)越有價(jià)值。這個(gè)僅是觀察面部特征,但對(duì)病人來(lái)說還有很多。你可以用類似的工具來(lái)觀察X光片或視網(wǎng)膜的照片。”她說,“這只是一個(gè)例子。人工智能方法還可以為下一代表型帶來(lái)許多其他功能。”