人工智能(AI)和機器學習可加速醫療研究,但數據科學家需要全包工具(如英偉達的 DGX Station)才能更高效。
毫無疑問,這個世界正處于一個重大變革的邊緣——人工智能(AI)和機器學習(ML)將像空氣一樣滲透到我們的生活中,如同互聯網對我們的滲透一樣。人工智能可以分析信息,發現異常情況并能夠比人更快地做出明智的決策,并且會成為幫助我們更好地完成工作的重要工具。
然而,人工智能的采用在垂直方向上差異很大。人工智能領域的其中一個行業是醫療,因為它可能會產生救死扶傷的效果。
其中一個很好的例子是位于波士頓的MGH&BWH臨床數據科學中心——Mass General Hospital(MGH)和Brigham and Women's Hospital(BWH)合作的產物,為醫療事業開發、推廣并對人工智能進行商業化——一直在加速分析磁共振圖像(MRI)的過程。
我最近與MGH&BWH臨床數據科學中心(CCDS)的高級機器學習科學家Neil Tenenholtz進行了交談,以更好地了解該組織正在做什么以及如何利用英偉達的DGX工作站為他們的計劃提供支持。(注:英偉達是ZK Research的客戶。)
DGX Station為桌面設備帶來數據中心般的能力
我們可以將DGX Station看作是桌面型的,支持GPU的超級計算機。英偉達(NVIDIA)的主要人工智能平臺是DGX-1,它是一款可安裝8個NVIDIA Tesla V100 GPU的機架式服務器。位于數據中心的服務器所面臨的難題是數據科學家需要與IT部門合作,為該特定任務配置DGX-1。這通常會產生滯后時間,妨礙研究人員分析數據和進行深度學習實驗。
DGX Station是一種便攜的,工作站規格,由4個Tesla V100 GPU提供支持。盡管規格緊湊,但4 GPU系統的計算能力相當于大約400個x86 CPU,使得DGX工作站成為人工智能、機器學習和數據分析等計算密集型工藝的理想選擇。
人工智能可以提高放射科醫生的效率
Tenenholtz團隊的使命是開發專門用于放射學的基于人工智能的模型,并將其融入放射科醫生的臨床工作流程中。成功的模型可以授權給外部合作伙伴,也可以通過初創公司自立門戶并實現商業化,因此全球各地的醫院都可以使用它們。
在高層次上,該中心試圖證明,基于人工智能的模型能夠比人工完成的分析更快,更高效地改善放射科醫生和內科醫生的效率。我們要明白人工智能不是用來替代臨床醫生,而是成為下一代放射科醫生的另一種工具,這一點很重要。
GAN加速了人工智能訓練
DGX電臺目前正在使用的項目是用于核磁共振的大腦“GAN”。GAN是一個“生成對抗網絡(generative adversarial network)”,它是一類用于無監督機器學習的人工智能算法,它由兩部分組成:生成器創建合成影像,判別器評估它們,以確定它們是否真實。這兩個組件都可能具有很高的價值。
在CCDS用例中,發生器創建合成的腦MRI,判別器評估它們。Tenenholtz解釋說,GAN的目標是并行地訓練這兩個系統。隨著時間的推移,生成器將更加準確地創建可用于增強腫瘤分割算法(tumor segmentation)訓練集的合成腦成像。
另一方面,學習檢測類似于大腦特征的判別器(discriminator)可以在未來的“轉移學習(transfer learning)”應用中加以利用,這個過程中,一個任務上訓練出來的算法可以用到另一個任務上——在另一個任務的訓練例子少于訓練新算法所需的例子時。因此,鑒別器可用于檢測其它更罕見的腦異常。
如果沒有預先訓練的模型,就需要分析數以萬計的影像。有了它,數量可以顯著減少。
DGX站的交鑰匙性質催生了“開箱即用”人工智能研究
我向Tenenholtz詢問了使用DGX Station、DGX-1或其它帶有GPU的電腦的好處,他解釋了使用DGX Station的理由。
MGH的數據中心目前有四臺DGX-1服務器,但醫院范圍內的資源所面臨的一個難題是在系統上獲得時間。他承認,雖然他們正在做的工作很重要,但這工作不會優先于一些醫院系統。這可能會推遲項目的進展,因此很明顯他們需要專門的資源。
他們本來可以使用一臺帶有4個英偉達GPU的小型服務器,但是處理器之間的通信是通過PCI Express總線進行處理的,PCI Express總線可能會因數據量過大而不堪重負。DGX Station擁有一個名為NVIDIA NVLink的專用連接接口,可將GPU與PCI Express插槽分離,以加快數據傳輸速度。
GPU計算面臨的難題之一是向GPU提供足夠的數據來處理并保持它們的利用率。NVLink不會飽和并像PCI一樣停滯。
另一個好處是所有部件都經過預先配置和優化,并且軟件和應用程序都適配了硬件。不需要安裝什么驅動程序或更新什么版本。
Tenenholtz說:“隨著機器學習領域的飛速發展,開發人員的生產力至關重要。因此,任何能讓科學家在幾分鐘內從拆箱到進行分布式模型訓練的解決方案都是非常可取的。”
作為分析師,我看到技術浪潮來來去去。多年前,IT行業主要由硬件平臺主導。過去十年來,“軟件創新”已成為新的潮流。我相信我們達到了這樣的程度——擁有優化軟件的專用硬件才是將我們推向人工智能時代所需的東西。
谷歌和亞馬遜這樣的全網域(web-scale)公司都有專人將軟件運行在商業硬件上,確保其性能達到最佳狀態。像MGH這樣的組織難得有這樣的機會,它需要像DGX Station這樣管用的工具,所以他們得以開始工作。
版權聲明:本文為企業網D1Net原創,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。