7月11日上午消息,2017中國互聯網大會在北京國家會議中心拉開帷幕,為期三天。IBM大中華地區CTO、中國研究院院長沈曉衛圍繞“大數據背景下的人工智能”主題進行了觀點分享。
沈曉偉
沈曉衛認為在人工智能時代的創新戰略需要從四個方面進行布局:1)人工智能核心技術的創新,包括機器學習算法、語音識別、圖像識別及基于構建這些核心算法的能力。當下的深度學習算法仍然需要很多人工干預,未來如何減少人工干預,構建數據自我驅動的學習算法成為關鍵。
2)人工智能技術與行業結合,即利用人工智能技術來解決行業中的問題,這其中包括環境中的問題、教育中的問題、醫療中的問題等;3)區塊鏈技術,區塊鏈作為分享式的共享賬本技術,它能夠極大地降低交易成本,提高商業交易的安全性;4)構建新一代的計算能力,包括芯片技術、服務器的技術等,以及在摩爾定律后時代中的納米技術、量子計算技術等。
結合IBM自身,沈曉衛認為人工智能(認知)、云、行業是IBM轉型的最重要三個詞匯,即構建基于行業的從云端提供的具有人工智能能力的或者具有認知能力的行業解決方案,“這是我們認為IT行業接下來發展一個非常非常重要的方向”。他分別列舉了IBM三個具有代表性的行業應用解決方案,包括利用人工智能技術與物聯網技術結合進行環境污染源監控、基于臨床數據的機器學習建立腫瘤診斷系統、利用視頻自動解讀與圖像識別技術進行自動化質量檢測。
以下為IBM大中華地區CTO、中國研究院院長沈曉衛的演講全文:
沈曉衛:大家上午好!很高興今天能夠有機會來參加2017年的中國互聯網大會,我也希望能夠利用這個機會跟大家分享我們在人工智能時代、大數據時代關于創新戰略的一些想法。
應該說,我們今天處在一個從數字化邁向智慧化這樣一個時代,在這樣一個時代,大數據的出現,而傳統的IT技術不能夠滿足我們對數據分析,從中間產生洞察力這樣的需求。所以我們看到大數據,包括用于大數據分析的,無論是人工智能的算法,還是運行這些算法的芯片,整個這個時代對這樣的一些數據、芯片、算法來重新塑造。在這樣一個情況下來看一下人工智能時代的創新應該是一個什么樣的戰略?從技術的角度來看,我們認為今天有四個大的方向,就是在人工智能時代、大數據時代,我們需要來關注的。
首先是人工智能核心技術的創新。這里面包括機器學習的算法,包括語音的識別、圖像的識別及基于這些核心算法之上,我們需要構建的能力。應該說在這上面還是有非常多的事情需要去探討的,比如今天深度學習的算法,基于數據的自我學習,但是確實是需要很多的人工干預,如何來構建新一代的機器學習的算法,能夠減少這種人工干預?第二方面我們要看的就是如何把人工智能的技術與行業結合,如何利用人工智能技術來解決行業中的問題,可能是環境中的問題,可能是教育中的問題,可能是醫療中的問題,等等。第三點我想特別談到區塊鏈技術,區塊鏈作為分享式的共享賬本技術,它能夠極大地降低交易成本,提高商業交易的安全性。如何在大數據時代把區塊鏈技術和人工智能技術做一個結合?在合適的行業中做這樣的應用。第四點,從技術創新的角度來看,非常重要的就是我們需要來構建新一代的計算能力,因為無論如何,最終的人工智能的算法、最終的大數據的分析都是在新一代的計算平臺上實現的,這里面包括芯片技術,包括服務器的技術,等等,甚至也包括今天正在開始看到的后摩爾定律時代,或者摩爾定律后時代,無論是納米技術還是在之后更進一步看到的量子計算這樣的一些新的技術,如何構建新一代的計算系統來支撐未來的人工智能應用。
這里我再多說幾句,從技術的角度,從人工智能系統的這樣一個角度,我們需要構建的人工智能系統不僅是算法和應用,同時要構建人工智能的平臺,需要在這樣的平臺上把人工智能的能力以服務的形式提供給我們的客戶,提供給人工智能應用的開發者。而人工智能系統也是一樣的,可能是今天傳統的計算機,我們今天已經在使用的計算機的一個延展,無論是用人工智能芯片的加速,還是用今天已經存在的FPGA的加速,或者圖形處理器的加速,都是在這方面的努力。
另外一點我特別想提到,我們需要探討或者來構建基于人腦思維方式或者模擬人腦思維方式,或者某種意義上模擬人腦思維方式的新一代的系統。今天我們可以做到用54億晶體管模擬100萬個神經原,兩億五千萬個神經突處。這個距離人腦還是有距離的,但是畢竟是一個好的開創性的嘗試。
接下來,我們看在人工智能時代,我們最關鍵的幾點是什么?這里我給出了三個詞:人工智能(認知)、云、行業,這也是今天IBM在新時代轉型的最重要的三個詞匯,就是我們需要構建基于行業的從云端提供的具有人工智能能力的或者具有認知能力的行業解決方案,這是我們認為IT行業接下來發展一個非常非常重要的方向。
在這樣的背景下我們來看行業,其實今天的人工智能已經能做很多事情,人工智能可以寫詩,可以做電影剪輯,可以做服裝設計,等等。當然,人工智能已經在很多博弈類的比賽中戰勝了人類。但可能和這些相比,一樣重要甚至更重要的是人工智能需要進入到行業中,來解決我們行業中的問題。接下來我就來跟大家分享我們在這方面的一些嘗試,因為最終人工智能的成功除了技術的進步,它需要持續不斷的商業的成功。
例一:IBM綠色地平線計劃,這是2014年開始的一個IBM全球,由IBM中國研究院牽頭引領的一個全球的研究計劃,這個是做一個什么樣的事情呢?就是我們把人工智能的技術、物聯網的技術做一個結合,包括云計算的技術,我們來看一看如何來改進空氣質量的管理和優化,今天我們可以做到利用人工智能技術來訓練大量的,我們把它叫超級模型。利用的數據,這里面有衛星的遙感數據、有氣象數據,有一個城市的實時的空寂質量監測數據,當然還有污染源的數據、交通的數據,甚至社交媒體的數據,今天可以做到什么程度呢?我們可以非常精準地預測一個城市未來72小時1公里×1公里PM2.5的濃度?;诖?,我們可以對污染源進行溯源,我們也可以對決策提供支持,因為當,比如當污染源達到一定程度的時候,我們可以有不同的解決方案,不同的解決方案有不同的經濟成本和社會成本,我們可以為決策者提供支持,來選擇更好的方案,這就是人工智能今天在環境中的非常好的應用例子,我們也把綠色地平線計劃今天從環境中也推廣到能源、食品安全等等這樣的新的領域。
我們在認知醫療或者人工智能應用在醫療行業的實踐。應該說醫療行業在眾多行業中可能是人工智能率先能夠取得突破性成果的非常有可能的一個行業,而今天我們也知道,我們能夠使用到的用于診斷的醫療數據是真正影響診斷的數據的非常少的一部分,我們今天用到的更多的是臨床的數據,大概占到整個數據的可能不到10%或者10%左右,實際上我們知道,還有基因數據,還有更大的所謂的大健康的數據,包括飲食、鍛煉、生活規律等等,如何構建新的解決方案為未來的醫生診療提供更好的決策支持?
例二:今天已經做到的就是我們通過對幾十萬糖尿病病人,二型糖尿病病人,幾十萬病人的臨床數據學習,把這樣的學習自動抽取到信息,與醫療指南的信息做一個結合,來構建針對糖尿病的醫療診斷系統,這樣的系統我們已經在實際的社區醫院進行試點的試用,今天有超過6000病人已經從這樣的系統中獲益。這實際上相當于我們為每一個社區醫生提供了一個助手,能夠為他診斷提供建議。
腫瘤診斷也是一個例子,IBM沃森腫瘤診斷系統,我們在國外一家腫瘤醫院,比如以乳腺癌為例,我們今天看到的一些初步的結果,在國外有一家醫院,它有15個醫生組成了一個診療小組,今天針對乳腺癌,沃森給出的建議,在這家醫院90%已經與醫療專家所給出的醫療診斷是一致的。醫療影像是另外一個方面,例:我們今天與國內一家合作伙伴合作,他們是做膠囊機器人,我們吞下一個膠囊機器人進行腸胃系統的檢查,每次檢查能夠生成兩萬到五萬張膠片,這里面如果有病灶的話,大概只有幾十張、幾百張是能夠顯示出這樣的情況,所以我們也需要構建具有人工智能能力的系統,能夠幫助醫生提高他的工作效率。今天應該說在很多的跟醫療影像有關的領域,有很多種病,今天的技術已經可以做到接近,甚至超過人類醫生的精準度。
人工智能跟物聯網的結合。剛才談到的像綠色地平線計劃本身就是超大規模的物聯網系統,我特別希望在這里強調的就是人工智能技術把智能帶到了物理世界,當我們對物理世界進行模擬的時候已經遠遠超過數據的采集和分析,我們需要構建這種具有自我學習能力的系統,而這種系統不但可以分析結構化數據,它也可以分析非結構化數據,像多媒體數據,它也應該,如果需要的話,也應該用到具有領域知識的物理模型。比如剛才談到的天氣預報模型、污染傳播模型等等。在這樣一個背景下,我們來看人工智能可能對制造業的影響,它已經超過了我們以前想象的更精準的預測市場的需求,更好的來優化生產的流程。
例三:我們今天可以用對視頻的自動解讀,圖像識別技術,來對一個生產線產品的質量監測進行自動化。比如一個SOP的生產廠商用這樣的技術可以做到節省他50%以上的人力,需要這樣的人力來用于產品質量監測。
最后特別談一下,在大數據背景下的人工智能。我們今天講人工智能有技術的創新、有跟行業的結合,從跟行業結合這一點來講,與其談AI是人工智能,我們更多的是把它看作增強智能,今天在大數據背景下的人工智能是需要與行業結合,來增強今天在這些行業中對數據處理的能力,來幫助我們解決行業中的問題,來造福我們的生活,來使我們的社會變得更加地美好。