雷鋒網(公眾號:雷鋒網)按:2018 全球人工智能與機器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦,得到了深圳市寶安區政府的大力指導,是國內人工智能和機器人學術界、工業界及投資界三大領域的頂級交流盛會,旨在打造國內人工智能領域最具實力的跨界交流合作平臺。
CCF-GAIR 2018 延續前兩屆的“頂尖”陣容,提供1個主會場和11個專場(仿生機器人,機器人行業應用,計算機視覺,智能安全,金融科技,智能駕駛,NLP,AI+,AI芯片,IoT,投資人)的豐富平臺,意欲給三界參會者從產學研多個維度,呈現出更富前瞻性與落地性相結合的會議內容與現場體驗。
大會第三天的“AI+專場”,中興力維首席技術官曹友盛博士發表了題為“人工智能和城市智腦”的主題演講,分享了人工智能技術如何應用到智慧城市、電信和公共安全領域。曹友盛現任力維首席技術官,曾任思科全球研發總監和思科中國研發副總裁,并于惠普、SGI、愛立信等公司擔任技術高管。獲得美國賓夕法尼亞匹茲堡大學物理博士、美國超算中心超級計算科學博士后學位。
在演講中,曹友盛認為,人腦不是簡單的三維體,而是具有極其復雜的結構。我們能不能用多維的腦袋去設計一個城市大腦、人工智能群體,讓這個群體像人腦一樣可以進行各方面的考量,這就是力維在考慮的問題。
談及智慧城市的發展歷程,他認為,智慧城市1.0基本上都是在做智慧交通,智慧城市2.0實現了信息共享,智慧城市3.0則是要用“城市五官+城市智腦群”實現術業有專攻。
打造“城市智腦”需要用到三方面的技術,分別是“數據使能”、“數據融合”以及“數據分析”,其中數據分析是最難的,。曹友盛認為它要求更高一層的智能,模擬人腦進行分析,作出決策,這就需要業界能夠對自己的業務形成深刻的認識,在此基礎上通過數據分析技術,可以才能得出比較有效的選擇和建議。
以下是曹友盛博士的全部演講內容,雷鋒網做了不改變原意的整理與編輯:
曹友盛:正式演講前,我們先探討下人類是怎么思維的?現在人工智能都是基本靠“人工”,投入多少人工才會有多少智能。我們是用人腦訓練人工智能,實際上這是很不成功的,因為人腦看世界是三維空間,加上時間就是四維。愛因斯坦曾經用超過三維、四維的能力想出一個東西。
以AlphaGo為例,AlphaGo不是靠眼睛、鼻子等五官去全方位判斷事物,而是有點“偏才”。比如有些人是弱智兒童,但計算能力很強。它需要把精力集中到一本書上或者一個算盤、一個計算機上,但這時你會失去眼睛、耳朵等共用的功能。
有時候人們為了進行深度思考會習慣把眼睛閉起來,這個時候五官的功能就也會同時被關起來。我們把人工智能分成三類,大的范圍是人工智能,中間的一個子集是機器學習,最核心的部分是深度學習。AlphaGo實際上是機器學習,但最后一級用的是深度學習,就是需要關起門來想一想。
愛因斯坦是十三維的腦袋,據說他有十三維的空間,那到底什么是十三維?簡單來說,從一開始,上帝就給了我們一組數據:1+2=3,這是一維數據;二維數據是Table、Excel表格;三維數據是數據庫;四維數據是數據倉庫。深度學習就要到N維了,需要超過四維的想象力,所以我們今天無法像愛因斯坦那樣做出他想要的人工智能。
近年來,AI又引領了一波全球浪潮。不管是中國,還是美國、歐洲、日本,人工智能都是一個趨勢。2018年我們要怎么做人工智能,接下來我們來討論這個問題。
人工智能”能否達到“人腦智能”?
人工智能”能否達到“人腦智能”?阿里、百度喜歡用“城市大腦”,為什么我把它改成“智腦”?正如我剛才所講,具有超強的數學能力的人在某些方面非常強,比如AlphaGo在計算上非常強,但在一些感官等其他方面的感知能力則非常弱,所以我們今天只談大數據、深度學習是不行的,這是我今天要講的主題。
力維如何做“人工智能”?人腦是如何被機器模擬的?很多人都會問一個問題“人腦是怎么思維的?”前面我已經講了,人腦思維分成三種思維:
一是人工智能思維,簡單的由五官作出快速判斷,快速判斷時不需要回到人的腦子里細想;
二是需要專門針對某一方面進行學習,比如AlphaGo學東西,我們把它稱為機器學習。
三是要進行冥思苦想的,這一類我們稱之為深度學習。在深度學習上,我們認為一定要跟業務相關,不懂業務去做人工智能或者做深度學習是不可能的。
人腦不是簡單的三維體,它是無窮復雜的結構,做數據科學的人都會跟你說卷積神經、深度神經等。腦神經不是簡單的三維體,是一個多維體,它在思考問題時也不是三維、四維、五維,聰明的人會用N維考慮問題。我們能不能用四維的腦袋去設計一個城市大腦、一個人工智能群體?要讓這個群體具有各方面考量,比如睜開眼睛就能用人工智能判斷,針對某一數據能進行機器學習,也能做深度學習,有沒有這么一個設計呢?這就是力維在考慮的問題,我們認為打造人工智能,三者都要做。
怎么用人工智能做智慧城市?
我們怎么用人工智能做智慧城市?智慧城市1.0基本上是在做智慧交通,到了智慧城市2.0,大家知道信息需要共享,共享后可以進行機器學習、數據碰撞。智慧城市3.0怎么定義呢?以阿里和百度的定義,智慧城市3.0就是城市大腦,即城市有一個大腦,將所有信息到云端匯總,這個大腦可以做各種各樣的思考,這就是智慧城市3.0的定義。
力維認為,一個大腦不可能解決智慧城市,正如一個城市的管理需要按區域、層級進行劃分,需要市長、區長等級別的管理者。如果真有一個大腦能管理城市,也應該是上帝的大腦,我們認為一個城市應該有一群腦。城市還要有五官,既有五官,又要有一群城市智腦,這樣才能做到城市人工智能、機器學習、深度學習,并能管理一個城市。
這是百度城市大腦和阿里城市大腦框架,是一個非常完美的城市大腦,自上而下管理城市。
城市智腦的技術路線分為三個階段:過去做城市智腦時,我們希望把各種各樣不同的數據都匯聚到一個中心做機器學習,有點像周末我拿本書,好好學這本書,把這個問題搞明白,將互聯網數據匯聚到一個地方,用偏才的方法學習數據,從中得出一個可以派上用場的結論。
這種做法有一個好處,就是可以學得很深,但它也有很多壞處,數據來源單一,缺乏其他數據。當大腦在深度思考的時候,全部都是腦子內部的數據進行計算。比如我們經過機器深度學習,我們從民政局拿到菜價,菜價的波動居然跟一個城市的安全指數相關,這不就是啤酒和尿布之間的關系嗎?因此,只有把眼睛閉下來,讓機器去做深度學習,才會發現菜價跟城市安全指數非常吻合。
所以在日常生活中,我們既需要往深里想,把更多維的數據在一個可以思考的腦袋中思考,但有時我們又必須要作出快速判斷。未來我們要按照神經擬態計算,接下來會專門講神經擬態計算,因為我們過去和今天做的并不能完全模擬一個人的神經。
未來我們要依賴三個技術:
一是數據使能。一個城市需要感知設備采集數據,但是采集進來的數據并不能馬上使用,這中間還要有使能過程,何為使能?就是對感知設備采集到的數據進行清洗、處理等。
二是數據融合。把前面使能好的數據融合起來,轉換成一種知識,將有能力的數據融合在一起進行加工,讓它成為能夠被應用的東西。
第三個技術、也是比較關鍵的是數據分析。數據分析是最難的,它要求更高一層的智能,模擬人腦進行分析,作出決策,這個時候我們要結合一些業務,所以必須要對自己所在的行業足夠了解。在此基礎上,通過數據分析技術,可以得出比較有效的選擇和建議。接下來怎么改進,某種意義上來說,機器在這個時段會作出一些判斷,這些判斷比人腦能想象的東西更深奧。
人工智能和深度學習存在的問題
目前大家都在談人工智能、機器學習、深度學習。我們認為這里大概有四個困難:
一是機器學習很多時候是用督導式學習,首先要大量的數據訓練機器,比如AlphaGo,只有進行了很多棋譜訓練的AlphaGo,才能跟李世石下圍棋。但是很多情況下我們沒有足夠的數據, 也不能區分這些數據。這種我們稱之為無標簽數據。
第二是數據樣本太少,甚至零樣本。
第三是訓練機器花的時間很大,要用大量的數據訓練機器。現在市場上有很多人工智能企業,如商湯、依圖、曠視都做得很好,它們基本上是在做樣本學習,所以需要花費很多時間才能做出一個人臉特征來。
第四是成本問題。因為計算量、維度越來越大,沒有足夠的數據和維度,這些樣本都很難被計算出來,這種情況下用CPU很難進行計算,所以就會出現GPU,怎么理解GPU呢?CPU是一維的話,GPU就是二維的,現在又出現了TPU。
這四個問題怎么解決呢?一是大家比較關心的小樣本,沒有什么數據怎么做大數據?這里又要講到人的淺層學習,即不需要很多數據,人工智能判斷很快,這種能力我們稱為“元知識”。
小樣本挑戰我們就是用和元知識相關的元學習和關系網絡來進行的。比如這張圖,上面有雞、狗、貓,我們讓機器先把雞、狗、貓的特征提取出來,讓它學習。當有一只狗放進去進行識別時,機器就能很快識別出這個東西像一只狗,這就是小樣本元學習和關系網絡技術。
下面是一些經常用到的技術:K近鄰、深度學習與少樣本學習、弱監督、無監督學習,增強學習,數據增擴技術,生成式對抗網絡。
我們做智慧社區時經常碰到樣本特別小,尤其是公共安全領域的視頻監控,對行人進行再識別,基本上采樣很小,一兩張照片就能把罪犯找出來。
解決第三和第四個問題的辦法基本上有多個。,其中的一個是采用神經擬態計算,人腦判斷一個數據時用的是脈沖形式,而不是一直在想。所以我們需要有一個CPU,它也是以人腦的脈沖形式在想。
其次是期待未來的人工智能更快、更簡單、更便宜、更智能,更省能耗。其中高性能計算今天已經可用,量子計算機和神經擬態計算網絡即將進入商業化。
一個城市應該有五官和智腦群
最后是我今天的總結:簡單來說,一個城市應該有五官和智腦群。人腦思維時并不是簡單的用腦在想,更多時候是用中樞神經和脊椎神經在思考,中樞神經和脊椎神經直接跟感知設備連在一起,判斷一個事情并沒有連接大腦,是直接在中樞神經、脊椎神經作出判斷。
如果今天有一個人跟你說,一定只能是利用大數據進行深度學習,通過學習和模仿才能做出人工智能,顯然這是不可能的。這是我們在智慧城市中的機器模擬,首先是五官,各種采集設備;然后通過中樞神經進行數據匯聚,如果這里能作出判斷就立刻作出判斷,快速作出反應;中樞神經存儲、神經網絡和記憶思維在這一塊,淺層次的做出快速判斷,最后是深度學習,也就是能超出人腦思維能力的這一部分。
近年來,在智聯網領域,力維不斷進行探索和實踐,以力維結合最新智聯網技術推出的智慧社區解決方案為例,基于社區多維數據匯聚融合以及大數據架構的深度挖掘分析技術,為社區主管單位和社區居民提供更豐富的社區級大數據服務,如人像惠民、社區停車、社區聯防、社區指數等,極大提升了社區智能化治理和服務水平。
這就是力維對人工智能和城市智能的體會。謝謝大家!