中興力維 CTO 曹友盛：打造智慧城市，我們需要“城市智腦群+人工五官”

責任編輯：hxy |來源：企業網D1Net 2018-07-13 15:28:53 本文摘自：雷鋒網

雷鋒網(公眾號：雷鋒網)按：2018 全球人工智能與機器人峰會（CCF-GAIR）在深圳召開，峰會由中國計算機學會（CCF）主辦，雷鋒網、香港中文大學（深圳）承辦，得到了深圳市寶安區政府的大力指導，是國內人工智能和機器人學術界、工業界及投資界三大領域的頂級交流盛會，旨在打造國內人工智能領域最具實力的跨界交流合作平臺。

CCF-GAIR 2018 延續前兩屆的“頂尖”陣容，提供1個主會場和11個專場（仿生機器人，機器人行業應用，計算機視覺，智能安全，金融科技，智能駕駛，NLP，AI+，AI芯片，IoT，投資人）的豐富平臺，意欲給三界參會者從產學研多個維度，呈現出更富前瞻性與落地性相結合的會議內容與現場體驗。

大會第三天的“AI+專場”，中興力維首席技術官曹友盛博士發表了題為“人工智能和城市智腦”的主題演講，分享了人工智能技術如何應用到智慧城市、電信和公共安全領域。曹友盛現任力維首席技術官，曾任思科全球研發總監和思科中國研發副總裁，并于惠普、SGI、愛立信等公司擔任技術高管。獲得美國賓夕法尼亞匹茲堡大學物理博士、美國超算中心超級計算科學博士后學位。

在演講中，曹友盛認為，人腦不是簡單的三維體，而是具有極其復雜的結構。我們能不能用多維的腦袋去設計一個城市大腦、人工智能群體，讓這個群體像人腦一樣可以進行各方面的考量，這就是力維在考慮的問題。

談及智慧城市的發展歷程，他認為，智慧城市1.0基本上都是在做智慧交通，智慧城市2.0實現了信息共享，智慧城市3.0則是要用“城市五官+城市智腦群”實現術業有專攻。

打造“城市智腦”需要用到三方面的技術，分別是“數據使能”、“數據融合”以及“數據分析”，其中數據分析是最難的，。曹友盛認為它要求更高一層的智能，模擬人腦進行分析，作出決策，這就需要業界能夠對自己的業務形成深刻的認識，在此基礎上通過數據分析技術，可以才能得出比較有效的選擇和建議。

以下是曹友盛博士的全部演講內容，雷鋒網做了不改變原意的整理與編輯：

曹友盛：正式演講前，我們先探討下人類是怎么思維的？現在人工智能都是基本靠“人工”，投入多少人工才會有多少智能。我們是用人腦訓練人工智能，實際上這是很不成功的，因為人腦看世界是三維空間，加上時間就是四維。愛因斯坦曾經用超過三維、四維的能力想出一個東西。

以AlphaGo為例，AlphaGo不是靠眼睛、鼻子等五官去全方位判斷事物，而是有點“偏才”。比如有些人是弱智兒童，但計算能力很強。它需要把精力集中到一本書上或者一個算盤、一個計算機上，但這時你會失去眼睛、耳朵等共用的功能。

有時候人們為了進行深度思考會習慣把眼睛閉起來，這個時候五官的功能就也會同時被關起來。我們把人工智能分成三類，大的范圍是人工智能，中間的一個子集是機器學習，最核心的部分是深度學習。AlphaGo實際上是機器學習，但最后一級用的是深度學習，就是需要關起門來想一想。

愛因斯坦是十三維的腦袋，據說他有十三維的空間，那到底什么是十三維？簡單來說，從一開始，上帝就給了我們一組數據：1+2=3，這是一維數據；二維數據是Table、Excel表格；三維數據是數據庫；四維數據是數據倉庫。深度學習就要到N維了，需要超過四維的想象力，所以我們今天無法像愛因斯坦那樣做出他想要的人工智能。

近年來，AI又引領了一波全球浪潮。不管是中國，還是美國、歐洲、日本，人工智能都是一個趨勢。2018年我們要怎么做人工智能，接下來我們來討論這個問題。

人工智能”能否達到“人腦智能”？

人工智能”能否達到“人腦智能”？阿里、百度喜歡用“城市大腦”，為什么我把它改成“智腦”？正如我剛才所講，具有超強的數學能力的人在某些方面非常強，比如AlphaGo在計算上非常強，但在一些感官等其他方面的感知能力則非常弱，所以我們今天只談大數據、深度學習是不行的，這是我今天要講的主題。

力維如何做“人工智能”？人腦是如何被機器模擬的？很多人都會問一個問題“人腦是怎么思維的？”前面我已經講了，人腦思維分成三種思維：

一是人工智能思維，簡單的由五官作出快速判斷，快速判斷時不需要回到人的腦子里細想；

二是需要專門針對某一方面進行學習，比如AlphaGo學東西，我們把它稱為機器學習。

三是要進行冥思苦想的，這一類我們稱之為深度學習。在深度學習上，我們認為一定要跟業務相關，不懂業務去做人工智能或者做深度學習是不可能的。

人腦不是簡單的三維體，它是無窮復雜的結構，做數據科學的人都會跟你說卷積神經、深度神經等。腦神經不是簡單的三維體，是一個多維體，它在思考問題時也不是三維、四維、五維，聰明的人會用N維考慮問題。我們能不能用四維的腦袋去設計一個城市大腦、一個人工智能群體？要讓這個群體具有各方面考量，比如睜開眼睛就能用人工智能判斷，針對某一數據能進行機器學習，也能做深度學習，有沒有這么一個設計呢？這就是力維在考慮的問題，我們認為打造人工智能，三者都要做。

怎么用人工智能做智慧城市？

我們怎么用人工智能做智慧城市？智慧城市1.0基本上是在做智慧交通，到了智慧城市2.0，大家知道信息需要共享，共享后可以進行機器學習、數據碰撞。智慧城市3.0怎么定義呢？以阿里和百度的定義，智慧城市3.0就是城市大腦，即城市有一個大腦，將所有信息到云端匯總，這個大腦可以做各種各樣的思考，這就是智慧城市3.0的定義。

力維認為，一個大腦不可能解決智慧城市，正如一個城市的管理需要按區域、層級進行劃分，需要市長、區長等級別的管理者。如果真有一個大腦能管理城市，也應該是上帝的大腦，我們認為一個城市應該有一群腦。城市還要有五官，既有五官，又要有一群城市智腦，這樣才能做到城市人工智能、機器學習、深度學習，并能管理一個城市。

這是百度城市大腦和阿里城市大腦框架，是一個非常完美的城市大腦，自上而下管理城市。

城市智腦的技術路線分為三個階段：過去做城市智腦時，我們希望把各種各樣不同的數據都匯聚到一個中心做機器學習，有點像周末我拿本書，好好學這本書，把這個問題搞明白，將互聯網數據匯聚到一個地方，用偏才的方法學習數據，從中得出一個可以派上用場的結論。

這種做法有一個好處，就是可以學得很深，但它也有很多壞處，數據來源單一，缺乏其他數據。當大腦在深度思考的時候，全部都是腦子內部的數據進行計算。比如我們經過機器深度學習，我們從民政局拿到菜價，菜價的波動居然跟一個城市的安全指數相關，這不就是啤酒和尿布之間的關系嗎？因此，只有把眼睛閉下來，讓機器去做深度學習，才會發現菜價跟城市安全指數非常吻合。

所以在日常生活中，我們既需要往深里想，把更多維的數據在一個可以思考的腦袋中思考，但有時我們又必須要作出快速判斷。未來我們要按照神經擬態計算，接下來會專門講神經擬態計算，因為我們過去和今天做的并不能完全模擬一個人的神經。

未來我們要依賴三個技術：

一是數據使能。一個城市需要感知設備采集數據，但是采集進來的數據并不能馬上使用，這中間還要有使能過程，何為使能？就是對感知設備采集到的數據進行清洗、處理等。

二是數據融合。把前面使能好的數據融合起來，轉換成一種知識，將有能力的數據融合在一起進行加工，讓它成為能夠被應用的東西。

第三個技術、也是比較關鍵的是數據分析。數據分析是最難的，它要求更高一層的智能，模擬人腦進行分析，作出決策，這個時候我們要結合一些業務，所以必須要對自己所在的行業足夠了解。在此基礎上，通過數據分析技術，可以得出比較有效的選擇和建議。接下來怎么改進，某種意義上來說，機器在這個時段會作出一些判斷，這些判斷比人腦能想象的東西更深奧。

人工智能和深度學習存在的問題

目前大家都在談人工智能、機器學習、深度學習。我們認為這里大概有四個困難：

一是機器學習很多時候是用督導式學習，首先要大量的數據訓練機器，比如AlphaGo，只有進行了很多棋譜訓練的AlphaGo，才能跟李世石下圍棋。但是很多情況下我們沒有足夠的數據，也不能區分這些數據。這種我們稱之為無標簽數據。

第二是數據樣本太少，甚至零樣本。

第三是訓練機器花的時間很大，要用大量的數據訓練機器。現在市場上有很多人工智能企業，如商湯、依圖、曠視都做得很好，它們基本上是在做樣本學習，所以需要花費很多時間才能做出一個人臉特征來。

第四是成本問題。因為計算量、維度越來越大，沒有足夠的數據和維度，這些樣本都很難被計算出來，這種情況下用CPU很難進行計算，所以就會出現GPU，怎么理解GPU呢？CPU是一維的話，GPU就是二維的，現在又出現了TPU。

這四個問題怎么解決呢？一是大家比較關心的小樣本，沒有什么數據怎么做大數據？這里又要講到人的淺層學習，即不需要很多數據，人工智能判斷很快，這種能力我們稱為“元知識”。

小樣本挑戰我們就是用和元知識相關的元學習和關系網絡來進行的。比如這張圖，上面有雞、狗、貓，我們讓機器先把雞、狗、貓的特征提取出來，讓它學習。當有一只狗放進去進行識別時，機器就能很快識別出這個東西像一只狗，這就是小樣本元學習和關系網絡技術。

下面是一些經常用到的技術：K近鄰、深度學習與少樣本學習、弱監督、無監督學習，增強學習，數據增擴技術，生成式對抗網絡。

我們做智慧社區時經常碰到樣本特別小，尤其是公共安全領域的視頻監控，對行人進行再識別，基本上采樣很小，一兩張照片就能把罪犯找出來。

解決第三和第四個問題的辦法基本上有多個。，其中的一個是采用神經擬態計算，人腦判斷一個數據時用的是脈沖形式，而不是一直在想。所以我們需要有一個CPU，它也是以人腦的脈沖形式在想。

其次是期待未來的人工智能更快、更簡單、更便宜、更智能，更省能耗。其中高性能計算今天已經可用，量子計算機和神經擬態計算網絡即將進入商業化。

一個城市應該有五官和智腦群

最后是我今天的總結：簡單來說，一個城市應該有五官和智腦群。人腦思維時并不是簡單的用腦在想，更多時候是用中樞神經和脊椎神經在思考，中樞神經和脊椎神經直接跟感知設備連在一起，判斷一個事情并沒有連接大腦，是直接在中樞神經、脊椎神經作出判斷。

如果今天有一個人跟你說，一定只能是利用大數據進行深度學習，通過學習和模仿才能做出人工智能，顯然這是不可能的。這是我們在智慧城市中的機器模擬，首先是五官，各種采集設備；然后通過中樞神經進行數據匯聚，如果這里能作出判斷就立刻作出判斷，快速作出反應；中樞神經存儲、神經網絡和記憶思維在這一塊，淺層次的做出快速判斷，最后是深度學習，也就是能超出人腦思維能力的這一部分。

近年來，在智聯網領域，力維不斷進行探索和實踐，以力維結合最新智聯網技術推出的智慧社區解決方案為例，基于社區多維數據匯聚融合以及大數據架構的深度挖掘分析技術，為社區主管單位和社區居民提供更豐富的社區級大數據服務，如人像惠民、社區停車、社區聯防、社區指數等，極大提升了社區智能化治理和服務水平。

這就是力維對人工智能和城市智能的體會。謝謝大家！

關鍵字：智慧城市中興力維