以下是微軟全球資深副總裁王永東發表的題為“從互聯網到人工智能的產業創新”的演講實錄。
我們在新時代面臨的經濟發展的挑戰,是不能再依靠大的資本投入、資源投入和人力投入,來推動經濟的發展。我們更需要通過創新、提高效率來拉動經濟的發展。剛才提了從蒸汽到電力這個階段,對做技術的人怎么想產業創新來說,這是一個很好的例子,比如說,1882年,在愛迪生發明電力的時候,電力已經可以提供了,那么并不是說電力提供了以后它很快就在產業里面推開來了,到1900年也只有5%的工廠使用電力,到1910年福特汽車公司,建立新工廠,全部設計用電力驅動,這才帶來了很大的一個革新的效率的提高。其他汽車公司很快就跟他學,也有人沒有跟他學,沒有跟他學的,隨著歷史的發展被淘汰了。
從我們信息技術或者IT技術來看,我把它稍微歸納了幾個發展階段:
大概從1975年開始,電腦和軟件開始發展起來,那時在國內還沒有什么人用電腦。我是1980年上大學,報考的是計算機專業,在我上大學之前從來沒有見過一臺電腦,就因為在報紙上看到關于計算機的文章,覺得這個東西特別神奇,我要去上大學讀計算機,就這樣糊里糊涂進了計算機專業。在那個時代,成就了一些這個行業的巨頭,比如說像英特爾這樣的公司,從產業來看的話,在電腦和軟件發展過程中,有些產業就開始逐漸的使用起來,今天來看可能沒有一個產業不使用電腦和軟件了。
第二個階段從1995年開始,互聯網開始發展,到后來的移動互聯網再到這個階段,又成就了一些了不起的公司,比如像谷歌、亞馬遜這樣的公司。產業的話同樣,有的產業用互聯網早,有的產業用互聯網晚一些,互聯網到現在在房地產產業已經成為標配,所以今天還沒有用互聯網的可能已經變得落后了。
那么下一個階段,我自己覺得,從2015年開始,其實是云和AI發展的階段。這個還屬于比較早期的階段,但是我們做技術的人一定是走在應用前面的,在我們看來未來云和AI的發展潛力和空間是非常大的,我做了一點估算,到2020年的話,可能各種各樣的這種應用。它所產生的數據,它對我們全世界的連接,這種影響是特別巨大的。它不僅僅是云,而且是終端。各種各樣的終端設備在每個地方產生數據,它能夠根據這些數據做出的分析、決策,能夠對我們的生活帶來影響,對我們工作帶來影響,對我們生產效率的提高帶來影響,這種影響會是非常巨大的。
我們微軟作為平臺公司,叫它世界觀,我們怎么看未來的世界,其實有兩個最重要的,一個是云,是中心化的,把很多的數據集聚在一起;另外一個就是邊緣,邊緣深入到我們生活方方面面,比如說家具就是一個很好的環境,制造也是一個很好的環境,各種各樣的。這里面還有一個關鍵詞,智能,不僅僅是有云,不僅僅是有邊緣,如果沒有智能的話,即使有很多的數據,能夠發揮效應是非常有限的,所以這個智能里面加了智能邊緣,是我們看未來產業和世界發展的大趨勢。
說到這,我就要介紹微軟在這方面的工作。微軟的云叫Azure,我們看云有這樣幾個方面:一個是公有云,今天談云大部分是公有云;另外還有一種叫混合云,有些時候有些數據,安全性特別高,私密性要求非常高的沒有辦法放到公有云上,可能是在私有云,有些數據在公有云,所以就叫混合云;第三種就是物聯網,云架構如何支持各種終端設備,也就是IOT物聯網。最后是安全性,在云的范圍做安全性比以前困難很多,因為它全部都是連接在一起的,時不時大家也聽到說,哪個地方安全出問題了,數據泄露等等。安全性做不僅僅在應用層面、軟件層面,要從最基層做起,從芯片開始做起,到計算機的基礎架構,到操作系統,到系統軟件到應用軟件,然后到我們這方面,比如說像數據產業的應用,這樣一個完整安全架構,這是云的結構。
從智能方面講,主要是像AI這樣的,有很多的應用大家可以看到了,但是最最基本的技術,有這樣幾類,一個是計算機視覺方面的技術,這個我們在國內看到的是最多的,比如說像安防方面的應用,甚至我們到酒店入駐,會議,有的時候注冊等等,可以看到很多的應用。做技術的目標能不能達到或者超過人類的水平,我們從業者特別是研究人員,是有一些標準的,也就是說它有一個數據集,你的好拿出來比一比,第一個是計算機視覺方面的一個測試集,斯坦福大學教授做的,2016年微軟的算法就已經可以達到人類的水平,我待會再給大家說一下。
到2017年語音識別,它也有一個測試集,是用客服的電話標注出來做語音識別的,在2017年基本上可以達到人類的語音識別水平。后來就是自然語言理解,同樣有一個比標準的測試集,在2018年文本理解這塊測試的水平上可以達到人類的水平,后來在自然語言理解方面,有一個標準測試就是機器翻譯,中譯英,英譯中,我們在今年3月份可以達到人類的水平,可以看到人類水平第一個數字不是完美的,沒有一個100%,越往后數值越低,自然語言理解AI是最難的問題。達到人類水平在研究測試環境當中,真正應用的時候還有很多的挑戰,比如說像語音這方面,測試集里面包含了多少方言,包括了多少的老人孩子這個跟我們實際應用不盡相同。
作為技術公司或者平臺公司,我另外想問一個問題,特別重要的問題就是說我們怎么能夠來幫助產業的轉型、創新和發展,一方面給平臺公司提供很多的商機,另外可以給產業的生產力提高提供巨幫助。我們做一件事情,就是把20多年來AI研究的成果,用API的方式開放出來,所以我們的客戶可以通過API來使用AI的能力,而不是說每個都要自己發明,包括剛才提到的語音、機器學習、視覺或者是搜索,或者知識圖譜,或者在語言理解幾個大的方面。
我講了微軟,現在回過頭想一想我們國內,在技術發展階段,我們自己是什么樣的情況?我在國內上大學,1985年去美國讀書工作,2009年又回國。我兩邊都能夠看到這方面的技術和產業發展。在第一個階段,電腦和軟件的階段,那個時候我們國內其實是覺醒了之后開始學習、追趕,這個過程中我們得益,但是也有一些后遺癥,比如說我們國內的軟件產業沒有真正的發展起來,但是我們沒有認識到軟件創新的價值。
從95年開始中我們在互聯網的階段,是從學習到創新,早期的時候,我當然還有記憶,看到美國一個什么東西出來了,很快在國內就可以看到,國內出來的東西可能跟美國的長得很像。這沒問題,在那個時代是非常正確的選擇,這給我們國家帶來時間和經驗,發展到后來,大家可以看到國內很多的創新,其實已經是在世界上有領先了,比如說我現在的一些美國同事或者朋友過來,看到我們的移動支付,他們覺得不可思議。在云和AI的時代,我們是不是有機會從創新到領先,我寫一個問號在這,我覺得機遇是在那兒,看我們的努力。
我覺得國家層面非常重視AI,業界也感覺有很多的機會,不過這里面還是有很多挑戰的。我覺得研究和技術的發展是相當快的,正因為如此我們的期望也很高,不過有的時候,我覺得期望有點過高。我覺得挑戰最大的是尋找合適的應用場景,能夠把它落實到應用中,然后要能夠對這個現實與預期的差距有所理解,在短期內,如果沒有達到你的預期,并不代表對它沒有發展前途,只是說它還在處于發展的早期,那么在這個早期的過程中,我自己個人非常不希望看到,它變成像某些行業一樣大的泡沫,因為這個泡沫給發展帶來特別負面的影響。我覺得今天的發展狀況,差不多和1999年的互聯網類似,技術在發展我們有很好的期望,但有些東西還不能完全落地,期望和現實之間有一些差距。
不過,這反而是讓我們覺得,未來會有很大的發展空間。從AI和互聯網來講,剛才馮董講了互聯網在很多行業的應用,特別是在房地產行業,從AI來講也是一樣,有很多行業應用,我待會會講一兩個例子。我經常會看到一些關關于“AI和社會”的討論,AI給我們社會帶來什么樣的變化,這個變化是好還是壞,AI是否存在威脅等。我們這一代人注定是人類和AI共存的第一代人,一方面我們要來學習和適應,另一方面我們有責任控制好AI的發展方向。人和AI共存的的時候,人和AI是怎么樣的交互方式?大家看電腦的發展,最開始是打mini,最后開始有鼠標,然后移動上有APP,越來越容。在AI時代,我認為這是一個對話式的AI,可能會成為一個最重要的人機交互的方式,原因就是說對話對我們人來說是最容易的。以前我們人適應技術發展,技術發展非常強大,我們應該說是讓技術來吸引人類,技術淄博技術、AI應該用我們人類最適合的方式來和我們進行交流,進行這種對話。
在這個方面我們做了一些探索,業界的大部分AI工作,是集中于怎么解決問題,然后怎么讓AI在某一方面來幫助我們做事情,基于我們對AI和社會未來的考量,我們做了一個產品叫小冰,主要是探索人與AI探索的問題,最開始是對話機器人可以和小冰進行對話,互聯網讓我們可以和陌生人進行對話,AI讓我們人可以和AI、機器進行對話。今天小冰的月活躍用戶超過1億,有很多人時不時的和小冰聊一聊。
也有人覺得很奇怪,大家很忙,誰沒事找AI聊天,但還真是有不少人找AI聊天,聊天的高峰期是晚上10點鐘左右,到凌晨一兩點鐘。后來想了想為什么,其實今天的互聯網時代,雖然一方面我們聯系很緊密了,但是不知道大家有沒有注意到,另一方面某種意義就變得更孤獨了。到晚上想聊天的時候,家人朋友都休息了,小冰是機器人一天24小時聊天,同時和幾千幾萬的人聊天,這個時候反而有很多人跟他聊天,甚至有人跟他傾訴。在這個基礎上,在想說是否具備人所有的創造能力,比如說可以唱歌可以做主持人可以寫詩等等,這方面我們自己感覺未來AI要是能夠融入我們人類社會,越向往的人越和AI越近,越容易被接受,在各種各樣AI應用中,如果把情感的成份帶在里面它的效率會更高。我們也在想,如果你有這個AI的基礎應用,那么對行業發展能夠帶來什么樣的影響,當然可以聊天,大家可以想到,別的可以做什么,其實在過程中,我給大家講一點,就是說,一些基礎的技術,它特別融會貫通的。
你要想跟別人聊天聊的好,一定要了解人家在說什么東西,說什么東西就是自然語言理解的過程。我們就把這樣的技術應用在商業應用上,比如我們做的一個小冰姐姐講故事,這個很多你已經有現成故事在那,我只是用一個自然的語音把它讀出來,因為是AI這個聲音可以調,一個故事聽起來好象有很多的角色在里面可以講,比如說和擁有文字版權的出版商合作,共同做的這個聲音可以共享,可以想像比人讀故事所生產效率要提高非常多。因為AI我們可以做定制,孩子可以定制故事,可以把自己,把父母,朋友甚至自己的這種動物玩具都可以寫到故事里去。父母可以講故事,還可以有點教育意義,比如說要養成好的習慣,要注意安全,怎么和陌生人交往,這些教育的東西,同樣可以把它編到故事里去,這個可以個人定制。
更嚴肅的應用,自然語言理解可以應用到文本方面。如果我理解上市公司的公告,這樣理解以后如何出摘要,我用機器出就會出的非常快,公告出來20秒鐘就可以把摘要出來。今天在國內,我們也和萬德和華爾街合作,現在大部分的國內交易,看到的實際上可能是小冰產生的。我用兩個小的例子給大家講一下AI的可能性。
最后我講一下AI對社會的影響,對人類有沒有威脅等等。未來是什么樣子我們來預測,但是這句話特別喜歡,預測未來最好的方法是什么,就是我們一起努力創造未來,所以我想用這句話跟大家共勉,我們一起來努力,創造一個美好的未來,謝謝大家!