觀點一:25年來,微軟通過云計算、人工智能這些創新技術,來加速中國企業的數字化轉型。中國公司和世界級的創新公司在引領全球,不少公司都來自深圳,我們大家一起努力,實現夢想。
沈向洋博士指出,世界就是一臺計算機,今天的世界已經變成一臺龐大的計算機,手機是計算機,PC是計算機,所有的計算被連接起來,分布在各處強大的計算能力,采集無處不在的傳感器數據,應用機器學習分析采集到的數據,用人工智能創造出工作生活中的各種各樣的體驗,這是了不起的事情。
在新時代,微軟新的世界觀是“未來的世界就是云到邊緣的計算世界”,智能云(Intelligent Cloud)+智能邊緣(Intelligent Edge),為了達到這個遠景,微軟誓要把Azure打造成世界新的計算機,成為融入AI的最佳云和邊緣平臺。
在IoT領域,微軟呈現四大布局,分別是Azure云、Azure混合云、Azure 邊緣(Azure IoT Edge)、Azure Sphere。現場重點介紹了后兩者的最新進展。沈向洋表示,Azure IoT Edge,是一項將云端的人工智能和Azure服務直接部署和運行在各種跨平臺物聯網設備上的全托管服務,目前支持Windows、Lunix等多個系統。微軟展示了與科勒和大疆的合作項目,另外,半導體芯片開發商樂鑫(Espressif)也發布了ESP-32-Azure IoT Kit開發板。
微軟的Azure就是一臺世界的計算機,覆蓋54個國家和地區,獲得了安全和合規的認證。全球覆蓋的區域和安全合規認證遠遠高于其他公司。服務全球500強中超過百分之九十的公司。
觀點二、計算機視覺,計算機圖形,文本到語音合成,微軟在中國的創新已經影響到全球。
沈向洋博士介紹說,微軟之所以可以在智能云和智能端取得如此大優勢,得益于微軟在人工智能領域20多年的研究和世界級的研發成果。
筆者梳理了這張圖片上的五大里程碑事件:
1、2016年,微軟亞洲研究院一支團隊在圖片網絡(ImageNet)得全球圖像識別大賽中一鳴驚人,這個團隊帶來得精妙算法叫殘存網絡(ResNet),它對10萬張照片進行識別,并列入了1000個不同類別之下,其錯誤率低到3.5%。2年后,谷歌的DeepMind研發出AlphaGo Zero,即能夠自學的新一代AlphaGo,殘差網絡就是它的核心技術模塊之一。
2、2017年8月20日,微軟首席語音科學家黃學東宣布微軟語音識別系統繼微軟對話語音識別技術達至人類專業水平,開啟人工智能新征程之后再次取得重大突破,錯誤率由5.9%進一步降低到5.1%,可與專業速記員比肩。此次突破大幅刷新原先記錄,并在語音識別行業樹立新的里程碑。
3、2018年 1 月,微軟研究院在斯坦福大學發起的 SQuAD 文本理解挑戰賽上獲的完成 SQuAD 閱讀理解測試的準確率高達 88.5%,超越人類。2018 年 3 月,微軟宣布旗下機器翻譯技術取得突破,在中文翻譯英文準確度可媲美人類。
4、2018年3月微軟宣布機器翻譯研究系統的準確率達到69.9%。中英文翻譯,新聞高測試集測試比對準確率達到69.9%。
5、2018年5月份Build 2018 大會上,微軟在公有云Azure平臺上推出了語音合成定制服務產品Custom Voice。將語音和對應文本(500句)上傳,Custom Voice即可對聲音進行模擬,并在線測試模擬效果。
“語音和語言是衡量人類智能的標桿,人工智能的發展分支之一是語音識別,去年《經濟學人》雜志總結了過去40年語音方面的進展,過去20年,語音識別上有標桿上的測試,兩人隨便聊天,看看計算機是否可以轉錄下來,包括吵架、談情說愛,錯誤率高居不下,微軟轉錄系統在不考慮代價的情況下,轉錄水平可以超過專業人員。黃學東表示,微軟的語音合成技術除了端到端神經網絡開發,還使用了遷移學習,最大特點就是支持各種定制化服務。但考慮到定制某個人聲音會涉及法律問題,定制化服務暫時不向個人開放。
沈向洋表示,微軟希望利用AI技術在所有感知方面超過人類水平,最近研發的是微軟還在研發OCR印刷體識別、手寫文字識別等技術。
觀點三、全球每年微控制器有90億量,隨著物聯網數量增加,MCU使用量會越來越大。微軟Azure Sphere三部分,芯片級的云+端物聯網安全解決方案,是基于Linux安全小型的操作系統,包括認證微控制器、操作系統、安全服務三方面,協同可以確保智能邊緣設備的安全。
沈向洋表示,Azure 給制造業帶來的機遇,憑借著Azure Sphere,制造業有全新的安全體驗和新的商業模式,比如ROOBO做得語音芯片,做離線遠程的語音控制,讓Azure集成語音服務放在任何設備上。長虹集團子公司四川愛聯發布了面向智能家電的嵌入式Azure Sphere模塊。除了語音之外,ROOBO發布了基于Azure Sphere及ROOBO嵌入式語音芯片的家電物聯網模塊,該解決方案支持通過多達400種離線語音指令控制家用電器,能為智能樓宇、智慧工廠等環境種的麥克風的終端設備提供隱私安全保護。我們期待和更多的深圳廠商開發Azure Sphere的合作方案。
人工智能落地應用加速:
全球首創Azure智能會議系統+IoT Edge 的視覺人工智能開發工具包
微軟作為智能語音行業的領先企業之一,認為中國當前技術下的語音識別效果還遠沒有達到理想水平,微軟結合硬件技術合作伙伴有望借助技術優勢撬動市場。
黃學東表示,微軟在文本到語音合成方面達到了一個新的里程碑,利用深度神經網絡,使計算機合成的聲音幾乎與真人的錄音無法區分。微軟和儒波斯和簽訂了人工智能戰略合作備忘錄。
微軟在現場展示了“黑塔”全球首創的人工智能會議系統,這款由Azure人工智能驅動的邊緣設備,能同時追蹤、記錄多人會議的語音和圖像,對每個人發言進行文字記錄,從中提取要點議題并生成會議紀要。
據悉與微軟合作開發這一系統的儒博(ROOBO)宣布與微軟達成戰略合作,將成為微軟智能語音轉錄服務于定制文本到語音服務的合作伙伴,將儒博在智能硬件開發于平臺運維上的優勢,和微軟在人工智能與服務上的先進技術結合,共同開發和拓展智能語音在物聯網、智能邊緣、智能家庭、智能教育等領域的應用前景。
在這次大會上,微軟和儒博向行業展示了搭載Azure Sphere安全方案的語音模組,該產品搭載雙方自主研發的芯片,在保證物聯網設備安全的前提下,滿足端到云的物聯網安全解決方案,實現在低功耗下物聯網設備的離線、在線語音控制,完成IoT場景下的設備管理、數據管理、安全管理及設備升級服務。
在全球各地,各種智能設備正快速涌現在家庭和商業場合中,預計到2020年,其總數將超過200億臺。這些設備將非常智能,甚至無需一直連接到云端,就能具備看、聽、推理、預測的能力。對于智能邊緣計算,微軟已經高通的合作,打造運行 Azure IoT Edge 的視覺人工智能開發工具包。這一解決方案將為開發基于攝像頭的物聯網解決方案提供關鍵的硬件和軟件支持。
開發者可以利用 Azure 機器學習服務及高通視覺智能平臺與高通人工智能引擎的硬件加速開發應用解決方案。攝像頭也可以用于更高級的 Azure 服務,例如機器學習、流分析和認知服務,并且可以從云端下載到邊緣環境中在本地運行。
通過近二十年的高強度研發投入,微軟在很多人工智能落地的關鍵賽道上已經探索形成了一些明確的產品,下一步就是這些產品怎么規模化和釋放利潤的問題。我們從微軟這次全球大會上看到的是人工智能加上物聯網賦能多場景應用的前景,但落地到底如何,還有待市場和客戶的檢驗。