阿里云在2017年6月10日的云棲大會·上海峰會上,正式發布了“圖像識別”和“人臉識別”兩項視覺智能服務。
視覺計算是阿里巴巴“NASA”計劃的一部分,“NASA”計劃聚焦于機器學習、芯片、IoT、操作系統、生物識別等核心技術領域,希望解決10年、20年后的挑戰。雖然著眼于解決10年、20年后的挑戰,但每新推出一項智能服務,阿里云都有一本自己的生意經。
智能視覺識別的生意經
在針對的目標市場方向,阿里云表示圖像識別分為生物識別、物體與場景識別、視頻識別等,預計2020年的總市場規模將達到數百億美元,應用領域包括金融、安防、醫療、自動駕駛、手機、工業、娛樂圖片、媒資等。
阿里云強調了其對于三大領域的價值——圖片娛樂、金融和安全監控以及電子商務行業:
對于手機廠商和圖片娛樂業來說,行業現狀為沒有相關的技術儲備或儲備不足,核心需求包括人臉AR、智能相冊管理、圖片安全監控等,阿里云的價值在于高性能底層核心算法;對于金融行業和安全監控行業來說,行業現狀為人工圖像辨別的成本高、支付安全性低,核心需求包括身份識別、人臉支付、敏感圖片識別、客戶行為分析等,阿里云的價值在于降低人工成本、實現智能識別、提高識別準確率、增強安全性等;對于電子商務行業來說,行業現狀為購物場景和體驗單一、人工圖片監控力度弱,核心需求為試妝試戴、電商圖像分析、電商圖像檢索等,阿里云的價值為豐富購物體驗與購物場景、增強圖片安全性等。
與電商、搜索和存儲等緊密結合,阿里云一站式視覺產品服務生態平臺的商業模式為標準化產品收費、定制化方案項目收費、SDK收費以及共建分成等方式。阿里云方面表示,其圖像識別服務面向全球市場,目標客戶包括了行業客戶和行業ISV等。
刷新國際大賽紀錄
在一個月前的5月18日,阿里云的智能視覺識別算法刷新了全球權威機器視覺算法測評平臺KITTI的新紀錄,將該測評的車輛檢測準確率拉升至90.46%。
KITTI是德國卡爾斯魯厄理工學院(Karlsruhe Institute of Technology)和芝加哥豐田技術研究所聯合創辦、目前國際上最大的自動駕駛場景下計算機視覺算法評測數據集,可以用于評測目標(機動車、非機動車、行人等)檢測、目標跟蹤等計算機視覺技術在復雜真實環境下的性能。
在車輛檢測這一競賽項目上,要求參賽計算機視覺算法能檢測出由車載相機所拍攝的車輛以及估算車頭朝向。該測試包含7千多張訓練圖像和7千多張測試圖像,單張圖像上有車輛遮擋等真實場景,檢測挑戰相當大。
本次技術突破是由阿里巴巴iDST視覺計算研究員華先勝領導的團隊完成,他們提出了基于區域融合決策和上下文相關的多任務深度神經網絡,用于復雜場景下的車輛檢測任務,重點解決其中多視角、多姿態以及車輛遮擋等問題。在訓練過程中,還借鑒了GAN(生成對抗網絡)中的對抗訓練模式。
華先勝在云棲大會·上海峰會上表示,當天發布的“圖像識別”和“人臉識別”兩項服務僅是阿里云的智能視覺服務中的一部分技術,在云上已經過很長時間的測試。
華先勝表示已將智能視覺技術集成到阿里云ET當中,阿里云ET的人臉識別技術已經實現了人臉檢測、器官輪廓定位、1對1人臉認證和1對多人臉識別等多個功能。阿里云的視覺識別服務還包括視頻分析、視覺設計、工業診斷、醫療診斷等,將陸續推向市場。
此外,阿里云的智能視覺識別服務還已經在城市大腦中落地。城市大腦是包括阿里云在內的13家企業聯合杭州市政府發起的項目,旨在構建一個城市級的人工智能中樞,其中分析視頻是城市大腦獲取信息的關鍵。以交通治理為例,城市大腦通過普通攝像頭就可以感知復雜路況下車輛的運行狀態和軌跡,對這些數據進行實時分析,并基于此進行多種智能交通優化。
根據阿里巴巴集團公布2017財年(2016年4月1日-2017年3月31日)全年財報,阿里云在該財年營收規模達到66.63億元人民幣,同比上年增長121%,連續兩年實現三位數增長。財報顯示,在2017財年第四季度,阿里云共發布152款新產品和功能,其中包括多項智能解決方案。
在通向智能之路上,阿里云一方面不斷技術突破、推出更多的產品,一方面也源源不斷把新技術和產品轉換成為能產生營收的商業模式。正因為有本“生意經”,才能讓阿里云堅持走在通往智能之路上。(本文首發鈦媒體)