眾所周知,計算機視覺、語音交互以及NLP是人工智能的三大核心技術,然而市面上的人工智能解決方案魚龍混雜,此次發布的三款產品已經承受了阿里巴巴集團內部復雜業務場景的挑戰,為行業客戶提供了絕佳的選擇。
拍立淘同款:圖像搜索正式商業化
此次推出的圖像搜索是以深度學習和大規模機器學習技術為核心,通過圖像識別和搜索功能,實現以圖搜圖的智能圖像搜索產品。圖像搜索服務在基于圖像識別技術基礎上,結合不同行業應用和業務場景,幫助用戶實現相同或相似圖片的搜索。
與通用搜索主要依靠字節不同,圖像搜索被主要定義為“以圖搜圖”,可支持以下兩大功能:
商品圖片搜索,通過輸入商品圖片,可以在商品庫中準確地找到圖片中商品的同款或者相似款,返回對應的商品信息;
通用圖片搜索,通過輸入具有相同元素或主體內容的圖片,在海量圖片庫中查找相似或相同的圖片。
據了解,該方案包含了深度學習、圖像識別、支持百億級數據的向量檢索引擎等方面的最新前沿研究成果。
值得一提的是,淘寶拍立淘功能背后采用的就是此圖像搜索技術,并且完美的支持了每天超過千萬的UV。在拍立淘數據庫中有超過 10 億個商品,學界熟知的 ImageNet 數據庫也只保存了 1500 萬張照片,而拍立淘每一天上傳的圖片就超過了這一數字。
智能語音自學習平臺:0基礎訓練人工智能模型
智能語音自學習平臺是一鍵式語音智能自助優化方案,突破了語音識別優化依賴于語音供應商專家服務的局限,可以讓不懂技術的人員從此也可以快速顯著提升自己業務的識別準確率滿足業務需求。
傳統的語音識別優化依賴于語音識別AI科學家來進行,對于很多智能項目的實施而言,這種方式存在幾大難題:首先,項目進展受限于集中在語音供應商的AI科學家資源;其次,后續項目效果優化周期數以周記甚至數以月記,人工智能不再智能。
阿里巴巴機器智能技術實驗室語音智能高級專家周躦表示,“自學習平臺的目的是向沒有專業知識背景的人員提供低門檻甚至零門檻的智能語音優化平臺,使得我們的客戶擺脫對AI科學家的依賴。”
據悉,相關技術已經在智能政務、智能導航、智能催收、智能音響、智能家居、機器人及自動駕駛等領域都有廣泛應用。在今年的云棲大會武漢峰會上,基于相關技術訓練的“AI收銀員”在與真人店員的PK中,在嘈雜環境下準確識別了用戶的語音點單,在短短49秒內點了34杯咖啡。此外,裝備這一技術的自動售票機也已在上海地鐵“上崗”。
機器翻譯:單天翻譯詞超千億
阿里云機器翻譯提供多類的翻譯和語言服務,具有高性能高并發服務、多模態服務等能力,可幫助國際化企業提升業務價值。
據了解,上述機器翻譯平臺已經沉淀了優質的跨境語料數據庫,充分利用先進的機器翻譯算法技術和海量的數據資源,深度打磨機器翻譯質量和產品體驗,并積極拓展機器翻譯業務的產品形態,將各項機器翻譯技術產品化,如語音翻譯、會場同傳、實時溝通等新產品和服務形態。
官方信息顯示,機器翻譯在阿里巴巴內部可以達到每天翻譯出幾十億量級的產品信息,每天的線上翻譯請求到達數億次,在雙11時每秒鐘的翻譯請求大概有幾萬次,每天翻譯的詞語個數超過2000億,而根據Google 2016年披露的數據,其每天翻譯的詞語個數大概是1400多億。
目前該技術已為阿里巴巴集團十幾條業務線提供機器翻譯和本地化支持,覆蓋了Alibaba.com 、 AliExpress 、 Lazada 、釘釘、阿里云、優酷、支付寶、菜鳥、天貓精靈、高德、飛豬等眾多產品。
最全面的人工智能平臺
從行業大趨勢來看,云計算將會是AI最好的落地平臺。阿里云一直致力于推動產業AI的落地,并且擁有從底層硬件基礎設施到行業解決方案的豐富人工智能產品家族,是國內最全的人工智能解決方案商。
從2015年開始,阿里云推出了一系列人工智能產品,例如基于CPU、GPU、FPGA等異構計算平臺,面向開發者的機器學習PAI平臺,以及語音識別、圖像識別、視覺識別等130多款細分產品(印刷文字識別、人臉識別、圖像識別、智能語音交互和自然語言處理等),可以服務300多個不同行業的應用場景。
除上述解決方案之外,阿里云的ET大腦家族也在不斷完善。目前,ET大腦已經覆蓋了城市、工業、零售、金融、汽車、家庭等多個場景。其中,ET工業大腦已經幫助工業制造企業創造利潤數十億,ET城市大腦支持了杭州、澳門、吉隆坡等城市進行智能化升級。