與其他基于云的產品一樣,Azure中的認知服務讓企業用戶能夠更容易地使用AI服務。但是,其價格和整合仍然是一大挑戰。
在企業用戶中,云服務是AI應用的一個關鍵推手。對于Azure用戶來說,一套被稱為微軟認知服務的產品正是發揮著這樣的作用。
對于企業用戶而言,人工智能即服務讓他們能夠較容易地使用上執行機器學習和深度學習等算法的應用,且無需購買和建設用于執行算法的昂貴定制基礎設施。它還允許開發人員使用相同的后端代碼為Windows、iOS、Android和瀏覽器客戶端提供AI功能。
大多數的主流云供應商們都提供了一套基于AI的功能集(并在不斷完善之),而微軟認知服務則是目前最大的功能集之一。以下簡單列舉了其主要功能以及與其他Azure服務和應用場景的集成選項。
微軟認知服務組合有哪些內容?
與大多數AI產品類似,微軟認知服務主要關注圖像、語音、語言和非結構化數據分析。其產品組合擁有著超過二十個以上的服務,相關API和軟件開發者工具包(SDK)可分為六類:
視覺:圖像分析、對象識別和面部識別等功能;語音:轉錄口語和不同語種的文本翻譯;語言:分析自然語言的服務,具體包括拼寫檢查、情緒分析以及對元數據和邏輯部分或斷句的解析文本;知識:分析和映射數據的功能,以求發現諸如推薦或查詢自動完成等任務的關系與模式;搜索:與Bing搜索引擎集成的服務,包括圖像與新聞搜索API;以及實驗室:仍處于開發階段的各種實驗性服務,具體包括基于手勢的控制、地圖路線規劃與物流、路線與距離優化以及基于位置的分析。企業應用與應用程序與那些模擬企業用戶現有IT功能的眾多云服務(例如計算實例、對象存儲與數據庫)不同,微軟認知服務旨在實現全新的應用類型,而不是使用現有的。其中大多數的服務涉及了對之前難以處理的數據類型的分析,例如照片、視頻、語音、位置和非結構化文本等。因此,人工智能和機器學習的應用場景高度依賴于企業用戶的經營業務、其可用數據源以及其員工的創造性。
微軟認知服務的一些企業應用示例包括:
一家荷蘭家具企業使用建議API來為客戶提供建議,例如經常一起購買的商品或基于過去訂單歷史的建議。一家企業使用微軟的計算機視覺、人臉與表情API在各種不同的非結構化內容(包括文本、圖像和視頻等)中自動提取元數據。這家企業可以通過掃描視頻來識別出每個人臉所表現出的情緒,然后為其打上標簽,如幸福、悲傷或驚訝等。Uber使用人臉API來驗證駕車司機與帳戶登記的注冊司機是否是同一人。正如這些應用示例所示,銷售支持、客戶關系管理、安全、對話UI和圖像/視頻分析是微軟認知服務的主要應用領域。
學習曲線與潛在挑戰對于已經非常熟悉云應用開發的開發人員來說,微軟認知服務的學習曲線是很短的;而那些不了解云應用開發的員工也只需很少的編碼就可以實現認知服務與Azure Logic Apps的集成。
但是,這些服務不是沒有其挑戰的。例如,很難將基于云的應用與內部數據源相連,無論這些數據源是駐留在中心數據庫內還是分布在遠程系統和末端傳感器上。在部署生產AI應用之前,應實施混合網絡和數據集成策略。開發人員還應當使用微軟的免費服務層來進一步熟悉AI服務、API和SDK,從而開發和測試應用程序。
定價與可用性微軟公司通常會根據每月每個服務的API調用次數來為其認知服務定價。但是,鑒于服務的多樣性以及企業用戶的使用方式,其定價可能會令人困惑,特別是因為有幾種定價模式都在并行使用:
表情、人臉、語言智能服務、Bing“語音-文本”和Bing“文本-語音”API 的定價都是按照每千次生產API事務調用來計算的,與開發/測試定價層不同,有限次的(通常為1千次)API事務調用是免費使用的。 Bing Long Form Speech API服務則是按照語音分析的單位時間(按分鐘分攤)來計算的。建議和文本分析API是根據四個層次設定API事務調用數量的固定價格來收費,超出配額部分需超額收費。企業用戶可以通過免費層來測俄式這些服務,免費層為用戶每月都提供了一定有限數量的API事務調用次數,其中超出限量將限制使用,不收取超額費用。使用Azure的在線定價計算器可根據特定應用程序需求來估算費用。
目前,微軟認知服務僅在Azur眾多區域中的一小部分中可用。大部分服務站美國西部或者在不依賴數據中心的區域可用。在西中部和東二美國區域以及西歐和東南亞,其中部分服務可用。