亞馬遜網絡服務(AWS)周三推出了一系列機器學習服務,希望讓客戶更加容易地將人工智能融入自己的應用。其中一項服務可以進行視頻分析,還有一個三件套語言理解API,能夠自動進行轉錄、翻譯和文本處理。
這些工具是為了方便客戶享受到機器學習帶來的好處,而不必掌握自主構建系統的專業知識。亞馬遜之前已經為客戶提供一些預制人工智能功能,包括Lex語言理解服務、Polly語音合成服務和Rekognition圖像識別服務。
AWS此舉是為了追趕微軟和谷歌等競爭對手,后者已經提供了類似的服務,而且也可以為用戶提供云計算服務。
新的Rekognition視頻服務將幫助用戶自動分析云端腳本,以便探測重要的物體、情緒、明星等信息,此外還可以提供一些信息,方便計算機程序追蹤人們在場景中的位置。
為了幫助客戶獲得所有相關視頻信息,AWS還發布了Kinesis Video Streams,這項服務可以幫助客戶安全地吸收和存儲視頻、音頻及其他時間編碼數據。
此前大約一周,AWS宣布對Rekognition服務進行更新,可以在人群中識別人臉,另外還可以實現實時人臉匹配。
新的Transcribe功能則可以自動轉錄唱片語音。它可以處理高質量的錄音文件和電話錄音。該服務最初支持英語和西班牙語,今后還有可能支持其他語言。
Transcribe與其他語音識別服務的差異在于,它的重點是生成帶有時間戳的文本,而且能夠使用機器學習自動增加標點符號,方便人類閱讀。
借助最新的Translate服務,客戶還可以對他們存儲在AWS的文本進行翻譯。AWS同時還推出了一項服務,讓應用可以更加深入地理解他們獲取的內容:這項名為Comprehend的服務可以提取人員和地點等實體以及關鍵語句,此外還包括用戶對文本內容的感受有多么積極。
雖然聽起來不算技術突破,但這類信息卻可以用于對本來難于處理的文件進行分類,這一直都是電腦面臨的一大難題。
這些內容都是AWS re:Invent大會的一部分。該公司當天早些時候還宣布了新的SageMaker服務,方便開發者在缺乏專業知識的情況下開發定制自己的機器學習模型。