亞馬遜在最近的一篇博文中宣布了Rekognition Service新增的三項新特性。這些新特性可用于識別圖像中的文本、最多可從一張圖片中識別出一百張人臉,以及基于上千萬張人臉進行實時臉部識別。
亞馬遜在re:Invent 2016大會上推出了Rekognition,開發人員因此可以在他們的應用中加入圖片分析功能。后來,亞馬遜在這方面又投入更多資源推出新的特性。Pinterest是Rekognition的早期用戶之一,Pinterest CTO Vanja Josifovski說:
作為一個以視覺為驅動的平臺,Pinterest高度依賴圖像處理的速度和質量,而圖像中的文本也同樣重要,因為它們提供了重要的上下文信息,對于我們的兩億活躍用戶來說至關重要。借助Rekognition的文本識別能力,我們能夠更好地從存儲在S3上的大規模圖片中抽取文本。我們期待繼續與AWS合作,為我們的用戶提供更高質量的服務和更好的體驗。Web和移動開發者媒體管理平臺Cloudinary已經將Rekognition的新特性用到他們的服務當中。Cloudinary的業務拓展副總裁Daniel Amitai說:
Cloudinary與AWS緊密合作,促進這項解決方案的落地。我們與Rekognition的集成讓這項工作取得長足的進步,省去了手動分析圖片內容的枯燥工作,讓用戶可以自動地對圖片進行分類。
Rekognition API提供了一些操作用于臉部識別和圖像分析:
DetectFaces——最多可從一張圖片中識別出一百張人臉,并提供每張人臉的相關細節,如年齡范圍、性別和表情。CompareFaces——用于比對臉部特征??梢詫斎雸D像與目標圖像中的人臉進行比對,最多可以支持單張圖像中最大的一百張人臉比對。DetectText——檢測和抽取圖像中的文本,文本以元素數組的方式返回。RecognizeCelebrities——識別圖像中的名人,最多支持一百個。識別結果中包含名人的細節信息,如名字、URL鏈接和匹配指數。用戶可以登錄AWS體驗這組API。
開發者可以使用這組API對上傳到S3的對象或字節數組進行分析。Rekognition支持JPEG和PNG格式的圖片,如果是S3對象,最大可以達到15MB,如果是字節數組,最大可以達到5MB。Rekognition API支持Java、.NET和Python,目前在美國和歐洲可用,官網給出了定價細節。
亞馬遜、谷歌和微軟在AI產品方面展開競爭,希望為自己的平臺帶來更多的用戶。微軟的Cognitive Service提供了超過25組API,包括Emotion API和Computer Vision API,它們都具備圖片和人臉分析能力。谷歌推出了Vision API,可以檢測圖片中的物體和人臉。谷歌和微軟比亞馬遜要早走一步,而現在亞馬遜也迎頭追擊。Investopedia的一篇文章中寫道:
亞馬遜的頹勢在于AI應用的開發,AI應用可以助力云計算用戶的數據分析、語音識別和圖像識別。雖然亞馬遜仍然是云計算的市場領頭羊,但微軟和谷歌正通過推出AI產品來縮小差距,為用戶提供更多的選擇。
查看英文原文:Amazon Adds New Features to Its Rekognition Service