今日,Facebook宣布面向盲人和視障用戶推出圖片內容自動描述功能。這個被叫做“文本自動替代(automatic alternative text)”的功能由Facebook已經成立了5年的易用性團隊開發。該團隊由Jeff Wieland領導,在負責這支隊伍之前,他是Facebook產品團隊的用戶研究員。
“文本自動替代”功能現已經在iOS上推出,很快,Android平臺以及網頁版也都會迎來這項功能。這套機器學習技術將利用算法作出預測以實現人工智能的目標。當軟件接收到一張圖片并識別出里邊的對象之后,它會利用iPhone中的VoiceOver告訴目標用戶圖中的內容。雖然這套技術現處在早期開發階段,但它卻能可靠地識別出分類概念對象,如交通(汽車、船、飛機)、自然(雪、海洋、日落)、體育(籃球場)、食物(壽司)。另外,它還能識別人(嬰兒、微笑、胡須)和自拍照。
而Facebook之所以想到利用人工智能技術“閱讀”圖片則是因為其各個平臺上龐大的上傳圖片量。據統計,用戶在Facebook、Instagram、Messenger、WhatsApp每日上傳的圖片數量達到了20億張。
顯然,Facebook并不是唯一一個在做這件事情的公司。像Google Photos、Flickr,它們的技術團隊也有在開發相類似的技術,不過看起來成果并不喜人。去年,谷歌就因為將照片中的兩名黑人標示為大猩猩而遭到來自各方的抨擊,為此,公司公開道歉。而Facebook只會在80%確定的情況下才會對圖片中的對象做標示,并且如果涉及到敏感話題--如上面提到的種族問題--系統對判斷結果的確定比例要求就更高了。這并不是說Facebook對自己的技術感到不自信,它只是不打算陷入更加麻煩的境地。“有些情況下,沒有數據比壞數據來得更好,”Wieland說道。
雖然圖片對象描述技術對于科技公司來說已是陳詞濫調,但Facebook這次是真的把它帶向了用戶。目前,僅支持iOS平臺和英語。雖然現在還有許多對象是Facebook還無法達到80%確定的水平,但它已經在大力推廣兩款新的工具:識別視頻中的對象和“視覺問答”--用戶可以提出跟圖片相關的問題然后從平臺上得到反饋。