Facebook 認識到圖像是一種維持自己18.6億用戶保持活躍的生命力。Facebook 用戶每年分享數十億的嬰兒、寵物、假期以及其他事物的照片。這就使得公司必須要開發出能夠搜索到最相似的圖像的技術,這樣用戶就能輕松找到朋友、親人或愛人經常分享的圖片。
近日,Facebook 宣布了一系列人工智能上的創新,它認為這將改善用戶體驗。這方面的技術突破,使它的人工智能系統能夠在像素級別上對圖像進行理解。
新的人工智能在兩個方面帶來了精彩的成果:
首先是一套新的圖像分類功能,可以向視力受損的用戶說明照片中的動內容這在以前是不可想象的。
第二,系統可以允許用戶在照片沒有被任何文本標記和注釋的情況下,基于關鍵詞找到他們的朋友或家庭成員共享的照片。
人工智能是Facebook的重要努力成果
Facebook 認為人工智能可以作為重點跨越自己的許多(甚至可能是全部)主要服務來傳遞最相關的內容。Facebook希望自己能夠像在社交網絡和即時通訊中一樣,在人工智能和機器學習中占據主導地位,并且在該領域專門組織了超過150人的團隊。近年來,Facebook在增強人工智能和機器學習處理能力的研究投資增加了三倍——盡管它沒有公開這筆投資的具體數額。
當然,Facebook并不是唯一一個在這一技術上努力的公司。每個主要的技術公司都在人工智能方面進行了大量投資,因為該技術被視為下一個計算時代的基礎。英偉達公司的首席執行官黃仁勛在去年接受Fast Company采訪時表示:“這是近20年來最重要的計算的發展, Facebook和其他人將不得不為了確保人工智能的的核心競爭力而展開競爭。”
在關于發展新技術的博客文章中,Facebook的機器學習應用小組的負責人Joaquin Candela指出,在線搜索,即使是針對圖像的搜索,在傳統上都需要解析文本,而圖像通常只有在被標簽或字幕正確標記的情況下才能被正確搜索到。
“改變正在發生,因為我們已經將計算機視覺推動到下一個階段,目標是在像素級別上理解圖像,” Candela寫道,“這有助于我們的系統完成諸如識別圖像中的內容、場景類型是否是一個著名地標等事務。這反過來又幫助我們更好地向視力殘障人士描述照片,并為帶有圖像和視頻的帖子提供更好的搜索結果。”
無障礙環境自2011年以來一直是Facebook的工作重心,其目的在于改善視覺或聽力受損用戶參與服務互動的方式。
利用人工智能來豐富盲人用戶的體驗
2015年,Facebook開始利用人工智能來豐富盲人用戶體驗。它設計了一種算法,能夠自動將某些照片和視頻轉換為口頭詞句,讓那些有視力障礙的的對象也能了解他們從來不能看的帖子。
使用該系統,屏幕閱讀器可以告訴用戶一幅日落的照片中包含著諸如自然、室外、云、草、地平線、植物或樹木等元素。
但是現在,新的圖像分類系統可以在它的描述中添加動作,比如“人在走路”、“人在騎馬”、“人在跳舞”、“人在彈奏樂器”,等等。
通過建立基于130000個人工標記照片的機器學習模型,可以無縫推斷照片中的人的行為,Candela寫道。
第二個主要創新是一個搜索系統,基于圖像識別技術能夠過濾掉大量不相關的照片,并且以盡可能最快的方式找到最相關的結果。比如說,只要在搜索框輸入“黑色襯衫”,就能找到沒有被文本標記的黑色襯衫的圖片。
這對于看到過某人或某物的照片,但不知道照片來自哪里的用戶而言是有價值的,特別是在所需的照片沒有標簽或標題的情況下。
最后,雖然今天取得的這些進步令人印象深刻,Facebook很清楚目前仍然處于應用人工智能進行圖片搜索和無障礙化的早期階段。
“這些新的進展十分顯著,” Candela寫道,“我們的面前是一條漫長而激動人心的道路,而我們僅僅抓住了可能在將來引起變革的事物的表面。”
翻譯來自:蟲洞翻翻 譯者ID:锎-252
Facebook 認識到圖像是一種維持自己18.6億用戶保持活躍的生命力。Facebook 用戶每年分享數十億的嬰兒、寵物、假期以及其他事物的照片。這就使得公司必須要開發出能夠搜索到最相似的圖像的技術,這樣用戶就能輕松找到朋友、親人或愛人經常分享的圖片。
近日,Facebook 宣布了一系列人工智能上的創新,它認為這將改善用戶體驗。這方面的技術突破,使它的人工智能系統能夠在像素級別上對圖像進行理解。
新的人工智能在兩個方面帶來了精彩的成果:
首先是一套新的圖像分類功能,可以向視力受損的用戶說明照片中的動內容這在以前是不可想象的。
第二,系統可以允許用戶在照片沒有被任何文本標記和注釋的情況下,基于關鍵詞找到他們的朋友或家庭成員共享的照片。
人工智能是Facebook的重要努力成果
Facebook 認為人工智能可以作為重點跨越自己的許多(甚至可能是全部)主要服務來傳遞最相關的內容。Facebook希望自己能夠像在社交網絡和即時通訊中一樣,在人工智能和機器學習中占據主導地位,并且在該領域專門組織了超過150人的團隊。近年來,Facebook在增強人工智能和機器學習處理能力的研究投資增加了三倍——盡管它沒有公開這筆投資的具體數額。
當然,Facebook并不是唯一一個在這一技術上努力的公司。每個主要的技術公司都在人工智能方面進行了大量投資,因為該技術被視為下一個計算時代的基礎。英偉達公司的首席執行官黃仁勛在去年接受Fast Company采訪時表示:“這是近20年來最重要的計算的發展,Facebook和其他人將不得不為了確保人工智能的的核心競爭力而展開競爭。”
在關于發展新技術的博客文章中,Facebook的機器學習應用小組的負責人Joaquin Candela指出,在線搜索,即使是針對圖像的搜索,在傳統上都需要解析文本,而圖像通常只有在被標簽或字幕正確標記的情況下才能被正確搜索到。
“改變正在發生,因為我們已經將計算機視覺推動到下一個階段,目標是在像素級別上理解圖像,” Candela寫道,“這有助于我們的系統完成諸如識別圖像中的內容、場景類型是否是一個著名地標等事務。這反過來又幫助我們更好地向視力殘障人士描述照片,并為帶有圖像和視頻的帖子提供更好的搜索結果。”
無障礙環境自2011年以來一直是Facebook的工作重心,其目的在于改善視覺或聽力受損用戶參與服務互動的方式。
利用人工智能來豐富盲人用戶的體驗
2015年,Facebook開始利用人工智能來豐富盲人用戶體驗。它設計了一種算法,能夠自動將某些照片和視頻轉換為口頭詞句,讓那些有視力障礙的的對象也能了解他們從來不能看的帖子。
使用該系統,屏幕閱讀器可以告訴用戶一幅日落的照片中包含著諸如自然、室外、云、草、地平線、植物或樹木等元素。
但是現在,新的圖像分類系統可以在它的描述中添加動作,比如“人在走路”、“人在騎馬”、“人在跳舞”、“人在彈奏樂器”,等等。
通過建立基于130000個人工標記照片的機器學習模型,可以無縫推斷照片中的人的行為,Candela寫道。
第二個主要創新是一個搜索系統,基于圖像識別技術能夠過濾掉大量不相關的照片,并且以盡可能最快的方式找到最相關的結果。比如說,只要在搜索框輸入“黑色襯衫”,就能找到沒有被文本標記的黑色襯衫的圖片。
這對于看到過某人或某物的照片,但不知道照片來自哪里的用戶而言是有價值的,特別是在所需的照片沒有標簽或標題的情況下。
最后,雖然今天取得的這些進步令人印象深刻,Facebook很清楚目前仍然處于應用人工智能進行圖片搜索和無障礙化的早期階段。
“這些新的進展十分顯著,” Candela寫道,“我們的面前是一條漫長而激動人心的道路,而我們僅僅抓住了可能在將來引起變革的事物的表面。”
翻譯來自:蟲洞翻翻 譯者ID:锎-252