Facebook表示它已經建立了一個機器學習模型來檢測潛在的虛假照片或視頻,然后將這些模型發送給其事實檢查員進行審查。第三方事實檢查合作伙伴可以使用視覺驗證技術,包括反向圖像搜索和圖像元數據分析來審查內容。
Facebook打算利用其收集的照片和視頻評論者來提高其機器學習模型的準確性,以檢測這些媒體格式的錯誤信息。
它定義了照片和視頻中的三種錯誤信息,包括:操縱或制作的內容;脫離背景呈現的內容;文字或音頻中的虛假聲明。
Facebook提供了與文本相比識別圖像和視頻內容中的虛假信息的困難的高級概述,以及它用于克服它們的一些技術。但總體而言,人們的印象是,Facebook并沒有接近自動系統來大規模檢測視頻和照片中的錯誤信息。
目前,它正在使用OCR從照片中提取文本,例如照片上的虛假標題,以便將文本與事實檢查員文章的標題進行比較。它還在開發檢測照片或視頻是否被操縱的方法。為此,它使用音頻轉錄來比較它從音頻中提取的文本是否與事實檢查者之前已經揭穿的文本中的聲明匹配。
“目前,我們正在與照片上比我們使用的視頻音頻轉錄使用OCR更先進的,”說的Facebook產品經理泰莎里昂。
與文章一樣,一旦事實檢查人員確認其為假,Facebook將專注于識別虛假視頻和照片的重復。
Lyons表示,Facebook在尋找精確復制的照片方面“相當不錯”,但是當圖像被輕微操縱時,Facebook更難以自動檢測。
“我們需要繼續投資技術,這將有助于我們識別出以微小方式發生變化的非常接近的副本,”里昂斯說。
Lyons表示,檢測某些東西是否脫離背景也是一項重大挑戰。
“了解某些事情是否脫離了背景是我們正在投資的領域,但還有很多工作要做,因為你需要了解媒體的原始背景,媒體呈現的背景,以及是否兩者之間存在差異,“她指出。
照片和視頻內容中的錯誤信息的影響也因國家而異。Facebook已經發現,在美國,大多數人報告看到文章中的錯誤信息,而在印度尼西亞,人們更多地報告在照片中看到的誤導信息。
“在媒體生態系統欠發達或識字率較低的國家,人們可能更有可能在照片上看到錯誤的標題,或看到偽造的照片,并將其解釋為新聞,而在擁有強大新聞生態系統的國家,“新聞”的概念更多地與文章聯系在一起,“里昂說。