蘇馳認為,雖然AI在提高人工圖片審核效率、準確度方面有著得天獨厚的優勢,但在內容服務場景中應用還處在行業前沿。一方面是AI廠商對企業內容服務的需求把握不足,另一方面是AI算法在實際落地中還存在一定的技術挑戰。不過,金山云通過發揮在大數據和資源方面的優勢,結合AI在圖像分類和視頻理解上的關鍵技術,率先推出了金山云金睛一站式內容服務平臺。它克服了AI算法面臨的一系列難題,在有效滿足內容服務場景的同時,對提高監管效率和企業運營效率,加速內容服務產業的升級發揮重要作用。
金山云首席算法工程師蘇馳博士在infocomm會議現場演講
基于AI的“安全+理解”兩大方案 解決內容服務核心問題
蘇馳認為,內容服務產業有兩大核心需求,一是內容安全,二是內容理解。前者是內容生產企業的生死線,是國家監管紅線。而內容理解上的技術突破,則可以幫助企業更全面系統地了解自身和用戶產生的數據,從而提高內容運營和管理水平。
在內容安全方面,傳統方式是采用人工審核,效率低下,并且不容易及時發現偽裝的多媒體內容)。金山云一站式安全解決方案融合了云計算和AI能力,可對包括文本、語音、圖片和視頻等多媒體內容進行監管。 比如,在文字方面,針對直播彈幕、UGC評論、網絡文學等多種網絡文字傳播場景,金山云金睛可以基于語義分析和深度識別引擎,進行多重防護,準確識別垃圾文本;在圖片方面,金山云金睛可對超過80種低俗場景、1200個以上敏感人物和多達200種以上的違規場景進行識別和審核,并且,基于OCR識別,金睛可以通過文字檢測,再通過文字識別算法把敏感詞過濾,將違規與否的信息反饋給客戶。
此外,金山云金睛還可應用到更廣闊的場景中,以直播場景中主播為例,除了有人臉識別外,還提供基于聲紋識別和音轉文兩種模式的音頻監管服務。目前,這些包括標簽、內容識別、圖片編輯在內的服務,形成了一套從識別到送審的智慧廣電方案。 “AI很顯然提高了人工審核的效率,但是我們也會根據客戶需求,以人機協同的方式進一步提高效率。”蘇馳表示。
如果說內容安全解決了企業的基本安全乃至生存問題,那內容理解則涵蓋了更廣泛的應用場景,可以助力企業的進一步發展。 目前,金山云金睛可以對直播、游戲、秀場、短視頻中的內容進行理解,判斷出關鍵事件,視頻類型、風格、場景并識別視頻中的物體等,從而幫助內容生產企業提升內容分發管理效率,便于個性化推薦和精準的廣告推薦。
“圖像分類+視頻理解”升級AI能力 打造內容服務關鍵技術
眾所周知,AI可以在內容識別、內容理解上帶來比人工審核更高的效率。但在實際應用過程中,AI算法常會遇到一些現實存在的問題影響其在內容服務領域作用的發揮。比如,在圖像分類時,AI算法會遇到數據非均衡、標簽規則不統一、場景千變萬化、類型復雜多樣等難題;在視頻理解中,單模態理解會帶來相似圖像造成誤判、脫離場景判斷內容、單感官認知等問題。為此,金山云推出圖像分類和多模態信息融合的視頻理解關鍵技術,幫助AI更好的應用在內容服務領域。
蘇馳介紹到,金山云圖像分類服務中,通過采用級聯模型進行逐層過濾的方式,解決了輕網絡和復雜網絡環境下,計算速度和處理效果不一致帶來的數據非均衡問題;與此同時,采用底層細粒度標簽進行預測,上層動態可調整標簽映射規則的方式,解決了由于客戶對圖像的評判規則的差異及場景不同帶來的標簽不統一問題。
“顯然,不同于靜態圖像,我們的生活是現實世界中一系列隨著時間變化的動態事件組成的)。就好像一個視頻不僅是一系列孤立的靜態圖像幀組成的,它是有時序的,是有上下文信息的,還有音頻,甚至還有文字”蘇馳說道。“基于此,金山云金睛在單模態識別的基礎上,將視頻理解技術升級為多模態融合理解技術。
據了解,多模態融合理解技術是金睛AI算法團隊通過訓練超千萬個高質量的短視頻,得到的具有很強的泛化能力的內容理解模型和背后的金山云金睛時序算法專利。它可以對視頻內容進行精準的場景識別、對象跟蹤、行為理解、圖文聯想等。在視頻內容的生產過程中,它可以實現智能BGM功能,根據視頻內容自動推薦背景音樂,還可支持視頻特效功能,指定視頻場景或者動作,給出視頻特效等。
核心需求的把握,關鍵技術的研發,高精度的識別率,全維度的解決方案,以及海量數據庫、針對各個客戶的個性化分析和定制能力,使得金山云金睛一站式內容服務平臺可以全方面滿足客戶需求。蘇馳表示,金山云金睛是目前行業中為數不多的,將AI技術實現落地的企業。未來,金山云金睛將持續強化AI和大數據等新技術的融合,提升服務水平,借助高科技力量,助力內容服務企業加速升級,全面擁抱5G時代!