視頻云服務(wù)在其中功不可沒,其不斷降低移動視頻的準(zhǔn)入門檻,讓視頻與各行各業(yè)的融合成為常態(tài)。與此同時,隨著移動終端的升級和網(wǎng)絡(luò)環(huán)境的改變,用戶對視頻的上傳和播放提出了更高要求,產(chǎn)生了新的痛點(diǎn)。對此,在最近的LiveVideoStackCon 2018音視頻技術(shù)大會上,金山云高級總監(jiān)武愛敏發(fā)表主題演講,與聽眾分享了目前如火如荼的人工智能技術(shù),是如何為金山云的視頻云服務(wù)賦能,解決視頻行業(yè)痛點(diǎn)的。
金山云高級總監(jiān)武愛敏發(fā)表主題演講
人工智能:破除視頻業(yè)痛點(diǎn)的利器
視頻行業(yè)的繁榮,催生了專業(yè)化的服務(wù),云服務(wù)商的入場就是典型的例子。從早期的存儲、CDN,到現(xiàn)在的大數(shù)據(jù)、人工智能,服務(wù)內(nèi)容的多樣化,讓視頻行業(yè)企業(yè)專注于自身的核心業(yè)務(wù),更加靈活地應(yīng)對行業(yè)變化。
但這并不代表視頻行業(yè)可高枕無憂,行業(yè)的三個痛點(diǎn)仍然待解。首先,內(nèi)容越來越豐富、清晰度不斷提升,使得用戶對觀看體驗(yàn)的要求近乎無止境,高畫質(zhì)、零卡頓、超低延時、安全穩(wěn)定......有數(shù)據(jù)顯示,遇到視頻播放卡頓或加載時間太長,66%的用戶會直接退出當(dāng)前的播放,嚴(yán)重的卡頓會使用戶的滿意程度從接近滿分跌到幾乎為零。
第二,對于視頻行業(yè)而言,帶寬是無法忽視的問題。昂貴的帶寬費(fèi)用,讓許許多多想在視頻行業(yè)一展拳腳的公司望而卻步,對于視頻行業(yè)巨頭來說,從他們的成本結(jié)構(gòu)中可以看到,帶寬成本如果居高不下,長期處于“燒錢”狀態(tài),也會對他們在行業(yè)中的口碑和地位造成影響。
第三,視頻行業(yè)有著非常豐富的內(nèi)容,但同時也有著內(nèi)容的紅線。為了確保平臺上的內(nèi)容不會出現(xiàn)有害信息,視頻平臺需要對內(nèi)容進(jìn)行嚴(yán)格審核,完善內(nèi)容管控機(jī)制,改善內(nèi)容推薦算法,這也需要耗費(fèi)大量人力成本。
這些痛點(diǎn)需要依靠技術(shù)上的不斷突破才能緩解。“依靠算法、算力和大數(shù)據(jù)支撐的人工智能技術(shù),將成為賦能視頻云、解決視頻行業(yè)客戶痛點(diǎn)的重要工具”,武愛敏表示。
四大黑科技加持金山云集智高清
“一直以來,金山云通過不斷加大人工智能技術(shù)的研發(fā)投入,推動相關(guān)的應(yīng)用不斷落地”,武愛敏介紹了金山云最新推出的集智高清(Kingsoft smart high definition,簡稱KSHD),“集智高清圍繞人眼結(jié)構(gòu)特性,將編碼、圖像處理和人工智能進(jìn)行整合,通過自研算法和深度神經(jīng)網(wǎng)絡(luò),對視頻內(nèi)容進(jìn)行感知,為客戶節(jié)省20%—40%視頻傳輸帶寬,為用戶帶來更好的視覺感受”。
集智高清之所以能夠提升視覺效果,為客戶節(jié)省成本,是因?yàn)橛兴拇蠛诳萍技映郑紫仁菬艄饨!S捎谖覈挠秒婎l率是50Hz,燈光頻閃很難完全避免。人眼的視錐細(xì)胞負(fù)責(zé)感光,視錐細(xì)胞在經(jīng)歷一次刺激之后,無法對二次刺激產(chǎn)生反應(yīng)。
但對室內(nèi)場景來說,多光源的頻閃照射到物體上引起的反射,將會對視頻編碼帶來極大的負(fù)擔(dān)。集智高清的研發(fā)團(tuán)隊(duì)對室內(nèi)光源位置進(jìn)行建模,將人眼感受不到的燈光和反光消除,將紋理保存下來,幫助直播平臺節(jié)省更多帶寬。
第二,畫質(zhì)增強(qiáng)。人眼的視錐細(xì)胞負(fù)責(zé)感受亮視覺,視桿細(xì)胞負(fù)責(zé)感受暗視覺,在明暗轉(zhuǎn)換過程中,細(xì)胞的激活需要時間。針對人眼對光的感受特性,集智高清提供了多種模型進(jìn)行畫質(zhì)增強(qiáng),包括暗場增強(qiáng)、細(xì)節(jié)恢復(fù)、去除拍攝或壓縮產(chǎn)生的噪聲、超分辨率等等,并將最優(yōu)結(jié)果進(jìn)行融合操作,實(shí)現(xiàn)用戶無感知下對各種不同場景的自動應(yīng)對。
第三,視頻聚焦。集智高清的ROI處理技術(shù),可根據(jù)人眼最敏感最關(guān)注的內(nèi)容做視覺感知保護(hù),實(shí)現(xiàn)畫質(zhì)增強(qiáng)的同時節(jié)省至少20%的帶寬。
第四,恰可感知失真。人眼視覺系統(tǒng)能夠適應(yīng)的光強(qiáng)度(朗伯)級別范圍很寬,從暗閾值到強(qiáng)閃光閾值可以達(dá)到10的10次方量級。然而,當(dāng)背景光保持恒定的時候,人眼能夠感受到的范圍是有限的,典型的觀察者可以分辨總共12級到24級的不同光強(qiáng)度變化,而觀察者可以分辨的級數(shù)會根據(jù)其環(huán)境光源強(qiáng)度、高頻/低頻區(qū)域有著很大的差異。通過大量的統(tǒng)計(jì)建模,集智高清集成了最符合人眼視覺系統(tǒng)的恰可感知失真技術(shù),可以做到同畫質(zhì)下節(jié)省5%—25%的碼率。
破除技術(shù)和成本壁壘,更好應(yīng)對需求
有了黑科技的護(hù)持,集智高清在游戲、體育賽事、秀場直播以及VR、短視頻等多種場景和形態(tài)上,有著廣泛的應(yīng)用。在視頻場景識別方面,集智高清針對游戲、新聞、秀場、動漫、體育、短視頻等多種類型內(nèi)容,分別建立視頻模型,以便根據(jù)不同的視頻場景進(jìn)行分類實(shí)時識別,根據(jù)不同場景的識別結(jié)果,配置適合此類場景的編碼參數(shù),根據(jù)紋理和運(yùn)動變化幅度等,選擇最優(yōu)編碼模板參數(shù)。
在視頻場景分類上,集智高清通過深度學(xué)習(xí),形成了十余大類,幾十種小類視頻場景模型庫。客戶在使用集智高清服務(wù)時,可實(shí)時分析直播流,匹配相應(yīng)的視頻場景模型,根據(jù)客戶對視頻畫質(zhì)的要求,對畫質(zhì)進(jìn)行實(shí)時處理。
“我們希望集智高清能夠成為視頻行業(yè)的加速器,為客戶的業(yè)務(wù)創(chuàng)新和行業(yè)的技術(shù)演進(jìn)貢獻(xiàn)力量”,武愛敏表示,視頻云服務(wù)受到移動視頻行業(yè)的驅(qū)動,但是反過來也能促進(jìn)移動視頻行業(yè)的繁榮,金山云作為視頻云服務(wù)的領(lǐng)軍企業(yè),將幫助客戶更好應(yīng)對移動視頻日益復(fù)雜多樣的場景和需求,破除技術(shù)和成本壁壘,幫助客戶建立競爭優(yōu)勢,為用戶提供更加多元化和個性化的服務(wù)。