智能播報持久穩(wěn)定
新鮮出爐的新華社“AI合成主播”成為關(guān)注的焦點(diǎn),以后在電視機(jī)中能常常看到人工智能打造的“主持人”主持節(jié)目、播報新聞,也是一個值得暢想的未來。
“AI合成主播”通過提取真人主播新聞播報視頻中的聲音、唇形、表情動作等特征,運(yùn)用語音、唇形、表情合成以及深度學(xué)習(xí)等技術(shù)聯(lián)合建模訓(xùn)練而成。該項(xiàng)技術(shù)能夠?qū)⑺斎氲闹杏⑽奈谋咀詣由上鄳?yīng)內(nèi)容的視頻,并確保視頻中音頻和表情、唇動保持自然一致,展現(xiàn)與真人主播無異的信息傳達(dá)效果。
《中國新聞出版廣電報》記者登錄新華社客戶端、新華社微信公眾號、中國新華新聞電視網(wǎng)、新華視點(diǎn)微博等,都看到了這位“AI合成主播”的身影,在“AI合成主播”11月25日播報的《國臺辦發(fā)言人:團(tuán)結(jié)廣大臺灣同胞,走兩岸關(guān)系和平發(fā)展道路》《中國香港古董車滇越行在越南舉行》等新聞中看到,它不僅能用真人一樣的聲音進(jìn)行播報,同時連面部表情和唇形也可以做到十分吻合。科大訊飛聽見科技媒體行業(yè)總監(jiān)趙星說:“播音員需要30分鐘錄制的內(nèi)容,機(jī)器轉(zhuǎn)換秒級即可完成。主播聲音可能會受到身體情況的影響,但是機(jī)器可以更持久穩(wěn)定。”
南方財經(jīng)全媒體集團(tuán)在今年3月推出了人工智能語音主持人,通過語音模擬技術(shù),合成節(jié)目主持人俎江濤的虛擬聲音進(jìn)行新聞信息播報。南方財經(jīng)全媒體集團(tuán)總編輯、廣東廣播電視臺副總編輯趙隨意說:“人工智能已經(jīng)成為引領(lǐng)技術(shù)變革的下一個風(fēng)口。我們使用人工智能自動化生產(chǎn)和播報財經(jīng)新聞,既可以提高報道的及時性、準(zhǔn)確性,避免人為因素造成的差錯,又可以將采編一線人員從簡單重復(fù)繁雜的動態(tài)新聞采訪和編播工作中解放出來,將更多的人力和精力投入到深度報道、數(shù)據(jù)分析、趨勢研判等創(chuàng)造性工作之中,加快媒體智庫化、產(chǎn)業(yè)化轉(zhuǎn)型的步伐。”
人工智能不僅能智能主播,還能智能配音。趙星舉例,今年年初,在中央電視臺紀(jì)錄頻道播出的紀(jì)錄片《創(chuàng)新中國》,就是利用人工智能模擬人聲完成配音的大型紀(jì)錄片。節(jié)目解說部分全程運(yùn)用人工智能配音,已逝“配音大師”李易的聲音在信息技術(shù)的支持下得以“重現(xiàn)”。
重新定義大屏交互
隨著大視頻趨勢的發(fā)展和視頻內(nèi)容資源爆炸式的增長,傳統(tǒng)的遙控器很難滿足人們對電視的使用需求,因此語音為主的智能搜索和智能互動正在迅速崛起。
騰訊科技(深圳)有限公司云業(yè)務(wù)拓展部媒體行業(yè)商業(yè)化總經(jīng)理姚慶輝說:“人臉識別技術(shù)、語音交互技術(shù)正在重新定義大屏交互。”人工智能電視機(jī)可以通過傳感器接收用戶指令,依靠基礎(chǔ)應(yīng)用和基礎(chǔ)數(shù)據(jù)平臺識別并理解用戶目的,做出反饋和處理。同時依托完善的技術(shù)邏輯和大數(shù)據(jù)運(yùn)營,結(jié)合深度學(xué)習(xí)算法,分析用戶使用習(xí)慣,掌握用戶偏好和行為邏輯,以實(shí)現(xiàn)更精準(zhǔn)的交互及個性化內(nèi)容推薦。
很多電視廠商接連推出了人工智能產(chǎn)品,TCL推出了人工智能伙伴小T可以進(jìn)行英語翻譯,能夠輕松進(jìn)行匯率計算,還能訂餐、買票。微鯨電視推出了微鯨智能語音電視2.0產(chǎn)品,微鯨語音操控除了能識別普通話、四川話、廣東話等多個語系,提供內(nèi)容搜索、播控指令、查詢天氣、頁面操控等基礎(chǔ)功能外,還滿足用戶查詢股票、定鬧鐘、語音彈幕、語音聊天等需求,甚至是背古詩、講笑話等互動。
就目前的形勢來看,人工智能電視和智能化視頻制作異常火爆,但要想讓人工智能在實(shí)際體驗(yàn)上得到完美呈現(xiàn),還需要一個循序漸進(jìn)的過程。殷澤祥說:“成為智能中心是電視的正確定位,但整個電視行業(yè)還未對此形成標(biāo)準(zhǔn),用戶習(xí)慣沒有養(yǎng)成,各家產(chǎn)品的表現(xiàn)參差不齊,產(chǎn)品同質(zhì)化較高,能力下沉還有空間。如何讓電視真正讀懂人心還有很長的一段路要走,不過,智能大屏的未來一定值得期待。”
提高內(nèi)容生產(chǎn)效率
不僅電視變得智能,人們觀看的視頻在制作的過程中也越來越智能。人工智能進(jìn)入視頻內(nèi)容生產(chǎn)領(lǐng)域后,豐富了視頻內(nèi)容產(chǎn)業(yè)的生產(chǎn)方式,提高視頻內(nèi)容生產(chǎn)效率,降低了視頻內(nèi)容生產(chǎn)成本。
智能化視頻制作技術(shù)的應(yīng)用,在趙隨意看來主要包括3個部分:內(nèi)容分析——用戶輸入一篇文章、一個鏈接或者一個關(guān)鍵詞后,系統(tǒng)會自動將相關(guān)新聞內(nèi)容拆解為一個個內(nèi)容片斷。素材推薦——通過人工智能服務(wù),場景分析,依據(jù)內(nèi)容片斷自動推薦對應(yīng)的圖像內(nèi)容、視頻內(nèi)容、文本內(nèi)容。自動合成——通過視頻合成技術(shù),配以人工智能合成的語音系統(tǒng),直接向用戶提供多個版本的視頻,交由用戶選擇、確認(rèn)。
這些技術(shù)的應(yīng)用,都會對電視生態(tài)產(chǎn)生巨大的影響。上海廣播電視臺技術(shù)運(yùn)營中心副總工程師邵勇說:“原先需要投入大量能力進(jìn)行內(nèi)容分層描述的工作,逐漸開始變?yōu)樽詣踊墓ぷ鳎煞e累形成生產(chǎn)制作環(huán)節(jié)的傳媒大數(shù)據(jù),構(gòu)成新型廣電媒資生產(chǎn)管理平臺。”