9月24日,聲網(wǎng)在北京舉辦了主題為“AI重塑會議協(xié)作”的產(chǎn)品發(fā)布會,正式發(fā)布了 aPaaS “靈動會議”,該產(chǎn)品通過領(lǐng)先的RTE技術(shù),融合生成式 AI能力重塑會議協(xié)作使用體驗(yàn),為客戶提供低代碼視頻會議平臺,并且采用了多云、多平臺設(shè)計(jì),提供 SFU+MCU 混合架構(gòu)部署能力,支持客戶進(jìn)行靈活部署和擴(kuò)展,全面滿足客戶會議、協(xié)作和調(diào)度需求。
“RTE 技術(shù)確保了低延遲、高質(zhì)量的音視頻傳輸,讓視頻會議溝通更加實(shí)時流暢;而生成式 AI 則通過對會議內(nèi)容的分析和生成,提供智能化的輔助功能,如實(shí)時字幕、AI會議紀(jì)要等。兩大技術(shù)支撐,讓會議從傳統(tǒng)的信息傳輸工具升級為智能協(xié)作平臺,有效提升了會議效率和用戶體驗(yàn)。"聲網(wǎng)數(shù)字化行業(yè)負(fù)責(zé)人和利鵬介紹。
AI 成為下一代視頻會議的新方向
隨著技術(shù)的演變和企業(yè)轉(zhuǎn)型對降本增效的需求,國內(nèi)視頻會議正在發(fā)生三大核心變革:AI賦能,會議向智變;MCU 退場,云會議崛起;以及從會議工具到業(yè)務(wù)能力。
首先是生成式 AI 技術(shù)的快速發(fā)展,會議系統(tǒng)正在經(jīng)歷從“信息通道”向“智能決策引擎”的轉(zhuǎn)變,過去的會議系統(tǒng)只承擔(dān)信息傳遞的功能,而如今,AI 賦能為會議提供了更多智能化的支持。其次,傳統(tǒng)的 MCU 會議系統(tǒng)依賴昂貴的專用硬件,給企業(yè)帶來了高成本的壓力,而云會議系統(tǒng)憑借其靈活、兼容、高效的優(yōu)勢,逐步取代了傳統(tǒng) MCU 系統(tǒng)。
最后,由于企業(yè)數(shù)字化轉(zhuǎn)型的深入,會議系統(tǒng)不再是孤立的工具。企業(yè)需要將會議功能與其現(xiàn)有的業(yè)務(wù)系統(tǒng)深度集成,無論是內(nèi)部協(xié)作、客戶支持還是市場營銷,會議都必須與業(yè)務(wù)流程緊密結(jié)合。
隨著市場的不斷變化,尤其是政企,需要一款能夠滿足云會議架構(gòu)需求、支持業(yè)務(wù)集成的開放API能力,同時具備創(chuàng)新AI引擎架構(gòu)的產(chǎn)品,在此背景下,聲網(wǎng)推出了“靈動會議”aPaaS 產(chǎn)品。
AI+RTE 解鎖全新智能化會議體驗(yàn)
“靈動會議”產(chǎn)品采用RTE Core 和 AI Core 的雙引擎深度融合,能夠靈活適配多種會議場景業(yè)務(wù)需求。
基于聲網(wǎng)自研的AI Agent 框架,“靈動會議”能夠兼容市場上主流的 ASR(自動語音識別)、LLM(大語言模型)和 TTS(文本轉(zhuǎn)語音)技術(shù),具備 Workflow 編排能力。尤其是聲網(wǎng)的 AI 框架支持多模態(tài)大模型的集成,這意味著企業(yè)不僅可以使用單一模型(如語音識別模型),還可以將多模態(tài)的大模型能力(如圖像、音頻、文本處理等)融合到一起,滿足更復(fù)雜的會議場景需求。
同時,通過“靈動會議”產(chǎn)品底層的AI框架,開發(fā)者可以高效地集成會前、會中、會后場景的多種 AI 功能,如AI會議紀(jì)要、實(shí)時翻譯、AI助手等,滿足實(shí)時互動和會議場景的需求。并且,開發(fā)者還能通過“靈動會議”的產(chǎn)品架構(gòu)將這些 AI 功能獨(dú)立對外賦能其他產(chǎn)品,這意味著企業(yè)不僅能在會議場景中實(shí)現(xiàn)智能化升級,還可以通過靈動會議的 RTC 與 SIP 網(wǎng)關(guān)互通功能,應(yīng)用于如 AI 電話客服等場景,大幅降低客服成本,提升運(yùn)營效率。
在集成方式上,“靈動會議”采用aPaaS低代碼設(shè)計(jì),通過提供模塊化的API、UI組件和即插即用的集成功能,使得開發(fā)者可以在較短的時間內(nèi)完成集成,無需進(jìn)行大量的底層開發(fā)。如果UI不能滿足,“靈動會議”還提供多層次API接口與插件機(jī)制,支持基于SDK Core層和 RTE PaaS 層的定制,滿足多場景需求,通過標(biāo)準(zhǔn)的插件機(jī)制,客戶無需依賴原廠即可通過插件實(shí)現(xiàn)自己的會中功能,提升開發(fā)和上線效率。
“通過這些智能化功能的深度結(jié)合,靈動會議為用戶帶來了全新的會議體驗(yàn)。AI 不再是一個單一的工具模塊,而是通過與聲網(wǎng) RTE 平臺的深度融合,真正參與并優(yōu)化會議的各個環(huán)節(jié)。這就是我們所說的AI會議——AI深度嵌入會議流程,重新定義了會議的方式,而不是簡單地為會議提供AI功能的‘會議AI’。”和利鵬表示。
SFU+MCU 混合架構(gòu),支持靈活部署和擴(kuò)展
在傳統(tǒng)企業(yè)數(shù)字化轉(zhuǎn)型時,視頻會議不但要考慮和已有業(yè)務(wù)系統(tǒng)集成和打通,還需要充分利舊傳統(tǒng)會議設(shè)備。當(dāng)企業(yè)已經(jīng)擁有傳統(tǒng) MCU 架構(gòu)時,擴(kuò)展到新的云視頻架構(gòu)的傳統(tǒng)做法是使用視頻網(wǎng)關(guān)將兩種架構(gòu)進(jìn)行轉(zhuǎn)換,但這種方法需要額外的設(shè)備并消耗更多資源。
而“靈動會議”產(chǎn)品提供了最新的解決方案:支持 SFU+MCU 混合架構(gòu)。“MCU 模塊與 SFU 模塊直接集成,拋棄了傳統(tǒng)的網(wǎng)關(guān)架構(gòu),通過裸流通信技術(shù),實(shí)現(xiàn)終端設(shè)備與云端的直接互通,解決了網(wǎng)關(guān)集成時的畫質(zhì)損失問題,并且混合架構(gòu)支持 MCU 上的多個硬件終端與云端 SFU 的軟終端之間的多畫面靈活組合,用戶可以自主選擇多個視頻流進(jìn)行合成,不再局限于畫中畫模式。這一解決方案適用于大規(guī)模會議和復(fù)雜網(wǎng)絡(luò)環(huán)境,幫助企業(yè)實(shí)現(xiàn)音視頻會議系統(tǒng)的全方位升級。”聲網(wǎng)靈動會議技術(shù)負(fù)責(zé)人夏磊介紹。
此外,在部署方式上,“靈動會議”支持多種部署模式,包括私有化、混合云、公有云等,能夠靈活適應(yīng)企業(yè)的不同安全和合規(guī)要求。同時,“靈動會議”還支持混合云和公有云的無縫備份與切換,確保業(yè)務(wù)的連續(xù)性和數(shù)據(jù)的安全性。
音視頻黑科技 提升視頻會議體驗(yàn)
對于如何能保障整體的視頻會議體驗(yàn)?夏磊現(xiàn)場介紹,“靈動會議”依托聲網(wǎng) SD-RTN™ 軟件定義實(shí)時網(wǎng),能做到80% 丟包情況下,音視頻通話流暢,以及極致的抗弱網(wǎng)能力,超低卡頓,國內(nèi)視頻平均卡頓率小于 1.1%,海外視頻平均卡頓率小于 2%,隨時隨地提供高質(zhì)量視頻會議服務(wù)。
不僅如此,聲網(wǎng)的多項(xiàng)音視頻“黑科技”也在刷新視頻會議互動場景體驗(yàn)天花板,有專為實(shí)時互動打造的自研高清語音引擎,視頻增強(qiáng)策略、AI降噪和回聲消除能力等技術(shù),讓用戶擁有更高畫質(zhì)、更純凈、更流暢的視頻會議體驗(yàn)。
現(xiàn)場,會暢通訊產(chǎn)品總監(jiān)王暉針對 AI 重塑視頻會議的思考。他表示,AI 在給視頻會議場景帶來全新體驗(yàn)的同時也帶來了挑戰(zhàn),比如準(zhǔn)確度、企業(yè)信息安全、實(shí)施成本等問題。
在這些問題上,涉及企業(yè)數(shù)據(jù)信息的服務(wù),會暢通過混合云 2.0 幫助客戶在本地部署,保障企業(yè)信息安全性;靈活度上,會暢平臺支持集成三方 AI、翻譯、H5等,為企業(yè)提供個性化需求;成本上,應(yīng)當(dāng)充分利用企業(yè)現(xiàn)有的資源,而不是重復(fù)采購建設(shè),會暢會充分考慮到企業(yè)現(xiàn)有資源,如企業(yè)已有的傳統(tǒng)硬件終端利舊、本地自有語音線路、本地自有AI模型,降低視頻會議場景部署的實(shí)施成本。
圓桌:AI浪潮下,如何重塑會議與協(xié)作體驗(yàn)?
在發(fā)布會的最后,會暢通訊產(chǎn)品總監(jiān)王暉、京東科技協(xié)同辦公業(yè)務(wù)部產(chǎn)品經(jīng)理曾冠、科達(dá)-摩云視訊銷售總監(jiān)俞中、聲網(wǎng)數(shù)字化會議解決方案負(fù)責(zé)人尚敬超,圍繞“AI浪潮下,如何重塑會議與協(xié)作體驗(yàn)?”話題進(jìn)行深度交流和探討。
在談到AI為視頻會議帶來的改變時,王暉提到,利用 AI 為企業(yè)客戶提供定制化的功能,在會前、會中、會后都加入AI,讓會議溝通更加有效率,開會體驗(yàn)更佳。俞中則認(rèn)為,隨著底層音視頻能力與AI自身學(xué)習(xí)能力的提升,視頻會議的整體效果會演變得更加優(yōu)秀,比如沉浸式的3D場景將會是 AI 大顯身手的方向。
尚敬超認(rèn)為,“AI 技術(shù)會讓視頻會議脫離工具屬性,真正融入生活,例如原本成本較高的同聲傳譯場景,通過 AI 也可以讓多語言視頻會議的成本進(jìn)一步壓縮,降低所有人的使用門檻。”
關(guān)于會議AI 的想象空間,曾冠認(rèn)為,“通過 AI 和穿戴設(shè)備,未來的溝通方式將從信息溝通變?yōu)?ldquo;所見即所得”,幫助用戶快速獲取想得到的內(nèi)容,從而更好的服務(wù)于工作。”尚敬超認(rèn)為,“未來的會議主要是AI參與,人只需要最終下一個指令做決策,從而擺脫無窮無盡低效會議的束縛。而這背后,實(shí)時性和輔助決策也是最重要的兩點(diǎn)。”