自然語音交互與智能家居產(chǎn)品的結(jié)合已是人工智能領(lǐng)域不可或缺的一環(huán)。未來一定會實現(xiàn)任合時間或地點,只要你用嘴發(fā)出一句指令,智能家居產(chǎn)品就可以聽懂你的吩咐。在5月31日的《核聚變,云知聲開啟智能家居新篇章》行業(yè)沙龍上,云知聲COO康恒率先提出人工智能“交互場景”的新定義,一場關(guān)于智能家居的深度討論也就此展開……
語音交互:智能家居萬能入口
人工智能產(chǎn)品的運用,已不再是人們腦中的一個概念。科技引領(lǐng)生活并以強有力的勢頭改變著生活,隨著智能手機的出現(xiàn)智能化生活時代已拉開帷幕。智能家居的出現(xiàn)已經(jīng)在悄悄的改變?nèi)藗兊纳罘绞剑痪玫膶碇悄芗揖宇惍a(chǎn)品將會再一次引爆人們的消費狂潮。
據(jù)分析,智能家居目前還處在手機控制、多種控制方式結(jié)合、感應(yīng)式控制和系統(tǒng)自學習四個階段。無論其處在何種階段,技術(shù)的進步都會成為智能產(chǎn)品的催化劑。
語音交互技術(shù)無疑是智能家居的萬能入口的首選,自然的人機語音交互無疑給生活帶來巨大的便捷與改變。當智能家居通過語音識別進行一系列操控,例如:信息搜索、互動等所有與生活有關(guān)的服務(wù)時,感知生活,享受生活,便成為我們未來唯一的生活理念。電影中智能概念化生活,或已朝我們走來!
在床上下命令:“雙麥”遠場語音識別
為解決場景切換觸控、手勢等一系列控制弊端,遠場語音識別技術(shù)給智能家居產(chǎn)品抬上了新的高度。什么是遠場語音識別?通俗的講就是用戶在家中,在對某一設(shè)備下達指令時不需要走動到設(shè)備產(chǎn)品下進行指令控制,而是在家中有效范圍內(nèi)的任一角落中,直接通過語音指令來運行控制家中某一設(shè)備。
云知聲的遠場語音識別技術(shù)方案,主要是為了解決5米以內(nèi)的自然語音交互體驗。為什么是5米?這是因為普遍家庭環(huán)境下每個房間空間距離基本不超過5米,所以云知聲以5米為目標距離來解決人與自然語音交互。
要想做到遠場語音識別技術(shù),那么遠場識別設(shè)備基礎(chǔ)配備必須是具備兩個或兩個以上的麥克風組織陣列,通過麥克風陣列收集到的多通道語音主要是做以下三方面處理:
第一,濾除噪聲。由于我們生活在一個相對的噪音環(huán)境里,在遠場識別中,用戶和設(shè)備有一定距離,很多時候噪聲源距離麥克風的位置比人更近,在某種程度中也為錄制聲音帶來了一定的困難。
第二,混響處理。我們在空曠的空間中,聲音發(fā)出之后聲波遇到空間中的各種物質(zhì)進行物理反射,不同反射聲波最終匯聚到麥克風中,導(dǎo)致混響效果,所以聲音需要處理的相對純凈。
第三,修復(fù)衰減。聲音通過外界物質(zhì)傳輸?shù)禁溈孙L,會有一定的衰減,并且在不同頻段會有不同程度的非線性衰減。我們?nèi)セ謴?fù)這個聲音,需經(jīng)過一個比較復(fù)雜的處理,通過SSP技術(shù)處理,恢復(fù)到純凈聲音的效果,最終傳輸?shù)秸Z音識別引擎,達到遠程人機自然語音交互無障礙的目的。
經(jīng)過麥克風陣列收集到的語音,做了以上的信號處理之后,還需要跟語音識別引擎進行足夠的匹配,讓語音識別的模型與經(jīng)過信號處理的信號一致,這樣才會取得最好的識別效果。
讓家居乖乖聽話,沒那么簡單
高精尖的技術(shù)手段不足以讓我們擁有完美的智能家居產(chǎn)品,除了技術(shù)層面上做到準確識別有用的聲音,還需要有軟硬件的全方位加護,在軟硬件市場上仍有一些困難:
首先,在軟件方面。語音識別和語音交互是技術(shù)性較強的領(lǐng)域,開發(fā)者對一些技術(shù)元素的理解均有一定的難度。另外,在采用API或者SDK開發(fā)的時候,有一些問題非語音專業(yè)的開發(fā)者很難去定位。
其次,在硬件方面,如果我們把語音識別的引擎開放給客戶的話,客戶一定會挑選一款在性能、功耗、成本方面都非常平衡的硬件。因此在平臺上做一些精準識別,對客戶的挑戰(zhàn)還是非常大的。
從聲學的角度來說,怎么挑選元器件、怎么挑選麥克風,怎么設(shè)計結(jié)構(gòu)、開孔、定位麥克風?以上這些對于開發(fā)者和產(chǎn)品制造企業(yè)都是相當困難的事情,將語音交互的產(chǎn)品打磨得更好也是擺在眼前的巨大挑戰(zhàn)。
語音交互哪家強,云知聲讓你毫無技術(shù)負擔
云知聲為了能更好的解決上述問題,讓遠場語音識別的方案能夠落地,云知聲構(gòu)造了軟硬結(jié)合的模塊級的解決方案,在這個模塊級的解決方案上,完整的啟動了自然語音交互體驗。它支持遠講、支持家庭場景噪聲適應(yīng),而功耗和性價比相對來說比較平衡。云知聲使用標準接口,讓開發(fā)者可以方便的集成,而無需考慮技術(shù)的壁壘,真正讓大家把精力集中到產(chǎn)品設(shè)計上。
針對不同的客戶需求,模塊設(shè)計方案有不同的分支。云知聲COO康恒重點介紹的是IVM方案,即智能語音模塊。在這個模塊上,完整的集成了云知聲的語音識別引擎,以及標準的語音交互方式,并且通過串口,把語音識別的結(jié)果或者語音識別的指令發(fā)送給智能硬件的主板。所以,它的連接、串口等實現(xiàn)方式都相對比較簡單。
“懶癌”患者的需求,智能家居之痛點
“懶癌”一詞已足夠說明當今時代的人們在生活習慣上越來越趨向便利化生活,怎么能夠讓“懶癌”用戶更多的節(jié)省出時間來享受生活,或是讓我們生活更加便利化,用戶的痛點和需求點是我們首先要十分清楚的問題:
機智云銷售總監(jiān)黃泳濱:智能家居的需求點,更多的是體現(xiàn)在是否能足夠釋放用戶更多的時間來做更重要的事情。智能家電可以把人們每天的生活習慣和使用方式收集起來,通過云端再對用戶進行深度的分析,把所有這些分析數(shù)據(jù)與設(shè)備之間關(guān)聯(lián),真正做到一個“虛擬管家”的概念,讓生活更加舒適。
云知聲COO康恒:人工智能是為了解放我們的雙手,解放生產(chǎn)力,將自己的時間和精力空閑出來以后,實現(xiàn)人類更有價值的事情創(chuàng)造力。我們把那些不具有創(chuàng)造力的事情交給機器去做,然后我們做更多有創(chuàng)造力的事情。
Intel高級技術(shù)經(jīng)理李文焱:我認為有三個具體需求。第一,智能家居設(shè)備更加“聰明”的了解用戶需求;另外,配置網(wǎng)絡(luò),一句話連接配置wifi,這種連接性是最大的一個痛點;第三個,環(huán)境與材質(zhì)的問題,日常生活中的安全也是智能家居方面的一個重大需求。
互聯(lián)網(wǎng)+智能家居,有驚喜嗎?
“互聯(lián)網(wǎng)+”的概念已越來越白熱化,互聯(lián)網(wǎng)+智能家居給我們的帶來的很多驚喜,從太火鳥深圳公司總經(jīng)理張翀女士和Intel高級技術(shù)經(jīng)理李文焱的談話中便可得知:
首先,“互聯(lián)網(wǎng)+”更多的帶給我們是一個機會,它帶給人們不一樣的玩法和商業(yè)模式,更多的也給大家?guī)聿煌姆?wù)商的體驗。
其次,“互聯(lián)網(wǎng)+”改變了人們?nèi)粘I畹那腥肟冢言痉ξ兜木€下生活帶到了線上。也由此帶來了一些營銷機會以及社交機會,從而增進了人與人之間的交流。
未來智能家居發(fā)展態(tài)勢
未來智能家居如何發(fā)展,以及朝著怎樣的方向去發(fā)展,智能家居行業(yè)領(lǐng)頭人分別為人們畫了這樣的一個藍圖:
云知聲COO康恒:一是連接,二是自動,三是智能。做到這三個方向,我認為趨勢就成立了,能夠落到實處。
TCL產(chǎn)品經(jīng)理史淼泓:我認為是人與人的連接,人與設(shè)備的連接,設(shè)備與設(shè)備的連接,這三個的完美融合。
機智云銷售總監(jiān)黃泳濱:這一種萬物互聯(lián)的表現(xiàn)形態(tài),但更多的是通過單品的連接到場景上的應(yīng)用,再到支持系統(tǒng)上的開放,最終是解決我們在生活上的一些需求。
泰寶峰創(chuàng)始人王復(fù)軍:第一,隨時隨地能夠了解想了解的信息。第二,在家庭里能夠在任意的時間甚至任意地點可以得到任何想要的信息、生活或服務(wù),這才是我理解的最終的方向。