在用戶由臺(tái)式機(jī)搜索轉(zhuǎn)向移動(dòng)設(shè)備與可穿戴設(shè)備搜索的發(fā)展趨勢(shì)中,GoogleNow是Google保持市場(chǎng)份額的重要賭注。
面向iOS用戶,Google上周發(fā)布了Google Now搜索服務(wù)。這不是一種簡單的服務(wù)延伸,Google對(duì)此寄予厚望,期待Google Now成為數(shù)十億人的智能數(shù)字助手,并在用戶由臺(tái)式機(jī)搜索轉(zhuǎn)向移動(dòng)設(shè)備與可穿戴設(shè)備搜索的發(fā)展趨勢(shì)中繼續(xù)鞏固在搜索市場(chǎng)的領(lǐng)先地位。
名如其意,Google Now告訴你現(xiàn)在想知道的東西,快速且精確。通過人機(jī)對(duì)話,Google Now將自然語言轉(zhuǎn)換成搜索指令,然后從Google服務(wù)器中獲取精準(zhǔn)的答案。
目前,Google Now的界面是一種“紙牌”設(shè)計(jì),提供諸如交通,天氣,體育,股票,公交車,飛機(jī),活動(dòng),物流,約會(huì)等信息。用戶提供語音即可獲得相關(guān)的信息。
Google Now最有趣的地方可能在于它能從你的手機(jī)設(shè)備,Google服務(wù)等應(yīng)用當(dāng)中找到用戶所需的數(shù)據(jù)。比如,它可以檢查Gmail賬戶中的餐館預(yù)約,為用戶提供前往的路線圖。它還可以查出你經(jīng)常訪問的網(wǎng)站信息,并自動(dòng)更新最新的新聞。
(圖:Google Now是Google Glass體驗(yàn)的一個(gè)重要組成部分。)
基本上講,Google Now越了解你,它能給你的幫助就越好。
Google Now仍處于起步階段,其結(jié)果尚無法預(yù)料。不過,Google對(duì)這種服務(wù)可謂傾盡全力,希望繼續(xù)保持它在美國搜索市場(chǎng)的霸主地位。
語音數(shù)字助理市場(chǎng)可謂競(jìng)爭(zhēng)激烈。除了蘋果的Siri,還有Sherpa和Donna。
“星際迷航”電腦
Google搜索部門負(fù)責(zé)人Amit Singhal在2012年談到了Google Now的由來:
拉里·佩奇曾經(jīng)描述了完美搜索引擎的藍(lán)圖,即它能精確理解你的意思,并準(zhǔn)確給予你想要的答案。這很像我小時(shí)候在印度看到的黑白電視劇,星際迷航中的電腦。這種電腦可以回答我任何的問題。今天,我們朝這種夢(mèng)想更進(jìn)一步了。
Google Now人機(jī)相互的背后融入了大量的技術(shù),比如語音識(shí)別,語言模型,知識(shí)圖譜(Knowledge Graph)等。
Google搜索部門的產(chǎn)品管理主任Tamar Yehoshua說,Google Now還處于發(fā)展的初期,需要耗費(fèi)大量的計(jì)算機(jī)資源才能領(lǐng)會(huì)自然語音,然后將其轉(zhuǎn)化詞條,搜索答案,最后將文本轉(zhuǎn)化為語音。
Google語音建模部門技術(shù)負(fù)責(zé)人Vincent Vanhoucke說:“基于深度學(xué)習(xí)(deep learning)技術(shù),我們?nèi)〉靡稽c(diǎn)起步,這種技術(shù)有點(diǎn)像90年代的神經(jīng)網(wǎng)絡(luò),可以讓機(jī)器感知,領(lǐng)會(huì)這個(gè)世界。”
Google深度學(xué)習(xí)技術(shù)有點(diǎn)類似人腦中負(fù)責(zé)數(shù)據(jù)交換的密集神經(jīng)元,它們可以進(jìn)行聲學(xué)建模,確認(rèn)原始的語音,比如區(qū)分“a”和“p”,然后一個(gè)語言模型會(huì)將語素串聯(lián)成恰當(dāng)?shù)脑~語與句子。
聲學(xué)建模領(lǐng)域的一個(gè)主要突破是引入了GPU(圖形處理單元),Vanhoucke說:“神經(jīng)網(wǎng)絡(luò)有大量,快速的數(shù)據(jù)通過。GPU具有很大的共享內(nèi)存,能夠很好的處理這些數(shù)據(jù)信息。以往需要一年訓(xùn)練的項(xiàng)目現(xiàn)在僅需三周即可完成,因此,我們?cè)跈C(jī)器上完成了更多的實(shí)驗(yàn)。Jelly Bean安卓系統(tǒng)前后,語音識(shí)別的精確度從15%提高到了30%。”
不過,復(fù)雜的交流對(duì)機(jī)器語音識(shí)別來說仍然是存在問題。比如,假如你是某支橄欖球隊(duì)的球迷,你可能會(huì)一口氣問,球隊(duì)的比賽情況如何,投手是誰,明天比賽的時(shí)間,提醒到時(shí)進(jìn)行錄像和觀看比賽等。為此,機(jī)器識(shí)別系統(tǒng)需要將幾句話整合在一起,這是一個(gè)難題,但前景令人興奮。
1%的解決方案
Google語音識(shí)別與語言模型技術(shù)取得了長足的進(jìn)步,但精確領(lǐng)會(huì)仍然是一個(gè)巨大挑戰(zhàn)。知識(shí)圖譜就是為此誕生的。
知識(shí)圖譜負(fù)責(zé)給Google Now提供主題,人,時(shí)間等分類信息,并構(gòu)建答案。知識(shí)圖譜有超過5.7億個(gè)詞條,180億個(gè)與之關(guān)聯(lián)的事件。
當(dāng)Google Now接收到詢問,它將原始的語音數(shù)據(jù)轉(zhuǎn)化為電腦能夠理解的詞條,然后在知識(shí)圖譜中找到匹配的答案。
不過,迄今為止,知識(shí)圖譜僅僅收集了語言所能產(chǎn)生的一少部分詞條與關(guān)系信息。
Google負(fù)責(zé)知識(shí)圖譜研究的工程師John Giannandrea說:“知識(shí)圖譜很好的覆蓋了人物,地點(diǎn),事件等信息,但它仍有東西還不知道,我們只是覆蓋了1%的語言信息。我們不會(huì)將知識(shí)圖譜打造成一個(gè)人,它是一種工具,能給予用戶數(shù)據(jù),文本,幫助你更好的理解一個(gè)問題,你仍然是決策者。”
每一天,Google會(huì)執(zhí)行大量的搜索,這給知識(shí)圖譜提供了原始的材料反饋。Yehoshua說:“每天,有大約16%的搜索請(qǐng)求是全新的,我們需要對(duì)已經(jīng)了解的詞條進(jìn)行提煉,這是一個(gè)持續(xù)性的工作。”
(圖:Google知識(shí)圖譜存在的地方)
隨著數(shù)據(jù)的增多,深度學(xué)習(xí)技術(shù)的進(jìn)步,處理容量的增加以及速度的增快,Google的人機(jī)相互等系統(tǒng)最終會(huì)走進(jìn)我們的生活,不過,這一過程將是一個(gè)非常漫長的過程。
Giannandrea說:“我們對(duì)世界的領(lǐng)悟不斷增多,我們需要從底層教會(huì)系統(tǒng)這種領(lǐng)悟能力。我們需要讓機(jī)器了解什么是比喻,諷刺,假想等等。計(jì)算機(jī)的發(fā)展史證明,這是一種一點(diǎn)一滴的進(jìn)步,而非質(zhì)的飛躍,但這種進(jìn)步的速度會(huì)加快。”