然而很多年過去了,人機(jī)自然語言交互依然不是主流的交互方式。
盡管投資人、用戶以及政府都對人工智能充滿了期望,應(yīng)該看到目前的進(jìn)步都還只是量變,并沒有達(dá)到質(zhì)變。
于是我們看到很多拿到投資的企業(yè)很快就變得平庸了,不再能讓我們眼前一亮。
但最初的操作系統(tǒng)是命令化操作,只有專業(yè)人士才能記住那些復(fù)雜的命令,于是電腦成了“奢侈品”,普及困難。
觸摸屏交互和鼠標(biāo)鍵盤交互存在的問題主要有以下幾點(diǎn):
第一、菜單式操作,能容納的功能有限。大多數(shù)人在手機(jī)上安裝的APP不會多于100個,大多數(shù)人即便在電腦上安裝的軟件數(shù)量也不會多于100個。因?yàn)樘嗔瞬檎移饋砭秃芾щy。我們大多數(shù)人手機(jī)里的電話號碼不會多于1000個,微信里的好友很多人連5000個都沒有加滿。這都是受限于操作系統(tǒng)需要通過菜單展示信息。
第二、需要人理解機(jī)器。過去計算機(jī)要輸入漢字是件很困難的事情。我們上學(xué)時最流行的是五筆字型輸入。需要參加培訓(xùn)才能學(xué)會這種輸入法?,F(xiàn)在也需要通過各種輸入法去解決漢字輸入的問題。這就需要我們理解輸入法的規(guī)則。過去很多軟件操作都很復(fù)雜,需要經(jīng)過培訓(xùn)成為專業(yè)人士用戶才能使用?,F(xiàn)在盡管軟件都智能了很多,但一些軟件還是需要人們?nèi)W(xué)習(xí)才能掌握它的使用方法。
第三、需要近距離操作,占用手和眼。無論鍵盤鼠標(biāo)還是觸摸屏,都需要近距離操作,需要手眼配合。因此在用計算機(jī)和電腦的時候,我們就不能干別的事情。另外,也因?yàn)榻嚯x操作,限制了人們的使用場景。例如,必須有電源,有辦工作安防電腦等等。
為什么SIRI不能實(shí)現(xiàn)以上功能呢?很多時候,那些SIRI一類機(jī)器人更像個智障。
其實(shí)人機(jī)自然語言交互需要的不僅僅是自然語言處理,而是一個系統(tǒng),一個大腦。語言處理的過程就是思辨的過程。我說“吃”,你不知道我說的啥意思,但我說話的對象就能聽得懂。因?yàn)樗麖奈疫@里獲得的信息比你多,他能綜合各個信息通過思辨來理解我的意圖。語言本身是模糊的,甚至矛盾的。說“是”也許表達(dá)的是否定,說“快樂”也許表達(dá)的是傷心。只有通過思辨才能理解一句話。機(jī)器要理解人就需要機(jī)器具備思辨能力,思辨能力就是智慧。如果像寫普通程序那樣寫人工智能程序,不會讓機(jī)器擁有思辨能力。
其次,只有機(jī)器擁有了相應(yīng)的知識才能解決相應(yīng)問題。但人類的知識是個無限集,是非常非常龐大的。只有通過UGC的模式,讓每個參與者都為機(jī)器人提供知識,才能保證機(jī)器人擁有無限多的知識。如果需要通過訓(xùn)練來讓機(jī)器人擁有知識,那普通用戶是無法參與的。
另外,語言是流動的是模糊的。一個詞在現(xiàn)代包含的意思和在古代不一定完全相同。一句話在不同的場合含義都不一樣。要理解語言,不是理解字面,而應(yīng)當(dāng)去理解文字背后的語義。如果把語言當(dāng)成處理對象,那就錯了。