已有之事,后必再有;已行之事,后必再行。
——《傳道書》
你能提出的大部分問題別人都已經提過了,并大都有了答案。所以一直在抓取網上信息的 Google 能夠給出你查詢的結果,只要你的定義夠清晰明確。但是總有一些含義模糊或沒人問過的問題存在,以往 Google 只能遺憾地宣布未能找到符合查詢的結果。不過最近情況有了變化,據彭博社報道,過去幾個月Google 悄然上線了名為 RankBrain 的 AI,對相當一部分比例的查詢進行結果過濾和回答一些 Google 沒見過的問題。結果表明其搜索的相關性改進效果不錯,在結果頁面選擇的測試中還擊敗了公司的專家。
據統計,每天向 Google 提交的查詢中有約 15%是其未曾見過的。公司的資深研究科學家 Greg Corrado 透露,為了更好回答這些問題,Google 利用了 RankBrain 來將海量的書面語嵌入到計算機可以理解的向量里面。
如果 RankBrain 看到自己不熟悉的單詞或短語,它會去猜測其類似的意思并對結果進行相應過濾,從而有效地處理一些從未見過的搜索查詢。比方說 RankBrain 能夠有效回答 “What’ s the title of the consumer at the highest level of a food chain?(食物鏈當中最高級的消費者的頭銜叫做什么?)” 這樣的問題。
對于 Google 的搜索處理機制來說,RankBrain 只是為其搜索算法提供輸入的數百個信號之一,但這種信號跟別的信號的不同之處在于它懂得學習,而別的只是別人在信息獲取中的發現和洞察。正是因為 RankBrain 具備了學習能力,幾個月后它就已經成為對搜索第三大重要的信號,其效果之好甚至出乎 Google 人員的預料。Google 內部曾讓做算法的工程師人工去猜測搜索算法會選擇哪個頁面作為排名第一的結果,其準確率為 70%,然后 RankBrain 去做了同樣的事情,準確率達到了 80%,超過了那幫做算法的工程師的平均水平。
RankBrain 原先由 Google 的 5 人團隊用了一年的時間進行研發,在今年初獲得了搜索負責人 Amit Singhal 的放行后又投入了幾十個人進行優化。為了確保結果排名的相關性,團隊一直在進行細致的監控,并通過不斷地向這個 AI 提供大量新數據來幫助它學習新概念,AI 仍在進化中。