許多人可能并不了解 Google 學術搜索,但是,對于學者、律師,還有學生群體來說,Google 學術搜索是非常重要的網絡服務。在那里,他們可以找到關鍵的信息,同時,也可以把自己的研究分享給真正需要的人。
在 Google 學術搜索誕生十周年之際,著名的科技作者 Steven Levy 采訪了該項目的關鍵創始人 Anurag Acharya,回顧了它發展中的一些故事。
Anurag Acharya 于 2000 年加入 Google。在很長一段時間里,他一直負責 Google 的網絡檢索技術。為此,他需要與網站管理員、出版商、企業、政府等打交道,同時,他還負責檢索的更新。這是一項壓力很大的工作,讓他感到身心俱疲。“或者是離開公司,或者是做些自己感興趣的、壓力較小的工作。” 他回顧說。
于是,他得到了準許,與另一位工程師 Alex Verstak 合作,創建了免費而開放的服務:Google 學術搜索。在經過一些測試后,他們把產品展示給佩奇。佩奇的反應是,“這個為什么還不上線?”
于是,在 2004 年 11 月 18 日,學術搜索正式上線了。
在學術搜索上線后,Acharya 和團隊努力去說服學術著作出版商,以獲得他們的允許,檢索他們的學術期刊。由于許多文章都是要付費的,用戶搜索到了,也不一定能夠閱讀,但是,就算是僅知道這些學術作品的存在,有時也會有很大的意義。同時,Google 還與出版商談判,希望他們允許用戶看到學術作品的摘要。他們說服了全球最大的在線期刊庫 JSTOR,讓他們向用戶提供學術作品第一頁的掃描。“通常來說,第一頁上有摘要,在舊的學術作品上,你會看到一篇介紹,” Acharya 說,“這至少能讓你有個大概了解,從而決定是否還需要去努力。”
多年來,Acharya 和團隊不斷與出版商打交道,改善產品,將其推向新的領域。Google 學術搜索的一個創新是,它能夠正確辨識出特定的作者。“學術界有許多作者的名字是‘Jay Smith’,” 他說。為了解決這個問題,Google 首先對作品進行判斷,把可能是同一人的作品聚集起來,然后,讓真正的作者來辨認。這看起來是很不 Google 的辦法。但是,Archarya 說,“這個問題無法通過完全自動化來解決,因此,我們給了你一些作品合集,然后你說,‘這些是我的作品’。這就行啦。剩下的事情是自動化的。”
在 Larry Page 的精簡政策中,Google 學術搜索沒有被拋棄,不過,它隱藏更深了。對此,Archarya 說,低調不是問題。那些使用 Google 搜索的人,仍然會很快地找到它。同時,他也表示,產品的使用量沒有減少,而公司也沒有削減投入。因此,他不擔憂 Google 學術搜索的發展,而且樂意繼續從事這項工作。