導讀:《紐約時報》網站近日刊載文章稱,在數據收集和分析這一正在繁榮發展的行業中,吉拉德-艾爾貝茲可能是最具影響力的投資者,他試圖找出世界上的每一個事實,并將這些事實都容納在被他稱為Factual的公司中。自2008年創辦以來,Factual已經吸收了大量的事實,其計劃是為相互之間聯系緊密的數千個超計算云建立全球范圍內最主要的參照點。以下是這篇文章的全文。
在數據收集和分析這一正在繁榮發展的行業中,Factual創始人、此外還對其他30多家創業公司進行投資的吉拉德-艾爾貝茲(Gilad Elbaz)可能是最具影響力的投資者。
在7歲大時,艾爾貝茲曾寫道:“我希望成為一名富裕的、非常聰明的數學家。”原因是,那將幫助他“發明時間機器、機器人和能回答任何問題的機器之類的東西”。
此后的34年時間里,艾爾貝茲已經完成了許多的目標,他已創造了能穿越網絡的軟件機器人、為谷歌回答了一些非常重大的問題,并在這一過程中獲得了遠遠超過百萬富翁的財富。
但是,他的時間機器計劃則已被拋棄,原因是其發現了更加重要的事情,那就是試圖找出世界上的每一個事實,并將這些事實都容納在被他稱為Factual的公司中。
“世界是一個大數據的問題。”艾爾貝茲在這家公司的總部中說道,這是一間安靜的辦公室,比洛杉磯鄉村俱樂部高14層樓。他身形纖瘦,說話溫和,當有什么想法讓他感到激動時,他會在椅子中不停地搖動身體。“如果能在一寫下錯誤的東西時就能馬上發現,那將會怎樣的一種情況?Factual肯定會是改變商界的新事物,對計算來說也是一種寶貴的新工具。”
在“大數據”蓬勃發展的這個年代里,曾經是難以想象的數量龐大的信息正在匯聚起來,從而創造出足以改變世界的發明。而在這一領域中,艾爾貝茲可能是最具影響力的發明者和投資者。除了Factual以外,他還對30家創業公司進行了投資,其中包括舊金山的一個致力于“大數據”的企業孵化器。Factual的總部位于星光大道的一幢高樓中,艾爾貝茲在這里主持召開研討會,希望在洛杉磯地區培育一個數據社區。
艾爾貝茲還是其母校加州理工學院理事會的一員,同時還是X Prize Foundation基金的成員,這個基金會向在太空飛行、醫藥和基因科學等領域克服難題的團隊提供現金獎金。艾爾貝茲出售給谷歌的公司Applied Semantics是谷歌旗下AdSense業務的基礎,這項業務每年都能給谷歌帶來接近100億美元的營收。
雖然艾爾貝茲的投資額十分龐大,而且對前景的展望也很有價值,但他仍相對鮮為人知。他是如此的不愛出風頭,以至于當最近他在參加一次有3000名數據科學家參加的會議時,僅有他投資的一家公司的幾名職員認識他。他與曾經是聯邦檢察官的妻子和三名子女住在西好萊塢的一座鄉間別墅中,一家人過著安靜的生活。在個人興趣方面,他喜歡在當地的一家運動俱樂部中打籃球。
艾爾貝茲說道,他的精神和金融資產就像是他需要分配的禮物,從而讓世界變得更加美好。
“如果所有的數據都明晰無誤,那么從世界扣掉價值的人就會減少很多,”他說道,“而為世界增添價值的人就會增加很多。”
創造明確的、可靠的數據還能讓Factual成為一家規模很大的公司。
“艾爾貝茲遠遠領先于我們其他人,對于這位企業家所說的每件事情,我都要過幾分鐘才能理解。”通過麾下公司Andreessen Horowitz為Factual提供支持的風險資本家本-霍洛維茨(Ben Horowitz)說道。“在三年以前,他認為Factual是改變世界的最大機會。而隨著時間的推移,世界已經朝著他所預料的方向發生了變化。”
自2008年創辦以來,Factual已經吸收了大量的事實,用艾爾貝茲的話來說,就是“我們已經收集了數百上千億的個體事實”。
Factual不僅向大公司提供數據,同時也面向規模較小的軟件開發商,這些數據中包括可用的政府數據、以兆兆字節為計量單位的公司數據、以及全球50個國家的6000多個地方的信息,每一條信息都有17到40條的相關描述。Factual用30種不同的方式對80多萬個餐館加以描述,其中包括地址、所有權以及食客和衛生組織的評價等。此外,這些數據還包括5億個網頁的信息、一份美國高中列表以及美國180萬名醫療保健專家的辦公室所在地、特長和保險偏好等,還包括1.4萬種葡萄酒的列表、從1950年到1974年的軍用飛機事故、以及大型慶典活動的參加人數等。艾爾貝茲指出,即使是奇特的事實也會有用處。
在靠近Factual總部的地方,艾爾貝茲儲存著500兆兆字節的數據,這大致相當于整個國會圖書館所需數據量的兩倍。在亞馬遜龐大的計算機云內部,他還存儲著更多的數據。他領導下的統計員們對大量的數據進行了收集和清理,用來說明很多事情,比如說衛生部門在對衛生設施進行評分時的差異性、“中學”這個詞匯在某個特別的鎮上意味著兩年還是三年的時間、以及原始數據及其副本之間是否存在修正等。
Factual的計劃是,為相互之間聯系緊密的數千個超計算云建立全球范圍內最主要的參照點。到今年底為止,數字世界的數據總量預計將會達到2.7澤字節(一澤字節相當于一萬億GB),大約相當于7000億張DVD的數據容量。Factual目前的員工總數為50人,當世界開始增長,以及這些數據庫開始互的情況下,這家公司的價值將被證明是極其龐大的。
Factual按浮動價格向公司和獨立軟件開發商出售數據,其依據是有多少信息被使用。小規模的數據提供是免費的,而最大型客戶需要支付的費用則會達到成百上千萬美元。在有些時候,Factual還會與其他公司進行數據交易,目的是擴大自身所占有的資源。
就目前而言,某些客戶使用Factual的數據是為了向手機地圖加入餐廳地址等信息,或者是為了規劃銷售戰略等。但Factual的真實目的則要更加廣泛,直指當前時代一項重大業務的核心,那就是利用所有基于云的數據和算法,來找到自然和社會的模式,供科學家加以觀察,同時供商界加以開拓。
“數據一直都僅被視為計算的副作用,一種當你工作時用來查閱的東西。”艾爾貝茲說道。“而我們將其視為一個完全獨立的層面,是每個人在希望解決問題時都不得不去挖掘數據的層面,但你自己可能沒有所需的完全可靠的數據。”
舉例來說,一個餐飲連鎖運營商可利用Factual來找出一個新的選址是否靠近競爭對手,以及當地人在社交點評網站Yelp上如何談論這個地方。查閱餐廳附近的加油站數據可以知道有多少輛汽車會從高速公路上開下來,運營商還可利用Factual來看看自己的餐廳在網絡上的哪些地方被提及,或是糾正其他人所說的有關餐廳的情況。
Factual擁有來自于多名硅谷明星級人物的2700萬美元融資,目前仍是一家封閉式持股的公司,但卻已經有了成千上萬的客戶。Facebook、CitySearch、AT&T及其他一些公司都會使用Factual來獲得有關某些地方的信息,《新聞周刊》則使用數據庫來為美國最綠色的公司進行評級。
其他一些公司則利用Factual的數據來執行產品規劃和客戶關懷等任務。這家公司還沒能實現盈利,艾爾貝茲正在聘用更多人才和建立更多數據集等領域進行投資,公司團隊已經包括高級數學家、來自于LinkedIn和谷歌的數據科學家、以及至少一名精通羅馬后期考古學的專業人士。
在這個新興的行業中,Factual的競爭對手包括微軟等公司,后者稱其Windows Azure Marketplace擁有“數萬億個數據點”和一個語言翻譯器。此外,人們也可以向Azure出售數據集。Infochimps提供地理和社交數據,Gnip和Datasift等公司提供來自于Twitter及其他社交網站的深度數據,由另一名數學家創立的Wolfram Alpha則擁有蘋果Siri所使用的數據和計算。
一家名為ClearStory的年輕公司則正試圖把所有這些公司都綁在一起,這家同樣由Andreessen Horowitz提供融資的創業公司希望提供的是能讓普通人使用的所謂“數據集市”。
其他幾名數據專家(主要來自于谷歌)也已辭去了原來的工作,用新的方式來爭奪大量的信息。原谷歌產品經理大衛-弗里德伯格(David Friedberg)開創了Climate Corporation,這家公司利用有關天氣、土壤孔隙度以及小麥和大豆根部結構的政府數據來制作農作物保險合同。
艾爾貝茲還是Kaggle的投資者,這家公司為找到數據模式的人提供現金獎勵。舉例來說,NASA(美國國家航空航天局)利用它來找到更好的方式去測量星系的形狀;在競賽開始的第一個周,一名專業為冰川繪圖的博士生就發現了超過NASA的算法。艾爾貝茲還向ZestCash注入了資金,這家公司以低于行業平均值的利率提供發薪日貸款,通過電話賬單及申請者如何解讀ZestCash網站等要素來判斷風險。
ZestCash CEO道格拉斯-邁瑞爾(Douglas Merrill)曾是谷歌的內部信息系統負責人。
“我們絕對,一切數據都是信用數據,只不過我們還不知道如何使用它罷了。”他說道,“這就是我們所有人在谷歌學到的數學。一張紙的重要性在于上面寫著什么,還在于寫的東西有多好的愈發,字體是什么,創作或編輯的時間是什么,諸如此類。艾爾貝茲正在做的事情也是一樣的,是有關數據的問題。數據越多總是越好。”
艾爾貝茲出生在華盛頓特區,在俄亥俄州、德克薩斯州和佛羅里達州長大成人。艾爾貝茲的父親出生在摩洛哥,在以色列長大,曾擔任一所學校的校長和希伯來文學教授;母親是一名新聞記者,在艾爾貝茲18歲時去世。在3歲時,他就開始在幼兒園中寫重復的數字串,他喜歡讀年鑒,喜歡看電視上的股價圖表,試圖從中找出數據模式。
“他會去參加許多數學競賽,然后拿三四個獎回來。”艾爾貝茲的父親尼西姆-艾爾貝茲(Nissim Elbaz)說道。“在參加數學競賽的間歇,他會去參加物理學比賽玩兒。當我跟他說他是一個大天才時,他就會擺出一副輕蔑的臉色給我看,所以后來我就學會了把這句話藏在心里。”
老艾爾貝茲說道,當他試圖向兒子解釋以色列與巴勒斯坦之間的矛盾沖突時,后者的回答是,如果雙方能在事實上達成一致,那么這種仇恨就將終止。
從幼年開始,艾爾貝茲就喜歡做與數學相關的生意——比如說在德克薩斯州的厄爾巴索(El Paso)把一種品牌的棒球卡全部買光,然后在紀念大會上以三倍的錢轉賣出去。
“我們會猜罐子中彈球的數量來玩博彩游戲。”艾爾貝茲的弟弟伊坦-艾爾貝茲(Eytan Elbaz)說道,他曾與哥哥共事,現在則擁有了自己的兩家創業公司。“16歲時他舉辦了一次比賽,用搖快艇骰子的方式來進行比賽。他熬夜制作了一張試算表,來顯示所有支出和我們能獲得的收入。”艾爾貝茲的另一個兄弟諾姆-艾爾貝茲(Noam Elbaz)過去十年里一直都在以色列的一所高等學院中從事研究工作。
在加州理工學院就學時,艾爾貝茲的專業是應用科學和經濟學家。當時他對壟斷這一課題感興趣,并因一篇論文而獲獎,內容是判定公司會因想要壟斷市場而承擔財務上的損失。
艾爾貝茲曾在IBM供職兩年,著眼于利用計算機來解決制造業的問題。然后他跳槽到數據庫公司Skybase,那是在20世紀初期,IBM正在從大型計算機廠商向服務器和PC廠商轉變。
艾爾貝茲的弟弟說道,他認為這段經歷使其發生了改變。許多職員都“只是試圖保住工作,而不是齊心協力為公司工作”,伊坦說道。他回憶道,由于擔心員工私藏數據的緣故,艾爾貝茲曾“開始談論如果人們分享數據,那么事情將會變好多少”。
隨后艾爾貝茲加入了一家名為Microunity的半導體創業公司,并擔任這家公司的顧問,在此期間他存錢炒股,為第一家自己的公司籌集了部分資金。他的父親給了1萬美元來讓他進行投資,而艾爾貝茲在18個月時間里將其變成了3萬美元。當艾爾貝茲和加州理工學院的一個朋友決定在1998年成立公司——這家公司后來變成了Applied Semantics——他父親讓他把股市里贏到的錢投入到公司中去。
Applied Semantics的軟件能迅速掃描成千上萬更多網頁,通過比較其內容的方式,這種軟件能告訴公司哪種類型的廣告將在某個頁面上表現良好。這家公司擁有45名員工,當谷歌在2003年以1.02億美元的現金加IPO(首次公開募股)以前的股票對其進行收購時,該公司已經實現了盈利。
雖然艾爾貝茲并未透露他從這項交易中獲得了多少收入,但他父親來自于投資股市的3萬美元最終變成了1800萬美元。“毫無疑問,是他改變了我的退休生活。”尼西姆-艾爾貝茲說道。
艾爾貝茲隨后曾在谷歌駐加利福尼亞州圣塔莫尼卡(Santa Monica)的工程辦公室擔任負責人,與其妻子伊莉莎(Elyssa)和三個兒子住在附近的處所。他為多個領域捐出了數百萬美元,其中包括科學教育、環境措施以及幫助羅衫非營利機構的一個組織等。他還曾向Common Crawl捐款,這是一種谷歌類型的網絡監測工具,研究者能通過亞馬遜的電腦使用這種工具。
在2007年,艾爾貝茲從谷歌離職,開創了Factual。2009年,霍洛維茨和Andreessen Horowitz的運營者馬克-安德森(Mark Andreessen)被邀請對這家公司進行投資。當時,霍洛維茨因一種想法而感到困惑,那就是艾爾貝茲已經很富有,為何還要努力開創另一家創業公司。但當艾爾貝茲對其搭建事實“宮殿”的想法進行描述以后,霍洛維茨稱其認識到這是一位“忠實的信徒”。
“當時我問他:‘你如此富有,為何還要構建這家公司呢?’”霍洛維茨回憶道。“他給出的答案是我聽過的最長、最深思熟慮的回答之一。他認為,這是一個改變世界的機會,而這對他而言比金錢更重要。”霍洛維茨說道,艾爾貝茲告訴他,他需要拿錢來刺激工程師的工作動力,他需要在智力仍舊足夠強大時實現自己的目標。
“我終于認識到這并非‘太富而不會努力工作’的問題。”霍洛維茨說道。
Factual的其他投資者還包括羅恩-康威(Ron Conway)、埃斯特-戴森(Esther Dyson)、Index Ventures和Founder Collective等。
Factual還在上海和加利福尼亞州的帕羅奧多(Palo Alto)擁有辦事處,在后一個地方,艾爾貝茲所希望的是從硅谷吸引更多人才。他在帕羅奧多聘用的前兩名員工分別是蒂姆-什克洛夫斯基(Tim Chklovski)和泰勒-貝爾(Tyler Bell),前者擁有麻省理工學院人工智能博士學位,后者曾在牛津大學從事研究工作,隨后供職于雅虎,負責地圖相關事務。
對員工來說,一個難題是判定多少數據才夠。“毫無疑問,我們希望獲得全球每一個加油站的正確名稱和位置,”貝爾說道,“而并非每個加油站的價格變動。”
“等一下,我倒是希望知道全球范圍內環流的每一加侖汽油,”什克洛夫斯基插嘴道,“這可能需要20年時間,但很有意思。”
在大多數創業公司中,人們談論的事情無非是越大越好,因此要花20年時間做什么事情看起來可能就像是妄想與空洞的結合。但艾爾貝茲和他的團隊則表示,他們覺得這很有意義,因為把真實的事實告訴所有人至少是份終生的工作。
“最近,我一直都在想我們需要獲得更多的個人數據。”艾爾貝茲說道。他所說的個人數據并非姓名和地址等等,而是其遺傳信息、飲食習慣、鍛煉身體的時間和地點,諸如此類——理想的情況是搜集這個星球上所有人的數據,無論是現在還是永遠。“我想要指出一條道路,”他說道,“讓人們從數據走向科學。”(金良/編譯)