隨著云計(jì)算的發(fā)展,世間每個(gè)人每件東西每天每秒所產(chǎn)生的新數(shù)據(jù)(位置、狀態(tài),所見、所聞、所思、所言……)都有能夠被更完整和豐富地?cái)?shù)字化,并全部聯(lián)入互聯(lián)網(wǎng)。我曾經(jīng)說(shuō)過(guò), 云計(jì)算是目前最大的技術(shù)趨勢(shì),也是以互聯(lián)網(wǎng)為基礎(chǔ)的新一代技術(shù)的總稱。寬泛地看,其中除了基礎(chǔ)設(shè)施層面的新型硬件與數(shù)據(jù)中心、分布式計(jì)算、海量數(shù)據(jù)存儲(chǔ)與處理等等技術(shù)之外,還包括人與人之間更多的交流方式(社會(huì)化網(wǎng)絡(luò)),終端設(shè)備的多樣化(移動(dòng)),無(wú)所不在的數(shù)據(jù)采集方式(物聯(lián)網(wǎng)),和新一代自然用戶界面、用戶體驗(yàn)。
其中,海量數(shù)據(jù)將發(fā)揮核心作用。
互聯(lián)網(wǎng)企業(yè)與傳統(tǒng)行業(yè)(包括軟硬件和電信廠商)相比最大的優(yōu)勢(shì),就是幾乎消除了任何中間層,所有最終用戶使用產(chǎn)品的行為數(shù)據(jù)可以輕易地保存在服務(wù)器上;通過(guò)對(duì)這些海量數(shù)據(jù)的挖掘、分析和圖形化呈現(xiàn),能非常清晰地揭示用戶的行為模式,加深對(duì)用戶需求的理解,提取用戶的集體智慧,從而為產(chǎn)品研發(fā)人員決策提供依據(jù),同時(shí)不斷提高系統(tǒng)的智能化水平,提升產(chǎn)品用戶體驗(yàn)。而社會(huì)化網(wǎng)絡(luò)更進(jìn)一步,用戶都以登錄甚至實(shí)名為主,可以為每個(gè)人提供個(gè)性化的服務(wù)。
早在2005 年,Web 2.0 的主要倡導(dǎo)者Tim O’Reilly在經(jīng)典文章“什么是Web 2.0”中就強(qiáng)調(diào)過(guò)“數(shù)據(jù)是新的Intel Inside”,也就是說(shuō),就像PC時(shí)代Intel 芯片是核心一樣,數(shù)據(jù)是新一代計(jì)算的核心。(細(xì)讀此文,我們會(huì)發(fā)現(xiàn)云計(jì)算與Web 2.0之間的緊密關(guān)系。)
2007 年Google 承認(rèn),在很多情況下海量的數(shù)據(jù)比好的搜索算法還要重要。而它的競(jìng)爭(zhēng)對(duì)手近來(lái)也在抱怨彼此的差距主要在用戶搜索數(shù)據(jù)的積累上。Google 的很多產(chǎn)品,比如翻譯和語(yǔ)音輸入,同樣得益于海量語(yǔ)料庫(kù)的支持。2009 年Google 的研究總監(jiān)Peter Norvig 等人發(fā)表了《The Unreasonable Effectiveness of Data》一文,得出一個(gè)結(jié)論:簡(jiǎn)單的模型加上海量的數(shù)據(jù)比精巧的模型加上較少的數(shù)據(jù)更有效。也許正是因?yàn)槿绱耍珿oogle 首席經(jīng)濟(jì)學(xué)家Hal Varian 才會(huì)堅(jiān)稱數(shù)據(jù)科學(xué)家將是未來(lái)十年最具吸引力的職位,他認(rèn)為管理者甚至中小學(xué)生,都應(yīng)該具備對(duì)數(shù)據(jù)進(jìn)行處理、從中提取洞察、理解和表達(dá)的能力。
Facebook更是眾所周知的數(shù)據(jù)驅(qū)動(dòng)無(wú)所不在的公司。2006年,為了找出Facebook在某些學(xué)校不受歡迎的原因,公司從華爾街聘請(qǐng)了數(shù)據(jù)科學(xué)家Jeff Hammerbacher(現(xiàn)為Cloudera 的首席科學(xué)家),他和其他幾位同事組成了最早的數(shù)據(jù)團(tuán)隊(duì),在不知不覺中自行研發(fā)了一個(gè)商業(yè)智能系統(tǒng)。這成為Facebook 日后產(chǎn)品成功的重要基礎(chǔ),不僅很好地支撐著工程團(tuán)隊(duì),而且在產(chǎn)品設(shè)計(jì)決策中也起到了關(guān)鍵作用——他們的設(shè)計(jì)師也能寫代碼,用真實(shí)內(nèi)容和頁(yè)面來(lái)做產(chǎn)品原型,然后上線測(cè)試,快速迭代,2009年時(shí)設(shè)計(jì)團(tuán)隊(duì)每周提交40次。
可以想象,隨著云計(jì)算的發(fā)展,世間每個(gè)人每件東西每天每秒所產(chǎn)生的新數(shù)據(jù)(位置、狀態(tài),所見、所聞、所思、所言……)都有能夠被更完整和豐富地?cái)?shù)字化,并全部聯(lián)入互聯(lián)網(wǎng)。近年來(lái)互聯(lián)網(wǎng)領(lǐng)域的創(chuàng)新幾乎都可以納入這一模式:Google 將每次搜索和去向存儲(chǔ)下來(lái),F(xiàn)acebook將人們之間的各種交互數(shù)字化,Amazon、淘寶等電子商務(wù)網(wǎng)站將商品流通的信息、人們的購(gòu)買喜好數(shù)字化,Twitter 等微博將人們稍縱即逝的想法和談話記錄下來(lái),F(xiàn)oursquare 等LBS應(yīng)用將人們?nèi)ミ^(guò)那里的信息記錄下來(lái),Instagram、Color 等移動(dòng)應(yīng)用捕捉瞬間的圖片和音頻、視頻……
這其中蘊(yùn)含的巨大潛力將是空前的,影響極為深遠(yuǎn)。互聯(lián)網(wǎng)企業(yè)甚至更多行業(yè)企業(yè)之間的競(jìng)爭(zhēng)將圍繞誰(shuí)擁有更多詳細(xì)的用戶數(shù)據(jù)并能善加運(yùn)用展開。我們很有可能打造一個(gè)智能系統(tǒng),實(shí)現(xiàn)計(jì)算機(jī)科學(xué)長(zhǎng)久以來(lái)的人工智能夢(mèng)想。