從2012年以來,“大數據”持續升溫(《紐約時報》就把2012年定義為“大數據的十字路口”),跟著“熱鬧圍觀”的還有圖書市場。
截至目前,關于大數據的代表作品有:
維克托·邁爾·舍恩伯格的《大數據時代:生活、工作與思維的大變革》
馮啟思(Kaiser Fung)的《數據統治世界--如何在數據統計中挖掘商機與做出決策》
Anand Rajaraman、Jeffrey David Ullman的《大數據:互聯網大規模數據挖掘與分布式處理》
艾伯特-拉斯洛·巴拉巴西的《爆發:大數據時代預見未來的新思維》
涂子沛的《大數據:正在到來的數據革命,以及它如何改變政府、商業與我們的生活》等,
當然,還有大衛·芬雷布的《大數據云圖:如何在大數據時代尋找下一個大機遇》。
這些書中,公認的以舍恩伯格的《大數據時代》為“國外大數據系統研究的先河之作”、“迄今為止關于大數據最好的一部著作”,那么,在眾多所謂的“《大數據時代》之后必讀之作”的書單中,大衛·芬雷布的《大數據云圖》則更勝一籌、實至名歸。它開啟了大數據從理念啟蒙到商業應用的時代,而身為作者、同時也是大數據集團(Big Data Group)創始人的大衛?芬雷布的被業界譽為“大數據商業應用引路人”.究竟,他指引了什么,貢獻了什么?
首先就是“大數據云圖”(Big Data Landscape),這也是中文版的書名(英文原版書名Big Data Demystified,直譯為“掀開大數據面紗”)。為了讓更多人理解大數據,并從中得到啟發和受益,芬雷布和他的合伙人通過對包括網絡科技新貴、傳統商業巨頭在內的數百家公司進行了跟蹤、評估,繪制了一幅大數據領域應用全景圖,也就是著名的“大數據云圖”,而且每隔一定周期進行更新。通過它,我們可以知道現有各家企業在大數據領域扮演了什么角色,做了什么,以及有哪些空白等待后人去填補。也就是說,大數據的商機在哪,一看云圖便知。隨著“大數據云圖”的廣泛流傳,大衛·芬雷布聲名鵲起,找上門的咨詢業務也絡繹不絕。于是,芬雷布就從早先的“科技創業者”(他先后創辦數家科技公司,很多被大公司收購)一下子變成了“科技引路人”.
其次在于“可視化”,芬雷布提出,它是“數據中發掘機遇的重要工具”.這一點有別于一般的大數據著述。在芬雷布看來,將信息可視化能有效抓住人們的注意力。“有的信息如果通過單純的數字和文字來傳達,可能需要花費數分鐘甚至幾小時,甚至可能無法傳達;但是通過顏色、布局、標記和其他元素的融合,圖形卻能夠在幾秒鐘之內就把這些信息傳達給我們”.可視化是壓縮知識、傳遞信息的一種方式。芬雷布提到了“數據界的達·芬奇”的愛德華·塔夫特,后者早在20世紀出版了《定量信息的視覺展示》一書,而該書就是“以視覺方式傳遞數據信息”的經典著作。而芬雷布專門花了一章的篇幅闡述“數據可視化”,其意義在于,強調了大數據理性之余的感性一面。事實上,大數據界的許多觀點顯然偏離了這點,常常倒向模型、算法、數學這一邊。芬雷布的這一觀點與IBM等業界英雄所見略同,而從理論上的“數據可視化”到實踐中的“大數據云圖”,芬雷布走在了前面。
不過,僅僅有方法論是不夠的,首要的得在觀念和思維上有所改變。例如維克托·舍恩伯格在《大數據時代》中要人們在邏輯上放棄“因果”轉而“相關”,馮啟思在《數據統治世界》里在統計學上提出要“關注異常值,而非平均數本身”(特別是小概率的力量)。在《大數據云圖》中,芬雷布將“大數據”推向了極高的位置,視其具有決定下一個大機遇的重大戰略意義。他說,數據、算法和速度讓計算機能作出更好的決策和預測,從商業到生活甚至到飄忽不定的感情,一切都可以分析。
基于大量實證案例的支撐,芬雷布完全有這樣的樂觀和自信看待大數據的未來。在書中提到的許多公司應用中,不難發現在研發設計到管理銷售,從教育、醫療到電子、汽車再到音樂、建筑,大數據的影子無處不在、并且發揮著不可忽視的作用。而像亞馬遜、谷歌、IBM、Facebook、LinkedIn、Twitter、Netflix等公司對大數據的應用已經習以為常、開始得心應手。例如作為社交網絡巨擎的Facebook 使用大數據來追蹤用戶在其網絡的行為,通過識別你在它的網絡中的好友,從而給出新的好友推薦建議,用戶擁有越多的好友,他們與 Facebook之間的黏度就越高。更多的好友意味著用戶會分享更多照片、發布更多狀態更新、玩更多的游戲。像商業社交網站LinkedIn則使用大數據在求職者和招聘職位之間建立關聯。有了LinkedIn,獵頭們再也不用向潛在的受聘者打陌生電話來碰運氣,而可以通過簡單的搜索找出潛在受聘者并聯系他們。與此相似,求職者也可以通過聯系網站上其他人,順利地將自己推銷給潛在的雇主。可以這么說,現在業界對于大數據的認識可不再是“數據大”或者Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)的“4V”這么簡單、表面化了。大數據“真的”廣泛進入商用。至于對比舍恩伯格《大數據時代》中提到的應用實例,《大數據云圖》更新穎、更前沿、更接近正在發生的未來。
不僅如此,除了“大數據將影響所有方面”外,大衛·芬雷布至少以下兩個觀點值得注意。第一,他認為下一個獲得重大發展的是在應用領域,這個領域通過各種技術的手段,能夠真正的把數據變成生產力。過去的幾年中,大部分的投資都是在數據基礎設施方面,未來人們會看到在應用層有更大的發展。第二,他介紹自己喜愛鐵人三項運動(游泳、騎車、跑步),平時通過技術手段,將自己在整個運動過程中產生的數據進行搜集和分析,這里面包括了運動過程中的熱量、心率、運動的軌跡、跑的長度等,然后不斷自我優化、自我提升。通過這個現身說法,芬雷布實際上指出了可穿戴智能設備對大數據應用的推波助瀾的作用。這也可以理解為,下一步移動互聯時代,大數據是隨時隨地的、無時無刻的。商家通過把越來越多的移動端放到消費者的手里,更好的了解消費者在移動端和各個場景中的消費習慣。這意味著,在未來幾年中,大數據與移動終端、與云計算的結合,將會孕育更多的商機,會有更多的新的創業者在這個方向開創出新的企業和事業。對此,在《大數據云圖》中,專門有一章就叫“誰是下一個上市的數十億美元項目”.
當“大數據”落地,當技術接軌商業,芬雷布向我們展示了一場已經發生而且將影響深遠的商業變革。對于讀者而言,應該心領神會:在理想情況下,企業應當具備一種能夠讓數據分析貫穿于整個組織的視野,分析應該盡可能地接近實時。通過觀察谷歌、亞馬遜、Facebook和其他科技領袖企業,我們看到了大數據之下的無限可能--當務之急,現在需要做的就是讓企業盡快融入大數據戰略中。