大數據,幾年前的一項技術報道,現在正展示其巨大的成果。越來越多的商業機構、大學院校和政府機關通過運用超級計算機、無處不在的傳感器以及環球網絡處理大量的源數據來洞悉以往無法發現的事實。它正改變著我們從胎兒發育到宇宙學的對一切事物的認知。
多虧了大數據,我們已經認識到幼兒學習語言并非通過背誦——幾個世紀以來我們都是這樣以為的——而是通過在多種語境下聆聽詞匯來習得。我們還知道早產兒的心跳穩定時面臨的風險最大(健康嬰兒的心跳會更不穩定些)。研究者正在研究了解自閉癥的外部影響因素(二氧化碳濃度,室內溫度)以及為何城市犯罪會大量地被隔離于幾個街區,甚至個別建筑。在周三晚PBS紀錄片“大數據的人類面孔”中我們可以看到這些以及其他的大數據突破點。該紀錄片基于2012年的一部同名書籍拍攝,其中也收錄了我的一篇文章。
現在我們可以通過觀察潛在患者的生活習慣的變化(社交媒體的使用,遞減的運動)來識別即將到來的抑郁癥,甚至自殺傾向。而且通過谷歌搜索數據,流行病學家可以比醫生更早發現一種新興的流行病。
大數據的一個最超乎尋常的特點是它標志著統計學統治的終點。整整400年,我們被迫從復雜的系統中取樣并進行推算。現在,大數據使測量一切事物變為可能,不論是數以億計的天體運行軌跡還是人類的每一次心跳。
大數據同時也給人們的日常生活帶來了潛移默化的影響。越來越多的智能手機成為大數據的首選平臺,在以色列有80%的市民通過智能手機上的一款WAZEapp來上傳交通數據,幫助彼此溝通交流路況。加利福尼亞州正在考慮在智能手機上安裝一種可以檢測突然運動的加速計,它能形成一個比政府安裝設備更快預測到地震的地震預警系統。
不久,中西部的農民將對他們田間的幾乎每一株作物進行測量,它將結合土壤、水質和天氣的數據來設想出數億計的保險保障方案。現在通過對推特、即時消息和手機來電的實時分析可以精確定位自然災害受害者并給予其援助。甚至由于每一秒都在產生變化的地圖,最古老的人文學科之一地理學也正發生著徹底的革新。
但是走進大數據時代最明顯體現在商業領域。近期,一項來自NewVantage Partners顧問的調查顯示,在過去三年間使用大數據的美國公司數量躍升58個百分點達到63%的滲透率,同時70%的公司目前表示大數據對其公司極其重要。相對2012年21%的滲透率,這是一次驚人的跳躍,是有史以來增長最快的技術采納率之一。
與此同時,54%的被調查公司設有首席數據官的頭銜,即大數據高級經理,這是一個直到近期才開始存在的頭銜。
這場革新帶來的商業沖擊體現在各個方面,在產品和服務上它能預測每個客戶的獨立需求,在信用上它可以提高信用精度,在商場里它可以迎合每一個經過的顧客(通過在你的智能手機上彈出交易和特別折扣)。
迄今,大多數此類的活動仍悄然行進。然而很快它將更多地迸發進公眾視野,我們的日常生活經驗將產生深刻的變革,我們將體驗到一套新的我們今天難以想象的人性化的,預言化的和自主化的人生。
也許沒有任何一方面的改變比改變我們人體更偉大。新一代的內外部監控設備正持續收集數以億計的難以想象數量的人民健康和醫療數據,很快我們將在一年內對人體有更多的認知,而曾經這需要一個世紀之久才能達成。中國已經在著手對國內億萬慢性病患者開展此項研究。這項學問將有助于改變一切,不論是流行病學,遺傳學研究,還是個體化醫學和治療方案。
最重要的是,大數據即將產生一些文化上的問題,我們沒有現成的答案,幾乎沒有達成共識。比如說,誰擁有我們的私人數據?至今答案都不明朗,并且它有可能引發法律判例,甚至可能采用《大數據權利法案》來解決那個問題。這些是主要挑戰,但它們將會被克服因為大數據的碩果太有價值了。現在清楚的是,沒有什么比“元數據”更有價值,這是一種來源于其它數據又同時提供信息給其它數據的數據。技術革新最大的課程之一是,它們始于滿足你原本就有的需要,比如監測一種特殊病毒在人群中的擴散軌跡,而終于解決你意想不到的需求。也許這就是大數據的真正宿命。
當你可以研究數以億計的,甚至億萬計的數據點,你開始發現至今仍一直未被人們所察覺的力量與趨勢。比如你10歲時長的阻生智齒將在70年后縮短你的壽命?又或者上周停止心跳的逃犯預示著下個月的心臟病危機?
元數據的發現有可能被證實是大數據的真正宿命:教導我們以一種前所未有的方式看待自己還有我們賴以生活的自然世界。