威廉-普萊費爾(William Playfair)生于1759年,在家里排行老四,父親是上進的蘇格蘭大臣。他年紀輕輕便當上瓦特的個人助理,隨后從事制圖、會計、工程、經濟、銀匠、土地投機、記者等多種職業,取得大小不等的成功。最終他在貧困中去世。
不過在此過程中,他差不多是不聲不響地一手創立了統計圖表學,發明了柱狀圖、線形圖和扇形圖。1786年他出版《商業和政治地圖集》,該書以一副英國歷史進出口圖開場,放在今天的話與本刊的排版看上去并不太脫節。用他自己的話說,“普萊費爾是將幾何原理用于財政事務之第一人”。
他生不逢時。如果他活在當今時代,普萊費爾很可能身居硅谷一家受熱捧創業公司的首席數據官高位。我們周圍的世界發生著看不見但影響巨大的轉變,即從信息稀缺到信息過剩的無聲顛覆。人類進化首先面臨的是食物短缺,如今我們卻遭受著普遍肥胖之苦。
與之大同小異的是,過去我們獲得信息很困難,現在到處都是海量的信息。谷歌前CEO斯密特曾經估計,人類每兩天所創造的數據量就相當于有史以來到2003年的數據量總和。他說這話是在五年前。我們從認識上還未進化到這一步。
估計人類創造的總數據量是技術人員的一大愛好。確切數字雖然各不相同,但誰都承認大得驚人。只需想想你的智能手機就夠了:沒錯,它是一個通訊設備,但它也是把你周圍的世界轉化為數據的工具。你看到某個東西,把它拍下來或者錄下來,然后上傳到云端,以字節的方式永遠存在。每一天人們發布五億條推文,在Instagram分享7000萬張照片,在Facebook觀看40億條視頻。每一分鐘我們向YouTube上傳300小時的新內容。
創造數據的不僅是人。還有被稱為物聯網的新現象。汽車、自動售貨機、眼鏡、計步器等裝上傳感器和傳輸器,與云端或彼此之間通訊。這些物體也像人類一樣在數字世界留下痕跡。市場研究機構IDC在2014年的報告中估計,數字世界的規模將從2013年的10萬億吉字節增長到2020年的44萬億或44澤字節。
我們擁有豐富的數據,但從中獲得的回報卻迅速減少,因為擁有的數據越多,就越難從中挖掘出意義。頗具諷刺意味的是,信息過多差不多也像信息不足一樣難以分析和理解。于是,新技術讓我們的世界充斥著越來越多的復雜信息,我們最終就越需要有著悠久歷史的人類努力,即始終致力于使復雜的東西可以理解、從混亂中求得意義的藝術,尤其是視覺藝術。
正如普萊費爾所發現的那樣,超過某一界限挖掘數據意義的最佳辦法就是使數據形象化。試想Instagram的海量照片。去年紐約市立大學教授曼努維奇(Lev Manovich)對來自紐約、圣保羅、柏林、曼谷、莫斯科5座城市的12萬張照片進行了視覺分析。他和他的研究團隊從中選取自拍照片,估計照片上的人的年齡和性別。然后他們對照片運用面部分析算法,對所有數據進行統計分析,最后放到selfiecity.net制成互動圖表。
結果這些毫無意義的原始數據現在具有了意義。你可以按照城市、性別、心情、是否歪腦袋、是否戴眼鏡、睜開還是閉上眼睛瀏覽照片。你可以提出問題并得到答案:誰自拍用的多,男人還是女人?(答案是女人)。哪里的人笑得最多?(曼谷)哪里的老年人愛自拍?(紐約)……
如果你把數據形象化看作我們抵抗信息海洋的防洪堤,那么隨著數據日益增多,防洪堤的壓力總是不斷上升,而壓力上升又改變了數據形象化的方式和作用,這一點甚至普萊費爾也不曾料到。
形象化從對統計數據集的分析呈現發展為實時數據的不斷變化圖景。在Bostonography你可以像上帝一樣鳥瞰波士頓所有按照當前時速進行顏色編碼的公交車位置。Crimemapping.com實時顯示按照報案地點分類的案發地情況,用不同表情符號代表不同性質的案件。fbomb.co網站提供上推特的人何時何地如何說國罵的全球實時圖景。
從“紐約出租:生命中的一天”(NYC Taxis: A Day in the Life)可以得見美觀、免費的數據豐富性。一位名叫Chris Whong的黑客根據《信息自由法》從出租車與電召車委員會(TLC)下載50G紐約市出租車數據,利用這些數據制作了2013年某一天任意出租車的路線和收入圖。你可以選擇一輛車快進(或以正常速度——如果你有時間)觀看它在曼哈頓大街上行駛,像勤勞的小精靈吃豆子那樣在身后留下一條藍線。
數據形象化并非總是為了鬧著玩。今年4月30日在Kickstarter發布的一個眾籌項目將從OpenSecrets.org抓去競選資金數據并以多種方式自動圖像化,清楚、簡潔地顯示政治家獲得的資金數量和來源。這是超越透明性的下一個必要步驟:不僅公布信息,而且要公布該信息的意義。今年數據圖像化最引人注目、最具革命性的實驗之一是紀錄片制作人、數據專家霍洛蘭(Neil)的“二戰死難者”(The Fallen of World War II)互動視頻。該實驗利用圖表圖像講述歷史:表示成千上萬死難者的幾乎獨家的抽象數據形象化地帶領我們回顧二戰和“大屠殺”。
視頻六分鐘左右鏡頭急劇仰拍現出摩天大樓似的柱狀圖,表示前蘇聯軍隊870萬人的傷亡。初一看似乎極不可能,但隨著鏡頭回搖,在二戰的巨大災難中又合情合理。在這種不動聲色的敘述中,人類的死亡更顯觸目驚心。
之后的視頻同樣攝影手法反復出現:冷冰冰的抽象數據變為視覺藝術,讓我們感同身受,增加知識。現階段人類遭遇普萊費爾也發現無法理解的海量數據。我們也覺得數據多得無法理解,而這些數據又可能使得我們的世界不可理解。不過我們并非毫無辦法。信息不僅需要自由,它還需要看得見摸得著。