Yevgeny Zamyatin(葉夫根尼·扎米亞京)在1921年的小說中,想象未來的每一個建筑都是玻璃制造的,使當權者可以在任何時候都能看到他的臣民在做什么。那是關于大數據的未來構想嗎?一些悲觀主義者擔心它可能成真,但我擔心的是悲觀主義者可能過于樂觀了。
如果你摸不著頭腦,我可以告訴你,“大數據”是一個術語,它描述了信息的積累和分析。這里,信息是大量的,像海洋一樣。
每當人們在亞馬遜上網購,它都會被記錄下來,并添加到信息庫里。每次在Loblaws公司結帳,每次閱讀家庭電表報告,每次包裹通過聯邦快遞的檢查站,每次海關官員檢查護照,每次有人上傳照片到Facebook,每次有人用谷歌搜索 --這是一片信息的海洋。
人們一直在開發數據的新形式。功能日益強大的計算機能夠篩選那些我們不認為是“數據”的東西--靜止圖像、視頻圖像、文字,然后它們可以通過分析被提取出數據,就像鼠標點擊和掃描儀發出蜂鳴聲一樣容易。
但是,大數據比大量的數據所代表的含義多得多。它也有提取意義的能力:通過對大量的數字進行排序,發現隱藏的模式、出人意料的相關性和令人驚訝的聯系。這種能力正在以驚人的速度增強。亞馬遜將以向客戶推薦適合他們看的書為手段來吸引顧客,這也許就像我們的祖先驚訝不再用馬拉車一樣少見,但這樣的日子不遠了。
在許多方面,這都為我們帶來了一定的好處。事實上,它可以創造奇跡。就以藥品來舉例,曾經,醫生根據經驗和預感來做決定。到如今,醫生轉而依靠更加科學的數據收集和分析,而這改善了醫藥前景。類似的改變也發生在其他領域,其中大多數都基于經驗和直覺來做決定。
可能最大的影響是在商業領域,該領域里經理人的能力仍然是企業智慧和方向的主要來源。最近的一項研究發現,采用“數據推動決策”的公司比那些沒有采用的公司有更高的生產率。這聽起來可能有點夸大。但是,提高生產率是經濟繁榮的基礎。大數據還處于起步階段。如果人們對它的預測沒有錯,那么大數據的未來將是光明的。
當人類發明了火并學會了如何使用它,他們可以用火烹調肉類和保暖,但也可能被燒毀小屋 - 技術與風險是并存的。
被數據的海洋包圍是一件可怕的事。你住在哪里,你走到哪里,你買什么,你說什么,你想要什么和你相信什么,這一切都與數據相關。哪怕只獲得一小部分數據,企業和政府都可以知道比你想讓他們知道的更多。
“如果我們想弄清楚一位顧客是否懷孕了,但是她不想讓我們知道,你能做到嗎?”,正如Charles Duhigg(查爾斯·杜黑格)在紐約時報報道的那樣,這是美國連鎖百貨商店Target的市場營銷人員,對Target的幾十個數據分析員中的一個所提出的問題。 Duhigg寫道,“Target的營銷人員說,他們想給處于懷孕中期的婦女專門設計廣告,當這些準媽媽開始購買如產前維生素和孕婦裝之類的東西的時候。”
雖然Target拒絕正式討論這些,但Duhigg發現,Target在這方面做得很成功。一個人經常投訴Target讓他十幾歲的女兒去拍產婦廣告,但當他女兒承認懷孕時他便向Target道歉了。
這正是我們運用現有的技術和數據源的地方。如果你看過谷歌視頻的交互式眼鏡,你對未來有什么小想法?冰箱自己進貨,帶傳感器的服裝與互聯網連接······想象你曾經拍攝的每一張照片,你曾經發送的每一封電子郵件,你曾經的每一次購物,訪問的每一家網站,閱讀的每一本書,聽的每一首歌,填充的每一張處方--所有這些信息都被分散存儲在全球各地的巨型服務器上。
用嚴格的監管來保護個人隱私,可能讓大數據成為老大哥,也可能只是徒勞。如果徒勞的話,我們將生活在Yevgeny Zamyatin (葉夫根尼·扎米亞京)想象的近一個世紀前的玻璃建筑的世界。
但可怕的是從反烏托邦的角度來看,我們并不能確定這樣的世界會是什么樣。
現代心理學最基本的觀點是,我們大部分的精神生活都發生在意識之外。但我們都沒有意識到這一點。
這就是為什么,當人們問他們會在某個特定情況下選擇什么,他們往往是錯誤的。這也是為什么,當他們被問到他們為什么做了一個特別的選擇,他們給出的原因往往是沒有什么實際動機的選擇。相反,后同步思想合理化,掩蓋了令人不安的真理:我們不知道答案。
當然,大數據無法直接進入我們的潛意識思維過程。但是,在我們過去決策分析的巨大倉庫的幫助下,它可以探測到我們不知道的行為模式,這些模式可以揭示導致行為的無意識思維過程。在一個非常現實的意義上來說,大數據可以比我們更了解我們自己。