2018年,蘋果8發布,這時,手機已經不叫手機,而叫個人信息終端,人們可以在這上面完成一切;2025年,打車軟件的大數據系統已經不需要個人發出打車需求,你出門的時候,就已經有車停在門口,并且知道你要去哪里;2032年,一個無遠弗屆的信息收集機制被建立起來,同年,國家統計局改名為國家信息中心,一切已經不需要統計,一切發生的時候就已經被統計;2050年,市場取消,在大數據與智能制造的配合下,一切個性化的需求都可以被滿足;2084年,時間回到100年前。
這一切可能發生嗎?應該不會,但是,不可否認的是,數據收集已經深入人們的生活。特別是當下的大數據熱潮。
對于“大數據”(Bigdata)研究機構Gartner給出了這樣的定義。“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。根據維基百科的定義,大數據是指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合。更簡單的定義是,在新的技術條件下,大數據,意味著可以拋棄人類之前限于成本的的抽樣分析方法,而是存儲一切,分析一切。
隨著摩爾定律不斷的延展,人們具有了越來越強的運算能力,移動互聯網的出現,使得收集信息的機制貼身而行,加上云概念的,更進一步把運算能力連接起來。在這個熱潮中,人們似乎開始相信,只要足夠好的技術,足夠多的數據,計算機能夠比人更了解他們的自己。
一個非常經典的例子。一位男性顧客到全美第二大零售商塔吉特店中投訴,聲稱商店竟然給他還在讀書的女兒寄嬰兒用品的優惠券。經過這位父親與女兒進一步溝通,才發現自己女兒真的已經懷孕了。一家零售商是如何比一位女孩的親生父親更早得知其懷孕消息的呢?每位顧客初次到塔吉特刷卡消費時,都會獲得一組顧客識別編號。日后凡是顧客在塔吉特消費,計算機系統就會自動記錄消費內容、時間等信息。再加上從其他管道取得的統計資料,塔吉特便能形成一個龐大數據庫,運用于分析顧客喜好與需求。
塔吉特的統計師們通過對孕婦的消費習慣進行一次次的測試和數據分析,得出了一些非常有用的結論:孕婦在懷孕頭三個月過后會購買大量無味的潤膚露;有時在頭20周,孕婦會補充如鈣、鎂、鋅等營養素;許多顧客都會購買肥皂和棉球,但當有女性除了購買洗手液和毛巾以外,還突然開始大量采購無味肥皂和特大包裝的棉球時,說明她們的預產期要來了。
在塔吉特的數據庫資料里,統計師們根據顧客內在需求數據,精準地選出其中的25種商品,對這 25種商品進行同步分析,基本上可以判斷出哪些顧客是孕婦,甚至還可以進一步估算出她們的預產期,在最恰當的時候給她們寄去最符合她們需要的優惠券,滿足她們最實際的需求。依靠分析消費者數據,塔吉特的年營收從2002年的440億美元擴大到2010年的670億美元。這家成立于1961年的零售商能有今天的成功,數據分析功不可沒。
實際上這個例子并不是大數據的例子,甚至不需要太強的計算能力,一臺電腦就能分析,不過由于其戲劇性,往往被用來作為“數據比人更了解人”的證明,并在當下,被用來論證大數據。在有的媒體上,這個例子的標題就是《大數據沖擊大賣場比父親更了解女兒》,大數據的傲慢躍然紙上,至上而下的俯視著蕓蕓眾生。
但是,我認為,這并不是數據比人更了解人的例子,恰好相反,這證明了計算機、大數據,并不了解人。還在讀書的女兒,顯然并不想父親知道,但“愚蠢的計算機”卻自作主張,把嬰兒的優惠用品寄給了女兒,還寄到了她家里。
當然,可以說這是由于數據的收集還不完全,如果多加兩個變量,一個年齡,一個職業,做一個簡單的邏輯判斷,計算機也不難發現這是一個敏感顧客。但是,計算機并不能自己判斷,而程序員、產品經理,能加入一切要素進行判斷嗎?顯然不可能,因為,每一次判斷,都是有成本的。
相對而言,單純的生產過程(不包括市場活動)是一個理性的、目標單一的過程,只需要更高效率,更低成本的生產出既定的產品。所以,在這個過程中,計算機的規劃能高效的發揮作用。但相對生產過程,人們的市場活動更加復雜,有很多非理性因素,也是多目標約束的,
在這個過程中,程序員與產品經理們不可能預先預估一切,這就意味著計算機替代不了人,最終人自己做出的決定才是最適合的決定。這就使得,花費很大成本收集的數據,經過挖掘得到的結果,不如直接彈出一個對話框,或者用人工智能溫柔的女聲問:你想買嗎?
可以預見的是,隨著技術更深入的滲透到人們的生活中,必然之中的偶然事件,必然會引起人們的警覺與反感,更嚴厲的隱私與個人數據收集管制必然出現。
更深層次的看,隨著技術的進一步發展,大數據的傲慢,可能不會僅僅只違背女兒的意愿把嬰兒用品優惠券寄到家里。
亞當斯密認為:每一個追求自身利益的人“被抑制看不見的手所指引,達到一個并非其意圖的一部分的目標。允許競爭自由發展是國家的工作。社會的目標是擴大生產,及最好的分配資本、勞動力和其他資源。其理論是,市場如果不收壟斷的阻礙或者法律與習俗的限制的阻礙,就能夠最好的按照需要分配資源。
一直以來,許多社會主義者認為,市場體系的主要不足之處在于缺乏計劃,對經濟活動未能進行有目的的協調。在過去,由于計劃經濟實驗在全球的徹底失敗,這種觀念已經沒有市場。但是,隨著大數據的出現,過去的失敗很可能被歸咎于技術的失敗:數據的不完全、模型變量少、要素之間邏輯關系少、計算能力不足。在今天,技術發展滋生的大數據之傲慢,很可能會成為理性的傲慢的又一次機會。
應該承認的是,信息革命為集中控制創造了新的可能性,今天,我們已經看到了這個可能性。計算機、互聯網、移動互聯網技術的出現,使一個集權的官僚機構能夠記錄下關于個人的大量事實。除了那些人們意識到的隱私信息,比如對話、文字、圖片,還包括一般人認為相當不敏感的信息,比如銀行賬號、購買的商品,即便只是對后者的分析,也可以得到個人動向與活動的信息。
不過,技術是市場的一部分,一個要素,自然非常重要,但是,不能簡單的說技術發展等同于市場發展。市場與社會的根本決定因素以及發展,是生產、交換過程中人們的自由意志。
而且,不管什么信息系統,都是由人建造,有人操作,而這些人也生活于這個信息系統之中,打個比方,一個硬盤可以儲存反映自身,精確到原子與夸克級的一切信息嗎?顯然不可能。因為這是一個自我調用的遞歸過程,而不斷的自我調用,會吞噬掉一切計算能力。而信息系統的規劃與預計,正是這樣的一個自我調用系統。
當然,雖然今天的互聯網產品是由程序員與產品經理主導,他們雖然崇拜技術,但是,投資人卻要講究成本,所以,在演示中、在針對投資人的PTT中,雖然充滿了大數據的傲慢,但這種傲慢之下,實際上熙熙攘攘皆為利的市場小心思。真正值得警惕的,是這種傲慢被不計收益的動機所利用,最后,反過來吞噬市場。