早在1980年,著名未來學家阿爾文·托夫勒在《第三次浪潮》一書中,就將大數據譽為“第三次浪潮的華彩樂章”。大數據為什么這么熱?如何科學對待大數據?本報記者就此專訪了中國社會科學院信息化研究中心秘書長姜奇平。
人類第三次創世紀工程旨在建設一個新維度
《中國社會科學報》:當前,“大數據”在業界和學界已成為“時尚”話題,人們認為“人類已進入大數據時代”,并賦予“大數據”之于經濟社會發展的作用以“革命性意義”。在您看來什么是大數據?
姜奇平:我們不用工程師的語言,而從“人類”和“時代”這個角度,看看什么是大數據。我們今天所從事的大數據,只不過是人類第三次創世紀工程的一個片斷。整個工程的“目的”,旨在建設一個新的維度,使“意義”投胎到世界的“數據體”上。為什么這么說?我們可以這樣表達,人類曾投了三次胎。第一次投胎的胎體,我們稱之為世界1。這是實體的世界,它以實體為中介存在。這個世界以功能和使用價值,承載人們生存的存在。第二次投胎的胎體,我們稱之為世界2。這是價值的世界,它以貨幣為中介存在。這個世界將一切轉化為等長的社會必要勞動時間,即我們平常所說的價值。人們衡量一切事物的尺度,就是它“有沒有價值”。這個世界以價值承載人們發展的存在。第三次投胎的胎體,我們稱之為世界3。這是意義的世界,它以網絡為中介存在。這個世界以意義承載人們自我實現的存在,要在以往的實用、價值的基礎上,追求認同。
世界2是一個時空標準化的世界,它無法準確呈現意義的存在。今天,人們發明人際網絡、物聯網,都是在給意義一個適合的呈現空間,使事物隱含的快樂或痛苦的潛在含義,在我們創造的每一份價值和使用價值中鮮明呈現出來。大數據就是“意義發現”。通過意義的發現,指導價值的取舍,讓有意義的價值實現,讓沒有意義的價值湮滅。
世界3的誕生,并不意味著世界2和世界1的消失。世界3只是相當于世界2和世界1的照明系統。傳統經濟相當于一個摸黑干活的系統,所謂“摸黑”就是指人們不知生產的東西哪些最終有需求,哪些沒有,為此需付出巨大的交易費用,來實現供求平衡。“智慧化”相當于提供一個照明系統,讓傳統貨幣經濟與實體經濟不再摸黑創造交換價值(世界2的價值)和使用價值(世界1的價值),通過大數據照亮意義,即洞察最終需求,只創造那些有意義的價值和使用價值。因此人們經常把智慧比喻成明燈。這是智慧化對于傳統經濟的意義。
從這個意義上說,大數據與傳統經濟并不是對立的關系,而是一個遞進發展的關系。大數據的應用,本質上就是在世界2、世界1中尋找并呈現意義。
大數據旨在實現“意義”的專業化
《中國社會科學報》:奧巴馬政府將“大數據戰略”上升為國家戰略,甚至將大數據定義為“未來的新石油”。從當前及未來看,“大數據”究竟有什么用?
姜奇平:在這里就不介紹“大數據”細枝末節上的作用了,我僅談談大數據的根本作用,即實現“意義”的專業化。我先談兩個具體方面:
一是“意義賦值”系統的專業化。在大數據之前的世界,特別是工業世界,各種事務的功能系統、手段系統都是專業的,但一涉及意義,例如宗旨與目的,就變得十分業余。我們以智慧城市為例說明。從以人為本的角度看,智慧城市到底智慧不智慧,關鍵看它的“意義賦值”系統是否專業,有效還是無效。習近平總書記指出,人民對美好生活的向往,就是我們的奮斗目標。就等于說,人民才是意義的賦值者。離開人民群眾,就沒有意義;數據離開了意義,就沒有智慧;沒有智慧,建設的所謂智慧城市就一定是愚蠢城市,與民生實際相疏離。從這個意義上說,大數據對智慧城市建設的頂層作用,應該是把群眾路線專業化,讓人民群眾滿意不滿意、幸福不幸福這類意義信息及時被洞察、被滿足,從而使人民群眾得到更良好的體驗。
二是企業決策系統的智慧化。大數據之前的企業決策,一線員工沒有決策能力,這是意義系統不專業的重要表現。用戶需求這種決定企業生死的意義信號,不能在此時此地的分散條件下得到當下響應。大數據讓決策這種意義處理系統發生根本變化,從后臺決策向前端決策轉移,從集中決策向分散決策轉移,從價值決策向意義決策轉移。
舉例來說,人們對大數據決策容易有一種誤解,以為就是數據大集中的決策。這是傳統集中控制思維方式運用到分布式計算條件下常有的慣性。
海爾的決策模式強調“群龍無首”。因為如果調動起每個自主經營體的主動性,使人人成為自己的CEO,這些一線員工就會進行分散CEO式的決策,沒必要事無巨細非得通過“龍首”來決策。為此,海爾用戰略損益表等制度,進行戰略性的價值管理,使每個員工在決策時可以按企業的戰略利益來權衡當前的形勢,達到比集中式決策更優越的決策效果,其最高境界就是企業無為而治。
事實上,大數據決策應是集中決策與分散決策的結合。共性的問題適合集中決策,個性的問題適合分散決策。而且,二者不一定是對立的關系。例如,一線員工的分散決策,也需要并且可以調用數據中心的分析資源和計算能力;數據中心的決策,也需要與員工本地數據,甚至客戶本地數據進行錨定和關聯。按美國最新的情境定價理論,在一對一的營銷中,產品和服務定價這種最關鍵的決策,可能要依靠用戶本地數據,如手機中數據的參與,通過與數據中心數據的即時匹配來完成。用戶數據參與決策將成為分散化決策的一個趨勢。
不能離開人這一主體來談大數據
《中國社會科學報》:“大數據”作用的發揮,依賴于數據收集、數據提純、數據判斷等多重關鍵要素。但數據有時候也會騙人,有學者基于此提出,大數據“是一個過度包裝的概念”,是個偽命題。對此您怎么看?
姜奇平:大數據當前確實存在包裝過度的問題,主要表現在一些人把不是大數據的東西,都裝到這個筐里,甚至夸大其作用,等等。但不能因此就把整個大數據說成是“偽命題”。
實質性的問題是,我們不能離開人這個主體來談大數據。現在談大數據,確實存在這樣的傾向,而且這種傾向很普遍。例如,把“大數據”當作了“數據大”,這就確實接近“偽命題”了。因為離開了人這個參照系,很難判斷數據是不是垃圾。
我認為,一些人看大數據的角度有問題。從數據這個角度解大數據,是客體的角度。僅從客體角度解大數據,缺點是難以聚焦,因為數據本身并沒有告訴我們,它們的存在是為了什么。所以,我建議人們換一個角度,從主體的角度來看什么是大數據,也就是從大數據到底能解決人的什么問題這個角度,來看它是什么。這樣看的結果,會發現大數據映射在主體上的是意義,是為了使人更好地獲得智慧。對大數據來說,使人更能把握意義,就是智慧;干擾了人們把握意義,就是垃圾。
這個方向上的思考具有現實意義。許多專家都在提大數據的應用導向,就是在從客體供給導向,向主體需求導向轉。不這樣轉,就成了為大數據而大數據,最后把要解決的問題丟了。這樣的大數據,最后只會成為一地雞毛、一堆碎片。更惡劣的是以搞大數據為名,其實是在為搞房地產、偷稅漏稅而服務,或者是套取、騙取國家有關資助,濫用納稅人的血汗錢。
我認為,“大數據”作用的發揮,不光有賴于數據收集、數據提純、數據判斷等多重技術要素,更關鍵的是應用,要同人聯系起來,同解決人的問題聯系起來。衡量大數據成效的標準,不應是TB這樣的客體標準,不是創造了多少TB的數據,而應是利用這些數據,在滿足人們需求方面創造了多少價值,有多大意義,這樣的大數據才是“真命題”。
規避大數據過度發展的風險
《中國社會科學報》:您認為“大數據”的負面作用有哪些?
姜奇平:“大數據”是中性的,談一個中性東西的“負面”作用,需要補上這個問題省略的潛臺詞,才能讓這個問題本身成立。
第一種可能,如果不能正確利用大數據,會產生什么負面作用?我認為,如果離開主體,離開人們的需求、應用搞大數據,會造出許多數據垃圾,不僅不會讓人的腦子變得更清楚,反而會加大決策成本,讓人們迷失在過多的數據中,找不到所要的答案。
為了規避為大數據而大數據的風險,第一要強調以人為本。搞大數據的根本目的就是要提高人的洞察能力,使人變得更加智慧,至于發展技術、產業等次一級的目的,是由此派生的。第二要強調應用導向。對大數據,要抓應用促發展,以最終用戶需求為導向,讓大數據產生實效。要克服長官意志,讓市場發揮配置大數據資源的基礎作用。要避免只是從投入、供給角度片面發展大數據,最后弄出一些沒有市場需要的政績工程。
第二種可能,在大數據本身沒問題的情況下,把大數據擺在不恰當的位置,或加以夸大,會產生什么負面作用?對此我認為,大數據在功能、價值和意義這一串價值鏈中,更多定位在意義上。意義要以功能和價值為基礎,如果脫離了功能、價值而片面強調意義,負面作用是對整體產生虛化作用,也就是讓事情不實在。
《中國社會科學報》:從中觀上看,大數據產業的比重是不是越大越好?如何規避大數據發展不足或是過度發展的風險?
姜奇平:大數據產業比重不見得越大越好。它與產品制造業、服務業的比重應恰當。比重過高,就會出虛火。大數據作為產業,恐怕與經濟的服務化程度有關,對農業、制造業、服務業等經濟的服務化越發展,對差異化和質量提升的要求就會越高,對大數據的需求就會越高,大數據的產業鏈就會展開得越充分。而經濟的服務化,也不應是人為決定的。一般在人均收入5000美元之后,出于對生活質量的追求,人們可能越來越多地把錢花在服務上。
為了規避大數據發展不足或過度發展的風險,需要的可能恰恰不是產業政策干預,而是要進一步發揮市場作用。美國《連線》雜志聯合創始人凱文·凱利認為,未來人們會在個人信息保護與個性化服務需要之間達成均衡。對個性化的賦值越高,越傾向于開放個人數據,供服務者量身定制;相反,越不重視個性化(如只顧溫飽),越傾向于保守個人數據,讓服務者不了解自己。大數據的發達程度,顯然與此機制有關。就中國現實情況來說,現在恐怕不是個性化供給能力過剩、服務水平過了,而是現有產業政策讓同質化的中國制造產能過剩太突出了。因此,雖然從局部和短期看,一些地方發展大數據可能有點熱,但整體上大數據發展還是不足的。