公共管理是公權力的行使者決定公共資源在公共領域配置的過程。公權力配置公共資源并不是隨意性的,科學配置公共資源必須建立在對公共領域詳細了解的基礎上;否則,公共資源的配置就會出現扭曲,最終導致公共資源的浪費和無效配置。傳統的公共管理是借助于歷史經驗的反復比較,正所謂“以史為鑒,可知興替”。今天雖然歷史縱向的比較仍然可以獲得經驗,但這并非唯一的方法,甚至可以說是一種陳舊的方法論。新的方法是基于大數據的公共管理,大數據將帶來公共管理的重大革命。
一、大數據的內涵和特征
“大數據”是近年來的一個技術熱詞,也是一個學術熱詞,同時也是一個政府施政的熱詞①。大數據究竟是什么?并非一個人人都能回答的問題。有學者把大數據視為一種統計工具,并將大數據解釋為“不是基于人工設計、借助傳統方法而獲得的有限、固定、不連續、不可擴充的結構型數據,而是基于現代信息技術與工具可以自動記錄、儲存和連續擴充的、大大超出傳統統計記錄與儲存能力的一切類型的數據”[1]。在這些學者看來,大數據對人類思維的影響也僅僅是表現在“認識數據思維的變化”、“收集數據思維的變化”和“分析數據思維的變化”[1]。即便有學者對大數據有比前者更深入的理解,認為“大數據將深刻影響人類的決策模式和社會經濟的運行模式”,但也仍然是從統計學的角度來思考大數據的意義[2]。從技術上來看,大數據可以歸人統計工具之內,但大數據與統計工具是存在巨大差別的。傳統統計工具是以傳統統計方法為代表的“以算法為中心”的,而大數據是以數據挖掘為核心的“以數據為中心”的統計[3]。前者通常需要提前對數據分布和誤差結構等做出假設,在某種意義上其結果只是人工擬合的近似世界而非真實世界,而后者基于總體數據可以給出更加精確的描述和預測[4]。由此可見,大數據雖然可以歸入統計工具之內,但它不是一般意義上的統計,一般的統計只是基于既有數據的分析,而大數據是透過既有的數據可以挖掘出既有數據隱藏著的數據和價值。尤其是大數據中的非結構性數據本身就隱藏著巨大的價值,這是戰略預測的重要依據;相反,傳統統計工具一般不會對非結構性數據產生興趣。也有學者認為,大數據既是數據,也是一種技術和能力,“是數據收集、分析的前沿技術,是從各種類型的龐大數據中快速獲得有價值信息的能力”[5]。持這種觀點的學者認為,大數據實際上是用來精準決策的工具。但是,大數據在于它的全數據、混雜性和相關性,大數據根本無法提供精準決策的工具。不過,大數據卻能夠提供一種獨特的思維。也就是說,大數據并不是提供決策的具體工具的,而是提供全新的決策思維的。指望用大數據來提供一種精準的決策工具是不可能的,但大數據思維的確使決策對數據產生嚴重的依賴性,然而,正如舍恩伯格所說的那樣,“數據遠遠沒有我們想象的那么可靠”[6]208,“大數據為我們提供的不是最終答案,只是參考答案”[6]233。還有學者認為,大數據就是指人們借助于云技術運用數據的能力,當然這種數據不是一般的數據,而是海量數據包括結構性數據和非結構性數據。也即是人們借助于云技術使用結構型數據和非結構性數據的能力,而這種能力體現在國家治理、隱私保護、公共服務、醫療衛生等。這方面的成果不少,但基本上都是從集體的領域來分析的,這里不一一列舉。
大數據固然是數據,也是技術、能力和價值,也正因為如此,人們都是從這些方面來認識大數據特征的,即通常用4個V(即Volume,Variety,Value,Velocity)來概括大數據的特征。
1.數據體量巨大(Volume)。據估計,人類生產的所有印刷材料的數據量是200PB(1PB=2[10]TB),而歷史上全人類說過的所有的話的數據量大約是5EB(1EB=2[10]PB)。當前,典型個人計算機硬盤的容量為TB量級,而一些大企業的數據量已經接近EB量級②。
2.數據類型繁多(Variety)。這種類型的多樣性也讓數據被分為結構化數據和非結構化數據。相對于以往便于存儲的以文本為主的結構化數據,非結構化數據越來越多,包括網絡日志、音頻、視頻、圖片、地理位置信息等,這些多類型的數據對數據的處理能力提出更高的要求。
3.價值密度低(Value)。價值密度的高低與數據總量的大小成反比。以視頻為例,一部1小時的視頻,在連續不間斷的監控中,有用數據可能僅有一兩秒。如何通過強大的機器算法更迅速地完成數據的價值“提純”,成為目前大數據背景下亟待解決的難題[7]。由于數據多、總量大、價值密度低,因此,人們對數據(信息)的關注度就非常低。正如約瑟夫·奈所說:“豐富的信息導致關注的貧乏。當我們被大量的信息淹沒在其中之時,我們難以確定關注什么。注意力取代信息成為稀有資源,而可以將有價值的信號與白噪音區分開來的人就獲得了權力。”[8]奈所說的“將有價值的信號與白噪音區分開來”,在大數據中就是數據挖掘;而“獲得了權力”的意思在大數據中就是指獲得價值。另外,Value還有一層意思是指大數據所蘊含的巨大價值。大數據雖然因信息超大規模而導致關注度降低,進而使數據的價值密度降低,但是,大數據之大在于數據具有“再生性”,數據的價值具有巨大的增值效應。大數據的使用者并非停留在對表層數據的使用和發現表層數據的價值,而是通過表層數據不斷挖掘,既可挖掘更深層次的數據,也可通過深層次的各種數據(包括結構性數據和非結構性數據),從而挖掘出更大的價值。
4.速度快(Velocity)。大數據框架內的速度包括兩個方面:一方面,指如何加快數據的導入;另一方面,指如何加快分析和利用新導入的數據。前者的一個重要原因是大數據時代數據產生迅速,而大數據本身要求的是全數據,如果沒有快速導入數據的技術,那么就很難做到全數據,不是全數據就不能成為大數據。后者則是由大數據的目標所決定的。大數據的目標是利用大數據進行科學分析和科學預測,新數據不斷產生,那就意味著新問題、新情況也迅速產生。沒有快速分析和利用新數據的能力,那么,所有的預測都是滯后的。滯后的預測會導致大數據喪失其預測功能。因此,在如此海量的數據面前,處理數據的效率就是一個機構的生命力所在。
除了上述四個特征,大數據更重要的還是提供一種獨特的思維,即大數據思維。什么是大數據思維呢?(1)開放性思維。由于大數據的來源是多源性、多路徑的,也就是說,數據本身是開放性的。因此,在分析數據和基于大數據進行預測的時候也需要一種開放性的思維來進行分析和預測。(2)非線性思維。這種思維要求我們在分析問題的時候不能僅僅憑幾個要素來進行決策,而是要把所有相關性因素都要納入分析框架。尤其是不能用簡單的因果關系來進行決策,要充分考慮問題的復雜性。(3)價值思維,不能把數據僅僅看作數據,要認識到數據背后的巨大價值。傳統的數據思維是數理統計思維,認為數據的本質在于統計,統計的目的是揭示歷史過往中的基本特征和基本規律,根本沒有通過數據來獲得價值的思維。大數據思維就是通過數據的導人、分析,挖掘出巨大的價值。這種思維是完全不同于傳統思維的全新思維。這種思維奠定了我們的學習創新(深度學習)、科技創新和管理創新。
二、大數據與公共管理的結合
公共管理的數據來自何處?弄清楚這個問題,首先要清楚數字和數據的區別,以及數據科學與管理科學是怎樣結合在一起的。不但數字與數據有巨大的差別,而且傳統數據與大數據也有本質的區別。一個數字只是一個符號,表現為一個數值或者是文本型數字,數字只是數據的一種形式。而數據則是一個很寬泛的概念,“只要是對客觀事物記錄下來的、可以鑒別的符號都可以稱之為數據,包括數字、文字、音頻、視頻等等”[9]。也就是說,數據是關于某個(些)方面的一組數字,表現形式就不只是數字,而是有更多的表現形式。數字毫無疑問是統計科學的基本素材,但統計主要是對結構化數據進行統計分析,對非結構化數據一般都不會納入傳統統計之內,而實際上,云技術普及應用之后,90%的數據是非結構性數據,而且是富含大量價值的數據。由此可見,數字和數據不但在形式上完全不一樣,而且在內容上也是大相徑庭的。在云技術出現之前,數據仍然主要表現為以結構性數據為主的傳統數據。這種數據雖然也會用于分析和研究,也表現為定量的微觀分析,但它所詮釋的仍然是一個問題的宏觀和整體的狀況,而且根據這種數據所進行的決策也仍然是宏觀決策。這主要是受制于傳統數據的采集方法、分類方法和采集標準。然而,云技術誕生以后,大數據的采集、分類、分析等方法和手段都徹底精細化,這樣大數據才能對所涉及的對象進行微觀性和個性化的分析。換言之,傳統的數據只能算是小數據,小數據揭示問題的宏觀現象,而大數據則可以揭示問題的內在本質。
大數據產生之后,數據科學迎來劃時代的變革,這種變革的最大表現是數據科學與其他科學的內在結合,并形成基于大數據的新興科學。數據科學最初與企業管理結合得最緊,主要原因是:隨著社會化分工越來越細,企業生產的社會化程度也越來越高,因而企業的管理包括預測、決策等都越來越復雜,越來越依賴于完整的客觀數據。而基于云平臺和云計算的大數據可以為企業提供這種大數據服務。隨著數據科學的迅速發展,公共管理、社會管理等也都全面引入數據科學。尤其是在新世紀,各國在繼20世紀90年代推行的各行各業包括政府的“上網工程”之后,各國在新世紀又大力推行大數據戰略。所以,大數據已經全面介入公共管理、社會管理之中。在這種情形下,數據科學與管理科學的高度相符嵌入而實現管理實踐的巨大飛躍,尤其是使基于大數據之上的精細化管理和微觀管理成為現實。在繼西方各大國大數據戰略之后,中國政府也頒布相應的大數據戰略,制定“建立‘用數據說話、用數據決策、用數據管理、用數據創新’的管理機制,實現基于數據的科學決策,將推動政府管理理念和社會治理模式進步”的行動方案[10]。這也表明,大數據將在短期內成為公共管理等領域內的主要技術工具,也是提升政府治理能力的重要技術手段。
既然大數據全面嵌入公共管理,那么,公共管理所依賴的大數據又來自何處呢?眾所周知,公共管理的內容非常廣泛,公共管理以社會公共事務作為管理對象,而社會公共事務的具體內容分為公共資源、公共項目、社會問題等內容。因此,用于公共管理的大數據并不是單一性的,而是來自各個領域的大數據。幾十年互聯網的發展為數據積累提供了重要技術平臺,加之大數據搜索引擎的發展,使社會產生的所有數據都能夠獲得迅速且有效的收集和儲存。特別是世界各國的電子政務建設為公共管理積累了大量數字化的業務數據,既是政府大數據的重要來源,也是用于公共管理的大數據。這些數據主要來自以下四個方面:
1.來自互聯網的大數據。這些數據大多分散在不同儲存系統,包括數據庫如Oracle、DB2、SQL Server等;Excel、電子郵件服務器等數據源上也積累不少數據源;Hadoop(分布式處理平臺)系統如ApcheCloudea、Hortonworks、MapR,以及NoSQL數據庫如Cassandra、HBase、MongoDB等也儲存大量的數據。此外,云應用如Salesforce.com和社交網站如新浪微博、騰訊微博、搜狐微博等上也產生大量的數據[11]。當然,來自互聯網的大數據必須基于搜集技術和保存技術。這種技術的發展是驚人的,例如對用戶在網站上行為的記錄(訪問日記)在20世紀90年代中期,其保存率僅有1%,而在21世紀的第一個十年中的發展已經可以達到100%的保存率。這些數據雖然并非都可以用于公共管理,但公共管理已經越來越離不開來自互聯網的數據。以新浪微博的數據為例,新浪微博中產生大量的關于政治參與、反腐倡廉、社會安全、社會問題、公共衛生事件、社會突發事件等的數據,而這些恰恰就是公共管理最重要的數據源之一,甚至這些數據在很大程度上影響公共決策。近年來,來自互聯網的數據對公共決策的影響越來越大,有的公共決策甚至直接就是在網民的輿論壓力之下進行決策的。例如,2012年8月26日凌晨,陜西省延安市境內發生重大車禍致36人死亡,2人重傷。陜西省安監局局長楊達才視察事故現場開心嬉笑的照片引發軒然大波,網友對他進行“上天入地”的人肉搜索,發現其曾佩戴過多款名表。2012年9月21日,陜西省撤銷楊達才的所有職務,并對其嚴重違紀行為進一步調查。2012年11月28日,網民在微博上發布一組視頻和照片,稱山東省農業廳副廳長單增德與一單身女性保持不正當關系長達6年,如今想甩掉“包袱”,動用警力非法拘禁其情婦。山東省紀委調查后認定該情況屬實,并對單增德立案調查。2012年11月下旬,網絡爆料人士實名舉報重慶市北碚區委書記雷政富,并發布其不雅視頻。2012年11月23日,經重慶市紀委調查核實,互聯網流傳有關不雅視頻中的男性確為北碚區委書記雷政富。重慶市免去雷政富北碚區委書記職務,并對其立案調查。隨后,重慶市一次性免去牽涉不雅視頻的10名廳級官員和國企高管的職務。2013年1月17日,一則有關陜西省神木縣“房姐”的帖子網上熱傳,該網帖稱陜西省神木縣農村商業銀行副行長龔愛愛在北京有20多套房產,總價值近10億元,后又被曝有4個戶口;1月24日,公安部成立工作組核查“房姐”戶口問題;1月31日,北京警方證實,龔愛愛在京擁有41套住房,共9666.9平方米,還有奧迪轎車一輛;2月3日,龔愛愛在北京被專案組抓獲,已按程序依法刑事拘留,而為其違法辦戶口的北京、山西和陜西4名民警也被刑拘。諸如此類的網絡事件驗證了來自互聯網大數據的強大威力。
2.來自公權力運行(政府)過程中的大數據。根據社會過程論的觀點,政治過程包括政治系統從輸入到輸出的全部活動,是二者一系列互動行為構成的動態系統[12]。政治系統的輸入和輸出,最重要的就是由話語、文件、口號、音頻、視頻等數據構成的信息輸入和輸出。這些數據是權力輸入和輸出的實際表現,因而也就是公共管理所依賴的大數據。政府數據的構成,從公開程度來看,可分為三層:第一層是免費公開、惠及民生的數據;第二層是有價值、有償公開的數據;第三層是不能公開的數據。目前,中國有用信息的80%由政府掌握,長期以來,這些信息一方面大多處于不對外公開狀態,嚴重地制約經濟發展;另一方面,部門之間、上下級之間的政府信息相互割裂、數據之間無法有效共享,形成一個個信息孤島,難以發揮應有的作用。從數據的性質來看,政府手里的大數據可以分為:(1)資產性數據,也就是直接表現為財產的數據,如國民收入、國債、對外貿易和投資等數據;(2)資源性數據,如自然資源、環境資源、政治資源、人口資源、教育與科研資源等數據;(3)互動性數據,也就是政府施政過程中與社會互動產生的數據,以及政府與市場主體互動產生的數據,包括宏觀經濟形勢、居民健康狀況、居民收入和社會保障等方面的數據。
3.來自企業的大數據。企業是大數據最重要的來源,它幾乎每時每刻都在產生數據,而企業管理層是絕對不允許數據丟失的,另外,從行業機密來考慮,企業也不允許隨意公開和丟失經營數據,因而企業的數據積累是最為全面的。更為重要的是,為防范風險,知名企業往往會通過建立容災系統來備份自己的數據。“9-11”事件后,為了防備數據在企業遭受恐怖襲擊、地震、火災等重大事件被毀掉,各國、各企業都加大容災系統的建設,以保護好這些數據。公共管理并非只是針對社會成員的,同樣也針對企業主體。所以,企業的數據積累也是公共管理大數據的重要來源。
4.來自個人的大數據。個人的基本數據包括涉及個人隱私的所有數據,如健康狀況、電話號碼、銀行賬號等既是公共管理的依據,也是公共管理的對象。個人在日常生活中的活動行程數據包括上網、電子郵件、短信,以及博客、微博、微信等自媒體數據。例如,汽車傳感數據用于評價司機行為會推動汽車保險業的深刻變革。此外,還有個人在其職業活動中形成的各種數據,如寫作、科研、發明等,同樣是公共管理數據的重要來源。
大數據客觀上為公共管理提供處理公權力內部的權力運作問題、公權力對公共資源的配置問題,以及為我們維護社會安全、應對社會問題提供全新的思路和技術。這也是大數據時代公共管理與傳統公共管理的最大區別。大數據公共管理更多的是處理數據,而對于不同來源的數據和不同性質的數據,公共管理的處理方式不一樣。
三、大數據在促進公共管理變革中的重要功能
舍恩伯格和庫克耶所著的《大數據時代》提出大數據時代的管理變革,但他們主要是從風險管理的角度來分析的。他們認為,在大數據時代,“我們時刻都暴露在‘第三只眼睛’之下:亞馬遜監視著我們的購物習慣,谷歌監視著我們的網頁瀏覽習慣,而微博似乎什么都知道,不僅竊聽到我們心中的‘TA’,還有我們的社交關系網”,“我們的隱私被第二次利用了”,所以,他們提出“管理規范的革命”,并認為大數據將對管理帶來五大方面的變革,即“個人隱私保護:從個人許可到讓數據使用者承擔責任;個人動因VS預測分析;大數據算法師的崛起;反數據壟斷”③。但是,本文則是從管理的效率、效能來分析大數據為什么能夠促進公共管理變革。大數據能夠促進公共管理的變革,是因為大數據有其特殊的功能。
1.大數據具有強大的數據收集功能。當今時代,數據呈三維爆炸式增長,即同一類數據在快速增長、數據增長速度在加快、新的數據來源和新的數據種類在不斷增加[13]。在這種情形下,傳統的數據收集方式根本無能為力,而云平臺支撐下的大數據技術卻能夠把海量、快速、多樣的數據實現軟件化、智能化。因而,大數據也就能夠為公共管理提供多元化、多源性的信息,這樣就能夠呈現更為真實的客觀實際。大數據為民意辯論和協商共識提供足夠的信息。公共管理的重要環節是民眾參與和通過協商來達成共識。而參與和協商的前提是民眾的信息充分知曉,信息不對稱的協商是不平等的協商,這種協商是難以達成共識的。在這種情形下,大數據就發揮提供多樣化、多源性信息的功能。因此,大數據和云計算實現了徹底的大多數決策的范式。
2.大數據本身具有數據管理的功能。大數據的數據管理是依托于云平臺的智能化管理。大數據的管理功能既包括對大數據的管理,也包括使用大數據結果的管理。從公共管理來看,對大數據本身的管理體現在政府能夠擁有對云硬件進行虛擬化的虛擬技術、對各種數據進行編程的編程技術和提供大數據使用服務的云服務平臺技術;對大數據使用結果的管理功能則體現在適應大數據時代大數據使用的國家立法能力上,也就是通過有效立法來加強對大數據使用結果的管理。簡言之,數據管理是大數據時代公共管理最重要的內容之一。
3.大數據具有強大的分析功能。數據沒有經過分析就是一組沒有生命力的數據,只有經過技術分析的數據才能夠“發聲”,才能夠用于預測和進行公共決策。沒有大數據思維就難以獲得大數據的分析功能。大數據的分析功能不僅是分析已經“發聲”的大數據,還要有能力重組各種已經存在且即將被挖掘出來的數據。由于大數據的核心是預測,因此,大數據結合傳統的分析方法之后,就是要“(1)使用全部或更多的數據來建立預測模型;(2)組合多種分析模型和技術來改善結果;(3)創造一個閉環的環境,讓新知識運用在生產模型中;(4)構建實時性的預測模型;(5)專注于應用預測模型技術”[14]。在思維過程中對數據進行重組,從而挖掘出數據的新價值,是大數據分析功能的核心內容。
4.大數據具有數據挖掘和數據重組的功能。在公共管理過程中,我們往往重視重要數據和可以用二維表結構來邏輯表達實現的結構性數據,并依據這些數據來進行公共決策,從而忽視眾多所謂的不重要的、非結構性數據,但這些數據客觀上對公共決策是有重要影響的。不過,“孤立的數據是沒有價值的”[15]。非結構性數據不能被發現其價值,就是因為它們是孤立的,但大數據技術卻能夠通過挖掘和重組功能對非結構性數據進行充分利用,尤其是通過算法來構建數據的相關關系并挖掘數據價值,把分散的數據整合起來,并在云平臺上通過云技術處理,使之成為有內在相關性的大數據,最終應用到公共管理過程中。
5.大數據具有強大的預測功能。預測自古以來就存在,那么大數據時代的預測與以往的預測有何不同呢?其最大的區別在于“一”與“多”的關系不同。傳統的預測是從“一”來預測“多”的,而大數據時代的預測則是相反,從“多”來預測“一”的。《呂氏春秋·察今》有段話說:“有道之士,貴以近知遠,以今知古,以所見知所不見。故審堂下之陰,而知日月之行,陰陽之變;見瓶水之冰,而知天下之寒,魚鱉之藏也。嘗一臠肉,而知一鑊之味,一鼎之調。荊人欲襲宋,使人先表澭水。澭水暴益,荊人弗知,循表而夜涉,溺死者千有余人,軍驚而壞都舍。向其先表之時可導也,今水已變而益多矣,荊人尚猶循表而導之,此其所以敗也。”這是典型的從“一”預測“多”的情形。以“一”預測“多”的誤差比較大,也導致預測的結果具有相當大的不確定性。然而,大數據的預測完全不同,大數據預測是基于海量數據甚至是全數據來預測某一種趨勢、某一種結果或某一種情形。在《三國演義》第四十六回中,周瑜問孔明:“即日將與曹軍交戰,水路交兵,當以何兵器為先?”孔明回答:“大江之上,以弓箭為先。”周瑜說:“但今軍中正缺箭用,敢煩先生監造十萬枝箭,以為應敵之具。此系公事,先生幸勿推卻。”孔明毫不推卻地說:“都督見委,自當效勞。”孔明之所以敢接這個常人不可能完成的任務,是因為孔明先前進行了相關的“大數據”分析。天氣:“今日有大霧”;曹操的心理特點:“吾料曹操于重霧中必不敢出”;友軍中的魯肅:“子敬只得救我”。在這種情形下,諸葛亮也依據自己掌握的“大數據”進行預測。天氣:“是夜大霧漫天,長江之中,霧氣更甚,對面不相見”,即濃霧不會暴露目標;敵對方:“重霧迷江,彼軍忽至”,也就是說,曹操因多疑,在濃霧之下必將按兵不動;盟友:“魯肅私自撥輕快船二十只,各船三十余人”,這表明諸葛亮早就清楚魯肅的職權和能力,以及他的為人。這一切都圍繞著一個目標來分析和預測:造十萬枝箭來攻打曹操。結果是眾所周知的,幾乎是完全按照諸葛亮預測的情形發展。“草船借箭”即為用“大數據思維”來進行預測的經典案例。大數據預測不是以隨機樣本為前提而是全數據,不追求數據的精確性而是在混雜性的數據中尋找相關關系。這就是諸葛亮所說的:“為將而不通天文,不識地利,不知奇門,不曉陰陽,不看陣圖,不明兵勢,是庸才也。”雖然是混雜的數據,但預測的結果卻不是多樣性的,而是單一性的結果。也就是說,大數據的預測追求預測結果的唯一性。這對于公共管理的意義而言,在于大數據的預測功能規避公共決策結果的不可預知性和結果的多樣性風險。
四、大數據促進公共管理內涵的重大變革
大數據推動公共管理的變革并不是因為大數據提供了數據服務,而是因為大數據帶來管理思維的變革、管理結構的變革、管理邊界的進一步明晰,以及公共管理對象的變化和管理效能的重大變化。大數據技術運用和相應的大數據服務,使公共管理徹底革新。
1.大數據促使公共管理從封閉性的管理結構轉向開放性的管理結構。傳統的公共管理受制于公權力,而公權力的運行在客觀上存在封閉性的特點,如所謂的保密性、國家安全等,社會組織的參與、市場組織的參與度比較低。這種封閉性決定公權力在進行公共資源配置的過程中存在權力尋租的現象,即便沒有權利尋租問題,但由于其封閉性也會導致社會的不信任,使公權力本身陷入“塔西佗陷阱”之中。相反,大數據完全不一樣,大數據是在互聯網和云平臺上運行的,大數據時代的公共管理存在天然的開放性。市場組織與社會組織,甚至民眾個體都可以在公共管理的框架中游走。在這個過程中,普通公眾成為管理框架中的一員,管理者與需求者瞬時轉換,實現全民參與管理,管理主體與客體對象的邊緣變得模糊。這種開放性表明,原來的單一治理模式向多元共治模式的重大變革。
2.大數據使公共管理由官僚科層制轉向扁平化結構。官僚科層制管理是一種金字塔形的治理結構,其結果導致資源配置形成與之相反的倒金字塔形結構,離金字塔塔尖越近的部門獲得的公共資源越多。這樣的公共管理結果最終是難以持續的。社會的不滿情緒也大多源于此。公共資源的分配強調在程序化基礎上的公平,而官僚科層制管理雖然有程序但缺乏公平。所以,官僚體制內部的層級在公共資源分配中發揮決定性的作用。然而,大數據就完全不一樣,大數據把橫向分工合作與縱向科層制的僵化結構打破,政府內部的數據共享與共同決策將最終消除官僚層級對公共資源分配的決定性作用,同時也會消除部門之間的公共資源鴻溝。
3.大數據公共管理與政治管理的邊界進一步得到明晰。傳統的公共管理更多的是基于政治意識形態的安全而實施的過程,把一切涉及經濟利益訴求的集體行動和個人維權行為都納入到與政府對抗甚至視之為顛覆政府的政治訴求行動,所以剛性維穩成為公共管理的常態。其結果往往是與實際目標相去甚遠,進一步激化社會矛盾。實際上大多數的集體行動和維權行動都是以經濟利益為目標的,與政治訴求根本就沒有關系。大數據的監控會把這一切都明明白白地告訴公共管理者。關于這方面的監控過去都是采取人對人的監控,而人往往會對一切都進行主觀判斷,甚至為某種目的而故意隱瞞客觀事實,把經濟訴求的社會行動上報成為政治訴求的社會行動,其結果不言自明。大數據不一樣,大數據采取的是技術監控和技術分析,包括對人的行為的監控。技術只會告訴你數據,不會做出主觀判斷,技術用數據說話。大數據的公共管理就是要去政治化的管理而轉變為社會化的管理。
4.大數據促使公共管理從強化對人的管理轉變為對數據的管理,并借助于大數據來為人服務。傳統的公共管理是為社會秩序服務的,所以專注于對人的行為進行規范化,使之合秩序化。在這種管理框架中,人是公共管理的目標,而不是管理服務的對象。大數據的公共管理,一是數據管理,因為數據是最為關鍵的管理對象,數據在云平臺上安全運行是大數據條件下公共管理的前提條件,因此,對數據的管理是第一位的,只有對數據有效管理,才能實現有效的公共管理。也就是說,對數據的管理是公共管理最重要的一部分。二是用數據服務公眾,即大數據的公共管理從直接對人的管理轉變為直接對人的服務。這是公共管理根本性的變革。
5.從公共管理的效能來看,尤其是針對社會問題,公共管理決策應該是一種預測性的決策,而不是被動應對性的決策。傳統的公共管理往往是一種被動應對性的公共決策,即只有當某種現象出現后,出于強化或防止該現象的再次發生的目的而進行公共決策。這種決策相當于用先前付出的代價來購買新的公共決策。大數據技術條件下可以避免這種用歷史代價來購買未來公共決策的現象,那就是用大數據進行預測式決策。這是因為,大數據不但構筑規模龐大、類型多樣的數據,而且云計算的快速計算能力,能夠實現“全樣本”的數據支撐,從而能夠使公共管理更好地做出預測性優化決策。
五、大數據條件下公共管理面臨的新挑戰
變革也就意味著風險,其中包括不確定性的風險和不可靠性的風險。正如前文所述,大數據預測是以“多”對“一”的預測,其結果應該是確定性的。但是,傳統的公共管理引入大數據之后使公共管理的新手段具有不確定性,同時公共管理的內容也具有不確定性,這樣會導致公共管理的結果具有不確定性。不可靠的風險是指大數據作為全數據的可靠性問題,以及大數據帶來的包括個人隱私保護等方面的問題,都會給公共管理提出全新的挑戰。
1.大數據真的是全數據嗎?所謂全數據都是相對的,但大數據條件下的公共管理對全數據具有天然的依賴性。因此,對大數據實際上就是全數據的依賴會導致公共管理為收集數據而收集數據,或者說是為追求全數據而導致公共管理因數據動態而困惑。雖然公共管理的目標是提高服務質量,但數據的大爆炸會導致公共管理者更多地應對數據爆炸帶來的收集困惑,為如何收集瞬間即逝的非結構性數據而費盡周折。而公共管理的服務內容很有可能被數據收集過程沖淡甚至被忽視。對數據的執迷是大數據時代公共管理面對的第一大挑戰。
2.大數據如何保護個人隱私?保護個人隱私雖然不是公共管理的目標,但它是公共管理的內容之一。傳統的公共管理也包括對隱私權保護的內容,即任何個人隱私都必須得到公共管理行為的保護,公共管理過程不得侵犯個人隱私;否則,公共管理就會被認為是違背法律的。然而,大數據所收集的所有數據都存放在互聯網之中和云平臺之上,而技術的使用者是受到人性控制的,人性可以通過道德來進行制約,可是技術是不具有道德規制功能的。于是,掌握大數據技術的人并不會因為其技術水平的提高而提高其道德水準;相反,在巨大的利益誘惑下,技術會異化為攫取云平臺之上的大數據特別是個人隱私方面的數據來牟取暴利,甚至是進行詐騙、勒索。近年來,網絡詐騙、電信詐騙層出不窮,就是因為人追逐特殊利益的本性而導致大數據技術的異化。由此可見,大數據本是為了提高公共管理水平,但大數據技術的異化給公共管理帶來新的難題。
3.大數據如何進行公共管理方面的立法?公共管理必須有法可依,但立法的原則不同,公共管理的內容是不一樣的。例如,傳統立法使用個人隱私數據必須征得個人同意。在大數據時代,大數據把個人隱私幾乎完全暴露在互聯網之中。因此,在立法管理上就要進行變革,即國家立法要從個人許可轉變為讓數據使用者承擔責任[6]220。由于大數據的價值并不是從表面的數據直接體現出來的價值,而是通過挖掘之后而發現數據的價值進行二級使用,因此,個人許可的立法原則就難以獲得全數據,但獲得全數據之后,數據使用者是否主動要為使用數據負法律責任呢?這無疑是一個未知數。大數據的公共管理要促使數據使用者評估數據使用的風險、規避或減少潛在傷害,但數據使用者往往忽視法律的底線,從而使公共管理在大數據條件下存在數據使用者道德的不確定性風險。
①“大數據”作為一個技術方面的用詞,是1980年著名未來學家托夫勒在其所著的《第三次浪潮》中首先提出來的,2008年9月《自然》雜志推出名為“大數據”的封面專欄。由此,“大數據”才成為互聯網技術行業中的熱門詞匯,同時也成為一個學術熱詞。隨著麥肯錫公司對大數據的應用,大數據迅速進入美國、德國、法國、英國、澳大利亞、日本等國的施政戰略框架之中。2015年8月31日,中國制定《促進大數據發展行動綱要》的大數據發展戰略規劃文件。
②TB級數據就是2的40次方B,PB級數據就是2的50次方B,ZB級數據是2的70次方B。例如,2009年,美國國會圖書館相當于235TB,所有美國學術研究圖書館只有2PB,每天由Google處理的數據相當于24PB。到2020年全球數據量將達到44ZB。
③參見維克托·邁爾-舍恩伯格、肯尼斯·庫克耶:《大數據時代:生活、工作與思維的大變革》,盛楊燕、周濤譯,浙江人民出版社2013年版,第三部分。