摘要:智慧城市的宣傳過分夸大了數據中心的作用,為數據中心設立達不到的標準對其發展是不利的。互聯網使數據資源由稀缺變為過剩,宏觀決策的信息渠道日益廣闊,以提供數據為宗旨的數據中心作用也日益下降,政府決策對數據中心依賴性下降不可避免,數據中心的生存空間被壓縮。
一、灰色的數據空間
數據空間是灰色的
大數據熱透全國之時,需要強調數據并不等于真實世界。將現實抽象為數字需要忽略許多信息,例如必須忽略統計對象間的差別才能進行統計,難以數字化的信息在數據空間中是沒有位置的,容易數字化的信息則占據了太大的空間,數據空間無法全面反映世界,靠大數據技術就能認識世界的想法并不靠譜。
認識無止境,不斷有新問題產生
互聯網之前人們認為決策水平不高是因信息不足、缺乏信息共享,互聯網實現了信息爆炸、推動了全球信息共享之后,決策水平依然不高,人們發覺原因竟然是信息過多使人迷惑,信息不足與信息過度后果是一樣的。如今人們認為決策水平低是因為缺乏大數據分析,有了大數據分析決策水平一定能提高嗎?不一定,過多依賴大數據分析同樣會拉低決策水平。
不要迷信工具,工具自帶局限性
經驗告訴我們不能迷信工具,正如不能迷信包治百病的靈丹妙藥一樣,任何工具都會帶來先天的局限性,大數據技術也是一樣,都有其致命的燈下黑,如果不能回避其薄弱點而盲目夸大其作用,會比沒有大數據技術更糟,大數據技術的欺騙能力與造福能力不相上下。
不要迷信數據,數據到價值的距離漫長
數據世界并不能替代真實世界,只靠數據決策和只靠地圖打仗一樣不靠譜。數據本身并無價值,只在對實現目標有貢獻時才產生價值。數據價值實現還依賴使用者的眼光、數據處理的能力,從數據到價值的路程太漫長,大部分數據很難實現其價值。外部互聯網數據資源日益豐富不斷增加對數據中心的競爭力,使政府決策對數據中心的依賴度也不斷下降。
二、大數據應用的局限
不是所有的信息都能數字化
大數據技術能夠充分挖掘大量數據中所包含的信息以支持政府決策,但是過分依賴大數據會產生另一種片面性。因為并不是所有的信息都能夠數字化,在宏觀決策中很多重要的信息恰恰是很難數字化的,例如未來趨勢、社會的情緒、團隊的士氣、人們的欲望以及這些因素的相互作用等都難以用數據表達,大數據善于表述某方面精準信息卻容易忽略全面的信息,并不比拍腦袋決策強到哪里。
巨大的數據量是以業務面狹窄為代價的
不能以為數據規模大所包含的信息就一定重要,其實數據量越大涉及的領域越窄,因為只有在狹窄的領域中才能形成巨大的數據量,從其中挖掘出來的信息也帶有領域狹窄的局限性,其所預測的范圍也會狹窄,因此大數據預測適合于局部性、專業性領域。
因數據源缺乏產生的局限性
大數據應用的實際困難經常來自數據源缺乏,因為大數據的收集成本太高,無法像統計調查那樣為收集數據而設計調查方案,大數據主要是來自大規模業務工作的副產品,如移動通信的聯網數據、互聯網搜索數據、電子商務數據、社交網絡數據等等,大數據應用對數據源的依賴性限制了應用的普及,在很多情況下大數據應用遠不如常規小數據應用方便。
大數據并不適合大決策
大數據應用對優化城市管理有很大貢獻,特別在某些專業化領域,如金融風險防范、刑事案件偵破、用戶產品推薦、廣告效果優化等等,但是大數據技術并不適合于政府高層決策,大數據應用并不能使政府高層決策科學化,高層決策更關注全面的態勢,而大數據信息視野太窄只適合具體業務應用,更重要的是,高層決策要面對許多不確定性問題,大數據處理不確定性問題不如有經驗的領導人處理得好。
三、數據整合的意義
大數據、小數據整合方法不同
數據整合是數據中心的核心工作,小數據的整合主要是原始數據的整合,數據整合主要是不同部門的業務處理數據,按照處理的對象鏈接起來,并進行數據核對,確保數據的精準對接,以支持政府的精細化服務。小數據的整合是政府數據整合的重點。
大數據的整合主要是大數據處理結果的整合,大數據處理成本很高,減少使用時的再處理是非常重要的,大數據處理的結果可以濃縮為報表、可視化展示等多種形式以方便后續應用,針對具體目標的搜索數據可以整理成數據庫,如信用庫、用戶庫、黑名單等,方便查詢。
小數據整合的價值
政府業務數據的整合將有效提升數據的價值,業務數據的產生只反映該業務部門的視角,這對于掌握服務對象(人、企業、項目等等)的全面情況是不夠的,如果能夠將各部門積累的業務數據整合起來就會產生對服務對象全面、精準的認識,對管理與服務的改進有重要意義。信息本質是事物間的相互關系,關系是多維的、網狀的,只有整合起來才能反映關系的全面屬性。
政府精細化管理依賴小數據整合
政府的管理與服務工作主要通過各部門規范化業務來實現,而業務數據就是這種管理與服務的記錄,業務數據成為進一步服務的依據,相關業務數據整合一體對于政府的精細化管理有著重要意義,數據精準是管理精準的基礎,當工作人員對服務對象信息能夠全面調用之時,服務會更精準、更快速,用戶會少跑腿,用戶欺詐行為也會大大減少。
大數據整合的兩個方向
大數據整合的目的是降低數據再利用的成本。大數據應用有宏觀與微觀兩個不同方向,其數據整合也有兩種模式,統計模式與搜索模式。統計模式對應宏觀應用,其目的是挖掘數據整體的信息,認識屬性間的相關關系,用于政府宏觀決策。大數據應用成果多以報表或可視化態勢圖來表示。數據中心的大數據整合業務主要是這種模式。
搜索模式對應大數據的微觀應用,關注焦點是個體行為信息,如個別用戶的消費習性、行為規律等。這種模式大量用于安全風險防范(如反恐、破案、金融安全等)。搜索模式多以數據庫形式提供查詢(如用戶CRM、個人征信庫、黑名單等)。以搜索為中心的大數據整合十分復雜,多由專業機構承擔,一般不作為數據中心的主要業務。
四、數據中心如何生存
不要夸大數據中心的作用
智慧城市的宣傳過分夸大了數據中心的作用,為數據中心設立達不到的標準對其發展是不利的。互聯網使數據資源由稀缺變為過剩,宏觀決策的信息渠道日益廣闊,以提供數據為宗旨的數據中心作用也日益下降,政府決策對數據中心依賴性下降不可避免,數據中心的生存空間被壓縮。
政府基層服務主要是業務數據的精確使用,不受互聯網信息膨脹的沖擊,未來數據中心的價值將更多體現在政府基層服務的精細化改進上,加強對基層的數據服務是數據中心重要的生存之路。
大數據應用是掛一漏萬的
依照目前的宣傳大數據幾乎可以解決政府的一切問題,從經濟預測到反恐破案都能勝任,事實并非如此,首先大數據源的準備就是難題,大數據任務很分散,每項任務都是非常復雜的工程,很難用一種規范化流程來降低成本,大數據應用成為掛一漏萬的示范項目,很難實現規范化經營,只有找到規模化、重復率高的應用領域,大數據應用才能變為有規模效益的經營。
數據中心成長要借助于規模化業務
數據中心的成長不能只靠初始投資,持續的業務收入更重要,數據中心的業務能力是大量實際任務訓練的結果,數據中心需要伴隨著業務的成長而成熟,未經大規模業務錘煉的數據中心只是中看不中用的。
大數據、云計算業務的領先公司亞馬遜、谷歌、阿里巴巴等,其業務能力都是借助于公司內部業務而成長的,內部應用的鍛煉促進了大數據應用技術的成熟,其后才逐步對外服務,形成大數據與云計算服務產業。
站穩腳跟是數據中心的當務之急
城市數據中心最要緊的是先能站穩腳跟,使貢獻大于政府的投入,這樣才有進一步發展的可能。選擇恰當的業務起步非常重要,唯有真實的需求才能鍛煉隊伍,數據中心才能學會生存,進而求得發展。從專業化的業務起步是有益的,專門做好一件事會容易得多,技術積累效率也高,數據中心不能浮躁,一個領域做好了再拓展新領域不遲。
五、數據中心不要以城市大腦自居
數據中心要有自知之明
數據中心的作用永遠達不到媒體宣傳的那么神奇,建設者要有自知之明,防止以后的被動。數據中心的資源、經費、人才是有限的,在未來的三、五年內能夠在電子政務領域做成幾件事就不錯了,國家四大基礎數據庫建設了十五年處境依然艱難,各地小數據的精準化工程推進都不輕松,更不要說大數據整合了。
城市數據中心被媒體捧為“城市大腦”并不妥,歷史上的城市是自然而然地發展起來的,沉淀了千年的智慧,不見“城市大腦”何在,城市智慧早已分布式存在著,不是靠數據中心的出現城市才有了智慧。
城市智慧是自組織的涌現
城市智慧存在于城市的機制之中,存在于城市各方面資源的配套與合作之中,城市的高效率來自社會組織的精細配合,來自生產方式與技術的積累,這些都是城市的智慧,而這些智慧的產生并不是政府能操縱的,它是社會自組織創新的結果,城市智慧是廣大居民自組織創新涌現出來的新狀態,城市智慧是以網絡形態、分布的模式滲透在城市的各行各業之中。
智慧是一種生態
聰明、智能是同一層次的概念,它們是具體的工作方式,我們可以更聰明地做好一件事,建好一個智能系統,但這樣做并不等于就智慧了,智慧是更高層次的概念,它是大量聰明行為、智能產品涌現出來的整體狀態,城市智慧更像是一種生態,是一種有利于產生聰明與智能的生態環境。這種有助于創新繁榮生態環境不是大數據中心能代表的,我們需要從網絡與生態視角來認識城市智慧,所謂“城市大腦”其實是一個分布式、網絡化的系統。
數據中心要做好自己的事
城市的智慧是城市居民長期自組織創新積累的結果,政府工作的智能化也只是智慧城市大量智能化工程的一部分,政府應當認真集中精力做好自身業務的智能化,數據中心要把份內工作做好去服務他人,正確認識“城市大腦”的網絡屬性將有助于調動全社會的積極性,共同建設智慧城市。