關鍵是“發現”的眼睛——數據如何轉化為生產力
當今社會,數據已如空氣和流水,無時不刻不圍繞在我們周圍,將我們包圍。早上醒來,智能手環記錄下了我們的睡眠時間和睡眠質量。吃完早餐,匆匆擠上上班的公交車或地鐵,滴的一聲,交通卡刷卡器已經記下了我們的上車地點和上車時間。一路上刷朋友圈,看看聞,手機記錄下了我們偏好的內容,或是電影,或是綜藝,或是理財產品。下班后約幾個朋友去吃飯,打開地圖搜搜附近評價好的餐廳,地圖留下了我們的痕跡。每天我們不僅僅在享受信息時代帶來的便利,更如辛勤工作的蜜蜂一般,勤勤懇懇、孜孜不倦地產生著、貢獻著我們的數據。
說到大數據,讓我們把視線轉向數百年前的科學家,看看數據如何給我們的生活一步步帶來巨大的變革。1600年,我們的先輩用《和諧大宇宙》描繪了我們所在的宇宙。圖的中間是我們生活的地球。圍繞地球中間有27層球面以展示我們能夠觀測到的太陽、行星和其他恒星。為什么是27層呢?因為這些是當時可以觀測到各種行星或者太陽當時圍繞地球運轉的數據。遺憾的是,一個球面的模型解釋不了觀測到的真實數據。因此,考慮太陽需要加三層球面,加一個行星又要加三層球面,等等。根據所觀測到的數據,加起來一共需要27個球面才能展示宇宙的和諧。
1609-1619年開普勒通過整理、分析觀測到的大量行星運動的數據,發現了行星運動的三大定律,即橢圓定律、面積定律和調和定律。然而,這些規律的發現并不是一件容易的事情。開普勒首先把每一年同一時間的天象進行逐年的對比,才消除了地球的自轉、公轉對數據帶來的擾動,進而才發現了行星運動的基本運行規律。由此可見,即使我們有了大量觀測數據,沒有一雙善于發現“美”的眼睛,也不能欣賞到身邊的良辰美景。如何才能具有一雙慧眼,欣賞云卷云舒的變幻莫測,感受大自然的多姿多彩呢?
首先,我們要能夠收集不同維度的數據,并且進行交叉融合。當前互聯網的發展很大程度上是由消費、娛樂、交友等基本需求驅動的。與之相應的是,在信息系統開發的過程中,更多考慮的是系統的安全性,穩定性,管理的便捷性,而忽略了不同維度的數據之間的關聯性。其實,當前希望挖掘自身數據價值,進行高效知識管理的絕大多數企業和組織都面臨類似的問題。
除了不同維度的數據整合,不同平臺數據的交叉融合分析,具有更高的挖掘價值。比如對于汽車銷售4S店而言,能否準確預測后面幾個月的銷量對于汽車的訂購十分重要。訂購太多,極容易造成產品積壓,增加庫存成本。訂購太少,會拉長用戶的等待時間,流失潛在的客戶,或者降低客戶體驗。如果我們將用戶在不同社區的瀏覽,問答數據進行整合,更進一步將近期用戶的試駕數據進行分析就能夠建立模型預測不同類型車輛在未來的銷售規模。除此之外,停車場管理者也可以利用用戶在在線搜索、評論、試駕數據,從而從消費者角度定義競爭對手,進而制定相應的競爭策略。
信息技術的發展讓政府、高校、企業等不同組織都從不同角度記錄了形形色色的數據。如何在保證數據安全的前提下,挖掘其中的價值?建立大數據背景下的分析理論和方法體系就顯得十分重要。數據的統計分析是指利用樣本數據和統計學方法還原整體數據的統計特征,通過這些統計特征還原數據所體現的真實世界的全貌。事實上,復雜系統的實證統計結果已經發現,不同于經典的正態分布假設,很多實際的復雜系統都具有冪律分布的特征,例如人們的財富分布,Internet中的路由器連接數目,網頁中鏈接關系,貿易網中的交易對象分布,人們的日常出行距離,以及蛋白質折疊和基因調控網絡等等真實系統的分布都符合冪率。以財富分布為例,經典理論通常都假設我們的社會財富分布是橄欖型的,即中等收入群體的人數占到絕大多數,收入很多和很少的人都只占整個社會人口的一小部分。然而,實證數據卻發現,隨著財富的增加,占有相應財富的人的比例卻在快速下降。在不同真實系統中發現的這一規律對于我們認識、理解復雜世界中的簡單規律非常重要。
我們現在還知道除了宏觀層次的系統統計分析之外,微觀層次個體的身體狀態、消費模式、學習習慣、駕駛習慣等高維、稀疏數據的分析,以及中觀(也稱為介觀)層次的消費模式、風險偏好、出行規律的數據統計分析對于個性化智能服務,智慧樓宇管理,智慧城市的建造都具有非常重要的意義。海量數據的統計特征的挖掘就如給我們霧里看花的雙眼帶上了一個VR眼鏡,可以全景式再現真實世界的特征。
然而,只是客觀描述現實世界顯然無法滿足人類對數據的好奇心和對未來的向往。科學家很關心五彩斑斕的現象背后是否有我們未知的彩虹?業界則非常關心如何挖掘其中蘊含的無限商機。如果說數據是蒸汽機、電力之外的另一種能夠推動生產力變革的資源,那么如何挖掘數據中蘊含的價值?如何讓數據幫助我們每個人心中的小宇宙爆發呢?如果將身邊無處不在的數據比作散布在我們周圍的金礦,那么顯然除了收集這些礦產資源,如何提煉高純度的金礦進而加工成不同風格的金飾品、藝術品就是技術含量非常高的一門藝術。
我國的自然科學基金委員會于2015年發布了“大數據驅動的管理與決策”重大研究計劃,計劃用八年時間分別從公共管理,醫療,商務,金融等四個維度開展研究,分析大數據時代所帶來的產業變革,以及相應商務模式,管理決策理論和相應的分析方法。對傳統行業來說,數據時代的到來既是機遇,更是挑戰。小的組織和企業船小好調頭,可以快速擁抱數據帶來的生產力變革,而大的組織和企業則如同航母——轉彎都非常困難。而我們的經濟生態系統就在這種“大與小”的博弈,“快與慢”的競爭中不斷地推陳出新、優勝劣汰。
數據變成生產力的時代,終會到來!
作者為上海財經大學講座教授