近日,大數據應用及產業發展大會在廣州舉行,本次大會主題為“數據驅動智造,互聯助力轉型”。大會上,珠江三角洲國家大數據綜合試驗區作為全國首批確定的跨區域類綜合試驗區正式獲批。廣東省副省長袁寶成表示,到2020年,力爭將廣東打造成為全國數據應用先導區、大數據創業創新集聚區,搶占數據產業發展高地,建成具有國際競爭力的國家大數據綜合試驗區。
大數據一詞近年炙手可熱,而大數據究竟是什么或者能做什么,公眾并不太清楚。當描繪大數據的時候,通常聽到的會是除了身份等基本信息之外,每個人生活中的一切活動,包括消費習慣、對話、社交、移動都會被儲存記錄,并用以分析。這樣的描述有助于增進對大數據“怎么來”的感性理解,卻未能呈現它能“做什么”。隨著互聯網的發展和信息數字化程度的指數級增長,這些收集起來的數據集所形成的大數據,經過分析和應用,可以在國防、公共服務、醫療、金融和企業創新等各行業各方面提升效率并創造新的可能——— 服務于當下并預測甚至規劃未來。
有很多令人嘆為觀止的新興領域或解決方案,其實都是以大數據為基礎,例如:通過收集和分析醫療數據,研發新的醫療技術;通過對各類數據的關聯分析,為金融反欺詐提供決策支持;區塊鏈也是基于大數據實時分析的產品,建成后可以大幅增進信息透明度取代人工,銀行將是成本和道德風險降低的受益者;美國本月剛宣布要建立全國武力使用數據手機系統來掌握警方對平民使用暴力和拘留所死亡事件發生的頻度,以防止警察濫用暴力。包括最近很受關注的人工智能(AI)在內,都和大數據緊密相關。
從2012年美國啟動“大數據研究和發展”計劃以來,英國、澳大利亞、日本、韓國等多個國家亦推出了一系列積極擁抱大數據的政策。當然,美國依然是這場信息革命的領頭羊,無論在數據源或分析工具、可視化呈現、決策支持方面,美國都最為成功。估值最高的大數據領域企業Palantir,最突出的案例是幫助美國政府獵殺本·拉丹;Ayasdi專注于醫療數據分析和人工智能,和多個頂級美國醫院、藥廠都有合作;Tab-leau和DO M O都是數據可視化方面的佼佼者;而在美國總統大選中因預測而備受關注的FiveThirtyEight,則是針對政治、文化、體育運動和經濟熱點進行大數據分析的博客。
中國也在加快進入大數據時代的步伐,近期剛提出建設國家新型城鎮化大數據庫。在此時啟動大數據綜合試驗區,是十分有價值且有預見性的嘗試,廣東亦有一定的技術支持和開放環境。
不過,在大數據領域,我國還處于入門階段,基礎比較薄弱。首先,最大的問題是數據源缺乏。政府是最大的數據收集者和使用者,所以各國的大數據政策中,政府數據開放都是第一步。而我國的政府數據在收集方式及儲存方式上都還很傳統,醫保、社保及住房信息尚未全國聯網,政府預算和決算等財務信息也比較粗糙,數據源本身的質量和數量都有缺漏。企業所擁有的數據就更零碎,主要集中在BAT,如阿里的淘寶和支付寶,騰訊的微信和Q Q,百度的搜索引擎,而即便BA T都尚未能對大數據進行深入分析使用。私人部門擁有的數據都很零碎,因此,很多大熱產品實質上都是假借大數據之名進行關聯推送等淺層使用,只是通過刷用戶活躍度和講故事來圈錢。
大數據的應用,數據源、分析方法和科研支持,缺一不可。這需要從政府到企業、從高校到非營利部門的全方位支持。無論是數據的挖掘、數據分析和使用、數據可視化,中國都才剛到門邊,對于利用大數據提升公共服務質量、執政透明度、開發新醫療技術或者探討大數據使用和隱私保護的邊界,就更是門外漢。但不要緊,全世界的大數據應用也不過才開始幾年而已。大數據綜合試驗區是令人欣喜的嘗試,除了一腔熱情與政策優惠,更需要技術積累與科研支持。廣東既然先邁出了這一步,可以從開放數據做起,加大科研力度,放開戶籍政策吸引人才,并以政府購買服務等方式激勵第三方企業的技術創新。站在大數據時代的風口,一切才剛開始,一切皆有可能。