近年來,由于各級政府的高度重視,大數據在中國也得到了較快的發展。當然,作為一個相對新鮮的事物,中國的大數據發展還存在著一定的問題。
2020年中國數據總量將占全球21%
經過多年信息化建設和互聯網發展,中國已經成為數據大國。互聯網已經成為生產、生活的重要技術平臺,隨著信息技術的日益普及和“互聯網+”融合態勢的加快,海量數據不斷快速聚集,據工信部總工程師張峰在2015中國國際大數據大會上介紹,國際有關機構統計,中國的數據總量將以年均50%的速度增長,預計到2020年將占全球的21%。在新形勢下,國務院于2015年6月24日印發了《關于運用大數據加強對市場主體服務和監管的若干意見》,提出要充分運用大數據先進的理念、技術和資源,加強對市場主體服務和監管,推進減政放權和政府職能轉變,提高政府治理能力。同年8月31日頒布了《關于促進大數據發展的行動綱要》,并提出“堅持創新驅動發展,加快大數據部署,深化大數據應用,已成為穩增長、促改革、調結構、惠民生和推動政府治理能力現代化的內在需要和必然選擇。”
各地出臺大數據行動計劃
與此同時,全國各地也加快了推動大數據發展的步伐。其中,廣東、上海、重慶、貴州、武漢等省市在全國率先制定頒布了推動大數據發展的效果政策文件。早在2012年11月,廣東便發布《廣東省實施大數據戰略工作方案》,提出“為保證大數據戰略有效實施,廣東省將建設政務數據中心,并為高等院校和企業等成立大數據研究機構提供支持。”2013年7月,上海發布《上海推進大數據研究與發展三年行動計劃(2013-2015年)》,提出“突破大數據關鍵技術,建立以企業為主體、產學研聯合的發展機制,形成需求牽引、創新應用的發展模式,發展數據產業,服務智慧城市。”擬成立“上海大數據產業技術創新戰略聯盟”,建設“上海市數據科學重點實驗室”、數據工程技術研究中心等,以大數據技術創新及產業應用為目標、以聯盟為紐帶促進形成若干引領大數據產業技術創新的企業聯合實體。2014年2月,貴州印發《關于加快大數據產業發展應用若干政策的意見》、《貴州省大數據產業發展應用規劃綱要(2014—2020年)》,提出了貴州省大數據發展的目標是,即推動貴州省大數據產業穩步快速發展,到2020年,大數據帶動相關產業規模達到4500億元。大數據產業體系基本健全,業務形態較為齊備,創新能力顯著增強,安全保障能力明顯提高。產業載體建設順利推進,聚集一批具有較強市場競爭力的骨干企業。數據中心布局合理,政府數據資源實現有效整合,大數據開放與管理機制初步建立,應用水平明顯提高,以大數據引領和支撐貴州省經濟社會轉型發展的能力顯著增強。此外,重慶、武漢等其他省市也紛紛頒布了各自的大數據行動計劃。
從數據大國向數據強國轉變五大制約
在中國積極發展大數據的同時,還存在著若干制約中國從數據大國向數據強國轉變的因素,具體來說,主要包括以下幾個方面:
1.需求不明確
數據是大數據產業發展的基礎,具有商業價值的數據和商業分析真正能夠幫助企業提升業務,創造出新的價值。很多企業業務部門不了解大數據,也不了解大數據的應用場景和價值,因此難以提出大數據的準確需求。而大數據部門又是非盈利部門,企業決策層擔心投入太多的成本,導致了很多企業在搭建大數據部門時猶豫不決,或者很多企業都處于觀望嘗試的態度,從根本上影響了企業在大數據方向的發展,也阻礙了企業積累和挖掘自身的數據資產,甚至由于數據沒有應用場景,刪除很多有價值歷史數據,導致企業數據資產流失。
2.共享不充分
由于缺少統一規劃和統一的標準,中國政府部門與數據企業在建設信息化系統的過程中形成了眾多的“信息孤島”。在很多企業中尤其是大型的企業,數據常常散落在不同部門,而且這些數據存在不同的數據倉庫中,不同部門的數據技術也有可能不一樣,這導致企業內部自己的數據都沒法打通。如果不打通這些數據,大數據的價值則非常難挖掘。另一方面,中國的大數據市場還不成熟,市場上存在的僅是孤立、不流動、沒有整合的數據,客戶很難找到完整的、具有商業價值的數據因而不得不從多個數據企業采購數據,這樣不但效率低,而且費用高。
3.安全保障低
隨著信息技術的不斷發展,如何保證用戶的信息安全日益成為一個非常重要的課題。在大數據時代,要求將所有的數據存儲在同一個地方,這使得保護數據會變得更加簡單,但與此同時,在線數據越多越集中,黑客也越容易獲得關于人的信息,從而更可能實施犯罪。日前一些知名網站密碼泄露、系統漏洞導致用戶資料被盜等安全事件已經警醒我們,要加強大數據網絡安全的建設。另一方面,隨著數據的不斷增加,對數據存儲的物理安全性,從而對數據的多副本與容災機制要求也會越來越高。目前,中國多數政府部門和傳統企業的數據安全令人擔憂。
4.人才隊伍少
大數據在中國是新生事物,國內高校開展大數據技術人才培養的時間不長,技術市場上掌握大數據處理和應用開發技術的人才很少。另一方面,大數據的發展速度很快,無論是政府部門還是企業都需要一支掌握懂技術、善管理、有經驗的大數據建設專業隊伍,包括大數據開發工程師、大數據分析師、大數據架構師、大數據后臺開發工程師、大數據算法工程師等。因此,目前中國大數據市場上的技術人才儲備與大數據處理和應用需求之間存在著巨大的缺口,而且這一缺口將在未來幾年可能持續存在。
5.隱私保護差
在大數據時代,信息公開和數據共享是必然的趨勢,但與此同時,隨著數據的指數性增長,隱私泄露事件時有發生。目前,中國還沒有專門的隱私權保護法律,因而無法保證國家大數據戰略進行過程中數據的隱私安全。為促進大數據的健康有序發展,我們必須盡快研究制定相關法律法規,明確對大數據戰略中每一個項目的活動周期中產生的數據進行隱私監管,確保數據隱私不被侵犯。
發展中國大數據六大對策建議
在借鑒國外發達國家和地區先進經驗的基礎上,充分考慮中國具體國情及國內外大數據發展的趨勢,中國發展大數據應該采取如下對策建議。
1.推動數據開放
政府擁有大量有價值的數據,因此政府應該著眼于民生福祉,帶頭推動政府數據的開放共享。要加快建立政府數據開放平臺,推動各級政府和公共服務機構優先開放高價值數據資源。加強政府與民間協作,推動各類優質數據資源的開放共享。積極發揮市場的決定性作用,引導更多非公共數據向社會開放,鼓勵基于開放數據開展應用創新,通過數據資源的開放利用,促進大數據技術和產業創新發展,并惠及更多民眾。
2.健全法律法規
借鑒美歐等發達國家和地區的經驗,加快制定完善《中華人民共和國政府信息公開條例》、《中華人民共和國保守國家秘密法》、《中華人民共和國個人隱私法》等有關信息公開、數據安全、網絡安全、隱私保護方面的法律法規,規范國家重要數據的存儲、備份和遷移,保障數據安全、可靠。在尊重知識產權的前提下,規范數據隱私保護的范圍、方式和程序,有效避免信息公開與隱私保護方面的沖突,對相關數據去除敏感信息后實現開放和共享。
3.完善標準規范
盡快制定并試行對數據開放原則和機制規范、數據分級標準、數據發展及使用的責任與權益等大數據發展應用過程中必需的相關標準規范。制定數據編碼、處理、共享、交換標準,出臺大數據技術、協議、標準等規范;建立數據資產訪問、連接和共享機制,搭建數據資產交易平臺,形成數據流轉的層次化體系結構;研究數據資產的所有權、使用權以及價值評估體系,通過市場化模式保障數據資產流轉的可行性。
4.保障信息安全
妥善處理發展創新和安全規范的關系,探索完善安全管理規范措施,切實保障數據安全。建立大數據安全評估體系,做好大數據應用安全評測和風險評估,提高大數據平臺信息安全監測、預警和應對能力。加強測試工具研發,開展大數據平臺可靠性及安全性評測服務,引導大數據安全可控和有序發展。推動數據保護、個人隱私、數據權益和合理利用等方面的地方立法工作,加快出臺實施細則,對重要數據的保存、備份、遷移等進行規范管理。
5.加強人才培養
落實各項人才政策,創建吸引人才、留住人才的良好環境,加快從美、歐等發達國家和地區引進既懂業務知識又具分析技能的復合型數據人才。扶持高等院校大數據相關專業的發展,推進大學課程改革,開設一系列符合現在和未來社會需求的數據技術的相關課程,培養數據存儲、數據挖掘、數據可視化等方面的專門人才。鼓勵高校和企業通過建立聯合實驗室、研發中心等形式,聯合培養理論與實踐相結合的大數據專業人才。充分發揮以崗位培訓和繼續教育為重點,加大社會化培訓力度,提高在職人員大數據應用技能,進一步加強對機關公務員、事業單位、大中型企業工作人員的大數據知識的培訓與考核。
6.支持技術創新
加大財政對大數據關鍵技術研發創新的引導和扶持力度,構建自主的大數據技術體系。加強大數據共性基礎技術研發。重點研發大數據存儲管理、分析挖掘、可視化、數據安全等關鍵技術和產品,提前布局自然語言處理、語義理解和機器學習等關鍵技術。支持國內創新型企業,開發專業化的數據處理分析技術和工具,提供特色化的數據服務。支持高校和科研院所建立大數據開放實驗室,推動多學科交叉融合,開展大數據分析關鍵算法和關鍵技術研究和大數據專業人才培養,并加強實踐應用。(武鋒 國家信息中心)
2020年全球大數據將達40ZB 美日歐發展經驗啟示
隨著新一代物聯網、云計算、移動互聯網等信息技術的不斷普及,人類產生的數據量正在呈指數級增長,大約每兩年翻一番,而且這個速度將在2020年之前會繼續保持下去。這意味著人類在最近兩年產生的數據量相當于之前產生的全部數據量。有關資料顯示,2011年,全球數據規模為1.8ZB,可以填滿575億個32GB的iPad,這些iPad可以在中國修建兩座長城。到2020年,全球數據將達到40ZB,如果把它們全部存入藍光光盤,這些光盤和424艘尼米茲號航母重量相當。
在此情況下,數據日益成為一種重要的戰略資源。近年來,美、歐、日等發達國家和地區也紛紛將開發利用大數據作為奪取新一輪競爭制高點的重要抓手,相繼出臺了相關的戰略規劃和配套法規來促進大數據應用與發展,致力于利用大數據來進一步增強自身的綜合競爭力。筆者將分析研究上述國家和地區的具體做法和經驗,供中國健康有序發展大數據學習借鑒。
美國、歐盟、日本大數據發展現狀及舉措:
美國
2010年,美國總統科學技術顧問委員會(PCAST)向奧巴馬和國會提交的《規劃數字化的的未來:美國總統科學技術顧問委員會給總統和國會的報告》指出,大數據技術具有重要戰略價值,而聯邦政府對其研發投資不足,建議聯邦政府“制定一個應對‘大數據’的戰略”。此后,奧巴馬政府著手采取了一系列主題為“我的大數據”(My Data Initiatives)的倡議和措施,分別為2010年發起的《“藍紐扣”計劃》、2012年發起的《“綠紐扣”計劃》、2012年發起的《“我的學生數據”計劃》和2014年發起《“創建副本”計劃》,旨在促進美國人可以更安全地獲取他們的個人數據,從而更好地處理他們私人領域的申請活動和服務。2012年3月,美國投資2億美元啟動了“大數據研究和發展”計劃,該計劃涉及國防部、能源部等6個聯邦政府部門,用以大力推進大數據的收集、訪問、組織和開發利用等相關技術的發展,進而大幅提高從海量復雜的數據中提煉信息和獲取知識的能力與水平。政府對大數據帶來的負面影響也更加重視,白宮 2014年5月,美國發布的白皮書《大數據:抓住機遇,守護價值》提出:“大數據正在改變世界。但是它并沒有改變美國人對于保護個人隱私、確保公平或是防止歧視的堅定信仰。”
歐盟
歐盟于2011年12月公開頒布了《開放數據戰略》。它以開放數據為核心,以創新、增長和透明治理為引擎,將重點加強在數據處理技術、數據門戶網站和科研數據基礎設施三方面的投入,旨在歐洲企業與市民能自由獲取歐盟公共管理部門的所有信息,建立一個匯集不同成員國以及歐洲機構數據的“泛歐門戶”。目前,歐盟正在研究制定數據價值鏈戰略計劃,以實現數據的最大價值,尤其是所謂的“大數據”,重點是通過一個以數據為核心的連貫性歐盟生態體系,讓數據價值鏈的不同階段產生價值。數據價值鏈戰略計劃包括開放數據、云計算、高性能計算和科學知識開放獲取這四大戰略,遵循的主要原則是:高質量數據的廣泛獲得性,包括公共資助數據的免費獲得;作為數字化單一市場一部分,歐盟內數據的自由流動;尋求個人潛在隱私問題與其數據再利用潛力之間的適當平衡,同時賦予公民以其希望形式使用自己數據的權利。
日本
2012年6月,日本IT戰略本部發布電子政務開放數據戰略草案,邁出了政府數據公開的關鍵性一步。為了確保國民方便地獲得行政信息,政府將利用信息公開方式標準化技術實現統計信息、測量信息、災害信息等公共信息,在緊急情況時可以較少的網絡流量向手機用戶提供信息,并盡快在網絡上實現行政信息全部公開并可被重復使用。2012年7月,日本總務省ICT基本戰略委員會發布的《面向2020年的ICT綜合戰略》(草案)提出,“提升日本競爭力,大數據應用不可或缺”,戰略將重點關注“大數據應用”。2013年6月,安倍內閣正式公布了新IT戰略——《創建最尖端IT國家宣言》,全面闡述了2013~2020年期間以發展開放公共數據和大數據為核心的日本新IT國家戰略,提出要把日本建設成為一個具有“世界最高水準的廣泛運用信息產業技術的社會”。
經驗與啟示:
1.注重頂層設計
為充分抓住大數據帶來的新發展機遇,美、日等發達國家無不從國家層面來制定大數據戰略規劃,提出國家實施大數據戰略的明確目標,并用于引領帶動本國大數據的快速發展。如美國的《我的大數據》、《大數據研究和發展》等,日本《面向2020年的ICT綜合戰略》、《創建最尖端IT國家宣言》等。另一方面,美、日等國政府除了做好大數據項目的統籌規劃以外,還會提供充足的資金以支撐提升國家數據能力的基礎設施建設以及促進面向大數據創新應用技術的開發,并保證政府部門數據存儲需求和數據安全需求。
2.注重數據開放
為保證大數據能夠充分發揮作用,美、歐、日等發達國家和地區都實行了開放數據的政策。如美國的《我的大數據》分別從退伍軍人健康記錄、納稅信息、電力能源使用和學生助學信息四個方面進行信息公開,使得美國人可以更安全地獲取他們的個人數據,用來更好地處理他們私人領域的申請活動和服務。《歐盟開放數據戰略》旨在歐洲企業與市民能自由獲取歐盟公共管理部門的所有信息,建立一個匯集不同成員國以及歐洲機構數據的“泛歐門戶”。日本IT戰略本部于2014年6月發布電子政務開放數據戰略草案;并于2013年7月由日本三菱綜合研究所牽頭成立了“開放數據流通推進聯盟”,旨在由產官學聯合,促進日本公共數據的開放應用。
3.注重隱私保護
隨著在大數據飛速增長,隱私問題也日益呈現在世人的面前。美、歐、日等發達國家和地區在強力推動大數據的同時,也充分考慮了隱私的保護。隨著遠程控制技術與云端儲存技術在個人電腦與文件管理領域普及,美國政府正在通過發展大數據戰略來完善隱私法以保證法律跟上技術發展的腳步。現今美國最高法院正從第三方數據的訪問權限、數據和元數據的安全、商業數據服務的政府使用、內部威脅和持續性評估這四個方面著手來完善隱私法。歐盟通過“迎接大數據時代”的推廣,呼吁成員國積極推動大數據業務,并就“數據所有權”和數據提供責任作出新規定、制定數據標準等。
4.注重社會參與
由國家出資推進政府與各科研單位、高校、企業的合作,組合社會各界多元力量共同參與大數據戰略,是發達國家和地區的重要經驗。如美國《大數據研究和發展計劃》就是以美國各級政府為主導,依托高校和科研機構,鼓勵聯邦政府機構和各州政府以及高校、非政府組織和企業等各種力量廣泛參與,并通過多種形式進行充分的合作。日本為促進本國大數據的快速發展,成立了由三菱綜合研究所牽頭、東京大學等機構廣泛參與的“開放數據流通推進聯盟”。(武鋒 國家信息中心)
【延伸閱讀】
大數據4V特征與六大發展趨勢
隨著新一代信息技術的迅猛發展和深入應用,數據的數量、規模不斷擴大,數據已日益成為土地、資本之后的又一種重要的生產要素,和各個國家和地區爭奪的重要資源,誰掌握數據的主動權和主導權,誰就能贏得未來。奧巴馬政府將數據定義為“未來的新石油”,認為一個國家擁有數據的規模、活性及解釋運用的能力將成為綜合國力的重要組成部分,對數據的占有和控制將成為繼陸權、海權、空權之外的另一個國家核心權力。此后,一個全新的概念——大數據開始風靡全球。
大數據的概念與內涵
“大數據”的概念早已有之,1980年著名未來學家阿爾文•托夫勒便在《第三次浪潮》一書中,將大數據熱情地贊頌為“第三次浪潮的華彩樂章”。但是直到近幾年,“大數據”才與“云計算”、“物聯網”一道,成為互聯網信息技術行業的流行詞匯。2008年,在谷歌成立10周年之際, 著名的《自然》雜志出版了一期專刊,專門討論未來的大數據處理相關的一系列技術問題和挑戰,其中就提出了“Big Data”的概念。2011年5 月,在“云計算相遇大數據” 為主題的EMC World 2011 會議中,EMC 也拋出了Big Data概念。所以,很多人認為,2011年是大數據元年。
此后,諸多專家、機構從不同角度提出了對大數據理解。當然,由于大數據本身具有較強的抽象性,目前國際上尚沒有一個統一公認的定義。維基百科認為大數據是超過當前現有的數據庫系統或數據庫管理工具處理能力,處理時間超過客戶能容忍時間的大規模復雜數據集。全球排名第一的企業數據集成軟件商Informatica認為大數據包括海量數據和復雜數據類型,其規模超過傳統數據庫系統進行管理和處理的能力。亞馬遜網絡服務(AWS)、大數據科學家JohnRauser提到一個簡單的定義:大數據就是任何超過了一臺計算機處理能力的龐大數據量。百度搜索的定義為:"大數據"是一個體量特別大,數據類別特別大的數據集,并且這樣的數據集無法用傳統數據庫工具對其內容進行抓取、管理和處理。互聯網周刊的定義為:"大數據"的概念遠不止大量的數據(TB)和處理大量數據的技術,或者所謂的"4個V"之類的簡單概念,而是涵蓋了人們在大規模數據的基礎上可以做的事情,而這些事情在小規模數據的基礎上是無法實現的。換句話說,大數據讓我們以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,或深刻的洞見,最終形成變革之力。
綜合上述不同的定義,我們認為,大數據至少應包括以下兩個方面:一是數量巨大,二是無法使用傳統工具處理。因此,大數據不是關于如何定義,最重要的是如何使用。它強調的不僅是數據的規模,更強調從海量數據中快速獲得有價值信息和知識的能力。
大數據4V特征
一般認為,大數據主要具有以下四個方面的典型特征:規模性(Volume)、多樣性(Varity)、高速性(Velocity)和價值性(Value),即所謂的“4V”。
1.規模性。大數據的特征首先就體現為“數量大”,存儲單位從過去的GB到TB,直至PB、EB。隨著信息技術的高速發展,數據開始爆發性增長。社交網絡(微博、推特、臉書)、移動網絡、各種智能終端等,都成為數據的來源。淘寶網近4億的會員每天產生的商品交易數據約20TB;臉書約10億的用戶每天產生的日志數據超過300TB。迫切需要智能的算法、強大的數據處理平臺和新的數據處理技術,來統計、分析、預測和實時處理如此大規模的數據。
2.多樣性。廣泛的數據來源,決定了大數據形式的多樣性。大數據大體可分為三類:一是結構化數據,如財務系統數據、信息管理系統數據、醫療系統數據等,其特點是數據間因果關系強;二是非結構化的數據,如視頻、圖片、音頻等,其特點是數據間沒有因果關系;三是半結構化數據,如HTML文檔、郵件、網頁等,其特點是數據問的因果關系弱。
3.高速性。與以往的檔案、廣播、報紙等傳統數據載體不同,大數據的交換和傳播是通過互聯網、云計算等方式實現的,遠比傳統媒介的信息交換和傳播速度快捷。大數據與海量數據的重要區別,除了大數據的數據規模更大以外,大數據對處理數據的響應速度有更嚴格的要求。實時分析而非批量分析,數據輸入、處理與丟棄立刻見效,幾乎無延遲。數據的增長速度和處理速度是大數據高速性的重要體現。
4.價值性。這也是大數據的核心特征。現實世界所產生的數據中,有價值的數據所占比例很小。相比于傳統的小數據,大數據最大的價值在于通過從大量不相關的各種類型的數據中,挖掘出對未來趨勢與模式預測分析有價值的數據,并通過機器學習方法、人工智能方法或數據挖掘方法深度分析,發現新規律和新知識,并運用于農業、金融、醫療等各個領域,從而最終達到改善社會治理、提高生產效率、推進科學研究的效果。
大數據六大發展趨勢
雖然大數據目前仍處在發展的起步階段,尚存在著諸多的困難與挑戰,但我們相信,隨著時間的推移,大數據未來的發展前景非常可觀。
1.數據將呈現指數級增長
近年來,隨著社交網絡、移動互聯、電子商務、互聯網和云計算的興起,音頻、視頻、圖像、日志等各類數據正在以指數級增長。據有關資料顯示,2011年,全球數據規模為1.8ZB,可以填滿575億個32GB的iPad,這些iPad可以在中國修建兩座長城。到2020年,全球數據將達到40ZB,如果把它們全部存入藍光光盤,這些光盤和424艘尼米茲號航母重量相當。美國互聯網數據中心則指出,互聯網上的數據每年將增長50%,每兩年便將翻一番,目前世界上90%以上的數據是最近幾年才產生的。
2.數據將成為最有價值的資源
在大數據時代,數據成為繼土地、勞動、資本之后的新要素,構成企業未來發展的核心競爭力。《華爾街日報》在一份題為《大數據,大影響》的報告宣傳,數據已經成為一種新的資產類別,就像貨幣或黃金一樣。IBM執行總裁羅睿蘭認為指出,“數據將成為一切行業當中決定勝負的根本因素,最終數據將成為人類至關重要的自然資源。”隨著大數據應用的不斷發展,我們有理由相信大數據將成為機構和企業的重要資產和爭奪的焦點谷歌、蘋果、亞馬遜、阿里巴巴、騰訊等互聯網巨頭正在運用大數據力量獲得商業上更大的成功,并且將會繼續通過大數據來提升自己的競爭力。
3.大數據和傳統行業智能融合
通過對大數據收集、整理、分析、挖掘, 我們不僅可以發現城市治理難題,掌握經濟運行趨勢,還能夠驅動精確設計和精確生產模式,引領服務業的精確化和增值化,創造互動的創意產業新形態。麥當勞、肯德基以及蘋果公司等旗艦專賣店的位置都是建立在數據分析基礎之上的精準選址。百度、阿里、騰訊等通過對海量數據的掌握和分析,為用戶提供更加專業化和個性化的服務。在智慧城市建設不斷深入的情況下,大數據必將在智慧城市中發揮越來越重要的作用。由城市數字化到智慧城市,關鍵是要實現對數字信息的智慧處理,其核心是引入了大數據處理技術,大數據將成為智慧城市的核心智慧引擎。智慧金融、智慧安防、智慧醫療、智慧教育、智慧交通、智慧城管等,無不是大數據和傳統產業融合的重要領域。
4.數據將越來越開放
大數據是人類的共同資源、共同財富,數據開放共享是不可逆轉的歷史潮流。隨著各國政府和企業對開放數據帶來的社會效益和商業價值認識的不斷提升,全球必將很快掀起一股數據開放的熱潮。事實上,大數據的發展需要全世界、全人類的共同協作,變私有大數據為公共大數據,最終實現私有、企業自有、行業自有的全球性大數據整合,才不至形成一個個毫無價值的“數據孤島”。大數據越關聯越有價值,越開放越有價值。尤其是公共事業和互聯網企業的數據開放數據將越來越多。目前,美歐等發達國家和地區的政府都在政府和公共事業上的數據做出了表率。中國政府也將一方面帶頭力促數據公開共享,另一方面,還通過推動建設各類大數據服務交易平臺,為數據使用者提供豐富的數據來源和數據的應用。
5.大數據安全將日受重視
大數據在經濟社會中應用日益廣泛的同時,大數據的安全也必將受到更多的重視。大數據時代,在我們用數據挖掘和數據分析等大數據技術獲取有價值信息的同時,“黑客”也可以利用這些大數據技術最大限度地收集更多有用信息,對其感興趣的目標發起更加“精準的”攻擊。近年來,個人隱私、企業商業信息甚至是國家機密泄露事件時有發生。對此,美歐等發達國家紛紛制定完善了保護信息安全、防止隱私泄露等相關法律法規。可以預見,在不久的將來,其他國家也會迅速跟進,以更好地保障本國政府、企業乃至居民的數據安全。
6.大數據人才將備受歡迎
隨著大數據的不斷發展及其應用的日益廣泛,包括大數據分析師、數據管理專家、大數據算法工程師、數據產品經理等在內的具有豐富經驗的數據分析人員將成為全社會稀缺的資源和各機構爭奪的人才。據著名國際咨詢公司Gartner預測,2015年全球大數據人才需求將達到440萬人,而人才市場僅能夠滿足需求的三分之一。麥肯錫公司則預測美國到2018年需要深度數據分析人才44萬—49萬,缺口為14萬—19萬人。有鑒于此,美國通過國家科學基金會,鼓勵研究性大學設立跨學科的學位項目,為培養下一代數據科學家和工程師做準備,并設立培訓基金支持對大學生進行相關技術培訓,召集各個學科的研究人員共同探討大數據如何改變教育和學習等。英國、澳大利亞、法國等國家也類似地對大數據人才的培養做出專項部署。IBM 等企業也開始全面推進與高校在大數據領域的合作,力圖培養企業發展需要的既懂業務知識又具分析技能的復合型數據人才。(武鋒:國家信息中心)