在日前舉行的國家信息化專家論壇上,中國工程院院士、中國互聯網協會理事長鄔賀銓表示,當前大數據面臨的問題主要表現在技術和應用、人才、安全隱私、發展戰略等方面。
首先是技術和應用問題。中國人口居世界首位,但2010年中國新存儲的數據為250PB,僅為日本的60%和北美的7%。我國一些部門和機構擁有大量數據但以鄰為壑,寧愿自己不用也不愿提供給有關部門共享,導致信息不完整或重復投資。2012年中國的數據存儲量達到364EB,其中55%(200EB)的數據需要一定程度的保護,然而目前只有不到一半(44%,即96EB)的數據得到保護。我國在自主可控的大數據分析技術與產品方面與發達國家相比有不少差距。國內企業在數據庫、數據倉庫、商業智能分析軟件等領域基礎薄弱,尤其是大數據方面已經遠遠落后于國外先進企業。
其次是人才問題。500年前達·芬奇可以同時是畫家、音樂家、工程師、科學家,100年前的醫生可以了解醫學領域的所有分支,今天一名初級醫生必須同時了解大約一萬種疾病和綜合征、3000種藥物和1100種檢驗方法。估計一個專業的醫生也需要每天學習21小時才能跟得上學科的發展。Gartner咨詢公司預測大數據將為全球帶來440萬個IT新崗位和上千萬個非IT崗位,麥肯錫公司預計美國到2018年深度數據分析人才缺口達14萬—19萬人,還需要數據需求和技術及應用的管理者150萬人。中國能理解與應用大數據的創新人才更是稀缺資源。
然后是安全與隱私問題。大數據的利用首先要求政府數據原則上該公開的必須公開。大數據的挖掘與利用需要有法可依。我國需要盡快制定“信息保護法”和“信息公開法”,既要鼓勵面向群體而且服務于社會的數據挖掘,又要防止針對個體侵犯隱私的行為,提倡數據共享又要防止數據被濫用。安全與隱私保護的隱患仍大量存在,重要的數據存儲和應用不能過分依賴大數據分析技術與平臺,需要重視信息泄密的風險。
最后是發展戰略問題。信息化要從重視硬件到重視軟件,再到重視數據的利用,不僅大數據,中小數據的挖掘也有意義。需要制定國家大數據發展戰略,大數據是一個應用驅動性很強的服務,其標準和產業格局尚未形成,這是我國跨越發展的機會,但切忌一哄而起在目的不明情況下到處建設大數據中心,到處搞“數據房地產”,而是需要從戰略上重視大數據的開發利用,將它作為轉變經濟增長方式的有效抓手。