大數據發展還處在“挖沙子”階段
“如果說信息資源是一座大山,那么開始認識并運用大數據的我們,最多只是挖到了一些沙子。”在昨日舉行的第十屆國家信息化專家論壇上,工業和信息化部副部長楊學山如此表示。他指出,大數據概念的出現讓人類社會看到了信息、能源和材料三者走向等量齊觀、共同推進經濟社會發展的曙光,但大數據目前還處于應用的低級階段,業界對大數據的概念認識和應用本身都還有很多的不足與問題。這些問題不解決,大數據很難發揮其應有的作用,也很難落地,必須認清大數據的本質,把握兩個關鍵的技術方向,處理好三個關系。
目前,各界對于大數據的本質,并沒有形成共識。楊學山認為,大數據使得開啟了60多年的信息革命終于觸及其核心——信息內容,人類社會開始走上信息、能源、材料共同發展的道路,信息資源的重要性開始與能源、材料相提并論,其地位從差異巨大走向等量齊觀,這樣的歷史轉折點已經出現。他認為,目前,人們對于信息資源的開發利用,無論是從量還是質的角度看都僅僅是剛開始,即使美國提出建立ZB(澤字節,相當于十萬億億字節)級別的數據中心,也不過相當于在信息資源的大山上挖到了一些沙子。目前,我們記錄下的數據,具備信息處理能力的不到1%,更不用說沒有被記錄下來的數據,大數據真正落地還有很長的路要走。
這條路該怎么走?楊學山提出了兩個關鍵的技術發展走向。首先,在內容屬性上,要突破語義解析技術,讓大數據結構化。其中需要突破模式識別、自然語言理解、語義分析、知識體系化等各個技術環節,重點從應用的角度,利用已有的信息集合,開發相應的理論和工具。其次,在物理屬性上,要在芯片、軟件、整機、系統等技術上取得突破。現有的主流芯片架構不適應處理大數據的需求,對處理過程中流量極其大、密度極其低、計算極其少的特征,需要大空間、低密度、非計算的處理能力。因此,從芯片到操作系統,都必須進行創新。
在大數據下一步的發展進程中,楊學山提出要處理好三種關系:一是昨天、今天和明天的關系,也就是推動大數據技術和應用的平滑升級,不能把發展的拐點變成了斷點,這樣既是對過去發展的否認,也是對未來發展的損害;二是局部和全局的關系,大數據只是信息技術體系中的一個部分而非全部,其發展必須與信息技術體系發展的全局相結合;三是求實和創新的關系,創新的立足點要放在求實上,求實際、求實效、求實用,否則創新就成了口號,反過來變成發展的阻力。
楊學山最后指出,大數據會催生很多好的新業態。當今經濟社會發展的很多模式會由此發生變化,包括教育模式、科技創新模式等,甚至第一、二、三產業的界限也會模糊,人類的生存空間將從物理空間變成信息物理空間,這樣才能走向信息、能源、材料三者同步發展,實現人類社會發展的拐點。
本屆論壇由國家信息化專家咨詢委員會(簡稱專家委)主辦,以“開放數據與大數據發展”為主題,專家委常務副主任周宏仁、副主任楊國勛,專家委副主任、中國工程院院士、中國互聯網協會理事長鄔賀銓等到會演講、討論。