“‘不識廬山真面目,只緣身在此山中’。應該說到今天為止,大數據還沒有形成完整明確的定義,大數據的發展方向、作用意義、以及怎么來應對大數據帶來的挑戰,發揮大數據的作用,很多問題還在探索之中。”在日前舉行的第十屆國家信息化專家論壇上,工業和信息化部副部長楊學山開宗明義地說。他表示,研究大數據,必須要認清大數據的本質,把握兩個關鍵的技術方向,處理好三種關系。
有效結構化可期
楊學山從信息的兩個屬性,即物理屬性(可以看到的和處理的信息)和內容屬性(慣有的意義)出發,申明大數據的本質是我們可以把握住的信息背后的內容,并對內容進行處理。
沿著信息的物理屬性和內容屬性,是兩條關鍵的技術方向。一是關于物理屬性的關鍵技術,二是關于內容屬性的關鍵技術。
由于現有的主流芯片架構不適應處理大數據的需求,處理過程中對流量極其大、密度極其低、計算極其少的芯片缺乏相應的處理能力,因此,楊學山認為,在物理屬性上,要在芯片、軟件、整機、系統等技術上取得突破。
關于內容屬性的關鍵技術,楊學山表示,從結構的角度看,大數據的類型多,因此,要讓大數據能用,就要把它結構化,沒有結構的大數據是不能用的。迄今為止,就如何實現大數據有效的結構化世界范圍內還沒有出現,未來二十年,相信一定會取得突破,而且會走向實用。
謹防拐點變斷點
在大數據下一步的發展進程中,楊學山提出要處理好三種關系:
一是昨天、今天和明天的關系。“斷點既是對過去的否認,也是對未來發展的重大損傷,今天在物聯網、云計算里面的斷點,實際上對未來的發展所帶來的損傷是清晰可見的,所以在推進大數據的過程中,一定要認真地思考,從昨天走到今天又平滑地過渡到明天的過程中,哪怕出現顛覆性創新,也一定要重視它,是拐點而不是斷點。”楊學山反復強調稱,并不能把顛覆性創新看成是一個斷點,而是要把它變成一個平滑的拐點,哪怕彎曲度很大。
二是處理好局部和全局的關系。大數據只是信息技術體系中的一個部分,所以大數據的發展必須要和信息技術體系的整體前進結合起來,統籌地考慮。
三是處理好求實和創新的關系。創新的立足點要放在求實上,求實際、求實效、求實用,否則創新就成了口號,反過來變成發展的阻力。
楊學山表示,從整體上來看,求實和創新是一致的,但二者分開來看又會有很多不一致。創新應該是全方位的。