“當國家把大數據技術作為戰略提出后,大數據技術處于炒作‘過熱’的狀態,跟統計數據相關行業的都穿上了大數據‘馬甲’。”4月22日,“科學與中國”院士專家巡講團走進南京工業大學。中國科學院院士、上海交通大學副校長梅宏在談及大數據應用時,直言當前大數據應用領域的現狀。
梅宏建議,在大數據的應用上亟須頂層規劃和示范引導,積極謀劃,審慎推進。“因為,大數據的計算設備6~8年會被淘汰,如果一哄而上,將造成超前投資、重復投資或者資源浪費”。
梅宏表示,大數據技術正引領新一輪的信息化建設熱潮,但在大數據分析中,應該要冷靜、謹慎。真正的大數據應用應該體現在數據挖掘的深度和多源(跨界)數據融合的廣度上,絕不僅僅是單源數據的“海量”。“‘大’未必一定勝過‘小’。承載‘規律’的模型驅動更符合人類探求知識的本性;無論從大數據的深度和廣度,均難有真正意義的“全體數據”,就現實世界的復雜性而言,均是抽樣數據。如果只是一個量大的數據進行規律統計,或者僅僅是一元的數據進行規律統計、分析、發布等都不叫大數據。”
梅宏坦陳,大數據正在影響著我們的生活,但根據大數據進行預測有時會有失偏頗,大數據首先得基于完全正確的數據,如果有假數據在里面,那么顯然預測就沒有意義。此外,他還指出,有些大數據并不能用作參考。比如股市就不能用大數據來進行預測,因為股市盡管完全符合多元化的、正確的數據特征,但股市作為一個開放系統,具有強烈的從眾性,其所呈現的大數據預測就不會很科學。
當日,梅宏院士還以“信息化3.0與大數據”為題,為南工師生作了一場精彩演講。演講中,他系統回顧了信息技術和信息化發展的歷程,簡要總結了信息化各階段的主要特征。同時,針對國家的“”戰略,嘗試去理解、分析“互聯網+”的本質內涵,從基礎設施、思維模式和實施指南三個視角闡述了“互聯網+”戰略在信息化3.0時代的重要意義,進而對信息化3.0時代的重要表征——大數據及其應用和技術發展進行了總結和展望。