在今天上午召開的由中國計算機學會主辦的“Hadoop與大數據技術大會”上,中科院計算所所長孫凝暉表示,如果說20世紀是一個石油為王的時代,21世紀就是一個數據為王的時代,21世紀數據的價值有可能等同于20世紀的石油。
但是,孫凝暉也指出,目前,互聯網服務對大數據的處理和挖掘還遠遠不夠,還有很多有價值的數據未被從海量的大數據里發掘出來,產生很多新的商業形態、新的企業和新的服務。
“如果把大數據和石油行業對比,數據勘探技術還很落后,跟石油的勘探技術相比還差得很多,我們在理論和技術的積累上還很弱,不知道大數據的幾個基本的原理和算法是什么,最基本的操作是什么,不像數據庫有基本和完整的理論體系,也沒有成套的工具,這就需要產學研共同努力來發展理論和技術。”孫凝暉如是說。
孫凝暉表示,Hadoop是在互聯網行業處理大數據的一個非常好的工具,同時大數據本身也超越了互聯網行業,因為生物基因本身也是大數據,基因數據產生以后也會產生很多的學術價值、商業價值。利用Hadoop挖掘大數據,利用大數據開發更大的價值,探索富有創新的空間。