雖然Open Data是英美等國政府倡導的大數據發展理念,但是創業公司的行動更加迅猛,Data.world近日融資1870萬美元,向數據民主化的方向繼續挺進。
這是一個數據爆炸的年代,同時又是一個數據饑荒的年代,這就好比在大數據的海洋上生產淡水一樣困難。大數據的體量不斷膨脹,但利用效率越來越低,應用門檻卻不斷加高,大數據已經成了互聯網巨頭和大型企業的昂貴玩具,與創業公司、中小企業和個人的距離越來越遠。
為了實現Open Data大數據民主化的夢想,創立于2015年的大數據社交分享網站Data.world搭建了一個大數據分享平臺,方便不同專業領域的用戶分享不同類型的數據,其產品理念有些類似Github,使用Semantic語意web技術作為基礎框架。
Data.world的首席執行官Brett Hurt指出:Google創立以來,全球的互聯網(站)開放數據集已經增長了至少7倍,從1998年的240萬個站點增長到2016年的1800萬個。
用戶目前可以免費在Data.world網站注冊賬戶,導入各種數據源,包括文檔、腳本、圖表等。Data.world自己開發了一種查詢語言——dwSQL,代替更加復雜的語意web查詢語言SPARQL,方便用戶訪問Data.World的語意圖譜數據庫。
用戶導讀的數據經過可視化處理和過濾后,就可以在Data.World的賬戶中與其他用戶分享,并收獲點評和建議。
Hurt指出,原始數據就像原油,需要精煉才能驅動世界,目前大數據處理80%的工作都用于數據清洗、格式化等方面,真正的數據分析不到20%。Data.world的商業模式與Github也類似,只有當用戶選擇將數據存儲于私有空間時才會收費。
Data.world上分享的數據集完全采用流行的社會化分享模式,由用戶社區自己來決定數據的價值和質量。