“大數據”被認為是可以重塑現有數據中心的技術。誠然,數據中心聽起來一點都不如iPad有趣,不過如果沒有數據中心對云計算的支持,iPad至少不會像現在這么有趣。云計算不僅極大的延伸了移動互聯網,同時正在成為一股冉冉升起的新時代的中堅力量,不斷為商業終端注入活力。美國政府已經意識到了大數據的重要性,美國總統奧巴馬甚至斥資2億美元聯邦財政預算用于大數據項目。無論是商務人士還是政府機構都在談論大數據,仿佛這是一盞濟世明燈,儼然在將經濟發展的重任交付于大數據的肩上。
但且慢,這些對大數據如此推崇的人,商業人士也好、政府官員也好,真正了解大數據的本質嗎?大數據真的是靈丹妙藥,還是我們高估了它的價值和能力?事實上,這些人對大數據的理解,都是源于各自不同的渠道,受限于供應商對他們的影響。而直到現在,互聯網上居然還沒有對大數據“是什么,能做什么”有一個直觀、易懂、確定的解釋。因此,我們首先應該搞清楚:究竟什么是大數據,大數據的本質是什么?如果沒有搞清楚就盲目的投入大筆資金,后果將非常嚴重。
隨著互聯網的發展,大量的企業面臨著新的挑戰,傳統的數據庫在很多情況下已經無法滿足企業及用戶的需求。Hadoop,一個從Yahoo出來的開源項目,已經變成它自己的商業行業。讀寫網的一項由154家美國中小企業主參與的調查顯示,對于大數據的定義,絕大部分企業主都是基于自身經驗和戰略來詮釋這個詞。其中28%的調查者表示認可“大量的急速增長的數據傳輸”,24%的調可以看出,查者則認為大數據“是一種新技術,旨在解決數據在體積、種類以及速度不斷增加的挑戰“,19%認為大數據是為了滿足”管理并遵循存儲和存檔數據的需求“,18%調查者則認為大數據是“新的數據大爆炸”。
以上多種答案,那么究竟正確答案是什么呢?Scott M. Fulton,多部教學書籍及資源的作者。大量的再生產品,從包裝箱到公園的長椅,都是根據他的教學書籍制造出來的。他給“大數據”下了一個普適的定義:
雖然數據庫技術在業務邏輯層面已經觸碰到了天花板(此邏輯依然在使用低效耗能的方式來訪問和維護數據),但是因為一直以來,硬件速度和能力的提升,以及存儲價格的不斷下降,這種低效率被很好的掩蓋了。于是直到2007年之前,一直沒有人能夠認真嚴肅的對待這個問題。這種低效終于在做大量數據分析從而進行結果推斷的過程中,暴露了出來。于是,大數據應運而生。
本質上來將,大數據工具們指明了大量數據如何被存儲、維護以及分析。他們可能不會完全取代傳統的數據庫,不過至少像Hadoop這樣的存儲系統取代了數據訪問的方式。