從目前的情況來看,我們正逐步邁向云存儲,而在這過程中,云存儲和所謂的“大數據”碰撞在了一起。這并不是說云技術不再向前發展或消失了,不過越來越多的磁帶、存儲和數據庫供應商,甚至是數據存儲行業中的任何人,都將注意力轉向了大數據。很顯然,只要你銷售設備,你就會鐘情于“大數據”這個想法,這意味著用戶將會需要更多的設備來處理這些大數據。那么,到底什么是大數據呢?
從長遠角度看,大數據這個詞曖昧不清,甚至都不能被稱之為一個合格的市場代名詞,不過當你退后一步,從一個全局的角度出發看,“大數據”代表著你處理數字信息的所有事情,正是由于這種最初的需求,驅動著當今每一次IT變革的發生。
IT業內的每一次破壞性變革都和處理信息數據的新的方式息息相關。所開啟的新功能通常都非常重要,以至于我們愿意為其大筆的投入。我們放棄了可靠的管理型和可用性,轉向分布式計算,為此放棄可靠性和速度以順應基于因特網的運作。這種巨大的變動使得我們能夠處理更多的數據,并使得處理數據變得更為容易。大數據將集成度和信息的使用提升到一個全新的水平。其范圍廣泛,包含新的對大量結構化或非結構化數據的高性能分析,全新的內容分析的層次,以及對現有存儲上頻繁利用和極少利用的數據更好的利用通用性的元數據。大數據還包括將許多不同的數據集中的數字信息提煉整合起來。
但是,問題出在我們將大數據視作其它各類技術的驅動者。在EMC World活動上有一些醒目的標識,告知人們云技術處于大數據的頂部。而在我看來,云并非處于大數據的頂部——其更多的情況下和其它技術混合在一起。更重要的是,云技術能夠成功部署的很大原因在于是否開啟了大數據的各項功能。而對此,我們遠未達到。
在過去的幾年里,無論各類基礎架構技術——網絡、存儲、安全防護、服務器、應用程序——如何相互交錯,業界已經在簡化基礎架構并使其更為高效方面取得重大進步。而下一階段的挑戰來自信息,而我們在這方面還有很長的路要走。讓我們想想這件事:你的基礎架構如何才能使你的程序員和業務通過使用信息來做更多的創新,并且能較以往都更加高效來使用它?
一些供應商對此的回答含糊不清。他們通常從大型的供應商那里獲取一堆技術,這看上去就像是為信息高速公路提供一個強大的引擎。我們并不是說哪些解決方案沒有作用,不過每個供應商都有這么一堆技術,而且他們都要確保其技術較其他友商更具競爭力。然而對于用戶而言,即使這些超大引擎看上去極其漂亮,它對于你業務是否能駕馭海量數據可能幫助不大。
建立大型的基礎架構并不足夠,于是有許多技術人員指出如何進行基礎架構相關的信息處理。云技術在于創建信息和基礎架構之間的連接,從而使得基礎架構可以配置為將信息調整用于新的用途。供應商可以通過提供底層對于應用程序和業務用戶的支撐致力于此。并且假設供應商目前已經在存儲市場占據優勢,并且亦希望保持這塊市場份額,他們最好能快速地轉變,一些新興的小型公司,如Cloudera、Eucalyptus Systems、OpenStack 聯合公司和其它的一些都在宣傳其創新性的技術。而且還有一個潛在而讓人可怕的競爭對手,VMware。VMware正揮舞著它諸多獨有的秘密武器,比如Cloud Foundry和SpringSource,這些技術或許有一天會成為下一代IT進化中更具擴展性和協調能力的基礎架構單元。
目前已有諸多有價值的技術來優化大數據集,提供更高性價比的大數據集存儲,并提供工具和技術來使得物理體系架構滿足大數據所需的擴展性。不過當將大量的數據集合放到“大數據”意味著將這些二進制字符轉變為對業務極具價值的東西。這并不是說支持大數據的的工具沒有價值,比如性能優化,虛擬化和自動化;不過為提供“大數據”,這些工具必須整合形成一個整體,而不是簡單的將這些工具相互疊加。當大數據開始的時候,你不得不考慮供應商如何才能更好地整合基礎架構,使其高效涵蓋諸多不同的IT基礎架構域;還要考慮該體系架構如何才能改變你企業創造和實用信息的方式。