現在全球進入了信息化時代,其顯著特征就是信息資源的極大豐富和極易獲得,相對于很多主體的信息需求而言,現在的信息供給是無限的,各種現代信息技術極大地增加了信息的數量。比如:應用程序、設備與數據類型等不斷地增加,再加上物聯網的應用,各種遙感遙測信息,使得數據量高速增長。還有就是高速的網絡可以使得多媒體信息極為迅速地傳遞,超本文鏈接技術和檢索技術也可以使人們輕而易舉地得到自己想要的大量信息。信息技術使各種信息活動的全球化成為可能,而且在速度、數量、質量、互動、成本等方面具有很大優勢,只要接入互聯網,就可以輕而易舉地在全球范圍接收、發送與交流各種信息,這些都使得數據量在快速增長。雖然數據量的高速增長一定程度上說明社會的信息化程度越高,全球進入了成熟的信息化社會,每個人的工作和生活都與很多數據信息密切相關,可是數據越多也不見得都是好事。數據量太大也會帶來很多問題,海量的數據已經給數據中心帶來了沉重負擔。數據中心建設和擴容的速度永遠也無法滿足數據量增長的速度,在數據中心里海量數據成災,數據中心已經沒有更多的存儲設備來保存這些數據,沒有更多的服務器可以處理這些數據,也沒有網絡帶寬去傳遞這些數據,海量的數據讓數據中心不堪重負。
對這些海量數據進行分析,其實不難發現,很多是重復和無價值的數據,這樣還是有些辦法可以去削減的。首先,減少重復數據的存在。數據中心里每個人都可以有自己獨立的存儲空間,就像個人郵箱,每個郵箱允許有幾十G的空間,很多人往里存儲的東西,尤其是視頻文件可能是相同的,但數據中心依然要存儲多份,這樣極其浪費存儲資源。對于同一個視頻文件,完全可以每個人空間內只保存一個索引,只有一份視頻文件即可。如此一個幾個G的視頻文件,保存一份即可,也許數百個人甚至數千個人都可以使用,其實只占用一份文件的存儲空間;其次,減少無用數據的存在。一般而言,數據中心里90%都屬于無用數據,因此需要過濾出能為數據中心提供經濟利益的可用數據。大數據技術很火,但利用大數據技術能得出有意義的結果,也是要對有特有特征的數據進行統計才有可能得到預期結果。如果數據本身都沒有多大意義,自然也不會有大數據技術的發揮空間。無用的數據包括長期無人訪問的數據、過時的數據、錯誤的數據等等,只要對數據中心業務發展無益的數據都可以及時清理,刪除;第三,減少中間過程數據。1+1=2我們只需要知道這個計算結果,而不需要知道這個中間計算過程,中間過程有大量的數據,這些數據對我們得到結果沒有意義,所以只要計算完 1+1,得到了2就可以將中間數據刪除了,如此可以大大減少中間過程的數據量。還有很多大量存儲著的臨時信息,幾乎不存在投入必要,這些臨時信息基本不會被使用;第四,減少與數據中心應用無關數據。在數據中心充斥著許多無用的信息與數據,有的數據看似非常重要,其實是一點作用都沒有,對數據中心發展毫無意義。就像我們用的手機,使用一段時間就會殘留大量的臨時文件,無用的聊天信息,占據著手機大量存儲空間,同時也降低了手機的運行速度,及時清理掉這些無關數據,可以節約存儲空間,提升手機運行速度。對于數據中心也同樣如此,周期性地對數據進行檢查,無用的數據及時清空,將資源分配到有效的數據處理中去。最后就是從數據中心外部接入到內部的網絡數據,這類數據價值極低,幾乎不會給數據中心帶來正面影響,這類數據也不要保存,及時清理。
海量的數據與信息已經成為數據中心的垃圾,大部分的數據都是無用的,這些數據不僅無用反而會阻礙數據中心的發展。越是信息發達的時代,我們就越是需要用挑剔的眼光去看待那些圍繞自己的數據。對數據用減法甚至用除法的方式去挑挑揀揀,避免數據泛濫成災。避免數據中心的各種寶貴資源被混亂的數據所侵占,被“惡意”數據誤導,時常給數據中心減減負,清除各類無用的數據,對數據一定要求質不求量,堅決消除一切無用數據,將數據中心的資源用到更有用的地方。當看到全球信息數據在高速增長時,請一定注意,小心你的數據中心里數據泛濫成災。