最近幾年,全球的數據量出現爆炸式增長,大數據存儲需求發生了很大變化。數據量的大小由TB級增長至PB級,并仍在不斷增長,企業日益將數據的深度分析作為利潤增長的支撐點。隨著社會的發展,各行業、各領域的數據量都會不斷地增長,數據量的急劇增長不斷對存儲系統提出挑戰,云環境下的大數據存儲成為未來數據存儲的發展趨勢。
云環境下的大數據存儲適用于我國政務、大型企業、部隊與軍工等領域。按照“基本型、系列化”的發展模式,為不同市場用戶提供針對性的安全的存儲產品。
一、云環境下大數據存儲的現狀
云環境下大數據存儲屬于云計算和大數據的基礎支撐設施,發展空間巨大。云環境下的大數據存儲作為基礎設施需求迫切。隨著云存儲概念的不斷普及與推廣和技術的不斷突破,國內外越來越多的研究單位和研究人員投入到云存儲的研究與開發工作。
但是,大數據安全存儲系統目前還幾乎沒有成熟產品,存儲效率低和安全性差是現階段云環境下大數據存儲的主要問題。在涉密信息系統內,存儲系統由于保存了大量涉密信息,是保密的重要環節,如果存儲系統不能保證安全性,會嚴重影響云環境的安全保密性。
1、 存儲效率低,很難滿足大數據的要求。
目前,存儲服務器對數據多采用集中式存儲。若對大數據進行集中式存儲,需要集中存儲系統的硬件支持,包括足夠大的存儲空間、高可擴展性的存儲方案及非常高的I/O性能,而這些正是大數據存儲發展的瓶頸。
2、 存儲安全性差,不能滿足軍工保密單位的需要
目前提供私有云產品的廠商只是提供了一個云計算的平臺,采用的存儲系統也是市場上主流的存儲產品,并沒有對存儲上的數據進行合理的保護。特別是軍工企業在生產、辦公要符合國家保密局武器生產科研的保密資質、分級保護、等級保護需求,對存儲系統的安全性有較高的要求。云平臺能否在這些單位廣泛應用,取決于云解決方案能否提供一個安全可靠并符合保密要求的環境,使建設在云平臺之上的各種應用系統安全運行。
二、云環境下大數據存儲的必要性
在互聯網環境中,數據的泄露和破壞會對企業造成重大損失,如何實現大數據的安全存儲一直是亟待解決的問題。隨著大數據存儲技術的發展,人們已經開始意識到數據安全的重要性。因此,云環境下大數據存儲的研究很有必要也很有意義。
1、建設云環境下的大數據存儲系統是國家涉密信息安全的重要保證
面對迅速增長的大數據存儲市場,數據安全性也成為用戶關注熱點,國內市場中包括用戶和各大IT企業都開始逐漸重視數據信息的安全,特別是政府、軍工行業,對于數據的絕對安全有著極為嚴格的要求。
現在我國軍工政府部門急需符合保密、安全可靠性需要,特別是軍工生產單位保密性需求的安全存儲產品。包括:基于增強的身份認證,基于分級保護要求的訪問控制,管理員的安全管理,細粒度的日志審計等。通過應用分布式文件系統和云計算技術實現本地無存儲;使用加密卡技術保證數據存儲安全,滿足生產單位的大數據安全存儲要求,同時符合分級保護、等級保護的標準要求。
2、 建設云環境下的大數據存儲系統是滿足市場存儲需求的措施
目前云環境下的大數據安全存儲幾乎沒有成熟產品,市場需求大,市場發展處于急速上升期。2013年8月,國務院印發了《關于促進信息消費擴大內需若干意見》,意見指出,到2015年,使信息消費規模超過3.2萬億元,年均增長20%以上,帶動相關行業新增產出超過1.2萬億元;基于互聯網的新型信息消費規模達到2.4萬億元,年均增長30%以上。
3、 建設云環境下的大數據存儲系統有助于國家信息安全戰略的實施
中央對網絡與信息安全高度重視。2014年2月27日,中央網絡安全和信息化領導小組成立,標志著網絡與信息安全已經上升到了前所未有的國家戰略高度,網絡安全已涉及政治、經濟、軍事、外交、科技、金融、意識形態等方方面面,已成為關系國家安全的重中之重,而數據安全是網絡安全的重要組成部分。
國家信息中心2012年組織召開“云時代終端安全技術與法規高峰論壇”;在論壇中,國家信息中心指出,國家政務外網已承載22個中央政務部門全國性業務系統,1200多個省級業務系統,接入終端超過50萬臺;未來云存儲將取代傳統存儲成為云時代終端的主要應用模式,特別在政務辦公領域將發揮重要作用,具有廣闊的應用前景;在十二五期間,重點是加強對云存儲的統一安全防護和集中管控。
三、關于云環境下大數據存儲的建議
1、制定存儲性能及安全性標準,實現云環境下大數據存儲的規范管理
目前,市場上的存儲產品沒有統一的安全標準,存在著嚴重的安全問題。各大廠商的發展戰略大多以支持大容量、高速率為目標,以適應云環境,但忽略了數據本身的安全性。而傳統的信息安全廠商對于存儲領域關注度不夠,造成目前市場上成熟的大數據存儲安全產品處于空白狀態。用戶管理與身份驗證強度較弱,且缺少數據隔離、數據流向控制甚至行為審計等功能,無法適應高安全信息系統對數據安全的趨勢要求。
2、 探索安全存儲的新方式,使大數據的存儲由集中式向分布式轉變
分布式存儲是將數據分散存儲在多臺獨立的設備上。傳統的網絡存儲系統采用集中的存儲服務器存放所有數據,存儲服務器成為存儲性能的瓶頸。分布式存儲采用可擴展的存儲結構,利用多臺服務器分擔存儲負荷,不但提高了系統的存取效率,同時易于擴展。
采取分布式存儲的方法,將數據分散存儲在多臺獨立的設備上,一方面完善了數據庫的性能,提高了數據的讀取效率,這對大數據來說十分重要;另一方面增加了大數據的安全性和可靠性,當有存儲設備故障發生時,只會影響局部數據的存取,而不會使整個數據庫癱瘓;同時分布式存儲也使大數據具有很強的橫向擴展能力,可以任意添加服務器節點,并且可以繼續提供數據服務。