作為中國的頂尖學府,清華大學承擔著下一代互聯網核心網國家工程實驗室建設項目中的“下一代互聯網核心網運行管理技術研發平臺(簡稱運管研發平臺)測量系統”的建設,擬建成“綜合流量采集與分析系統”,為網絡測量、網絡管理、探索新型網絡等業務系統提供網絡流量原始數據。
從目前來看,綜合流量采集與分析系統,用于采集和分析實時網絡流量,需具備8條主干鏈路分組流量的采集和分析能力,以便為網絡測量、網絡管理、探索新型網絡等業務系統提供網絡流量原始數據,數據容量最大達540TB。這就要求業務平臺必須具備足夠大的存儲容量、高讀寫帶寬以及高效的大數據分析能力,才能滿足“綜合流量采集與分析系統”未來的業務發展需要。
而Netflow流采集與分析系統,依托CERNET大規模試驗網絡構建,用于采集和分析試驗網核心節點的Netflow流數據,支持網絡研究人員從網絡全局的角度觀察和分析網絡行為、網絡發展與演進規律,基于現有的分析平臺,要求系統具備連續12個月流數據的存儲能力,并支持未來持續不間斷的存儲容量擴充,為網絡優化和新型網絡體系結構研究提供網絡流量采樣數據。
根據以上項目需求,清華大學在采購IT基礎設施時考慮如下訴求:
1.如何向大數據分析平臺平滑過渡?
整體架構和功能設計應該立足于較高起點,在考慮系統性價比的同時應兼顧系統的先進性和可持續發展性,要求存儲硬件平臺采用國內外領先的技術和理念,確保項目在建成后的3~5年內保持足夠的先進性。綜合流量采集與分析系統具備演進能力,建成后可平滑過渡到大數據分析平臺。
2.數據共享能力是否夠“硬”?
CERNET實驗網全國26個核心節點每天產生2TB Netflow流數據,網絡流量峰值高達1.1GB/s,對存儲系統的讀寫性能提出了非常高的要求。同時,采集到的數據需要共享給不同的業務系統進行研究分析,這就同時要求存儲系統具備高效的數據共享能力。
3.如何讓存儲系統變得更加“機靈”?
清華大學運管研發平臺將為下一代互聯網核心網國家工程實驗室提供數據服務,為科研項目提供原始數據和分析數據樣本,系統的建立必須具備前瞻性,需充分考慮未來5年業務的持續發展和數據急劇增長帶來的擴容問題,要求存儲系統具備靈活的擴展性,且不影響現有業務系統的正常運行。
清華大學國家工程實驗室大數據之路 一路有華為
為達成項目建設目標,清華大學對該項目整體方案的把控頗為嚴謹,在滿足綜合流量采集與分析系統對服務器及存儲設備要求的基礎上,還需充分考慮系統向大數據平臺演進的方案,系統建成之后易可平滑過渡到Hadoop平臺,并具備大數據分析計算能力。在對比Dell、宏杉、浪潮方案之后毅然選擇華為整體解決方案。
1.走向“大數據之路” 滿足客戶對平臺演進能力的要求
針對清華大學對IT系統的建設要求,華為推薦采用RH2288H高性能服務器集群,為綜合流量采集與分析系統提供計算及存儲平臺,以及平滑演進到Hadoop大數據平臺的能力。針對Netflow流采集與分析系統,華為推薦采用OceanStor N8500集群NAS存儲系統,為該系統提供CIFS/NFS業務,實現CERNET實驗網全國26個核心節點網絡流數據的集中存儲和共享。
此外,華為OceanStor N8500集群NAS存儲系統采用多節點全Active的集群架構,多引擎存儲空間全共享,全面滿足清華大學對存儲設備技術領先的要求。通過華為FusionInsight大數據解決方案,可將現有平臺平滑過渡至大數據分析平臺,滿足客戶對平臺演進能力的要求。
2.數據流動自如、存儲擴展 滿足運管研發平臺未來業務的擴容需求
針對清華大學對快速高效的要求,華為OceanStor N8500集群NAS存儲系統憑借雙引擎2GB/s的穩定讀寫帶寬,贏得客戶青睞;同時,CIFS/NFS/FTP/HTTP等多種數據共享方式的靈活選擇,最大程度的方便了不同業務系統間的數據流動。
憑借scale-out的領先架構設計,OceanStor N8500最高可支持16個節點,提供高達15PB的存儲容量,高于業界同類產品30%以上,同時系統的吞吐能力隨著節點的增加線性增長。隨著清華大學數據采集業務的增長,可在線增加NAS引擎達到橫向擴展性能的目的,同時也可在線增加存儲單元達到縱向擴展容量的目的,滿足運管研發平臺未來業務發展的擴容需求。
目前,該系統運行穩定,其大數據平臺演進能力更為未來的業務發展奠定了堅實的基礎。清華大學國家工程實驗室走向大數據之路 在華為一路相隨下,將走得更遠、更穩健。