鐵路信息化經過多年的發展已經成為鐵路日常工作的重要支撐,各類信息系統在運輸組織、客貨營銷、經營管理和安全監控等工作中發揮的重要作用日益彰顯。為滿足業務需求,在運輸站段、鐵路局、鐵道部都建立了各種等級的信息系統機房,并根據業務最大數據量及計算量的需求購置了主機、存儲設備及相應的平臺軟件等,為確保信息系統安全可靠運行,主要系統大多數采用了主備機、單(或多)存儲陣列結構。這些設備分布在鐵路局或站段機房。在運營實踐中,存在如下問題:(1)基礎設施龐大,投資和維護成本需求不斷增加。(2)資源使用不均衡,資源利用率偏低。鐵路的速度,運量和服務質量要求不斷提高。需要研究新的信息系統基礎架構,整合既有資源,建設基于云計算的數據中心,應對新的挑戰,減少不斷高漲的信息系統投資和維護成本需求。
1.云汁算
一般認為,云計算是一種通過使計算分布在大量的分布式計算機上或遠程服務器中、按照互聯網運作模式將資源能夠切換到所需要的應用上,并根據需求訪問計算機和存儲系統的網絡資源共享模式。在這一共享模式中,。云”是指各種虛擬化的計算資源池,它包括各種用于構造應用程序的基礎設施,以及在這些基礎設施上的具體云計算應用。
云計算體系架構作為一種共享基礎架構方法,雖然有不同的表述,但在本質上都是將計算動態分布到集群計算機上,根據業務發展和應用使用情況對軟硬件資源進行動態的調配,實現按需訪問,并對內對外提供各種IT服務。云計算由分布式計算,網格計算等技術發展而來,并融合了虛擬化和SOA等技術。
根據云計算運行模式可以將其分為私有云和公有云。公有云計算部署在服務提供商的環境中,為不同的客戶同時提供計算服務。私有云計算部署在用戶環境當中、并只為用戶提供計算存儲服務,企業擁有資源分配的自主權,并且可以基于自己的需求改進服務,進行自主創新。大企業可以開發自己的私有云計算,既享受云計算的高伸縮、易維護和易訪問等好處,也可以保證數據安全。
云計算系統可以根據它提供服務的層次進行分類,主要有提供基礎設施層服務、提供平臺層服務和提供應用軟件層服務的系統。
(1)基礎設施層服務。基礎設施層主要包括計算資源和存儲資源,整個基礎設施也可以作為一種服務向用戶提供,不僅包括虛擬化的計算資源和存儲,同時還要保證用戶訪問時的網絡帶寬等。這也是硬件產品提供商推薦的云計算模式。
(2)平臺層服務。在基礎設施之上的平臺層主要包括并行程序設計和開發環境、結構化海量數據的分布式存儲管理系統、海量數據分布式文件系統以及實現云計算的其他系統管理工具,如云計算的系統中資源的部署、分配、監控管理、安
全管理和分布式并發控制等。平臺層主要為應用程序開發者設計,開發者不用擔心應用運行時所需要的資源,平臺層提供應用程序運行及維護所需要的一切平臺資源。GoogleAppEngine云計算服務,Amazon云計算平臺等屬于這樣的平臺。平臺層服務技術門檻相對較高,仍處于不斷發展中。
(3)應用層服務。它是面向用戶提供簡單的軟件應用服務以及用戶交互接口等,用戶無需購買和管理服務器端軟件,稱為軟件即服務。對于傳統的軟件,應用層服務解決方案有明顯的優勢,包括較低的前期成本,便于維護,快速展開使用等。應用層服務的底層可以基于基礎設施層或平臺層。
2.基于云計算的鐵路信息系統數據中心
2.1基礎設施層整合資源
在基礎設施層整合資源,既有的應用系統軟件可以簡單地移植到新的環境中。虛擬化是云架構的一種基礎性設計技術,它允許將服務器、存儲設備和其他硬件視為一個資源池,而不是離散系統,可以根據需要分配這些資源,通過快速提供虛擬機器或物理機器,迅速部署和增加工作負載。除服務器和存儲整合之外,還提供整合系統架構,包括應用程序基礎設施,數據和數據庫,接口,網絡,桌面系統甚至業務流程。
目前鐵路信息系統主機一般包括小(中)型機和微機服務器兩種,在目前的技術條件下,小型機和微機服務器的虛擬化是不同的,小型機如IBMP595只能在單臺機器上完成資源的聚合和分拆,不能跨多臺IBMP595完成這樣的資源整合,各種類型的小型機虛擬化方面沒有統一的標準,可根據小型機利用率情況,采用廠商提供的虛擬化和集群技術整合資源。而微機服務器在虛擬化方面比較成熟,支持跨廠商、跨機型的虛擬化整合。微機服務器應盡量選用高端成熟產品,而已出保的低端服務器在考慮總體擁有成本情況下應停止使用。原有資源調配對象為微機服務器,完成后需要進行系統安裝部署;實現微機服務器虛擬化后,調配的對象為虛擬機,可以在調配過程中直接實現系統快速安裝和部署。通過虛擬化技術使企業內部已擁有的微機服務器資源實現池化共享,通過IT資源共享和動態分配,使閑置資源得以充分利用,從而提高資源利用率。在虛擬化之前,企業數據中心的微機服務器和存儲利用率一般平均不到50%(實際利用率通常為lo%~15%,一主一備)。通過虛擬化,可以把工作負載封裝一并轉移到空閑或使用不足的系統,這就可以整合現有系統,因而可延遲或避免購買更多服務器容量。
基于虛擬化的資源整合后,特別是微機服務器虛擬化后,可以大幅度提高資源可靠性,通過減少服務器數量可以減少動力電力、耗能以及數據中心機房空間。可以將更多的應用(包括以前使用小型機的項目)移植到虛擬化的資源池中,降低投資和維護成本,提高運行可靠性。當然,管好這些資源是非常重要的,管不好可能造成巨大損失。
2.2平臺層整合資源
在平臺層整合資源,需要建立新的軟件平臺,技術門檻相對較高,既有的應用系統移植難度較大,在開發新的應用系統或升級既有的系統時可以采用這種方式。IBM的藍云計算平臺是可供銷售的計算平臺,用戶可以基于這些軟硬件產品自
己構建云計算平臺。Google云計算平臺基于一整套分布式并行集群方式的基礎架構。其他廠商還有不少各具特色的計算平臺。下面結合Google云計算平臺來說明在平臺層整合資源的重點。
2.2.1分布式文件系統
分布式文件系統具有可伸縮性、可靠性以及可用性等特點,該系統將數據文件拆分成不同的數據塊或作為一完整的數據塊,這些數據塊將作為存儲基本單元,存放在文件數據塊節點。為了容災等目的,每份數據塊被存儲在不同的數據節點。
Google云計算平臺采用了其獨有的分布式文件系統GFS,每份數據塊被存儲在至少3個不同的數據節點,部署了許多GFS集群,有的集群擁有超過l000個存儲節點,超過300T的硬盤空間,被不同機器上的數百個客戶端連續不斷地頻繁訪問。
2.2.2分布式數據庫
分布式數據庫系統包含分布式數據庫管理系統和分布式數據庫。在分布式數據庫系統中,一個應用程序可以對數據庫進行透明操作。一個分布式數據庫在邏輯上是一個統一的整體,在物理上則是分別存儲在不同的物理節點上。一個應用程
序通過網絡的連接可以訪問分布在不同地理位置的數據庫。它的分布性表現在數據庫中的數據不是存儲在同一場地。更確切地講,不存儲在同一計算機的存儲設備上。Google云計算平臺采用了分布式的大規模數據庫管理系統BigTable,能夠處理格式化和非格式化數據。
2.2.3分布式編程
分布式模型計算過程是將待處理的數據集分解為小的數據集,數據集分布在集群的一個節點處理并生成中間結果·這些中間結果又由大量的節點進行合并,形成最終結果。Google構造Map-Reduce編程規范來簡化分布式系統的編程。應用
程序編寫人員只需將精力放在應用程序本身,而關于集群的處理問題,包括可靠性和可擴展性,則交由平臺來處理。MapReduce通過“Map(映射)”和“Reduce(化簡)”這樣兩個簡單的概念來構成運算基本單元,用戶只需提供自己的Map函數以及Reduce函數即可并行處理海量數據。
2.3應用層整合資源
應用服務(SaaS。軟件即服務)業務,基于互聯網的商業運營歷史悠久,也是技術發展非常成熟的云計算業務。可以在鐵路信息系統應用層面實現資源整合,許多站段的管理應用軟件功能基本相同,如各專業日常管理軟件、辦公管理軟件、電子郵件等。每個站段都安裝管理服務器端軟件,既要配置更多的軟硬件資源,又對技術能力有更多的要求。可以把這些軟件安裝在鐵路局的基礎設施“云”,實行專業化管理,站段只要“享用”這些服務就可以了。可以采用SOA技術。具體來說就是webService技術。SOA是一種IT架構,通過把任務和軟件功能封裝為能夠通過網絡訪問的一組相互連接的服務模塊,實現軟件功能的柔性組合,為云平臺應用軟件功能服務化提供了可行的方案。應用層整合資源對于降低投資成本、便于維護和快速部署使用也是非常重要的。
2.4網絡和負載均衡。
網絡是云計算的環境基礎,云計算會使網上傳輸的數據急劇增長,這對網絡帶寬和可靠性提出了更高的要求。目前的鐵路信息網絡狀況無法滿足這樣的要求,必須優化網絡布局、提高主干網絡速度和增加網絡冗余,避免出現單點故障。
負載均衡技術通過虛擬1P地址把多個服務器和服務組合起來,根據資源情況調度服務器和服務。負載均衡技術對于云計算數據中心也很重要。
3.結束語
建設鐵路云計算數據中心,需要在戰略上作出決策。應采用目前比較成熟的技術,從建立虛擬化的基礎設施和應用服務共享云入手,整合資源,提高信息系統可靠性,降低不斷高漲的信息系統投資和維護成本需求,更好地為鐵路運輸服務。進一步在建立鐵路云計算平臺服務方面開展研究,培養專業人才,使基于云計算的鐵路信息系統成為鐵路運輸組織智能化、客貨營銷市場化和經營管理現代化的有力支撐,并成為鐵路參與運輸市場競爭的核心競爭力之一。