通過對政務云平臺總體架構、網絡拓撲和容災備份等關鍵技術的研究和設計, 給出基于云計算架構的智慧政務云平臺的實現方案。政務云平臺能夠節約建設成本, 降低政府財政支出, 同時大大縮短業務上線周期, 減少運維難度。本方案已經在部分先進省市信息化項目中落地實施, 取得顯著的效果和寶貴的實踐經驗。
一、前言
為了促進服務型政府建設, 推動政務大數據產業的發展, 滿足電子政務、電子商務等信息化快速發展的需求, 避免信息化建設未來發展中可能出現的重復建設及信息孤島問題, 將政府各部門建設信息系統都需要的基礎設施從各自的業務應用中剝離出來, 集約建設、統一管理、按需使用, 形成共享資源池已成為當務之急。目前政府信息化建設的主要矛盾如下。
(1) 新建系統周期較長, 投資成本高
目前大部分政務系統均配置專屬的服務器、存儲和網絡設備, 從規劃、立項、采購、建設到交付的周期, 往往按年計算。同時, 由于系統獨立運行、硬件無法共享, 資源利用率十分低下, 產生大量重復建設問題。
(2) 運營維護效率低, 管理成本高
政務系統硬件均通過單獨的項目采購, 往往包括多個廠商, 無法做到統一管理。因此網管系統只能實現基礎設施的監控, 無法做到告警的關聯分析和故障的快速定位, 導致大部分工作依然靠人工的方式處理, 運維效率低下。
由于云計算技術的快速發展, 建設智慧的政務云資源池是解決以上問題的重要途徑。
政務云能基于VDC (Virtual Data Center, 虛擬數據中心) 實現多政府部門、多業務應用的資源共享和按需服務, 通過云管平臺實現整個云資源池的統一運營和運維, 達成跨區域、跨部門的信息共享, 滿足業務不斷發展和隨時變化的需要。
二、政務云平臺總體架構設計
政務云平臺的建設是一個復雜、社會化的工程, 需立足于較高的建設起點, 以長遠的眼光通盤考慮。政務云總體設計應充分考慮目前業務系統的內部整合, 以及資源靈活調配、統一管理的業務需求。為了完善隨需應變的應用環境, 政務云平臺的建設既要考慮技術先進性, 又要遵循簡化、共享、標準、動態的原則進行。
- (1) 采用層次清晰、結構完整、開放共享的技術支持框架, 實現目前條塊分割、煙囪式的架構向統一、協同、開放的架構轉變, 打造政務信息資源整合和信息交換的中央樞紐, 以持續、穩定、安全的架構支撐政府公共服務一體化、個性化、智能化。
- (2) 各部門按照數據向上集中、服務向下延伸的建設思路, 充分利用電子政務云平臺上的公共基礎設施及政務應用系統, 建設本部門業務應用, 形成統一證書認證、統一數據中心、統一網站入口、統一安全支撐以及各應用系統互聯互通的工作模式。
- (3) 機房資源、網絡資源、 (物理/虛擬) 計算存儲資源、數據資源、軟件資源、服務運營運維、安全管理全局共享, 并根據業務運行情況實現平峰錯谷和彈性伸縮。
政務云總體架構設計如圖1所示, 主要由基礎設施層、資源管理層和云運營運維管理層組成, 另外還提供安全和災備能力。
- 基礎設施層:服務器、存儲、網絡等物理設施, 構成融合資源池的基礎架構。
- 資源管理層 (虛擬化層):基于Open Stack統一管理主流虛擬化軟件, 對計算、存儲、網絡等物理資源進行虛擬化, 提供統一的資源池和基礎的運維能力。
- 云運營運維管理層:統一管理多個數據中心資源層提供的資源池, 提供統一運營和運維管理, 構建統一的融合資源池, 實現資源共享。
云運營運維管理層可以分為運維系統和運營系統兩部分。
- 運營系統主要提供數據中心服務管理, 提供V D C服務、云主機服務、物理機服務、云磁盤服務、網絡服務及應用部署服務。
- 運維系統提供對多數據中心的統一運維管理能力, 包括資源管理、告警管理、拓撲管理、性能管理以及統計報表等。
政務云基于云運營運維管理層提供的運營和運維能力, 匹配業務場景, 通過服務目錄向各需求單位提供各類服務, 承載各部門政務應用。通過VDC服務的形式進行資源的靈活分配, 實現VDCaa S (VDC as a Service, VDC即服務) , 在VDC內部進一步通過云主機、物理機、云存儲、彈性IP地址等服務提供自助資源發放, 實現Iaa S, 同時實現政務云平臺的容災備份, 保障關鍵業務的連續性。
圖1 政務云總體架構設計
三、政務云平臺詳細網絡設計
在進行網絡設計前, 首先要根據業務系統情況, 對政務云平臺進行安全域劃分, 建議劃分為互聯網區、政務外網區以及專網托管物理分區, 分別承載三個分區的業務系統。在互聯網區和政務外網區之間可以部署數據緩沖區, 實現跨區數據交換。政務云安全域劃分設計如圖2所示。
- 互聯網區:承載政務直接面向互聯網用戶的業務系統資源區, 包括政府門戶網站、網上服務大廳、市民服務中心等。
- 政務外網區:承載政務外網業務, 包括民政、工商、稅務等各委辦局專業業務。
- 專網托管區:承載政務專網中相對敏感的業務系統, 或一些不適合在虛擬化環境中運行的系統, 與其他區域進行完全物理隔離。
- 數據緩沖區:部署數據交換管理平臺 (網閘或防火墻) , 可以對互聯網區和政務外網區進行數據交換, 同時進行數據的清洗和脫敏等處理。
根據政務云平臺的分區設計, 以互聯網區為例, 進一步對云平臺組網進行詳細設計, 將區域分為核心交換區和業務功能區, 業務功能區中包括業務、存儲、管理三個平面 (根據業務需求可再增加數據備份及同步平面) 。業務平面中, 包括業務區、測試區、大數據區等多個子資源池, 具體如圖3所示。
圖2 政務云安全域劃分設計
在詳細設計中, 核心交換區的功能主要是完成各服務功能分區之間數據流量的高速交換, 是數據中心南北向流量和東西向流量的交匯點。核心交換區主體采用兩臺核心交換機構建雙網雙平面架構, 通過多條鏈路聚合技術保證網絡的高性能、高可靠。核心交換機支持SDN (Software Defined Network, 軟件定義網絡) 和Vx LAN (Virtual Extensible LAN, 虛擬擴展局域網) 等功能, 通過虛擬化技術實現多實例, 每個實例均擁有獨立的處理能力和運行環境, 可以實現安全域劃分和故障域隔離, 在提升設備資源利用率及可靠性的同時, 降低網絡安全風險。同時, 核心交換區提供對業務流量的控制和優化, 如安全控制、負載分擔等智能功能。核心交換機串聯或旁掛防火墻設備, 實現訪問數據中心業務的南北流量及區間互訪東西流量的安全控制。
圖3 互聯網區詳細網絡設計
業務功能區按照業務部署和運行要求, 劃分為業務區、測試區和大數據區, 滿足不同性能要求的業務系統部署。各區可在存儲設備上劃分不同的存儲池, 但采用相同的網絡方案接入核心交換區可簡化網絡設計, 降低維護難度。單臺機架服務器分別連接業務網絡、存儲網絡、管理網絡三個不同的網絡平面:業務網絡服務器提供萬兆光口對接接入交換機, 提供業務數據訪問網絡, 通過大帶寬滿足業務交互和對外提供服務的帶寬要求;存儲網絡服務器提供光纖接口, 采用光纖交換機構建獨立的光纖網絡, 實現SAN存儲設備的高速訪問;管理網絡帶外管理采用千兆網絡, 接入帶外管理交換機, 提供物理設備帶外管理, 帶內管理流量接入業務交換機, 通過VLAN與業務平面實現邏輯隔離, 通過鏈路的主備綁定, 提升管理網絡的可靠性。
圖4 政務云災備設計
四、政務云災備設計
政務云承載著大量政務系統, 其重要性不言而喻。為了保證系統的高可靠性, 可以通過建設雙活數據中心進行異地容災, 確保在單個政務云節點出現故障的情況下, 業務可以切換至容災節點。政務云要實現雙活, 必須在各個層面實現災備設計, 具體如圖4所示。
在網絡層面, 可以通過部署GSLB (Global Server Load Balance, 全局負載均衡) 設備實現資源訪問在兩個政務云節點之間的調度。負載均衡設備能夠對用戶的訪問進行智能分析決策, 返回給用戶一個最佳的服務地址, 同時對訪問應用集群的流量進行合理調度, 如果集群中某一節點不可用, 則將該節點移出集群, 把訪問流量分配到其他可以正常工作的節點。根據業務訪問模型的不同, 政務云提供高可靠的網絡互聯, 通過Vx LAN技術實現雙數據中心大二層互通, 形成跨節點的雙活網絡, 允許應用集群、虛擬機跨節點部署、遷移, 并且進行訪問路徑的優化, 使客戶端就近訪問業務所在的政務云節點。
政務云上, 各個委辦局的業務系統部署一般分為業務服務器和數據庫服務器。根據業務系統對性能的不同要求, 業務服務器建議采用虛擬化部署方式, 數據庫服務器建議采用物理機部署的方式。在應用層面, 可采用應用集群和虛擬機遷移等技術, 提供用戶跨節點的高可用和應用訪問調度能力, 通過數據RAC (Real Application Cluster, 真正應用集群) 等技術部署或集群方式實現兩個數據中心間的數據庫實時同步和雙活。配合監聽及應用程序故障轉移技術, 數據庫集群在服務器或單個節點出現故障時, 能夠使客戶端在新的連接中繼續工作, 防止業務中斷。
在存儲雙活方面, 可使用雙寫技術, 上層應用在兩個政務云節點同時讀寫、存儲, 寫入數據的同時寫入兩個節點的存儲, 最大程度保證數據的可靠性和一致性, 并且做到存儲、讀寫時延的性能優化。雙活存儲鏡像采用光纖互聯, 兩政務云節點相距25km以內可采用裸光纖直連, 如果距離超過25km, 建議使用OTN (Optical Transport Network, 光傳送網) 波分設備構建兩數據中心的同城網絡。部署OTN波分設備時, 建議采用1+1主備線路雙發選收的方式, 提供物理鏈路的高可靠性, 一條裸光纖中斷時, 另一條裸光纖可馬上恢復業務流量, 切換時上層網絡及應用無感知。
結合應用雙活和存儲雙活, 可以推動智慧政務云實現最高級別的業務連續性, 確保業務系統設備出現故障, 甚至單數據中心出現故障時, 業務無感知并自動切換, 實現RPO (Recovery Point Objective, 恢復點目標) =0、RTO (Recovery Time Objective, 恢復時間目標) ≈0。
五、結束語
通過政務云的建設, 大大降低政府部門的信息化投資風險, 提高業務上線速度, 同時能夠對多個政務系統的基礎設施進行統一規劃、統一管理、按需使用和資源共享。政務云還通過全方位的網絡安全和容災備份設計, 提高業務系統的風險抵御能力, 確保政府對外服務的不間斷性, 為政府的服務轉型奠定良好的基礎。同時, 政務云是智慧城市發展的重要一環, 政務云結合物聯網、大數據等關鍵技術, 向下實現城市發展更泛在的互聯, 向上實現政務數據更智能化的分析, 這是下一步重點研究的方向。