“中國聯通一直在積極探索IT架構的互聯網化轉型,目前已經實現了國內電信行業第一個核心業務系統上云。” 中國聯通軟件研究院創新與合作事業部總經理 尚一多表示。
據悉,中國聯通長期踐行IT系統集中化建設思路,早在2014年上線了全國集中cBSS系統,目前用戶數超過2.5億,已成為全球最大規模的業務支撐系統。日工單超過3000萬,日話單超過250億,每日接口調用量超過5億次。
cBSS系統的IT優化實踐
龐大的業務體量,讓cBSS系統在上線之初就面臨4G業務高速發展的挑戰:
1、傳統的IT架構擴容周期長、成本高
2、性能面臨瓶頸,4G時代話單急速增長觸及了數據庫的支撐上線
3、故障高頻發,由于模塊強耦合,任一小問題都有可能引發全局故障。
4、橫向南擴展:無法承載互聯網時代的突發業務,比如雙11促銷
5、業務難協同:集中系統之間,集團與省份之間協而不同
尚一多介紹,當時面臨每月超過80次系統故障,計費高峰期平均積壓5小時,對外數據提供平均延時2小時。IT系統已經成為業務發展的瓶頸。
優化措施1:應用性能優化
1) 建立系統全流程實時監控,對用戶操作日志、服務流程日志、接口調用日志、計費批價日志等海量日志進行收集分析
2) 建立系統關鍵性能基線,要求服務等待隊列《15,服務響應時延1s,話單批價時延不超過600s
3) 以問題為驅動,優化系統和流程,包括SQL性能優化,去中心化消除單點故障等
優化措施2:數據架構升級
合理引入NoSQL數據庫,以混合存儲架構滿足多場景數據需求,形成讀寫分離、熱數據與冷數據分離的模式
優化措施3:自主研發和完成了計費系統的x86化以及應用容器化部署。
已部署7大類55種應用共計41200個容器,實現在線灰度發布,不中斷業務,異常功能秒級回滾。應用彈性擴索容,擴容周期縮短為分鐘級,啟停時間縮短至秒級。
經過這些優化后,系統的主機利用率提高1倍,調用響應時延下降3倍,需求上線時間下降4倍,計費、查詢、中間件秒級擴展,投資節省40%
向互聯網化、云化轉型
在互聯網化轉型及新經濟蓬勃發展的背景下,聯通混改為企業發展帶來了新的契機,同時也對IT支撐能力提出了更高的要求。
為此,中國聯通開啟全面云化、“平臺+應用”的IT架構轉型之路,并于今年9月初發布了天宮云平臺2.0。
經過幾年的版本迭代和升級,天宮云平臺2.0擁有超過1萬個edas納管虛擬機實例,412臺數據庫服務器,同時支撐21個應用,日調用量超過9億次。
尚一多指出,傳統應用采用的是包機人治的方式,一群人來盯著某臺機器上跑的應用,現在采用分布式部署,一個應用可能分布在20多個機器上,運維模式需要轉變為以服務為視角進行監控,而不是以單個物理機。
此外,天宮平臺還結合了開源和商用技術,以100%自主掌控主流開源技術棧與業界最先進最成熟的互聯網商用技術棧相結合,成為集IaaS資源的管理調度和iPaaS的中間件能力為一體的核心基礎運營平臺,
尚一多表示,擁抱開源是沒錯的,對于穩定性要求很高的系統,更要掌控開源,達到源代碼級別的掌控,才能更好地用好開源。
尚一多還指出,私有云與公有云最大的區別在于能力的運營,因此天宮平臺構建了平臺能力開放和運營的體系。
目前天宮平臺已集成1200+能力,覆蓋開戶、繳費、支付、流量包訂購、異業下單、電子發票、無紙化及各類查詢等B域核心業務。各個省分公司可基于天宮平臺,通過直接調用、頁面集成、服務編排及個性化開發四種方式實現能力調用,支撐本省互聯網化營銷創新。
集中號卡資源系統,這是基于天宮平臺的第一個全云化架構嘗試。它拋棄了傳統的分省市分系統方式,徹底解決了多系統號碼不一致,選號成功率低的歷史頑疾,管理全聯通10億卡號資源,選好成功率提升至99.99%,日均調用量7.2億次,設計TPS達到4萬,系統響應時長小于20ms。
總結
最后,尚一多對于中國聯通的IT轉型做了如下金句總結:
互聯網架構轉型必須建立開放、與之適應的“橫向共贏、縱向協同”D餓IT生態
各行業特別是傳統行業的互聯網轉型必須有與之匹配的采購與項目管理辦法
開源時代,沒有自主研發、自主掌控就等于自殺
架構不完全是設計出來的,是不斷優化演進的結果
適合自己的就是“好的”
持續發揮容器化、微服務的優勢,要從軟件開放組織形式,開發模式上主動適應調整。