源于互聯網的大數據技術,現如今已經深入到傳統行業之中。各行各業大都在積極使用大數據推動數字化轉型,基于每個行業的特點和信息化水平的不同,在大數據的應用上也各不相同,其中金融、電信、政府、交通行業領跑大數據應用。
某電信運營商的大數據應用在運營商中屬于第一梯隊,早在3、4年前就開始了大數據平臺的建設。但隨著業務帶動數據量的增長,也產生了多租戶的問題,所以在大數據平臺二期建設上,其考慮通過統一架構來解決多租戶問題。
運營商的多租戶挑戰
在大數據應用上可以分為三個階段,第一,實驗期,非核心業務的應用;第二,廣泛使用期,針對一些大數據技術選擇使用的場景;第三,引領發展期,實現創新應用。
電信行業算是最早使用大數據開展業務的行業之一,在大數據的應用上已經經歷了第一階段大多處在第二階段,而且運營商目前也正進入新的轉型期,大數據也將成為創新的驅動力。
而在大數據廣泛使用期的運營商有兩大驅動力需求:業務和技術。業務驅動力表現為實現端到端的業務模型,從用戶畫像提煉出目標客戶產生價值等;技術驅動力表現為技術平臺的建設滿足不同的需求。在大數據應用第二階段的后期,兩種驅動力也會交織在一起,運營商甚至建立專門的大數據部門,來統籌和實現需求。
運營商在各省市都有不同的分支機構,某電信運營商作為第一批建設大數據的運營商,在3、4年前就開始大數據平臺的建設,2年內獲得了超過3000萬的業務收益。但隨著海量數據和數據應用種類的不斷增長,大數據系統超負荷運行,驅使100%的磁盤空間利用率幾乎崩盤,對業務的穩定性和安全造成了潛在風險。
這也是運營商在大數據應用第二階段最突出的問題“多租戶”,多租戶是一個比較廣的概念,其中涵蓋了資源共享、資源調度、可是化管理,多租戶也基本代表了規模以上企業在技術驅動的大部分范疇。
多租戶來自于使用和維護部門的直接需求,之前運營商在IT系統的建設上都是一個應用一套平臺,這也造成了系統和系統之間的隔閡,產生大量的孤島。在經過不斷的架構優化后,逐漸形成了在統一的平臺建立大數據應用,這就需要實現硬件甚至數據的共享。在應用都在分享資源時,如何調派這些資源,就產生了多租戶的需求。
構建統一架構大數據平臺
某電信運營商需要滿足分批量數據處理的同時,引入實時分析應用,提高數據的高效利用率,挖掘潛在數據價值。
在Hadoop的初期并不具備實現條件,經過發展目前Hadoop已經可以很好的滿足多租戶需求,但中間需要大量定制化開發。而且單一系統也不能完成大數據的所有需求,這也使得需要一個全面的解決方案。
某電信運營商在大數據平臺上更加關注實施風險和性價比,以Platform和GPFS為基礎結合開源Hadoop2.0+Spark整體解決方案實現完全兼容滿足多租戶需求,即使在租戶數量增多的情況下,也能保證企業租戶享有安全穩定高效的應用性能。
最終選用Power Linux主要是考慮硬件本身的性能、可靠性、安全性,之后再對比軟件的性價比。相比X86服務器,Power Linux在其中起到了軟硬互相優化的作用,Power對于商業軟件還是開源軟件都有很好的兼容性,而且還可以針對性的進行調優。而且在同一平臺上實現支持不同開源Hadoop版本,解決了集成問題,避免了推倒從來和數據遷移。
目前某電信運營商的大數據平臺已經進入第二期建設,每天數據量峰值已經超過50TB,平臺上的數據提供給業務部門、維護部門、創新中心三大部門使用。
大數據平臺在支持運營之外,提供了共享的框架,節省了資源提高利用率,該省公司也因此成為中國移動在大數據應用上的標桿工程。而且通過隔離功能可以讓不同應用運行在平臺的同時,還可以實現數據的共享,提高性能的同時降低開發成本。
在未來大數據平臺的規劃上將更加突出業務特性,甚至有可能將其他省公司也接入到該省公司的大數據平臺,在技術層面越來越基于云進行分析,提升整個平臺的計算速度和易于維護性。