春晚紅包是金融云掀開門簾的“一只手”。
你也許記不得誰在今年春晚上唱了什么歌,但你肯定知道“誰”在彼時人氣最高,“敬業福”;你肯定不知道拿著手機“咻一咻”了多少次,支付寶卻統計出一個總數:3245億次。
記者了解發現,這個天文數字得益于一套完整的金融級云計算、大數據與移動互聯技術平臺的強大支撐。春晚紅包的背后是支付系統的升級,以及在“靈動”“彈性”的第三代技術架構下,支付寶實現了從互聯網金融架構基礎上逐步拓展出了能同時全面支持生活互動場景類業務的技術架構體系。
天文數字下的“收”與“放”
據支付寶官方數字,除夕第一輪“咻一咻”歷時5分鐘,互動次數達677億次,僅五分鐘就超過去年春晚全程的全場互動次數,而且是超后者6倍;到21點10分,前兩輪“咻一咻”互動次數合計突破1808億次,是去年春晚同期的16倍……
在馬云練太極拳的雕塑旁,從用戶“咻一咻”到最后資金到賬的過程,被螞蟻金服支付事業群技術部研究員倪行軍描述出太極“收”與“放”的味道。
每個開獎階段即為“收”,5分鐘之內,6000萬個紅包花落各家。伴著清脆的一“咻”,每次點擊屏幕的請求通過網絡被送至“螞蟻”的數據中心,然后服務器將該任務按照規則,交給不同的業務集群去處理。
在此階段,技術人員將整個業務系統前置,顯示出很好的“彈性”,使紅包系統承擔起了億級每秒的請求處理能力,讓所有用戶的請求都能及時進入紅包系統,并實時得到反饋。
幾乎在同時,系統啟動了第二階段的任務,“放”。即把6000萬個紅包資金快速準確地存入中獎客戶的支付寶賬戶內。倪行軍說,6000萬個紅包資金需要在分鐘級內到對應的6000萬個客戶賬戶,然后再將相應資金準確打入其中,完成這些巨大挑戰,全靠基于多年支付金融技術發展沉淀而來的金融云平臺的處理能力。
原來,當春晚紅包被還原成數字世界的“0”和“1”時,其運行軌跡看起來就非常熟悉了——各種任務最終都轉化成對該系統支付能力的考驗。
得益于整個金融云在技術架構、設計理念上與傳統銀行架構的不同,系統不但處理能力可以彈性增長,而且仍保留金融級的高可靠性、準確性要求,整個過程中4場每場6000萬個紅包發放做到了0差錯。
技術碾壓出“絲滑”體驗
從主持人口播至紅包到賬,春晚紅包團隊形容當晚的系統運行“如絲般順滑”。這種絲滑的前提是,將技術難點統統碾碎。
在海量業務并發的考驗下,很多小問題都會升級稱大隱患,就更不要說原生的技術難點了。
春晚紅包活動完全基于手機客戶端,每場活動內容、獎品設置、展現形式、時間要求都有差異,包括如何保證所有人能在約定時間點起開搶紅包,都是對“客戶端動態控制技術”很大的挑戰。為了解決端和云的聯合協同,技術人員在方面做了很多定制升級的研發。
大家“咻一咻”過程中要么是點中紅包,要么是抽中??ǎ词琼撁鎻棾鰣D片或視頻。幾億人同時在移動客戶端對資源集中并發訪問,技術人員為此開發了專門的“資源加載管理技術”。
每場都有6000萬個現金紅包以及大量福卡,這些獎品要實現類似于淘寶商品秒殺的庫存管理以及類似于鐵道部的票源管理,即在接受上百億的并發訪問時不出錯,技術人員還開發了專門的“獎品控制系統”。
每秒億級的任務請求,可謂“業務洪峰”。倪行軍介紹,“我們利用歷年大促的洪峰預測模型預測可能的鏈路反應情況,并根據反應利用‘獨門秘籍’,對上千系統進行全鏈路的壓力測試,檢驗、修正系統指標是否符合預測,并在春節期間對上萬臺服務器資源進行了快速的調配部署。”
在“咻一咻”的同時,我們在頁面可以看到一個根據實際中獎情況在實時變化紅包減少的倒計數條,數字變化精確到秒精確到個位數。就這樣一個數字展示背后是大數據的實時計算能力,是“實時大數據處理技術”。
此外,據了解,除夕夜技術團隊把所有可能想的到風險全部列出來,每個風險點都配上了相應的技術預案,“技術預案是以千為單位的”。
“螞蟻”、“蜂群”、“大象”
準確地說,春晚紅包是螞蟻金融云掀開門簾的“一只手”。門簾那邊,是金融創新的新階段。
技術專家向記者強調,紅包其實是在互聯網金融場景要求的前提下,加上生活互動類的場景應用的云應用。“跑在金融云上的春晚紅包背后是一套輕巧、靈便、彈性十足的分布式技術架構。”倪行軍表示。
據介紹,傳統金融機構普遍采用集中式架構的IOE系統(IBM的小型機、Oracle數據庫、EMC存儲設備),而云計算是分布式架構,其最大特點就是擴容方式簡單——只需要加機器就可以滿足數倍涌入的需求量,且系統本身不受壓迫,它可以全自動、標準化操作。
“靈動”與“彈性”是描述其用到最多的形容詞。傳統金融技術架構的開放性是緊耦合的,而基于云計算的金融技術架構是松耦合,并強調開放、協同的理念。
有一個比喻被用來說明傳統架構和“云”的區別:傳統集中式的架構猶如一頭大象,力大無比但是身上任何一個器官組織的問題都會導致大象生病,系統不可用,并且一頭大象的力氣增長是有限的;而分布式架構就像一個蜂群,著名互聯網先鋒凱文凱利在《失控》一書中曾舉例,“一個蜂群的行為特征,如果從個體的蜜蜂來看是找不到的。但蜂群的整體行為特征又是從許多個個體而來,比如說蜂群擁有的記憶能力,如果我們用某種杠桿衡量蜂群的記憶能力的話,它要比單個的蜜蜂的記憶能力長很長時間。”并且蜂群的能力不會因為其中幾個成員的損失而喪失機能。金融云的架構就比較靈活,當數據量小、運算量少時,投入資源也可以少,數據量增加后也可以方便進行彈性擴展。
目前,保障大家“順滑”搶紅包的螞蟻金融云上已駐有芝麻信用、天弘基金等不同金融業態的用戶。這些上了“云”的金融機構,付出遠低于傳統金融技術的成本,就能夠擁有處理高并發金融交易、海量大數據處理的能力,提升了金融業務創新與風險控制的能力。這些實踐也讓人看到了云計算與大數據技術服務于金融行業更多的可行性。而這也正是這朵“云”所希望的,在未來能夠幫助更多金融機構、中小金融機構,能夠讓他們從金融轉向新金融,讓其帶來更多的產品和業務創新。
■快問快答
問:敬業福發了多少張?
答:根據支付寶集?;顒禹撁骘@示,共有791405個人集齊五福,平分了2.15億元現金,每人分得現金271.66元。而據支付寶官方微博透露,“敬業福”一共發了826888張,這意味著有3萬多人浪費掉了搶手的“敬業福”。
問:很多視頻中,網友各顯神通,改裝了機器增加“咻一咻”的速度,這樣真的可以多搶到敬業福嗎?
答:敬業福和紅包的發放是隨機的,也就是說每一次點擊,中獎的幾率是一樣的。就像你扔硬幣扔了三次正面,第四次出現反面的機會到底會不會大一些的道理一樣,這是一個數學問題了。
問:“咻一咻”和過去手機“搖一搖”的難度差別在哪里?
答:這個肯定是有差異的,一開始產品上設計這個方式時就對技術提出了比搖一搖更苛刻的要求,我們也進行了一些極限模擬測試,搖一搖搖一次基本上是一秒多,“咻一咻”一秒鐘最快速度可以點7下,所以技術壓力來說“咻一咻”的產品設計方案對技術處理的壓力自然會更大些,服務請求量更為龐大些。