《云原生降本增效大咖說》是企業網D1Net與騰訊云聯合策劃出品的訪談欄目,我們期望通過深度專訪,挖掘企業應用云原生技術的驅動因素,探索各自的應用歷程,了解企業面臨的技術痛點以及解決之道,梳理云原生技術應用最佳實踐的一系列方法論,向外界展示云原生技術的價值,為中國企業的云歷程再添助力。
本欄目采訪了騰訊云、蒙牛、中國黃金集團、海爾、石化盈科5家企業技術大咖,來分享企業在部署云原生背后的思考、實踐效果和方法沉淀。
在本期“云原生降本增效大咖說”中,企業網D1Net采訪了騰訊云云原生產品中心總經理鄒輝。
鄒輝認為:只有IaaS層面遠遠不夠,云計算廠商需要跟企業的眾多生產業務相結合,結合一些新的技術,在PaaS和SaaS有更大的投入。面對傳統企業,云廠商需要投入更多資源,覆蓋售前、售中、售后等從交付到落地的各個階段,幫助客戶能夠將產品用起來,還要用的很好。同時,他也為傳統企業在云原生實踐層面指明了最佳路徑:首先,傳統企業上云前期的決策和規劃非常關鍵,要按照規劃和節奏分步落實;其次,思維方式、組織架構和流程規范需要轉變,要以更加云原生的理念去實踐;最后,要注重云原生技術儲備,提升技術團隊和業務團隊的綜合能力。
(騰訊云云原生產品中心總經理鄒輝)
以下是企業網D1Net對騰訊云云原生實踐采訪內容的整理報道。
Q1:有人說,當前云廠商之間的競爭已經不再是單純的計算、存儲的性能競爭,而是服務、生態、落地的綜合實力比拼,是IaaS+PaaS+SaaS組合拳的競爭。您是否認同這一觀點?您覺得當前云計算市場的發展趨勢是怎樣的?
鄒輝:我非常認同這一觀點。伴隨云計算市場的飛速發展,近幾年國內大部分企業的上云進程都在加快,尤其是泛互聯網行業上云已經趨于飽和,同時傳統企業也在提速,國內整個云計算行業已經進入下半場。
過去企業上云最先用到的是IaaS,它是云計算里最基礎的一層。IaaS層的技術非常成熟、商業模式清晰,所以IaaS對云廠商而言是兵家必爭之地。經過多年來的發展,云廠商的IaaS產品和技術相對同質化,企業在IaaS這里使用也越來越普及,極大地幫助企業提升了資源層面運維和開發效率。
但除了資源層面,云計算在企業內部的應用還遠遠不夠,特別是和企業的生產業務結合這里,仍然有很長的路要走。同時我們也看到,一些新的技術如大數據、AI、AR/VR、元宇宙、腦機、機器人……正在與不同行業逐步融合,誕生出非常新的應用場景;在這些領域,云計算將會對企業業務,產生更大的價值和想象空間。比如IOT、AI跟汽車行業結合可以實現自動駕駛,5G、機器人跟醫療行業結合可以實現遠程手術。因此,我認為未來云計算需要跟企業的眾多生產業務相結合,結合一些新的技術,在SaaS和PaaS領域會有更大的發展空間,這也將成為未來云廠商贏得競爭的關鍵落腳點。
至于您所說的服務、生態和落地的綜合實力比拼,這也是一大趨勢。當前,國內泛互聯網行業的云化進程已經非常成熟,但是傳統行業上云仍然處在初期階段。傳統行業的細分領域非常多,對云計算的要求差異更大。從云廠商的角度來看,如果想打磨出一款標準產品來滿足傳統行業各個細分領域的需求,完全不現實;但如果廠商想深入各個細分領域,滿足不同領域的深度定制化需求,從人力成本和技術積累的角度來看也不是一個最佳的選擇。因此,云廠商如果想要深耕傳統行業客戶,就必須與每個行業細分領域的合作伙伴一起,關注客戶在落地實踐過程中的所有環節,服務好客戶,最終讓客戶收獲價值,才有可能贏得未來的市場競爭。
Q2:今年6月騰訊宣布自研業務完成全面上云,已累計節省成本超30億元,這是騰訊自研上云戰略的一個里程碑。騰訊自研業務上云經歷了怎樣的過程?
鄒輝:過去三年,騰訊把自研業務全部搬到了公有云上,并且完成了云原生改造。“這一決策”背后其實有非常多的歷史原因和深度思考,總結來看有兩點,一是內因,另一個是外因。移動互聯網時期,騰訊內部業務團隊為了滿足業務的快速增長,贏得市場競爭,每個業務都有自己專屬的技術團隊,久而久之就導致不同業務的技術棧自成體系,技術煙囪林立。同時為了服務好業務,騰訊內部技術團隊積累了非常多的“億”級架構技術理念,有著非常強的自豪感;越是成功的組織越會有強大的慣性,隨著開源軟件和云原生技術的興起,騰訊內部主流技術仍然停留在上個時代,內部開發人員存在深深的技術焦慮感。這是內因。另外早期我們云去服務外部客戶時,很多客戶總是會問“你們騰訊內部的業務是否在用你們的云”,面對這種問題,我們很難回應。這是外因。
所以在這兩個因素的促進下,騰訊做出了“自研上云”的重要技術戰略;既然要上云,那上云上到什么程度,當時也有一番爭論;很多業務的意見是用云上的IaaS層就好,原因是很多業務已經有很完善的調度技術和PaaS組件;后來拿到騰訊決策層去討論時,決策層提出“上到虛擬機這一層根本就不是真正的上云”和“部分業務技術運行的很好,局部最優但不代表著全局更優”兩個觀點,于是最終討論下來,我們定下來,不光要上云,還要完成云原生技術改造,徹徹底底完成技術的升級換代,而不只是換一個輪子。
不過也恰好因為,騰訊內部技術團隊對技術這里自主性非常高;所以云原生技術剛出現時,騰訊內部部分團隊就開始引入并嘗試在業務中落地。當時最典型的場景有兩個:
一個是離線計算平臺,我們基于Docker構建了一個離線任務平臺,Docker的可移植性讓不同的底層異構資源能加入到離線算力集群;同時Docker的隔離性,讓更多的細粒度任務可以跑在同一臺機器上,提升利用率。
另外一個是游戲場景,游戲業務有一個特點,上線初期,如果火爆可能有大量擴容操作,運行一段時間后,如果效果不行,可能會頻繁合服和下線。而K8S Pod的快速啟停,動態升降配的能力非常符合這個場景,于是我們將K8S引入,運行了很多游戲業務。
早期經過這一系列騰訊內部業務試點,騰訊在云原生技術這里的積累逐步成熟;之后我們逐步將云原生技術放到騰訊云上對外部客戶輸出,同時進一步在騰訊內部自研業務中全量推進云原生技術升級換代。
正是因為騰訊內部在前期做了這些技術試點,使得騰訊的云原生技術能力能夠快速走向成熟,并將其應用到騰訊云上輸出給外部客戶,錘煉騰訊云的產品、技術和綜合服務能力,最終實現內部海量自研業務的全面上云。經過三年的努力,現在騰訊內部所有核心業務全量完成了云原生改造。騰訊通過K8S技術將內部分散在不同業務、不同事業群的幾千萬核心資源全部拉通到統一的資源池,由統一的容器技術進行調度和管理,有效地減少了資源浪費,累計節省成本超過30億元。同時我們也進一步通過容器的在離線混合部署等技術,使資源利用率得到質的提升。
除此之外,在自研上云的過程中,我們進一步將微服務技術、DevOps等研發效能方面的工具體系在內部統一,實現了開發和運維效率的大幅提升。在服務騰訊內部業務的同時,我們還將這些技術以標準產品的方式放到騰訊云上,對外部客戶輸出。可以看到,越來越多的開發者和企業用戶正在基于騰訊云的衍生產品去構建應用,如今騰訊云原生產品已服務300萬外部開發者,擁有國內最大的微信小程序開發平臺和開發者平臺。
Q3:您認為企業云原生化改造的最佳技術路徑是什么?騰訊可以提供哪些產品支撐?
鄒輝:企業云原生化改造的過程并非一蹴而就,過程中會考慮改造對業務的沖擊,會衡量資源投入的產出比,會擔心技術積累是否足夠支撐改造;所以企業云原生改造,往往會選擇一種穩妥的方式逐步迭代進行;過程中先拿一些簡單的模塊試水,逐漸積累云原生相關的技術經驗和信心,最終一步步走到深水區,完成整體云原生技術改造。
騰訊將云原生改造分成開發云原生、計算云原生、架構云原生、數據云原生和安全云原生5個大的階段,這是企業云原生改造的5個不同層次,每個層次對應著豐富的云產品。例如在開發云原生階段,我們有CODING DevOps一站式研發管理平臺,從需求管理、文檔管理、代碼管理、開發環境管理、測試管理到構建發布管理多個維度,為用戶提供完整的自動化工具平臺,幫助企業用戶提升研發效率。在計算云原生階段,我們有TKE容器平臺,能夠幫助企業用戶更好地使用計算資源,同時提升資源的利用率,節省成本;還有SCF云函數以及基于云函數的微信云開發平臺,兩款產品的資源使用量都支持按次計費和毫秒級計費,用戶可以按需使用,最大限度地幫助他們節約計算資源成本。當然,架構云原生、數據云原生和安全云原生也有非常豐富的產品供用戶按需選擇。
Q4:在您看來,傳統企業的上云需求與泛互聯網行業有哪些不同?
鄒輝:我認為最大的不同是標準化和行業化的差異。泛互聯網行業內部的IT架構相對標準化,對云的需求也比較一致。在服務泛互聯網客戶時,已經成為一種標準化模式,往往云產品上線前都會找一些標桿客戶來打磨和完善,過程中不斷增加一些新的功能,而這些積累往往也適用于其它泛互聯網客戶,甚至很多客戶還會主動去參考這些標桿客戶的用法,所以產品成熟最終推出時會是一個特別通用和標準化的產品。但是傳統行業的差異性非常大,單單工業制造領域常用的生產軟件就多達140余種,更別說銀行領域的一些軟件,這些軟件在功能、安全、性能等等層面對云計算的要求各不相同,很難標準化。
其次在服務和落地層面,傳統行業的技術積累相對薄弱,云廠商只做好云產品本身還遠遠不夠,某種意義來看,云廠商更大的投入反而是在后繼的交付和服務上。只要其中的任一環節沒做好,整個單就可能失去;更嚴重的是,傳統細分行業中人員圈子相對固定,內部透明度很高,一旦一個口碑做砸了,可能造成在某個細分行業的信任崩塌。所以面對傳統企業,云廠商需要投入更多資源,覆蓋售前、售中、售后等從交付到落地的各個階段,幫助客戶能夠真正的將產品用起來,還要用的很好。
第三是對云計算的能力要求上也存在著差異,比如安全能力、位置需求等。泛互聯網行業大多服務于線上的C端用戶,大多要求云計算部署在一線城市的數據中心即可;而傳統行業其IT基礎設施往往要求更靠近生產現場,例如工廠的生產調度系統、礦山的自動礦車駕駛系統,對計算的時延要求非常敏感,同時也有非常嚴格的成本訴求,這就要求云計算也能夠靠近這些終端應用所在的位置去提供服務。
Q5:正如您所說,傳統企業的IT基礎相對薄弱,您認為傳統企業在云原生實踐層面,如何才能少走彎路?應該采取哪些策略?
鄒輝:首先,傳統企業上云前期的決策和規劃非常關鍵。為什么上云?為什么要做云原生改造?云原生改造的價值是什么?改造過程中可能會碰到那些問題?改造的階段和目標如何制定?如果這些問題沒想清楚,改造途中突然發現投入太大、或者價值不明顯從而停掉或者調轉方向,無論對業務還是對團隊都是非常大的沖擊。因此前期要有非常清晰的認知和決策,企業內部從上到下要達成共識,按照規劃和節奏分步落實。
其次,思維方式、組織架構和流程規范上需要轉變。傳統企業的軟件和架構相對老舊,研發模式上也不那么敏捷。所以除了關注技術本身外,也要多關注云原生相關的理念:如Devops(持續交付,自動化運維)、微服務設計、彈性伸縮,動態調度;同時在組織架構和流程規范上,也要有相應的調整,以適應云原生場景下的新訴求。
最后,要注重技術儲備。例如微服務、容器的技術儲備,通過業務層面的一些培訓,讓業務更好地進行云原生改造。當然,傳統企業也可以與云廠商合作,進一步提升技術團隊和業務團隊的綜合能力。
專訪鄒輝:騰訊自研業務上云經歷 為企業云原生實踐指明最佳路徑(下)