《云原生降本增效大咖說》是企業網D1Net與騰訊云聯合策劃出品的訪談欄目,我們期望通過深度專訪,挖掘企業應用云原生技術的驅動因素,探索各自的應用歷程,了解企業面臨的技術痛點以及解決之道,梳理云原生技術應用最佳實踐的一系列方法論,向外界展示云原生技術的價值,為中國企業的云歷程再添助力。
本欄目采訪了騰訊云、蒙牛、中國黃金集團、海爾、石化盈科5家企業技術大咖,來分享企業在部署云原生背后的思考、實踐效果和方法沉淀。
作為全球白色家電龍頭,海爾智家為用戶提供衣、食、住、娛的智慧全場景解決方案,全面提升用戶生活品質,以“云”體驗、全鏈路服務、個性化智慧終端,實現交互、體驗、銷售、服務于一體的全流程生態平臺。
海爾智家全球數字化平臺用到了哪些云原生技術產品?如何實現降本增效?在云原生技術應用方面有哪些實踐和探索?云原生技術發揮了哪些價值?在本期“云原生降本增效大咖說”中,企業網D1Net采訪了海爾智家全球數字化平臺技術總監高麗。她表示,海爾智家從2017年開始云原生試點,2018年全面擁抱k8s,多年來緊跟云原生的技術發展趨勢,在產品技術和管理方式等方面做了一些嘗試性的探索,經過五六年的積累,收獲了一些心得。
以下是企業網D1Net對海爾智家云原生應用實踐采訪內容的整理報道。
海爾智家全球數字化平臺技術總監 高麗
企業網D1Net:您如何看待云原生產品技術?海爾智家在云原生方面有哪些實踐?
高麗:海爾智家從2017年開始關注云原生,彼時CNCF剛剛發布了一些云原生的技術趨勢。根據CNCF給出的定義,云原生既包含技術,也包含管理。例如:技術方面包括微服務以及容器等基礎設施技術,管理方面包含DevOps持續交付以及康威定律等諸多管理方式。
我理解的云原生是一系列云技術和企業管理方法的集合,它充分利用云技術的優勢,為企業提供了一套從應用程序設計、實現、部署到交付的總體運營架構和方法??傮w而言,云原生能夠幫助業務快速迭代,是一種科技的進步。實際上,CNCF至今仍未給出云原生的具體定義,它其實是一個不斷自我演進的理論體系加最佳實踐的組合。
2017年,在了解到以容器云為基礎技術的云原生技術之后,海爾智家結合自身的諸多業務場景進行了一系列落地實踐。例如:2017年,我們正在探索的業務中臺建設,當時海爾正在向互聯網、物聯網的方向轉型,我們既要面向C端消費者,又要面向B端客戶,因此從業務中臺的角度,我們需要建設產品中心、客戶中心等能力中心,不斷沉淀海爾智家的業務中臺能力。
在這一過程中,云原生技術發揮了很多優勢,不論是底層容器云基礎設施的穩定性,還是整體技術架構的先進性,都在幫助我們快速地實現業務需求。
企業網D1Net:海爾智家采用云原生產品的驅動因素來自哪些方面?
高麗:海爾智家采用云原生技術的驅動力主要來自三個方面:
一是業務需要快速迭代。我們經常說小步快跑,但是怎么落地呢?肯定需要一套管理加技術指導的方法論來落地。而落的基礎是什么呢?我們定位到了云原生的一系列產品,其核心是具備持續交付的能力,能夠幫助業務快速迭代,這是其一。
二是降低成本,包括基礎設施成本和人力成本兩個方面。首先,容器云能夠將服務器集群的多種資源池化,降低了基礎設施成本。我最近做了一個測算,采用容器云之后,海爾智家提升了整體硬件的使用率,基礎設施成本大約降低了37%,這對海爾智家來說是一個非常好的降本措施。
其次,降低了人力成本。用過k8s就能體會到,它能夠通過先進的技術降低運維成本和人工投入,用k8s之前必須人肉監控,每天安排很多運維人員7×24小時值班,而云原生大大縮減了這類人力成本。
三是架構的標準化。我同時負責海爾智家全球數字化平臺的技術架構,當時我們需要快速迭代的業務非常多,我一直在思考怎樣結合一套產品實現松耦合的架構治理和落地。這意味著一方面要讓業務快速迭代,另一方面架構又是松耦合的,發生任何流程和架構上的變化,都能快速適應。因此,選擇云原生這條路持續實踐,架構的標準化對我們而言非常重要。
企業網D1Net:海爾智家應用云原生產品技術經歷了怎樣的過程?主要用到了哪些產品?
高麗:海爾智家從2017年開始探索云原生技術,此前一直在保持觀望。2015年至2016年,我們發現Docker的聲量比較大,也有Mesos等類似的一些容器技術誕生,但是那時我們不知道哪一種技術會成為主流。經過兩年的觀望,直到2017年,我們看到以Kubernetes為基礎的容器云逐漸壯大起來,所以我們沿著k8s的技術路線使用了一系列云原生產品。
從2017年6月開始,我們以k8s為基礎進行容器云PaaS平臺的初步試點,在實現容器云落地的同時,也用到了微服務以及企業架構治理方面的一些工具。從2017年6月到年底,經過半年時間的驗證,我們認為這一平臺基本可行,隨后我們在2018年全面擁抱k8s,從基本的部署、監控、配置管理到服務發現,全部采用k8s技術。
多年以來,我們用到了很多云原生的開源產品,例如:鏡像倉庫用到了Harbor;CI/CD開發流水線中使用的Tekton,是Google剛剛捐獻給CNCF基金會的開源產品;ServiceMesh用的是Istio的解決方案;Serverless用到了Knative、Camel-k等等,這些都是我們目前正在用的一些開源產品。
企業網D1Net:很多企業都在通過云原生技術產品實現降本增效,海爾智家在追求降本增效的過程中采取了哪些措施?還有哪些痛點和訴求?
高麗:運用云原生技術產品實現降本增效,對于我們而言是一個不斷發現問題、解決問題的過程。在探索云原生的過程中,隨著我們使用云原生技術產品能力的提升,我們順便把IT自身的管理流程也做了諸多優化,包括剛才提到的運維人員的縮減和運維成本的大幅下降,云原生帶來的只有好處,沒有壞處。
比如,在服務器被資源池化之前,我們的服務器歸屬于某個產品或某個項目組,現在用容器云進行資源池化之后,我們把資源的申請流程乃至每個產品和項目組對于資源的使用情況,做了很多透明化的處理,實現了管理工作的諸多優化。
實際上,云原生技術產品本身正在持續迭代的過程中,從安全的角度來看,還有待成熟。雖然目前云原生涵蓋的技術多種多樣,但是云原生平臺的安全問題仍然是海爾自己探索的一個重要方向。同時,CNCF基金會也會持續探索,收編更多安全項目。
企業網D1Net:您最看重云原生技術的哪些價值?海爾智家應用云原生產品技術在降本增效方面帶來了哪些效果?
高麗:任何公司在考慮云原生技術的時候,降本增效一定是首要目標,與此同時也會帶來很多收益。比如增效,如果不用數據說話,可能很難有一個清晰的認識。我們在云原生技術的基礎之上,開發了很多管理工具和平臺,包括研發效能平臺,如果粗略地計算一下,我們的需求交付周期從以前的20多天縮短到14天,通過這個量化的數值,我們發現確實提效非常驚人。從這個角度來看,云原生在降本增效方面確實做的非常好。
其次,我剛才提到了運維工作的簡化以及運維人員的縮減,其實這是云原生本身的可觀測性帶來的價值。以前IT的很多工作是不透明的,打散在服務器、中間件以及數據庫等等各個技術領域,而云原生技術在各個層面都是可觀測的,這種機制能夠幫助我們快速地定位問題,同時對于出現的問題也能夠快速恢復,這方面也是我們看到的一個非常重要的價值。
不論是傳統企業,還是互聯網公司,應用本身的可用性一定是IT的底線,當應用出現問題后必須能夠快速恢復,這樣的可觀測性機制,我認為是所有企業必須具備的能力。
企業網D1Net:海爾在云原生技術應用方面還有哪些探索?
高麗:我剛才提到的云原生技術,大部分是在應用領域,比如訂單系統這類應用系統。現在我們正在把云原生技術復制到大數據和人工智能平臺上。其實,云原生技術對于這類平臺完全適用,我們正在向大數據和人工智能的方向進行探索。
另一個是安全方面,在數字化轉型的背景下,數據資產具有重要價值,云原生的DevOps平臺,如今加入了Security變成DevSecOps,正是在強調必須打下扎實的安全基礎。例如,權限控制、服務級的動態隔離、訪問控制等等,我們的安全策略要盡可能做到細顆粒度的管理,這是我們正在探索的另一個方向。
企業網D1Net:目前海爾用到的云原生產品是哪家廠商的?其產品的優勢是什么?
高麗:我們在2017年時選擇了一款叫“才云”的成熟軟件,現在已經被字節跳動的火山引擎收購了。我們在17年到18年兩年的時間里,借用外部公司的成熟產品實現起步,在逐漸建設的過程中,我們發現基于云原生的技術棧,不能完全依靠外部力量,我們必須建立自己的團隊去做一部分工作。
所以,在2019年底,我們基于市面上的開源產品,開始開發我們自己的產品模塊。目前我們所用的容器云、Serverless以及諸多開源工具,基本都是在開源工具的基礎之上自研的。
對于產品優勢,需要從企業的特性來看,海爾智家一方面基于云原生的技術棧不斷深入演進,另一方面,我們既有面向C端消費者的應用,也有很多企業內部應用,這就決定了我們的形態,一定會用到混合云技術,我們把面向消費者的應用盡可能的部署到公有云平臺。
我們認為,在混合云的基礎之上,自研能夠更好的發揮云原生產品的優勢。目前,我們在混合云平臺之上跑的所有云原生產品都是互通的,相當于我在一個統一的界面里,能夠動態地調度公有云和私有云的資源,這是我們的一個優勢。我認為,無論是自研,還是選擇廠商的產品,都必須支持混合云下的云原生產品。
企業網D1Net:從企業數字化發展和轉型的角度來看,您覺得未來云原生在幫助企業實現降本增效目標上,還有哪些更大的價值可以發揮?
高麗:我認為除了降本增效之外,云原生還可以發揮更大價值。
首先,云原生改變的不只是技術,關鍵在于它能夠幫助業務快速迭代,與此同時,業務的編碼、開發的代碼以及項目流程等必然會發生根本性的變化,比較典型的是:我們的業務邏輯會越做越輕,而云原生的技術底座會越來越厚。正因如此,不論是數據處理,還是非人用戶的參與,例如基于事件驅動的機器人,這類不需要人去手工干預的自動化用戶會越來越多,這些都會越來越智能化、自動化。
其次,從崗位的角度來看,我們剛才提到云原生給運維帶來很大轉變,其實不僅是運維,各類崗位都會有所觸動,每個崗位的變化都是一個全方位的重構。
例如:像我這樣的技術負責人,如今我考慮更多的是如何利用DevOps工具,能夠重新看待整體的企業級研發流程;對于開發人員,他只需要專注于寫好業務邏輯和業務代碼,不需要再去關注中間件、數據庫等等,因為云原生平臺已經屏蔽了包括中間件、數據庫、IaaS等在內的各種問題;對于架構師,過去他要去組合一堆堆疊的技術棧,現在只需沿著云原生的技術棧持續演進,不需要在中間摻雜過多的技術復雜性。
最后,我們正在做工業互聯網,云原生能夠為工業互聯網等全新的業務解決方案賦能。目前,海爾智家的云原生技術應用主要是在服務器端的后臺應用,其實基于工業互聯網也有豐富的場景。例如,云邊端的協同,云原生技術產品中包含基于邊緣容器、邊緣網絡、邊緣技術的版本——k3s,它是k8s的簡化版,完全為邊緣而生。
對于海爾智家正在做的工業互聯網場景,云原生技術能夠幫助業務,與業務一起構建應用,做到快速交付和統一管理。目前,海爾有幾大燈塔工廠,未來在工廠里,云原生技術可以在工業互聯網的環境中發揮更多價值??傊?,云原生值得探索的方向還有很多。
企業網D1Net:海爾在低代碼或無代碼開發方面有哪些探索?
高麗:目前,海爾在低代碼開發方面已經小有所成。根據Gartner預測,到2024年,65%的應用程序將使用低代碼模式構建,低代碼將推動幾乎三分之二的應用程序開發。
怎樣理解低代碼呢?第一個是開發可編排,面向開發人員提供開發組件,實現代碼與組件的復用。組件市場屬于面向開發人員的低代碼平臺,它是一個開發的通用能力,比如微服務的腳手架,我們的開發人員通過海爾定義的微服務腳手架,能夠快速搭建開發環境。以前每個開發人員需要花費7-10天才能搭建的環境,利用這個開發組件,只需要1-2個小時就可以完成。通過復用代碼或組件,能夠幫助大家實現快速交付。
剛才說的是開發后端,實際上在裝配組件平臺,我們提供了多種能力,包括前端開發,也可以通過這一平臺快速聚合,生成新的交互頁面,實現前端開發人員的效率提升。
第二個是服務可編排。所謂的服務可編排,能夠快速通過拖拉拽的方式實現業務能力,這是我們目前正在探索的方向。
其實,海爾智家的業務流程非常復雜,在低代碼開發方面,目前我們通過逐步解構已經實現了工作流的編排。以前,我們通過夯實云原生的基礎底座,不斷提升開發人員的效率,如今,在云原生的基礎之上,我們正在通過組件的復用,繼續提升開發效能。
結語
經過一系列深度訪談,企業網D1Net與騰訊云發現,雖然大型傳統企業選擇云原生技術的契機、面臨的挑戰以及技術的實現方式略有差異,但是呈現的效果卻殊途同歸,云原生架構的先進性,在降本增效、快速迭代、架構標準化、資源復用、高效協同、業務松耦合管理、夯實安全能力等方面,發揮了顯著作用。
云原生作為科技發展的重要里程碑,這項技術本身及其背后的一整套管理方法論正在持續迭代的過程中,為此騰訊云聯合中國信息通信研究院、作業幫編寫推出了2+萬字的《降本之源-云原生成本管理白皮書》,系統介紹了如何通過云原生來提升IT資源利用率,實現企業的降本增效。
白皮書中提出的“云原生成本管理模型”,在騰訊內部、外部客戶歷經大規模實踐,實現了通過云原生技術并充分利用彈性技術,整體平均利用率提升到30%~40%;一些企業在使用云原生混部技術后,最高實現整體平均利用率提升到60%~70%。
下載《降本之源-云原生成本管理白皮書》
http://hfnxjk.com/statics/images/ad/202206/20220601_Tencent_cloud_wp.pdf
掌握提升企業IT資源利用率方法論