Kubernetes 從 2014 年開源至今,在云原生領域的地位已經逐漸穩固。從宏觀層面來看,Kubernetes 解決方案的引進路徑十分清晰,在許多企業的落地實踐中均得到了成功的驗證。目前企業級 Kubernetes 解決方案逐漸成為大勢所趨,但不少企業對此仍持觀望態度。那么,2023 年 Kubernetes 管理將路走何方?
近日,Rancher 大中華研發總監張智博做客直播間,與大家分享了 Kubernetes 在企業中的落地實踐,共同探討其發展現狀及未來趨勢。
InfoQ:您認為,企業為什么需要 Kubernetes?
張智博:企業不斷采用 IT 變革技術,本質上它需要的是容器技術給它帶來生產力的提升,而非完全依賴 K8s。實際上,容器技術也確實提升了企業應用的分發效率、打包效率以及整個生產的迭代效率。
就目前行業發展情況來看,要將容器進行整體管理,K8s 仍是最佳選擇。此前雖出現過同類軟件,但已經在近幾年的發展過程中逐漸消亡。盡管還有其他一些小眾選擇,但那些選擇要么缺少生態維護,要么得不到大的云廠商支持。即便想要落地,也找不到可用且相對穩固的技術工具和技術棧。因此,我們認為 K8s 可能是當前時代已有的、唯一的選擇。
InfoQ:企業使用 Kubernetes,究竟是走開源自建路線,還是購買商業服務路線?Kubernetes 開源版和商業版的區別究竟在哪?為什么現在 Kubernetes 商業化是大勢所趨?
張智博:對于企業而言,無論怎樣選擇,采用新的技術就要付出成本。而企業到底關注人員成本還是 IT 成本,不同企業有不同的選擇。關注 IT 成本的企業可能會選擇開源自建,在它看來企業投入資金去采購新的軟件,這些費用會算在 IT 的支出費用里面,所以它更傾向于開源自建。開源自建只需滿足開源的 License,便可以免費使用。而企業如果比較關注人員成本,希望把精力聚焦在企業自身業務上,選擇購買商業服務就更好。
開源自建相當于把依賴新技術帶來生產力變革的這些關鍵戰略綁定到了具體的人員身上,這對企業來說存在一定的風險。開源軟件并非完美無瑕,也難以一直保持穩定,它需要持續地維護。在這過程中如不能深入到開源項目里面,自建就存在長期的技術風險。在這種背景下,企業負責人就要深度評估企業是否真正具備自建的技術能力。雖然當前很多開源軟件的開箱即用做得確實不錯,但這并不代表它背后沒有相應的技術成本。
商業服務有別于開源自建,它相當于把帶來生產力變革的關鍵戰略鎖定到了外部的第三方公司。在這個過程中,一旦供應商的產品或者迭代方向發生改變,或者服務不能滿足企業的使用期望,亦或者在使用過程中價格被鎖定,均會影響 IT 的變革。如果企業被某個商業公司所獨有的技術鎖定,隨之帶來的風險是非常大的。
根據我的工作經驗,我還是很看好 SUSE 這類公司的未來的。IT 主流的選擇應該是用戶去選擇開源產品的商業服務,去購買開源產品的訂閱,這樣可以較好地屏蔽供應商鎖定的問題。能夠提供開源商業支持的公司很多,即使一家公司出現了問題,或者它的產品無法滿足你的需求,由于你依賴的僅僅是開源的技術或產品,因此可以很容易地把供應商換掉。
即便企業未來不希望再受供應商和商業服務公司的牽制,或者企業具備技術自建能力且業務發展很好,它依然可以在之前復用的開源產品的技術底座上再往前走,甚至可以拋棄這些商業服務,因此這本質上是一種風險對沖。所以我認為真正的大勢所趨就是開源產品的商業服務。
開源版和商業版的區別主要在于:你作為使用者是否愿意付費。開源產品具有 license,有的 license 允許商用,也允許二次分發。在這過程中,有的用戶有意愿付費,他希望通過付費獲取保障。但有的用戶則認為不需要付費,因為這已經是開源了。當然,從產品功能角度兩者也有區別。通常來講,商業版本有比開源版本更穩定的產品迭代,更穩定的服務,可以使生產環境運行得到保障。至于內部功能性的差異,不同的廠商有各自的表述??傊?,開源版和商業版的區別第一是付費意愿,第二在于增強的一些功能。
關于第三個問題,我個人的觀點是,開源產品的商業服務是大勢所趨。提到 K8s 商業化是大勢所趨,我第一印象會認為這個觀點是錯的。K8s 本身是一個成功的開源軟件,它的采用量勢必會不斷攀升,隨著采用量的攀升,必然會產生一定數量的商業客戶。商業客戶增加、付費市場規模擴大,整個環境就會更好,但是真正的趨勢應該是更多的用戶為開源軟件的商業服務付費。
網友提問:對于企業級開源軟件來說,他們在企業運作中扮演著重要角色,大家對于其安全性有一定的顧慮,如何解決企業用戶這部分的擔憂?
張智博:越來越多的企業開始采用開源軟件,公有云的很多云服務也都是建立在開源軟件的基礎之上,這是目前全球 IT 行業的大趨勢。
首先,開源軟件的代碼是公開的,它為我們帶來便利的同時也潛藏著隱患。所有代碼都公開,一些不法分子如黑客,他們也可以閱讀代碼。他們可以快速找到漏洞,并利用漏洞去入侵你的 IT 系統。所以,好的開源軟件定期會有安全公告,它們有安全員不斷地去更新公告,并提醒使用者更新版本來修復安全漏洞。所以這里涉及的是一個治理問題。采用開源軟件后,如果你只鎖定一個版本且永不更新,那必然會有安全風險。
第二個風險是合規性的問題。我們知道開源軟件有自己的 license,現在整個業界把開源軟件的 license 弄得越來越復雜,有傳染性,又不能做二次商業分發。即便有商業分發,可能還會涉及分成。所以企業要用開源軟件,必須要確保你所在的行業、你的公司是可以采用它的,一旦采用,就存在合規風險。
第三是開源軟件的供應鏈安全。就像購買一件商品我們要看這個商品的成分表,其實軟件也一樣?,F在提倡要生成一個軟件物料清單,就是讓使用者去看這個軟件所依賴的成分,但是并不是所有開源軟件都會提供這份清單,所以企業想去使用開源軟件就需要多加考慮。要想在公司里長期運行,并不是改幾個參數或者增加幾個新功能就可以,必須要考慮到安全風險。
最后說如何解決,在我看來其實沒有所謂的“銀彈”,不存在一個固定策略供我們解決這個問題。一旦使用了開源軟件,就需要建立一個持續治理的機制。
InfoQ:過去一年里,企業都在優化人力成本、運營成本,都很關注降本增效,基于企業降本增效這個大目標,Kubernetes 是如何幫助企業降本增效的? “Kubernetes 商業化”、企業級的 Kubernetes 管理軟件,究竟能為企業降本增效提供多少助力?
張智博:降本增效的確是今年大家普遍在提的一個話題。需要先明確一個事實,即:通過一個軟件實現降本增效是非常復雜的。究其本質,真正提升效率、降低整個迭代成本的是容器技術,容器技術助力生產力提升,效率也隨之提升。因此,一定是在走完容器化改造之后,才能看到降本增效的優勢。絕不是隨意創建幾個 K8s,再布置幾個業務上去,就能實現降本增效。有的用戶可能會在大量的虛擬機上跑一些純粹的東西,導致資源利用率很低,又執意要創建 K8s,這其中的成本反而是上升的。
因此,第一步應該是有一個合理的規劃,即容器化達到何種程度后再遷移到 K8s 里面。機器的使用率降低,資源利用率提高,如此才能達到降本增效。值得注意的是,容器化改造應是真正系統化的梳理、改造,而非簡單建幾個 K8s 就草草了事。系統改造之后,真正上到 K8s 就會發現,目前所有的云廠商都提供 K8s 服務。也就是說,一旦你的業務體系全部容器化到 K8s 上,你就擁有了面向多云使用的天然便利。面向多云使用,必然會增加議價權以及使用的多樣性,這樣你就可以選擇成本低的地方去部署業務。
此外,我們講基礎設施,自己公司內部的基礎設施就做了一個很好的抽象。以前我們講叫 DevOps,現在可能又改頭換面叫平臺工程。在我們廠商看來其實沒有太大區別,因為我們有的客戶在沒有平臺工程這個概念之前就有這種理念。他把東西容器化之后放到 K8s 里面,業務就可以跟著 K8s 去走,整套環境的部署,無論是開發、測試,都可以通過 API 對接起來。依托 K8s 基礎設施,包括上層應用這一整套的業務系統,可以到任意的云上去部署。這個就是我們講基礎設施及代碼所具備的能力。
綜合來看,企業降本增效的關鍵在于整套 IT 系統和業務流程能否真正實現工程化,是更多地依靠人來部署、接入,還是通過自動化的平臺去做。借助 K8s,你不需要自己去抽象 API,也不需要自己去打通生態,K8s 均可實現。由此我們可以看到 K8s 助力企業降本增效的效果。
InfoQ:您認為,企業級的 Kubernetes 管理軟件最關鍵的功能是什么?
張智博:肯定是多集群群管理。為什么是多集群管理?我們可以回看歷史發展進程,針對 K8s 落地大廠之初如何引導用戶。我們創建了一個超大集群,其中可能包括幾千甚至上萬節點。由于這些超大的集群里面涉及很多深度的技術優化、內核優化,甚至還可能會模仿 K8s,所以他們最終實現起來,資源利用率的確很高。但是這個所謂的最佳實踐或是說工程經驗,是沒有辦法復用到更多的企業用戶手里面的。
原因在于大廠的人員、技術實力是絕大部分用戶所不具備的。為什么開始有多集群這個概念出現,就是因為多集群的管理更適合絕大部分用戶。我們說盡量不要去魔改一些開源軟件,因為一旦改完之后卻無法做到長期維護、長期更新、長期升級,你的這些東西跟它的生態便不再兼容,從而很容易鎖定到一個版本之上。即便有了解這些功能的人,也無法避免這些人離開后技術無人維護的情況發生,最終反而變成技術負擔。
在后面的發展過程中,我們看到越來越多的商業廠商開始研究 K8s 的發行版,且各具特色。但是如果你所用的管理軟件不是多集群管理,你就沒有辦法把你需要且有特色的發行版納入到你的管理體系當中。相當于我們本希望依托開源軟件的開放性吸納更多的生態來支撐自己的業務,但是由于沒有選擇這條技術路線,反而又被自己設定的牢籠鎖定了,這就錯失了開源生態帶來的紅利。
因此長期來看,多集群管理模式肯定有利于企業,也有利于 IT 行業長期的風險管理和成本控制。
InfoQ:在多云環境下運行 Kubernetes,復雜性大幅增加,企業運維難度也大大提升,目前市面上有沒有企業級的 Kubernetes 管理軟件已經解決了?在解決這些問題時主要會遇到哪些挑戰?除此之外,有什么其他的比較好的解決方案嗎?
張智博:當前,K8s 對云廠商來說已經是非常重要的基礎設施了,而且變成了一種服務。每個用戶只要有云的賬號,就很容易拿到一些資源。但是我們要明確,對于一個企業而言,選擇哪朵“云”就意味著它的業務在哪里。海外有 AWS、Azure、GCP,國內有阿里云、華為云、騰訊云,包括新近崛起的天翼云等,每朵“云”都有自己的特色。面向不同屬性的客戶,每朵“云”也都有自己的技術優勢。
對于企業級的 K8s 管理軟件來說,有這么多的云,每朵“云”都有類似的服務,該支持哪個?是聚焦海外還是專注國內,還是全都支持?每個云都有自己 K8s 發行版的生態演進計劃,它并不會跟其他云相互搭配、相互溝通。雖然上游有 K8s,但是每朵“云”都有各自的版本跟蹤計劃,所以這個挑戰很大。管理軟件所支持的云越多,復雜程度會越高。
雖然云廠商有 K8s,但也有用戶喜歡在云上自建。他們認為這樣自由度更大,可以更多地去控制。其實,我們在很早就改變了 Rancher 這個軟件的產品理念。我們本身就把云上的用戶設定為第一優先級的用戶,因為從整個市場份額來看,K8s 的絕大部分市場份額在公有云這一側。雖然有人更關注私有化部署,但是絕大部分用戶仍在公有云這一側。而在公有云這一側的又有自建的,有托管的,這給管理軟件又增加了一層挑戰。不僅要支持公有云的托管,還要支持面向公有云的虛擬機的服務,幫助用戶自建 K8s。這就使得軟件的知識矩陣變得很復雜,對軟件維護者的要求也相應提高了。
具體有哪些挑戰,我結合前面內容進行一下總結。第一是云有很多種,種類不同,接入生態就會很復雜。第二是知識矩陣很復雜,用戶既有自建的需求,又有用托管的需求。到底有沒有特別好的方案?其實,現在市面上所有的主流管理軟件,都聲稱具備多元的 K8s 管理功能。但是要細看其到底支持多少種云,支持自建的模式還是公有云托管模式,這方面我認為 Rancher 做的比較好。
InfoQ:Rancher 有一個非常著名的開源產品 K3s,由于其輕量級的屬性,很多用戶將其放到邊緣場景。企業級的 Kubernetes 管理軟件在邊緣環境下主要需要解決哪些問題?目前市面上的產品已經解決了嗎?
張智博:除了 Rancher 這個軟件主打的 K8s 多集群管理,K3s 確實是我們另一款發展非常好的軟件。最早我們設定 K3s 是很輕量的,由于邊緣計算正處于發展中,大家就開始嘗試將容器化落地到邊緣場景中,K3s 自然而然就開始有了一些邊緣的場景。但是針對邊緣的場景需求,不同廠商、不同用戶的理解均不同。每個廠商都是聚焦在自己的認知之下,幫助自己的用戶來解決這個問題。
K3s 的定位是比較專一的,本質上我們設定 K3s 是滿足 K8s 一致性測試標準的一個發行版,意思是 CNCF 推出 K8s Conformance,你要去跑它的一系列的端到端測試才能驗證這是一個標準的發行版,K3s 將永遠聚焦于這個點。這也意味著 K3s 不會為了某個特定的場景去魔改,因為魔改之后會造成兼容性問題。如果強行把 K3s 落地到邊緣,部分用戶場景就會出現問題。因此,從產品的原生設定角度跟大家做出解釋。
關于管理軟件在邊緣環境下解決的是什么問題,我沒有辦法從整個行業的角度去講,因為每家廠商都不一樣。從我們的角度來看,邊緣上如果在用 K8s,或者要用 K3s 技術把你的業務打包到 K8s 這種抽象的 API 里面然后再去部署,我們認為它并不能解決全部的邊緣場景,它只是在解決一個近端的邊緣場景。在我們的解決范疇內,目前 K3s 就只能到這一層,因為它需要依賴于一個有一定計算能力的設備,這樣才有能力在上面跑 K8s 的編排引擎和容器化組件。如果沒有這個計算能力,只能供給業務,那再弄一個基礎引擎上來完全是浪費資源。
我們目前先解決近端邊緣場景之下的問題,因為近端邊緣是具備一定算力的。通常無論是 ARM 架構還是 X86 架構,都需要一個操作系統,需要有編排引擎去承載業務,我們把它抽象成一個不可變的基礎設施。相當于 OS 加上 K3s,由于 SUSE 本身就是 Linux os 廠商,所以我們做這個東西的產品化做得還是很好的。
目前,我們在邊緣領域的確能夠解決問題,但是邊緣這個市場十分龐大,更多的內容我也講不了。用純粹的容器化或者 K8s,去嘗試解決所有的邊緣問題,包括遠端的、IOT 設備管理的,其實非常復雜,起碼目前從我們這邊還沒有看到一個特別穩定的市場機會。
InfoQ:整體來看,國內企業對于 Kubernetes 落地及管理的要求是怎樣的?
張智博:國內企業我們要分開來看,有一些企業要求自主可控;有的企業要求標準的商業化生產場景,你能夠解決問題就可以。其實無論是國內還是海外,都沒有太大區別。對于自主可控,國內的企業更關注 ARM 的支持,因為有很多用戶都在依賴 ARM 去運行 K8s。
目前,ARM 開始在公有云上普及,整個軟件生態也都在支持。所以提到要求,我認為首先要支持 ARM,這樣你才有機會參與到這些自主可控的企業里面。第二是自主可控更深層次的需求,即軟件的供應鏈,它跟工業品或者其他有限制性的商品的供應鏈是一樣的。
現在都在提軟件供應鏈的等級,即你提供出來的軟件的構建、編譯是不是可溯源?你構建出來的產物,有沒有軟件物料清單?構建出來的東西,用戶使用驗證時,能否做到不被篡改?以上這些是國內當前在自主可控領域開始關注的方向。
我們確實也在進行全新的探索。比如,國內自主可控領域在操作系統層面更多地運用 openEuler 或者 openEuler 衍生系列。同時,我們也在嘗試構建一個 K8s 的發行版,相當于把 openEuler 的生態變成一個生產車間,把 K8s 依賴的上游源代碼全部灌入到生產車間里,通過生產車間來生產 K8s 的發行版。在發行版里面,我們可以把軟件的物料清單、工程量等信息公示出來。目前,Rancher For openEuler 的發行版已經 GA。
網友提問:Kubernetes 企業落地及管理對企業技術管理者提出了怎樣的要求?從技術布道和人員管理方面是否提出了新要求?
張智博:這要看具體是什么企業,是要求標準化商業場景的企業,還是要求自主可控的企業,不同企業間采購的需求肯定是有區別的。要說對技術管理者有怎樣的要求,還是要回到我們最初的問題,用這些軟件到底是要采購商業軟件,然后二次整合到自己的業務里;還是要完全走開源自建路線。如果看中前者,就要看它的供應鏈。標準場景關注是否會被它鎖定,自主可控則看它的供應鏈是不是滿足合規需求。
如果要走開源自建,就要好好算一個成本賬。雖然省下了購買商業軟件的資金,但投入的人力成本絕不容忽視。自建帶來的技術風險,公司的資金和業務能否支持長期的建設。一旦走入自建就很難中斷,中斷后前面的努力就變成零了。此外,如果你是自主可控類型的企業,你還要關注你所用的軟件成分是否可用,以及能否在自己的生產車間生產,而不能下載下來直接用。
針對技術布道,我建議技術布道者應該嘗試去獲取一些流量眼球并傳遞一些新的技術理念。因為 K8s 本身已經不算是新鮮領域,現在并不是布道 K8s 的合適時間節點,去挖掘一些創新點可能更好。
InfoQ:從產品角度,Kubernetes 需要哪些增強來支持這一輪商業化的發展?
張智博:技術發展是有規律的。想知道今年商業化有什么新動向,就去看去年開源的領域在研究什么新東西。去年 K8s 到 1.24 版本后就開始把軟件供應鏈相關的信息融入進自己的發布流程里面,我們不難發現今年很多 K8s 的商業化公司都在提軟件供應鏈。上游社區技術演進涉及到的方向,商業公司絕不能錯過。因為商業公司至少要把上游社區所能實現的東西呈現出來,也就是所謂的軟件供應鏈,然后才能進一步加強。
關于如何“加強”,現在大的趨勢是技術布道。K8s 已經走過了飛速發展的創新階段,現在它要做的是企業落地,并且加速企業落地。隨著越來越多的企業開始采用這個軟件,安全合規也變得越來越重要,必須要有各種防護措施來保障生產環境。這其實是所有新技術走向成熟的一個客觀規律。
關于如何支撐這個領域的商業化發展。我們發現,由于 K8s 上游迭代的速度非???,云廠商包括 Rancher,雖然做了很多年 K8s 的商業供應商,依然很難完全跟得上上游的版本迭代,這就出現了碎片化嚴重的問題。就像安卓時代,手機多起來之后,你發現安卓最可怕的就是 4 點幾和 6 點幾,那個時代各種各樣的版本都有。對于用戶來說,有的用戶可能需要不斷地更新,有的用戶則不需要頻繁地更新,但是他用的版本已經過了生命周期。這個時候,企業在一個相對不那么新的版本上提供一個長期支持服務,是非常關鍵的一點。
InfoQ:這幾年,國內軟件供應鏈安全問題、容器安全問題、合規問題受到越來越多的關注,這為企業級的 Kubernetes 管理軟件的研發提出了怎樣的新要求?
張智博:就我個人近一年的經歷來看,工程化的難度加大了很多,因此最關鍵的肯定是工程化。由于人力是有限的,我們要用有限的人力去支持現有版本的不斷演進,就要持續地做好工程化。任何一個軟件,只要有人投入就要保證效率,無論是資金還是時間總會有成本,因此最終一定要有個合理的毛利率,而非無限的投入。要解決 K8s 版本碎片化,又要確保容器安全合規,還要引入軟件供應鏈,以上種種如果僅靠人去治理,完全消耗不起。我個人最近一年也在做產品,包括帶產品研發團隊做工程。我們去年一年做的工程化的量,可能比前幾年加起來還要多。這些與前一年相比,可能就是一個簡單的 CI,但現在的工作量比以前大很多,因此關鍵還是工程化。
InfoQ:您覺得 Kubernetes 商業化在 2023 年有怎樣的發展趨勢?將完成怎樣的技術演進?為什么?
張智博:一年的時間很短,很難稱得上演變到一種趨勢。不過從已經過去的兩個月時間來看,包括也在跟客戶聊,確實得到一些反饋。企業現在對 K8s 的需求不似前幾年,“K8s is everything”,那個時代大家認為新技術可以做很多事情,大家都在天馬行空地設想,但現在并不這樣。大家不再期望技術實現復雜的創新,而是把它作為一個高效率的工具引進并落地下來。由于容器管理確實給企業帶來了生產力的提升,因此企業的根本需求就是做容器管理,即 K8s 的根本。
很多客戶不再去投入一些過于前瞻性的創新,而是逐漸認識到軟件究竟能做什么、不能做什么,因此商業化在今年應該會有一個比較好的發展。
InfoQ:目前市面上基于 Kubernetes 的解決方案都有哪些形式?整個市場發展處在什么階段?
張智博老師:提到解決方案那一定是商業化,商業化形式就是公有云的托管服務,每一個云廠商只要有賬號就能去建他的 K8s,就像 AWS 有 EKS,阿里云有 ACK。還有 SUSE 提供 Rancher 這種企業級的容器管理軟件,你無需特別關注是私有云還是公有云,Rancher 都可以幫你把所有 K8s 資源統一管理起來。還有一些特定的發行版,在 K8s 的基礎框架之上做創新,這些都是大家做商業化的形式。
市場發展正處于什么階段,我想應該是:商業化的市場正處于上升階段,但是技術創新的熱度明顯在下降。印象中我看過一個海外Gartner 報告,報告顯示 2020 年全球企業采用容器化技術的比例占 5%左右,預計 2024 年可能達到 15%-20%。Gartner 采訪的應該是真正有實力付費的用戶,而不是純粹的社區用戶。所以商業化市場的空間和付費的空間還是非常大的,不過這也需要 K8s 不斷地成熟起來。
InfoQ:在 Kubernetes 企業級解決方案供給領域,全球的競爭格局是怎樣的?
張智博:SUSE 在國內與海外都有涉獵,算是一個在全球賣這種產品的公司。從我們接觸到的很多客戶來看,公有云應該是一個真正的贏家。關于公有云,無論是打開虛擬機還是打開任何一個服務資源,我們都默認是需要付費的。它的商業模式決定了它很容易把開源軟件和 K8s 變現,因此它是真正的贏家。
從全球范圍來看,我們目前在海外碰到更多的廠商是 OpenShift 這類的,國內目前競爭還是非常激烈的。我有統計,去年幾乎每個月都有廠商突然要開源自己的 K8s 管理平臺。隨著廠商越來越多,大家開始內卷競爭,低價的情況隨之出現。由于沒有長期的正向收益,國內的這類軟件就無法成長為有國際競爭力的產品,企業也難以在國際市場站穩腳跟。結合國內市場來看,當前的競爭格局難言樂觀。
InfoQ:剛提到國內的市場形式,在 Kubernetes 領域,國內介入也是比較早的,和海外相比,出現當前狀況的原因?
張智博:這也是我個人在這幾年的職業生涯中感到非常遺憾的一點。國內對這一波技術的介入非常早,而且原先 K8s 落在國內是全球最好的一個 user case。但是,為什么在后續成長中我們沒有出現具有國際競爭力的產品?
除了前面提到的廠商過多以外,還有一個原因就是我們的市場規模沒有發展起來。海外雖然也有一些小眾廠商,但是它的市場規模是可觀的,無論是小廠商還是頭部廠商都能拿到正向的收益。
我的理解是,我們沒能在關鍵階段制定出行業標準。對于長期從事這個領域的技術人員而言,可能認為這個東西不需要標準。但是市場要在各行各業鋪開,并非只針對 IT 企業和互聯網企業。如果沒有一個行業標準,對于其他企業來說,采用 K8s 和容器技術可謂天方夜譚,這也就造成了市場規模發展不起來的局面。
我最近在做一些研究,發現美國的國防部從 2020 年開始大力引入 K8s,它制定了非常詳細的廠商準入標準及產品標準。而且這個標準是完全公開的,公開則意味著國防部這一套基于 K8s 建設的軟件交付平臺,其他非 IT 行業可以直接參考。這套標準在國內并沒有看到,所以市場規模一定是上不來的,大家就只能在僅有的付費客戶領域里不斷地相互擠壓。
Rancher 在海外有很多客戶,這些客戶既可能是某個農業公司,也可能是某地區的一個縣政府,這在國內很少能看到。行業沒有標準化,就沒有辦法實現可復制,從而導致市場規模發展不起來。
InfoQ:SUSE 在這個領域也是關鍵廠商,在整個領域的發展和企業用戶痛點來看,你們是否有提出相應對策?
張智博:今年,產品層面我們還是定位于多集群和多云。目前這已經是一個標配,是一個固定的基礎需求。入到這個行業門檻,就得提供這個能力。
在此基礎上,我們嘗試擴展邊緣領域的產品能力。前面我們提到 SUSE 有自己的操作系統,也有 K3s,因此我們嘗試用產品化解決近端邊緣領域的一些問題。這就是我們在做的 2.7 版本,它將是我們整個 2023 年運作的一個大版本。
然后再走入生產化這個大趨勢,我們判斷產品質量、迭代質量是非常重要的一塊。為什么今年要特別提出來,確實是現在生態和 K8s 碎片化很復雜。我們前面也提到了工程化,如果不做好,Rancher 是開源軟件,我們在全球非常多的用戶,每個版本出來大家都會發現有一些瑕疵。不過開源軟件也有好處,這些信息都是公示出來的,會有臨時解決方案,發現問題了可以及時規避。
而且場景確實太多了,有的用戶用 AWS,有的用戶用 Azure,不同的云效果也不同?,F在如果不去做更多的工程化來治理產品質量,情況就會愈發艱難。如果把軟件范圍限定在某個特定領域,就失去了 K8s 企業管理軟件的核心。我們要讓大家在不同的場景、不同的資源池里去使用它。
除了前面講到的 2.7 版本,我們也在嘗試去凸顯社區版本和商業版本間的差異性。Rancher 本身開源,它相當于提供了一個社區版本,但我們也研發了一個商業版本,叫 Rancher prime。不過它完全是在社區版本的基礎之上,再去為商業客戶服務。它更加關注于企業付費客戶看中的東西,包括安全性的增強、漏洞的及時修復、合規性、軟件供應鏈等。
當然我們也面臨著激烈的競爭,我們的策略是,在國內的生態里面用本地的研發團隊去治理。國內的 IT 環境有其特殊性,因此我們要有一個獨立的治理體系去做這個產品。很明顯,在國內大家用的都是國內的幾朵“云”,很少去用 AWS、Azure 之類的。操作系統基本選擇自主可控的 Linux,而不會采用國際上主流標準的幾個大的 Linux。當然也有一些想出海的企業,它們要面臨海外的監管標準,那么就需要有軟件幫忙輔助。針對于此我們也在積極探索,作為一個外企的軟件本身具有優勢,在支持國內企業出海的時候,我們也可以把這個經驗復用給它。
InfoQ:Rancher Prime 目前是 V2.7 版本,下一個版本或者是說 Rancher Prime 未來的迭代方向規劃是怎樣的?主要會解決哪些問題?
張智博:2.7 版本是去年 10 月份發布的,2.8 版本預計在 2023 年的 11 月底或者 12 月發布?,F在是 2023 年初,其實談不上特別大的未來迭代。
不過總體思路是不會變的。我們判斷現在的趨勢是 K8s 向生產環境落地,所以我們所有的產品都將朝著這個方向努力。當然,除了自身的產品迭代以外,我們也會通過技術收購來圍繞 Rancher 去建設整體的產品能力。
網友提問:除了 RancherPrime,SUSE 在 2023 年還有什么大動作嗎?
張智博:其實,我們在去年年底就已經有了對今年的預測。2023 年不會是激進擴張的一年,不止我們,包括全球許多企業也都傾向于持防御姿態,因此并沒有特別夸張的大動作。目前我們的目標就是真正扎實地做好商業化的落地,在市場商業化的份額上升的時候,我們能夠吃掉匹配我們現在市場地位的份額,對我們來說已經非常值得努力的一件事了。
在這個過程中,安全肯定是我們非??粗氐模磥砦覀儗⒗^續圍繞著這個點去做,在 Rancher 的基礎能力上做安全擴展。
InfoQ:回溯到主題,企業想要實現降本增效的目標,企業進行 Kubernetes 落地,您有什么建議?
張智博:技術要關注其本質,即 K8s 在解決什么問題,它其實就是為企業采用容器化帶來便利。容器化在真正變革企業的應用交付方式,而在這個過程中,使用 K8s 肯定是必不可少的經歷。K8s 在走入生產環境后,我們要去關注它整體的穩定性,包括 K8s 整個社區 API 組件的穩定性以及管理平臺的穩定性。此外就是安全問題,容器運行時的安全問題、鏡像安全的治理、容器網絡安全、包括現在提倡的供應鏈安全。
現在追求的是整體的安全性,它并不是簡單幾個點。容器化改造,供應鏈勢必會更加復雜。不像以前用虛擬機只需固定一個版本,容器化打包會有多個版本。由于供應鏈變得愈發復雜,整個行業也急需跟進治理。
考慮完整的穩定性,前提要看清本質。你要知道依靠 K8s 不能幫你立即達成效果,而是在建設過程中,基礎設施經過不斷地演進,K8s 才能夠跟你的業務完整地整合起來。容器化是先行,再是遷移,遷移后具備了標準化的基礎設施,進而把它面向多云。
多云之后就擁有了議價權。你可以在不同的云上嘗試無狀態應用的多元部署,還可以去做 ARM 的實例遷移。我們知道云上 ARM 的價格比 X86 要便宜大概 30%,在這種操作之下,節省成本立竿見影。而且對業務的影響、對架構的影響均是完全可控的。
網友提問:Rancherprime 有較為成熟的應用案例嗎?目前已經合作的企業里面主要應用于哪些行業?
張智博: SUSE 有一個專門的站點來收集、展示客戶的應用案例。大家知道,Rancher 這個軟件已經存在很多年了,那么它必然積累了大量的、成熟的案例。它遍布的行業也很多,包括金融、保險、銀行、制造業、汽車等。
關于 SUSE
SUSE 是全球范圍內創新且可靠的企業級開源解決方案領導者,財富 500 強中有 60% 以上的企業依靠 SUSE 為其關鍵任務的工作負載賦能。SUSE 專注于企業級 Linux、企業容器管理和邊緣解決方案,通過與合作伙伴和社區合作,幫助客戶隨時隨地在任意場景進行創新——無論是在數據中心、云端還是邊緣環境。
SUSE 讓“開源”重新“開放”,使客戶能夠靈活地應對當今的創新挑戰,并能夠自由地在未來發展其 IT 戰略和解決方案。SUSE 在全球擁有2000 余名員工,2021 年在法蘭克福證券交易所的監管市場(Prime Standard)上市。