作者:JFrog大中華區總經理 董任遠
JFrog中國技術總監 王青
今日,如果聽到許多領域的企業正在加大舉措,推進DevOps在實際業務中的實踐,再也不會令人驚訝。顯而易見,這樣的形勢正是源于企業緊迫的業務需求,DevOps的實施已經寫入了企業的發展寶典。
事實上,這樣的變化在金融企業中體現的尤為明顯。追溯過去,金融企業的運維曾受手工操作的制約,伴隨運維系統的數量從上百個增長到成千上萬個,傳統的手工部署方式的效率方面一直存在著落差。當下,這樣的落差必須盡快解決。JFrog認為,以金融行業為例,許多企業都有很大的熱情和意愿希望做出改變。
我們究竟該將注意力放在哪里?如何能幫助企業提升軟件發布效率、改善開發與運維協作,金融企業尋求解決方案的有效路徑在哪里?又該從何下手呢?JFrog最近深入發現,致力于推動DevOps的實施,以此來消除開發和運維之間的鴻溝和溝通成本。結合金融行業的特性,以下即在2024年將會呈現的兩大趨勢。
1. DevSecOps - 安全性成為首要關注點
近年來,在全球尤其是北美地區,安全性已經成為備受關注的熱門話題。由于黑客攻擊和勒索事件頻發,軟件供應鏈安全標準(XBOM)已在美國制定。JFrog預測,在2024年,國內將出臺相關標準和法規,引導金融領域加強對開源治理,特別是在DevSecOps(即在DevOps的基礎上加強安全性)中加入更多的安全性措施。
DevOps牽涉到多個自動化工具鏈的集成,包括需求管理、代碼管理、持續集成、測試、自動化部署和制品庫等多個環節。為更好地支持DevOps,金融企業可能需要進行組織結構調整,并對人員進行培訓。更多的金融企業通過采用DevOps將有效改變開發和運維的工作方式,以提高交付效率,增強創新能力。
目前,六大國有銀行與股份制銀行,基本都建立了各自的DevOps平臺,實現了CICD自動化部署。在證券行業中,企業對DevOps的需求僅次于銀行業,因為它涉及到證監會監管、軟件發布可靠性、避免生產事故以及對軟件供應鏈漏洞的高度關注。所以,當前的發展趨勢即金融領域整體上在DevOps方面經歷了學習、應用和逐漸完善的過程,不同類型的金融企業在這一進程中展現出各自的特點和進展。
金融企業成功實施DevOps的關鍵在于注重制品庫的統一管理,特別是在CICD流程中,制品庫扮演著連接CI和CD環節的關鍵角色。DevOps的本質是將需求轉化為軟件產品并部署到相應服務器,而制品庫關注的正是這個軟件包的生命周期信息,包括代碼貢獻者、需求滿足情況、測試通過與否等等。在金融領域,制品庫管理被看作是實現DevSecOps的基礎,通過統一的制品庫管理,使得整個供應鏈的漏洞掃描和管理得以實現。例如,某大型國有銀行即通過全行范圍內的制品庫使用,對漏洞進行評分和管理,以此實現全行范圍內的安全性提升。JFrog幫助企業快速定位了Log4j漏洞的影響范圍,并且在2天之內全部修復了收到影響的組件。
此外,金融企業還需關注模型安全問題。當前國內許多模型的做法是先從各大開源模型平臺獲取模型,再在內網進行修改和重新包裝,宣稱是自己的模型。然而,這種做法就存在潛在風險,可能會導致惡意代碼的嵌入,容易引發各種攻擊,包括惡意代碼執行、礦機部署、以及密碼獲取等。因此,在模型安全方面,金融企業更必須做到謹慎小心,采取相應的安全措施以保障系統的安全性。
2. AI工具對Ops開發團隊的賦能
在JFrog看來,2024年,金融企業當務之急都在設法找出自己最需要改善的地方,比如在DevOps方面更應聚焦AI工具(AI Ops和ML Ops)的發展趨勢,特別是在提高運維效率、處理錯誤日志和處理大規模模型計算方面,以確保其基礎設施足夠滿足未來的需求。通過整合AI技術,Ops團隊可以更加高效地管理和維護系統,實現自動化和智能化的運維流程,為企業帶來更高的效益和競爭力。
以通過智能分析監控數據為例,通過預測系統哪個機器會宕機,從而提高運維效率,AI Ops能利用人工智能工具解決運維問題。目前,高端芯片和機器學習的結合已經用于提供代碼補全等功能,未來還將支持大型模型的學習。尤其是對于金融企業而言,AI Ops能夠智能預測流量高峰和低谷,實現資源的自動化調配,從而提高系統的效率。
ML Ops則是將運維平臺的能力應用于模型發布的自動化,實現了用Ops來解決機器學習的運維問題。ML Ops通過DevOps平臺自動化地拉取、訓練、發布和更新模型,大大簡化了模型開發者的工作流程。我們認為,尤其對于金融企業而言,盡管對ML Ops的需求并不飽和,但ML Ops可以幫助提高大規模機器學習模型的訓練、部署和更新速度,從而提高開發效率,也存在對錯誤日志進行分析等需求的解決方案。
JFrog通過對Huggingface倉庫的支持,通過提供本地的大模型倉庫,解決了企業內部模型管理困難的問題,為企業進行大模型訓練和模型分發提供了便利。
3.應對趨勢,展開行動
AI Ops對DevOps的影響已經開始顯現,盡管目前并非全都彼此能得到有效應用。然而,隨著未來可能涌現出更為成熟的產品,我們可以期待這一趨勢將在運維機器,尤其是版本發布頻率不斷攀升的背景下,迎來更廣泛的應用。通過AI工具的引入,特別是在測試領域實現自動化的AI測試,將會極大地助力開發者。
企業若這么做,就是在做正確的事情,而且如果實施彼此匹配的測試,就能迅速提升開發者的工作效率,利用AI在測試方面展現出的強大學習能力,使其成為未來的重要利器。
在未來,我們將見證自動化工具生成的嶄新發展,尤其在這一領域對研發工作提供了重要的互補支持,為Ops開發團隊在2024年實現更大幅度的賦能打下了堅實的基礎,同時也將深刻影響開發者的工作方式,這將是商業上的標準實務。我們必須為企業著想,討論怎樣的創新是最有效的,有哪些地方還有改善的空間。隨著AI技術的不斷演進,我們有望看到更多創新性的自動化工具的涌現,從而進一步推動整個開發運維領域的可持續發展。