1月4日,金山云舉辦了「云+人工智能·時(shí)代新機(jī)遇」媒體溝通會(huì),金山云副總裁錢一峰、金山云公有云產(chǎn)品中心負(fù)責(zé)人孫曉、金山云人工智能與大數(shù)據(jù)產(chǎn)品中心負(fù)責(zé)人徐寅斐在會(huì)上分享了金山云在基礎(chǔ)能力、平臺(tái)能力和模型服務(wù)等方面的技術(shù)歷程和落地實(shí)踐。通過(guò)技術(shù)自研和升級(jí),金山云已初步建成人工智能時(shí)代民用領(lǐng)域全棧的云計(jì)算體系。
夯實(shí)基礎(chǔ) 全面升級(jí)人工智能服務(wù)能力
全球數(shù)字化浪潮風(fēng)起云涌,云計(jì)算作為數(shù)字經(jīng)濟(jì)重要的支撐基礎(chǔ),正發(fā)揮越來(lái)越重要的作用。其中,智能化作為云計(jì)算3.0時(shí)代的重要理念,已成為數(shù)字基礎(chǔ)設(shè)施升級(jí)的重要驅(qū)動(dòng)力。知名調(diào)研機(jī)構(gòu)IDC于2023年發(fā)布的報(bào)告顯示,未來(lái)5年,以大模型、生成式人工智能驅(qū)動(dòng)的下一代人工智能有望帶動(dòng)整體云產(chǎn)業(yè)穿過(guò)下行階段,重回高增長(zhǎng)時(shí)代。
順應(yīng)趨勢(shì),金山云深入探索前沿技術(shù),圍繞AIGC升級(jí)核心計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等產(chǎn)品,從多個(gè)維度全面擁抱人工智能。在計(jì)算方面,金山云第七代云服務(wù)器X7搭載第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器、支持英特爾® AMX原生加速能力,CPU性能較上代最高提升60%,內(nèi)存升級(jí)至DDR5,頻率較上一代性能提升50%。融合金山云自主創(chuàng)新的加速技術(shù),云服務(wù)器X7可有效提升模型推理性能。
根據(jù)數(shù)據(jù)從極熱到極冷的不同熱度,金山云對(duì)象存儲(chǔ)已覆蓋標(biāo)準(zhǔn)存儲(chǔ)、低頻存儲(chǔ)、深度低頻存儲(chǔ)、歸檔存儲(chǔ)、深度冷歸檔存儲(chǔ)和全閃存儲(chǔ)等不同訪問(wèn)熱度的存儲(chǔ)產(chǎn)品。其中,金山云對(duì)象存儲(chǔ)KS3極速型最高可提供1Tbps/PB的兌付帶寬,相較基于機(jī)械硬盤(HDD)的對(duì)象存儲(chǔ)性能提升了上百倍,能為AIGC、存算分離和高性能計(jì)算等場(chǎng)景提供強(qiáng)有力的存儲(chǔ)解決方案。
面向大模型應(yīng)用場(chǎng)景,金山云推出互信虛擬私有網(wǎng)絡(luò)(簡(jiǎn)稱“互信VPC”)。相對(duì)于標(biāo)準(zhǔn)VPC,互信VPC對(duì)進(jìn)出VPC的通信行為有著更為嚴(yán)格的控制,幫助客戶解決合規(guī)和互信問(wèn)題。針對(duì)HTTP、HTTPS等應(yīng)用層負(fù)載場(chǎng)景,公司推出應(yīng)用型負(fù)載均衡ALB(Application Load Balancer),單實(shí)例最大支持100萬(wàn)QPS。與云原生場(chǎng)景融合,客戶在使用金山云容器服務(wù)KCE產(chǎn)品或自建K8S集群時(shí),ALB都可作為Ingress部署,為業(yè)務(wù)提供網(wǎng)絡(luò)流量調(diào)度服務(wù)。
當(dāng)前,金山云全棧技術(shù)體系已形成以云產(chǎn)品基礎(chǔ)設(shè)施為底座能力,云產(chǎn)品平臺(tái)服務(wù)為核心技術(shù)能力,并通過(guò)MaaS互信推理專區(qū)方案和金山云輕舟智問(wèn)為人工智能客戶提供助力。
加速技術(shù)轉(zhuǎn)化 做大模型助力者
2023年被稱為大模型“元年”。公開(kāi)數(shù)據(jù)顯示,從年初到年末,國(guó)內(nèi)大模型數(shù)量超過(guò)200個(gè)。與“大模型”數(shù)量呈倍數(shù)級(jí)增長(zhǎng)相反的是,真正被調(diào)用的大模型卻相對(duì)較少。在本次大模型浪潮中,金山云堅(jiān)持中立定位,充分發(fā)揮自身的底座和平臺(tái)能力,做大模型的助力者。
在洞察到模型供需方的痛點(diǎn)后,金山云于去年6月率先推出MaaS互信推理專區(qū)方案(以下簡(jiǎn)稱“MaaS 1.0”),在大模型廠商、用戶和金山云之間建立互信,以解決模型及數(shù)據(jù)的互信問(wèn)題。本次溝通會(huì)上,金山云發(fā)布MaaS互信推理專區(qū)方案2.0(以下簡(jiǎn)稱“MaaS 2.0”)。
在MaaS 1.0基礎(chǔ)上,MaaS互信推理專區(qū)方案2.0以金山云IaaS和PaaS為底座,可實(shí)現(xiàn)云上LangChain的一鍵部署,默認(rèn)對(duì)接多個(gè)生態(tài)合作商業(yè)大模型和開(kāi)源大模型。同時(shí)支持包括BGE、Bert等在內(nèi)的Embedding模型,能無(wú)縫對(duì)接金山云全托管向量數(shù)據(jù)庫(kù)Milvus,提供面向企業(yè)開(kāi)發(fā)者的簡(jiǎn)單易用、安全可信的一站式推理應(yīng)用部署平臺(tái)。此外,MaaS 2.0支持通過(guò)標(biāo)準(zhǔn)化的API接口和Web前端界面,實(shí)現(xiàn)包括模型推理和知識(shí)庫(kù)搭建的RAG大模型場(chǎng)景應(yīng)用。為進(jìn)一步增強(qiáng)云上運(yùn)行的安全性,MaaS 2.0還提供容器服務(wù)加密鏡像解決方案,依托金山云裸金屬服務(wù),實(shí)現(xiàn)在金山云容器服務(wù)中從鏡像加密、加密鏡像上傳、解密鏡像運(yùn)行的全流程模型安全運(yùn)行。
同時(shí),為滿足行業(yè)客戶的需求,金山云探索大模型時(shí)代企業(yè)賦能新機(jī)遇,圍繞企業(yè)級(jí)知識(shí)助手場(chǎng)景制定了“一三一四”產(chǎn)品全景規(guī)劃,即一套能力(金山云輕舟智問(wèn))、三個(gè)模型(行業(yè)語(yǔ)言模型、文本分片和Embedding模型)、一個(gè)平臺(tái)(金山云瀚海平臺(tái))及四大功能(微調(diào)推理、數(shù)據(jù)加速、智能檢索和文檔智能),圍繞生成式人工智能構(gòu)建應(yīng)用落地、模型訓(xùn)練微調(diào)、平臺(tái)支撐的全棧能力。基于“一三一四”規(guī)劃,金山云將分別針對(duì)應(yīng)用型客戶和平臺(tái)型客戶輸出多項(xiàng)原子能力。目前,金山云輕舟智問(wèn)知識(shí)助手產(chǎn)品已完成應(yīng)用以及Embedding模型、多路召回算法和智能數(shù)據(jù)切片模型等核心技術(shù)的建設(shè),計(jì)劃優(yōu)先在公共服務(wù)和法律場(chǎng)景落地。
與人工智能的結(jié)合,給了云更多的想象空間,也給各行業(yè)都帶來(lái)了新的生產(chǎn)力。隨著技術(shù)的進(jìn)一步完善和落地,云計(jì)算將迎來(lái)更強(qiáng)更久的生命力。金山云將持續(xù)圍繞客戶需求“練內(nèi)功”,攜手生態(tài)伙伴以差異化打法布局未來(lái)。