2023年10月24日,亞馬遜云科技生成式AI構建者大會在京召開,金山辦公AI研發總監劉強作為特邀嘉賓,代表金山辦公在大會上分享了他們之間的緊密合作,以及如何利用Amazon Bedrock加速金山辦公的生成式AI應用構建。
“在合作過程中,亞馬遜云科技為我們提供了全方位的支持,其客戶服務團隊調用了包括AI創新實驗室、數據創新實驗室、全球產品團隊,以及后端產品開發團隊,一起來幫助我們達成業務目標。”劉強提到。
金山辦公AI研發總監 劉強
WPS AI助力客戶構建一站式智能辦公平臺
作為一家深耕辦公軟件研發35年的軟件公司,金山辦公旗下的WPS是全球知名的辦公軟件產品之一,截止2023年9月,擁有5.89億月活躍設備數。WPS移動版支持 46 種語言,PC 版支持 13 種語言版本,用戶覆蓋全球220多個國家和地區。截至 2022 年底,金山辦公在海外已擁有超過 1 億活躍用戶,WPS Office 通過 Google Play 和 Apple App Store 累計獲得近 4 億次安裝。
據悉,金山辦公在今年年初大膽提出“All in AI”戰略,決心將LLM能力全面融入其產品線。為此,金山辦公于今年4月推出了基于大語言模型的智能辦公助手WPS AI,率先將新一代AI技術落地到辦公領域,WPS AI現已接入金山辦公全線產品。
WPS AI旨在為廣大用戶提供AIGC(內容創作)、Copilot(智慧助理)和Insight(知識洞察)三大核心功能,從而帶來全新的辦公體驗。其中,AIGC(內容創作)專注于內容生成、創作及排版美化,覆蓋文字、智能文檔和演示等模塊。Copilot(智慧助理)通過AI能力提高用戶使用效率,降低用戶操作門檻。Insight(知識洞察)如在PDF和隨手拍等模塊,助用戶快速進行內容識別和文意理解。
劉強介紹道:辦公軟件分為文字、表格和PPT三個組件,各有其特點。文字組件重視排版,表格組件側重數據處理,而PPT組件則強調展示。目前,AI主要增強已有功能,如智能排版在文字組件中,可以自動識別長文章如論文或合同,抽取關鍵要素并實現一鍵式排版。PPT組件可以根據主題自動生成美觀的PPT,再由用戶進行微調。在表格領域,AI可以生成自研公式,簡化數據理解和學習,甚至進行智能數據趨勢分析。
金山辦公的戰略目標是,通過這三大能力將AI技術開放賦能給企業客戶,助力他們構建一站式的智能辦公平臺,使用戶能夠更為簡便、高效地使用辦公軟件,從而極大地提高他們的辦公效率。
劉強認為:目前,AI尚處于多模態的發展階段。短期內,其主要價值在于增強現有的功能,使其更為高效。長遠來看,為了使AI真正融入辦公軟件,還需在多模態等領域取得更大的進步。然而,在當前階段,大模型與傳統技術的結合已展現出巨大的潛力。
借助大模型能力豐富WPS的產品功能
在推進“All in AI”戰略時,金山辦公特別考慮到了國內外市場的差異性。因此,無論是國內版還是海外版的WPS,金山辦公都進行了針對性的研發和優化,以確保產品能夠更好地滿足不同地區用戶的需求。
劉強表示:“作為Amazon Bedrock的第一批預覽版的用戶,我們從一開始就跟亞馬遜云科技的技術團隊進行了積極對接。正如沒有一個大模型能解決所有問題,在對接過程中我們也是提出了很多問題,Amazon Bedrock輕松地幫我們解決了這些問題,很大程度上提升了我們的研發效率。“
金山辦公與亞馬遜云科技長期合作,共同探索如何將AI/ML技術最大化地應用于業務中。在初期,借助亞馬遜云科技的機器學習平臺Amazon SageMaker,金山辦公的算法科學家得以快速進行場景實驗和算法迭代,從而更精確地識別用戶、提高轉化率、減少用戶流失,實現對用戶的精細化運營。
據亞馬遜云科技專家介紹,Amazon SageMaker為客戶提供了一個端到端的機器學習平臺,這使得算法科學家無需從零開始搭建模型。其內置的Amazon SageMake Jumpstart功能可以助力客戶迅速構建并部署模型,實現“一鍵部署”。值得注意的是,Amazon SageMaker Jumpstart已經支持了當前市場上廣受歡迎的多種開源和閉源基礎模型,如Llama2、Falcon、SDXL模型等,為用戶提供了快速嘗試和部署這些開源模型的便利。
如今,雙方的合作延伸至生成式AI領域,金山辦公正在對各種辦公應用場景進行全面測試,并將Amazon Bedrock服務集成到其海外產品中。對金山辦公而言,不僅能利用Amazon Bedrock提供的大模型能力豐富WPS的產品功能,還可與亞馬遜云科技的技術專家團隊進行深入探索與合作,從而確保在全球范圍內為用戶提供便捷、高效、卓越的辦公體驗。
Amazon Bedrock支持來自AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和Amazon等領先人工智能公司的高性能基礎模型,并可以輕松安全地進行自定義模型訓練。因此,金山辦公可以在輕松使用基礎模型的同時,使用自己的數據構建差異化的應用程序。
劉強分享道:對接Amazon Bedrock最顯著的優勢在于節省工程時間和提升工作效率。Amazon Bedrock的集成能力解決了之前需要手動統一不同大模型間的API和調用方式的問題。現在,利用Amazon Bedrock的模型管理功能,底層API變得透明,為金山辦公提供了無感知的統一的調用方式。
幾乎很少有單一模型能涵蓋全部能力,通常一個功能需要多個模型的協作。Amazon Bedrock為用戶提供了模型管理功能,大大減輕了用戶的工作量。例如,Amazon Bedrock提供的Claude基礎模型在金山辦公的Insight戰略中被用于閱讀理解。對于長文本,由于早期的大模型對一次接受的輸入有限制,WPS通常需要先將其分片處理,然后對各個分片進行總結。但現在,Amazon Bedrock支持的限制已經擴展到100K,這不僅提高了處理性能,還增強了準確性。
據亞馬遜云科技專家透露:Amazon Bedrock的設計初衷是簡化用戶在使用多個基礎模型時的操作,因此采用了統一的API形式。客戶只需簡單調整API參數,即可利用Amazon Bedrock訪問亞馬遜云科技及第三方模型供應商的大模型。目前,亞馬遜云科技正在與金山辦公合作,利用Amazon Bedrock探索文本潤色等文本相關場景,旨在提高WPS用戶的文本寫作質量。為確保合作的順利進行,亞馬遜云科技為金山辦公提供了全方位的支持,包括提示詞工程的建議以及確保金山辦公在各個測試階段都能獲得所需的基礎設施資源。
此外,亞馬遜云科技還提供了豐富的GPU選型,并專為生成式AI推出了特定的加速芯片,如Amazon Inferentia和Amazon Trainium。金山辦公正與亞馬遜合作,嘗試使用亞馬遜提供的GPU機型為其海外業務部署開源模型方案,并探索利用這些專門的加速芯片來進一步降低成本。
Amazon Bedrock提供安全性與合規性雙重保障
劉強強調:金山辦公始終將數據安全視為首要任務。金山辦公擁有專業安全團隊,與合作伙伴共同構建了完善的數據安全體系,確保在全球各地有效保護用戶隱私。在與亞馬遜云科技的合作中,Amazon Bedrock為數據安全提供了專門的模塊。
亞馬遜云科技專家進一步介紹道:從服務設計層面,Amazon Bedrock確保客戶數據不會被用于自有的Amazon Titan或任何第三方模型的訓練。所有客戶數據都經過嚴格加密,且加密密鑰完全由客戶掌控,確保數據的訪問僅限于客戶本身,且確保客戶數據不會離開其指定區域。為了進一步加強數據安全,企業級客戶還可以利用Amazon PrivateLink,在Amazon Bedrock與其虛擬私有網絡(VPC)間建立安全的專用連接,確保數據傳輸過程中絕不暴露于公共網絡。
Amazon Bedrock遵循PCI-DSS、HIPAA和GDPR等安全合規標準,可有效提升安全合規工作的流程。特別是對于有高度監管需求的客戶,它滿足HIPAA(《健康保險流通與責任法案》)要求,并在GDPR(歐盟《通用數據保護條例》)合規框架下提供服務,使更多客戶能夠安心地將生成式AI用于自身的業務創新。
隨著生成式AI的快速發展,亞馬遜云科技也認識到了以負責任的方式開發AI的重要性,為此在這方面投入了大量資源,與多家機構和合作伙伴合作,深入探索如何確保AI的負責任開發。
最后,劉強表示:金山辦公在AI領域秉持開放合作的態度,與各大模型廠商合作,旨在構建一個生態平臺。“我們不專注于自研通用大模型,而是與業內領先的服務商合作,共同為用戶提供卓越的辦公軟件服務。我們的自研方向更偏向于針對辦公領域的中小模型,來滿足更多用戶小眾場景的需求。”劉強如是說。