精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:新聞中心行業相關 → 正文

月之暗面Kimi智能助手實現200萬字長上下文,火山引擎提供云服務支持

責任編輯:yang |來源:企業網D1Net  2024-04-03 17:18:16 原創文章 企業網D1Net

2023年10月,Kimi智能助手初次亮相便憑借20萬漢字的無損上下文能力,幫助用戶解鎖很多新的使用場景,包括專業學術論文的翻譯和理解、輔助分析法律問題、快速理解API開發文檔等,獲得用戶口碑和業務量的雙增長。

  2024年3月,月之暗面(Moonshot AI)宣布Kimi在長上下文窗口技術上取得新突破,無損上下文長度提升了一個數量級到200萬字。月之暗面相信,大模型無損上下文長度的數量級提升,會進一步幫助大家打開對AI應用場景的想象力,包括完整代碼庫的分析理解、可以自主幫人類完成多步驟復雜任務的智能體Agent、不會遺忘關鍵信息的終身助理、真正統一架構的多模態模型等。

  過去要10000小時才能成為專家的領域,現在只需10 分鐘,Kimi 就能接近任何一個新領域的初級專家水平。支持200萬字超長無損,Kimi讓用戶更加輕松的快速學習新領域。比如,上傳一份完整的近百萬字中醫診療手冊,Kimi可以針對用戶問題給出診療建議。

image.png

  快速整理大量的資料也是不少用戶在工作當中所遇到的挑戰,以簡歷篩選為例,公司HR可以基于企業業務需求,通過Kimi精讀500份簡歷,速找出有某個行業從業經歷,同時從計算機類專業畢業的求職者,更加高效地篩選和識別合適的候選人。

image.png

  從20萬字到200萬字,由于沒有采用常規的漸進式提升路線,月之暗面團隊遇到的技術難度也呈指數級增加。為了達到更好的長窗口無損壓縮性能,研發和技術團隊從模型預訓練到對齊、推理環節均進行了原生的重新設計和開發,不走“滑動窗口”、“降采樣”等技術捷徑,攻克了很多底層技術難點。

  在產品研發和推廣過程中,月之暗面與火山引擎展開深度合作,進行聯合技術創新,共同推進大型語言模型在垂直領域和通用場景的應用落地。

  超大規模多模態大模型預訓練快、穩、省

  在大規模的訓練過程中,GPU資源利用損耗、千卡任務故障概率指數增長、模型梯度爆炸、訓練效果缺少及時反饋等困難常常影響模型的訓練效率,導致數據和算力的價值難以充分發揮。

  火山引擎機器學習平臺沉淀形成全棧AI開發工程優化、任務故障自愈、實驗可觀測性等解決方案和最佳實踐,為月之暗面提供了高效率、穩定、可觀測的一站式AI算法開發和迭代服務。在Kimi的打磨和發布過程中,月之暗面基于火山引擎提供的超大規模AI訓練和推理加速解決方案實現了數千卡單一大集群規模常態化訓練,幫助團隊快速完成大型語言模型的持續訓練迭代、精調和推理。

  大模型訓練過程中自定義任務與開發機繁多,由于任務的啟停時間不一致,不可避免會出現GPU碎片問題導致任務調度不上。火山引擎機器學習平臺通過Binpack背包算法匯聚降低碎片,并使用調度器定期驅逐,大大提高GPU資源利用率,保障任務快速執行。同時,GPU彈性計算實例可靈活調度資源,隨用隨取,最高可以為月之暗面節省70%的算力成本。

  大模型訓練是一個迭代的過程,需要進行海量實驗。火山引擎機器學習平臺支持交互式調試,集成了JupyterLab、TensorBoard、VSCode、實驗管理工具等,幫助觀測實驗各類指標。同時,大規模分布式訓練任務很可能會出現軟硬件、網絡等問題,火山引擎提供了一系列自動化故障自愈流程機制,如慢節點自動巡檢、故障自動檢測、故障注入演練等,幫助大幅減少故障對任務的影響。

  數據飛輪加持模型訓練,實現全面降本增效

  在與火山引擎的合作中,月之暗面團隊應用了火山引擎數智平臺VeDI旗下云原生大數據平臺E-MapReduce和增長分析DataFinder兩大產品,并結合數據飛輪方法論,在數據資產層面大大降低了模型預處理的成本,在業務應用層面則為Kimi的精準投放、高效拉新保駕護航。

  火山引擎數據飛輪是企業數智化升級的新范式,其強調以數據消費為核心驅動力,使企業數據流充分融入業務流,實現數據資產和業務應用的飛輪效應。

  大模型的訓練以海量數據為基礎,其訓練過程本身可視為一種大規模的數據消費。在多模態模型數據預處理過程中,非結構化數據量級龐大、數據種類及格式多樣、數據處理過程復雜,對集群的計算調度、存儲吞吐都提出了非常大的挑戰。

  火山引擎通過E-MapReduce產品及相關解決方案,將Spark與Ray計算框架統一調度,共享集群資源,大大提升了數據清洗的復雜度和效率,實現了對海量數據的快速和規模化的處理,集群成本降低30%,并能應對突發任務需求,加速Kimi上線時間。

  在業務層面,為了進一步推廣Kimi應用,月之暗面需要在保障廣告ROI健康水平的情況下快速拓展新客戶,一方面促進Kimi DAU的快速攀升,同時兼顧新用戶留存率,保障業務健康度。這一方面需要數據的支撐,同時也需要便捷高效的數據工具輔助業務決策。

  結合火山引擎增長分析DataFinder的能力,月之暗面對產品用戶路徑優化進行了全鏈路優化,尋找轉化卡點、流失高點,結合各節點數據快速發現問題、定位問題、解決問題,確保用戶體驗,提升整體留存。于此同時,借助DataFinder的廣告投放渠道監測功能,月之暗面團隊對廣告投放效果進行了精準分析,進一步優化了推廣素材和相關活動,確保拉新效率。

image.png

月之暗面應用DataFinder方案框架

  未來,火山引擎與月之暗面將持續深化合作,共同攻克技術難題,進一步幫助用戶加速AI進程。火山引擎也將不斷提升自身技術實力和服務水平,攜手伙伴共同為用戶提供更加優質、智能的AI體驗,助力 AI 應用的創新與發展。

關鍵字:云服務引擎火山智能

原創文章 企業網D1Net

x 月之暗面Kimi智能助手實現200萬字長上下文,火山引擎提供云服務支持 掃一掃
分享本文到朋友圈
當前位置:新聞中心行業相關 → 正文

月之暗面Kimi智能助手實現200萬字長上下文,火山引擎提供云服務支持

責任編輯:yang |來源:企業網D1Net  2024-04-03 17:18:16 原創文章 企業網D1Net

2023年10月,Kimi智能助手初次亮相便憑借20萬漢字的無損上下文能力,幫助用戶解鎖很多新的使用場景,包括專業學術論文的翻譯和理解、輔助分析法律問題、快速理解API開發文檔等,獲得用戶口碑和業務量的雙增長。

  2024年3月,月之暗面(Moonshot AI)宣布Kimi在長上下文窗口技術上取得新突破,無損上下文長度提升了一個數量級到200萬字。月之暗面相信,大模型無損上下文長度的數量級提升,會進一步幫助大家打開對AI應用場景的想象力,包括完整代碼庫的分析理解、可以自主幫人類完成多步驟復雜任務的智能體Agent、不會遺忘關鍵信息的終身助理、真正統一架構的多模態模型等。

  過去要10000小時才能成為專家的領域,現在只需10 分鐘,Kimi 就能接近任何一個新領域的初級專家水平。支持200萬字超長無損,Kimi讓用戶更加輕松的快速學習新領域。比如,上傳一份完整的近百萬字中醫診療手冊,Kimi可以針對用戶問題給出診療建議。

image.png

  快速整理大量的資料也是不少用戶在工作當中所遇到的挑戰,以簡歷篩選為例,公司HR可以基于企業業務需求,通過Kimi精讀500份簡歷,速找出有某個行業從業經歷,同時從計算機類專業畢業的求職者,更加高效地篩選和識別合適的候選人。

image.png

  從20萬字到200萬字,由于沒有采用常規的漸進式提升路線,月之暗面團隊遇到的技術難度也呈指數級增加。為了達到更好的長窗口無損壓縮性能,研發和技術團隊從模型預訓練到對齊、推理環節均進行了原生的重新設計和開發,不走“滑動窗口”、“降采樣”等技術捷徑,攻克了很多底層技術難點。

  在產品研發和推廣過程中,月之暗面與火山引擎展開深度合作,進行聯合技術創新,共同推進大型語言模型在垂直領域和通用場景的應用落地。

  超大規模多模態大模型預訓練快、穩、省

  在大規模的訓練過程中,GPU資源利用損耗、千卡任務故障概率指數增長、模型梯度爆炸、訓練效果缺少及時反饋等困難常常影響模型的訓練效率,導致數據和算力的價值難以充分發揮。

  火山引擎機器學習平臺沉淀形成全棧AI開發工程優化、任務故障自愈、實驗可觀測性等解決方案和最佳實踐,為月之暗面提供了高效率、穩定、可觀測的一站式AI算法開發和迭代服務。在Kimi的打磨和發布過程中,月之暗面基于火山引擎提供的超大規模AI訓練和推理加速解決方案實現了數千卡單一大集群規模常態化訓練,幫助團隊快速完成大型語言模型的持續訓練迭代、精調和推理。

  大模型訓練過程中自定義任務與開發機繁多,由于任務的啟停時間不一致,不可避免會出現GPU碎片問題導致任務調度不上。火山引擎機器學習平臺通過Binpack背包算法匯聚降低碎片,并使用調度器定期驅逐,大大提高GPU資源利用率,保障任務快速執行。同時,GPU彈性計算實例可靈活調度資源,隨用隨取,最高可以為月之暗面節省70%的算力成本。

  大模型訓練是一個迭代的過程,需要進行海量實驗。火山引擎機器學習平臺支持交互式調試,集成了JupyterLab、TensorBoard、VSCode、實驗管理工具等,幫助觀測實驗各類指標。同時,大規模分布式訓練任務很可能會出現軟硬件、網絡等問題,火山引擎提供了一系列自動化故障自愈流程機制,如慢節點自動巡檢、故障自動檢測、故障注入演練等,幫助大幅減少故障對任務的影響。

  數據飛輪加持模型訓練,實現全面降本增效

  在與火山引擎的合作中,月之暗面團隊應用了火山引擎數智平臺VeDI旗下云原生大數據平臺E-MapReduce和增長分析DataFinder兩大產品,并結合數據飛輪方法論,在數據資產層面大大降低了模型預處理的成本,在業務應用層面則為Kimi的精準投放、高效拉新保駕護航。

  火山引擎數據飛輪是企業數智化升級的新范式,其強調以數據消費為核心驅動力,使企業數據流充分融入業務流,實現數據資產和業務應用的飛輪效應。

  大模型的訓練以海量數據為基礎,其訓練過程本身可視為一種大規模的數據消費。在多模態模型數據預處理過程中,非結構化數據量級龐大、數據種類及格式多樣、數據處理過程復雜,對集群的計算調度、存儲吞吐都提出了非常大的挑戰。

  火山引擎通過E-MapReduce產品及相關解決方案,將Spark與Ray計算框架統一調度,共享集群資源,大大提升了數據清洗的復雜度和效率,實現了對海量數據的快速和規模化的處理,集群成本降低30%,并能應對突發任務需求,加速Kimi上線時間。

  在業務層面,為了進一步推廣Kimi應用,月之暗面需要在保障廣告ROI健康水平的情況下快速拓展新客戶,一方面促進Kimi DAU的快速攀升,同時兼顧新用戶留存率,保障業務健康度。這一方面需要數據的支撐,同時也需要便捷高效的數據工具輔助業務決策。

  結合火山引擎增長分析DataFinder的能力,月之暗面對產品用戶路徑優化進行了全鏈路優化,尋找轉化卡點、流失高點,結合各節點數據快速發現問題、定位問題、解決問題,確保用戶體驗,提升整體留存。于此同時,借助DataFinder的廣告投放渠道監測功能,月之暗面團隊對廣告投放效果進行了精準分析,進一步優化了推廣素材和相關活動,確保拉新效率。

image.png

月之暗面應用DataFinder方案框架

  未來,火山引擎與月之暗面將持續深化合作,共同攻克技術難題,進一步幫助用戶加速AI進程。火山引擎也將不斷提升自身技術實力和服務水平,攜手伙伴共同為用戶提供更加優質、智能的AI體驗,助力 AI 應用的創新與發展。

關鍵字:云服務引擎火山智能

原創文章 企業網D1Net

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 宁晋县| 河东区| 翁源县| 讷河市| 金华市| 来凤县| 龙胜| 临安市| 南雄市| 会理县| 汾西县| 屏南县| 抚远县| 衡水市| 汾阳市| 达孜县| 益阳市| 山东省| 襄汾县| 黔江区| 金华市| 两当县| 霍州市| 靖西县| 栖霞市| 勐海县| 喀喇| 静乐县| 上饶县| 麻城市| 富宁县| 成安县| 梅河口市| 柘城县| 义马市| 淮南市| 凤山市| 莱州市| 南宫市| 定南县| 同德县|