精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:人工智能行業動態 → 正文

馬斯克推出Grok-1.5,接近GPT-4級別的性能

責任編輯:cres 作者:Shubham Sharma |來源:企業網D1Net  2024-04-01 10:29:43 原創文章 企業網D1Net

定于下周發布的Grok-1.5帶來了增強的推理和解決問題的能力,并接近于已知的開源和閉源的LLM的性能,包括OpenAI的GPT-4和Anthropic的Claude 3。它也能夠處理長文本,但在上下文窗口大小方面仍落后于Gemini 1.5 Pro的最多100萬個標記。
 
馬斯克指出,Grok-1.5將為xAI在X平臺上的ChatGPT挑戰者聊天機器人提供支持,而Grok-2(新模型的繼任者)仍在訓練階段。他表示,下一個版本應該能夠“在所有指標上超越當前的AI”,但沒有分享它可能何時變得可用的具體細節。
 
Grok-1.5帶來了什么?
 
xAI去年11月宣布了Grok-1,稱這個AI是以《銀河系漫游指南》為模型,幾乎可以回答任何問題,以幫助人類在尋求理解和知識的征途中——無論背景或政治觀點如何。在GSM8K、HumanEval和MMLU等基準測試中,由xAI分享的數據顯示,Grok-1的表現超過了Llama-2-70B和GPT-3.5。
 
現在,隨著Grok-1.5的發布,該公司在先前模型的基礎上取得了顯著改進,在所有主要基準測試中,包括與編碼和數學相關的任務,都實現了顯著提升。
 
xAI在博客文章中指出:“在我們的測試中,Grok-1.5在MATH基準測試中達到了50.6%的分數,在GSM8K基準測試中達到了90%的分數,這兩個數學基準測試涵蓋了從小學到高中競賽問題的廣泛范圍。此外,它在評估代碼生成和問題解決能力的HumanEval基準測試中得分為74.1%。”
 
在MMLU基準測試上,評估AI模型在不同任務上的語言理解能力,新模型得分為81.3%,比Grok-1的73%高出顯著幅度。
 
此外,xAI還確認,Grok-1.5的上下文窗口可達128,000個標記(標記是單詞、圖像、視頻、音頻或代碼的整個部分或子部分)。這使得模型能夠一次性處理和處理大量信息,比Grok-1多16倍,使其更適合分析、總結和提取長文檔中的信息。它甚至可以處理更長、更復雜的提示,同時仍然保持遵循指令的能力。
 
接近OpenAI和Anthropic
 
憑借增強的推理和解決問題的能力,Grok-1.5不僅在基準測試中勝過其前身,而且還接近流行的開放和封閉源模型,包括Gemini 1.5 Pro、GPT-4和Claude 3。
 
例如,在MMLU上,Grok-1.5的81.3%得分超過了最近推出的Mistral Large,但落后于Gemini 1.5 Pro(83.7%)、GPT-4(86.4%,
 
截至2023年3月)和Claude 3 Opus(86.8%)。在GSM8K基準測試上也注意到了類似的差距,xAI模型僅落后于Google、OpenAI和Anthropic的產品。
 
值得注意的是,Grok-1.5唯一看起來有優勢的基準是HumanEval,在那里它的表現超過了所有模型,除了Claude 3 Opus。xAI希望繼續這些改進,并通過Grok-2提供進一步的性能提升,據馬斯克稱,應該在所有指標上超越當前的AI。該模型目前正在訓練中。
 
技術顧問Brian Roemmele表示,根據他與Grok-1的工作,Grok-2“在發布時將成為最強大的LLM AI平臺之一。它將在幾乎所有指標上超越OpenAI。”
 
Grok-1.5的可用性
 
至于Grok-1.5,xAI計劃下周開始部署。公司表示,該模型最初將提供給早期測試者和那些已經在X平臺(Twitter)上使用Grok聊天機器人的用戶——實時訪問平臺上的所有帖子。推出將分階段進行,公司將改進模型并引入幾個新功能——可能包括一種新的不受限制的有趣模式——同時逐步使其對更廣泛的用戶群體可用。
 
當馬斯克在X上推出Grok時,被視為推動Grok和X的采用。他首先將AI作為平臺的“高級+”訂閱的一部分,價格為每月16美元。然而,就在幾天前,這位億萬富翁分享說,聊天機器人也將為支付8美元每月的高級訂閱者啟用。在另一個更新中,他還確認,擁有一定級別的驗證訂閱者的關注者將免費獲得高級和高級+訂閱的好處,包括Grok。
 
企業網D1net(hfnxjk.com):
 
國內主流的to B IT門戶,同時在運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。同時運營19個IT行業公眾號(微信搜索D1net即可關注)。
 
版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。

關鍵字:GPTAI

原創文章 企業網D1Net

x 馬斯克推出Grok-1.5,接近GPT-4級別的性能 掃一掃
分享本文到朋友圈
當前位置:人工智能行業動態 → 正文

馬斯克推出Grok-1.5,接近GPT-4級別的性能

責任編輯:cres 作者:Shubham Sharma |來源:企業網D1Net  2024-04-01 10:29:43 原創文章 企業網D1Net

定于下周發布的Grok-1.5帶來了增強的推理和解決問題的能力,并接近于已知的開源和閉源的LLM的性能,包括OpenAI的GPT-4和Anthropic的Claude 3。它也能夠處理長文本,但在上下文窗口大小方面仍落后于Gemini 1.5 Pro的最多100萬個標記。
 
馬斯克指出,Grok-1.5將為xAI在X平臺上的ChatGPT挑戰者聊天機器人提供支持,而Grok-2(新模型的繼任者)仍在訓練階段。他表示,下一個版本應該能夠“在所有指標上超越當前的AI”,但沒有分享它可能何時變得可用的具體細節。
 
Grok-1.5帶來了什么?
 
xAI去年11月宣布了Grok-1,稱這個AI是以《銀河系漫游指南》為模型,幾乎可以回答任何問題,以幫助人類在尋求理解和知識的征途中——無論背景或政治觀點如何。在GSM8K、HumanEval和MMLU等基準測試中,由xAI分享的數據顯示,Grok-1的表現超過了Llama-2-70B和GPT-3.5。
 
現在,隨著Grok-1.5的發布,該公司在先前模型的基礎上取得了顯著改進,在所有主要基準測試中,包括與編碼和數學相關的任務,都實現了顯著提升。
 
xAI在博客文章中指出:“在我們的測試中,Grok-1.5在MATH基準測試中達到了50.6%的分數,在GSM8K基準測試中達到了90%的分數,這兩個數學基準測試涵蓋了從小學到高中競賽問題的廣泛范圍。此外,它在評估代碼生成和問題解決能力的HumanEval基準測試中得分為74.1%。”
 
在MMLU基準測試上,評估AI模型在不同任務上的語言理解能力,新模型得分為81.3%,比Grok-1的73%高出顯著幅度。
 
此外,xAI還確認,Grok-1.5的上下文窗口可達128,000個標記(標記是單詞、圖像、視頻、音頻或代碼的整個部分或子部分)。這使得模型能夠一次性處理和處理大量信息,比Grok-1多16倍,使其更適合分析、總結和提取長文檔中的信息。它甚至可以處理更長、更復雜的提示,同時仍然保持遵循指令的能力。
 
接近OpenAI和Anthropic
 
憑借增強的推理和解決問題的能力,Grok-1.5不僅在基準測試中勝過其前身,而且還接近流行的開放和封閉源模型,包括Gemini 1.5 Pro、GPT-4和Claude 3。
 
例如,在MMLU上,Grok-1.5的81.3%得分超過了最近推出的Mistral Large,但落后于Gemini 1.5 Pro(83.7%)、GPT-4(86.4%,
 
截至2023年3月)和Claude 3 Opus(86.8%)。在GSM8K基準測試上也注意到了類似的差距,xAI模型僅落后于Google、OpenAI和Anthropic的產品。
 
值得注意的是,Grok-1.5唯一看起來有優勢的基準是HumanEval,在那里它的表現超過了所有模型,除了Claude 3 Opus。xAI希望繼續這些改進,并通過Grok-2提供進一步的性能提升,據馬斯克稱,應該在所有指標上超越當前的AI。該模型目前正在訓練中。
 
技術顧問Brian Roemmele表示,根據他與Grok-1的工作,Grok-2“在發布時將成為最強大的LLM AI平臺之一。它將在幾乎所有指標上超越OpenAI。”
 
Grok-1.5的可用性
 
至于Grok-1.5,xAI計劃下周開始部署。公司表示,該模型最初將提供給早期測試者和那些已經在X平臺(Twitter)上使用Grok聊天機器人的用戶——實時訪問平臺上的所有帖子。推出將分階段進行,公司將改進模型并引入幾個新功能——可能包括一種新的不受限制的有趣模式——同時逐步使其對更廣泛的用戶群體可用。
 
當馬斯克在X上推出Grok時,被視為推動Grok和X的采用。他首先將AI作為平臺的“高級+”訂閱的一部分,價格為每月16美元。然而,就在幾天前,這位億萬富翁分享說,聊天機器人也將為支付8美元每月的高級訂閱者啟用。在另一個更新中,他還確認,擁有一定級別的驗證訂閱者的關注者將免費獲得高級和高級+訂閱的好處,包括Grok。
 
企業網D1net(hfnxjk.com):
 
國內主流的to B IT門戶,同時在運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。同時運營19個IT行業公眾號(微信搜索D1net即可關注)。
 
版權聲明:本文為企業網D1Net編譯,轉載需在文章開頭注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。

關鍵字:GPTAI

原創文章 企業網D1Net

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 贡嘎县| 玛曲县| 察哈| 根河市| 盱眙县| 图木舒克市| 洛阳市| 汝州市| 客服| 胶州市| 池州市| 盱眙县| 商丘市| 宁海县| 扎赉特旗| 天津市| 定西市| 红桥区| 马尔康县| 博罗县| 克拉玛依市| 微博| 望都县| 涪陵区| 雷山县| 青阳县| 潢川县| 江永县| 行唐县| 延吉市| 上蔡县| 秭归县| 金门县| 襄垣县| 类乌齐县| 都江堰市| 禹城市| 鹤山市| 报价| 正阳县| 夹江县|