全球最大開源大模型！馬斯克正式開源Grok AI

責任編輯：cres 作者：Carl Franzen |來源：企業網D1Net 2024-03-18 11:30:53 原創文章企業網D1Net

馬斯克此前曾宣布，開源Grok的舉措將于本周實施。現在，任何其他企業家、程序員、公司或個人都可以體驗和測試Grok——模型的人工神經元或軟件模塊之間的連接強度，這些模塊使模型能夠做出決策、接受輸入并以文本形式提供輸出——以及其他相關文檔，并將模型的副本用于任何他們想要的東西，包括商業應用。

該公司在一篇博客文章中宣布：“我們正在發布我們的大型語言模型Grok-1的基本模型和網絡架構，Grok-1是xAI從頭開始訓練的3140億參數混合專家模型。”

感興趣的人可以在Github的頁面上或通過鏈接下載Grok的代碼。

Grok的開源意味著什么

參數是指支配模型的權重和偏差——通常參數越多，模型就越先進、越復雜、越好用。Grok擁有3140億個參數，遠遠領先于開源競爭對手，如Meta的Llama 2(700億個參數)和Mistral 8x7B(120億個參數)。

Grok的體系結構于2023年10月使用JAX和Rust上的定制訓練堆棧開發，結合了神經網絡設計的創新方法，對于給定的令牌，該模型使用25%的權重，這一策略提高了其效率和效果。

Grok最初是在2023年11月發布的，當時它是一款專有或封閉源代碼的機型，到目前為止，它只能在馬斯克獨立但相關的社交網絡X(前身為Twitter)上使用，特別是通過X Premium+付費訂閱服務，費用為每月16美元或每年168美元。

然而，Grok的發布并不包括其訓練數據的完整語料庫，這對于使用模型并不重要，因為它已經經過了訓練，但它不允許用戶看到它從X上學到了什么——大概是X上的用戶文本帖子(xAI博客文章含糊地說它是“基于大量文本數據訓練的基礎模型，沒有針對任何特定任務進行微調”)。

它也不包括任何與X上可用的實時信息的掛鉤，馬斯克最初將其吹捧為Grok相對于其他LLM的主要屬性，為此，用戶仍需要在X上訂閱付費版本。

不僅僅是一項技術舉措還是一項商業和公關戰略

為了與OpenAI的ChatGPT競爭，馬斯克于2018年脫離OpenAI并創建了自己的大模型Grok。馬斯克將Grok定位為ChatGPT和其他領先的大語言模型的更幽默、更未經審查的版本，鑒于人們對人工智能審查的抱怨，以及谷歌Gemini令人尷尬的混亂圖像和可疑的意識形態立場(Gemini在至少一個例子中暗示，馬斯克的推文對社會的影響可能與納粹領導人Adolf Hitler一樣糟糕)，這一立場在更廣泛的用戶中重新變得有吸引力。當然，Gemini受到了馬斯克和其他有影響力的科技領袖的強烈批評，其中包括16z的聯合創始人和網絡先驅馬克·安德森。

Grok的開源顯然也是馬斯克在訴訟和對OpenAI的普遍批評中有益的意識形態立場，他最近起訴了OpenAI，指責他的前公司放棄了《創始協議》，轉而以非營利性組織的形式運營。OpenAI在輿論法庭上發布了為自己辯護的電子郵件，至少表明馬斯克知道并可能支持其轉向專有的營利性技術。

X上的人工智能社區已經對這一發布充滿了好奇和興奮，值得注意的是，技術界指出了該模型在前饋層中使用GeGLU，以及它的歸一化方法，就連OpenAI的員工也發帖表達了他們對該模型的興趣。

因此，Grok的發布可能會給所有其他大語言模型提供商，特別是其他競爭對手開源提供商帶來壓力，讓他們向用戶證明他們是多么的優越。

企業網D1net(hfnxjk.com)：

國內主流的to B IT門戶，同時在運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。同時運營19個IT行業公眾號(微信搜索D1net即可關注)。

關鍵字：AI 馬斯克