免费特黄一级欧美大片在线看 ,午夜影院一区二区三区,欧美日韩免费播放一区二区

D1net閱聞：OpenAI宣布推出AI Agent評測基準PaperBench

責任編輯：cres

2025-04-03 10:18:34

來源：企業網D1Net

原創

OpenAI宣布推出AI Agent評測基準PaperBench；微軟CT 預判：未來一年AI智能體記憶能力將有重大突破；軟銀集團擬融資165億美元打造“星際之門”AI項目……

OpenAI宣布推出AI Agent評測基準PaperBench

OpenAI當地時間4月2日宣布推出PaperBench——一個評估AI智能體復現前沿AI研究能力的基準。智能體需從零開始復現20篇ICML 2024 Spotlight和Oral論文，包括理解論文貢獻、開發代碼庫并成功執行實驗。據介紹，在PaperBench上測試多個前沿模型后發現，表現最佳的智能體Claude 3.5 Sonnet(新版)結合開源框架，平均復現得分為21.0%。最終其招募頂尖機器學習博士嘗試部分測試集，發現上述模型表現尚未超越人類基線。

微軟CTO預判：未來一年AI智能體記憶能力將有重大突破

當地時間 3 月 31 日播出的一檔 Twenty Minute VC 播客節目中，微軟 CTO 凱文?斯科特預言，“未來一年，AI 智能體(AI agents)最大的缺陷 —— 記憶能力將實現重大突破，它與人類的交互模式將發生顯著變化。”

軟銀集團擬融資165億美元打造“星際之門”AI項目

據報道，日本科技公司軟銀集團正尋求籌集高達165億美元資金，用于建設代號為“星際之門”(Stargate)的下一代人工智能超級計算項目。軟銀集團的165億美元融資貸款，重點將用于支持其在美國市場的人工智能領域布局。這將成為該公司繼ARM上市后最大規模的融資行動之一，標志著孫正義在生成式AI賽道的新一輪豪賭。

Gartner：2025年全球GenAI支出將達到6440億美元

Gartner預測，2025年全球GenAI支出將達到6440億美元，較2024年增長76.4%。Gartner杰出研究副總裁John-David Lovelock表示：“初始概念驗證(POC)工作的高失敗率以及對當前GenAI成果的不滿，導致人們對GenAI能力的期望下降。盡管如此，基礎模型提供商每年仍投入數十億美元，提升GenAI模型的規模、性能和可靠性。這一矛盾將貫穿于2025和2026年。”

智元機器人與Physical Intelligence在具身智能領域達成合作

4月2日，智元機器人宣布與國際頂尖具身智能公司Physical Intelligence(Pi)攜手，雙方將圍繞動態環境下的長周期復雜任務，在具身智能領域展開深度技術合作。近期正式加入智元的羅劍嵐博士將全面領導智元具身智能研究中心，同時推進雙方的深度合作。

AI 智能體