OpenAI當地時間4月2日宣布推出PaperBench——一個評估AI智能體復現前沿AI研究能力的基準。智能體需從零開始復現20篇ICML 2024 Spotlight和Oral論文,包括理解論文貢獻、開發代碼庫并成功執行實驗。據介紹,在PaperBench上測試多個前沿模型后發現,表現最佳的智能體Claude 3.5 Sonnet(新版)結合開源框架,平均復現得分為21.0%。最終其招募頂尖機器學習博士嘗試部分測試集,發現上述模型表現尚未超越人類基線。
微軟CTO預判:未來一年AI智能體記憶能力將有重大突破
當地時間 3 月 31 日播出的一檔 Twenty Minute VC 播客節目中,微軟 CTO 凱文?斯科特預言,“未來一年,AI 智能體(AI agents)最大的缺陷 —— 記憶能力將實現重大突破,它與人類的交互模式將發生顯著變化。”
軟銀集團擬融資165億美元打造“星際之門”AI項目
據報道,日本科技公司軟銀集團正尋求籌集高達165億美元資金,用于建設代號為“星際之門”(Stargate)的下一代人工智能超級計算項目。軟銀集團的165億美元融資貸款,重點將用于支持其在美國市場的人工智能領域布局。這將成為該公司繼ARM上市后最大規模的融資行動之一,標志著孫正義在生成式AI賽道的新一輪豪賭。
Gartner:2025年全球GenAI支出將達到6440億美元
Gartner預測,2025年全球GenAI支出將達到6440億美元,較2024年增長76.4%。Gartner杰出研究副總裁John-David Lovelock表示:“初始概念驗證(POC)工作的高失敗率以及對當前GenAI成果的不滿,導致人們對GenAI能力的期望下降。盡管如此,基礎模型提供商每年仍投入數十億美元,提升GenAI模型的規模、性能和可靠性。這一矛盾將貫穿于2025和2026年。”
智元機器人與Physical Intelligence在具身智能領域達成合作
4月2日,智元機器人宣布與國際頂尖具身智能公司Physical Intelligence(Pi)攜手,雙方將圍繞動態環境下的長周期復雜任務,在具身智能領域展開深度技術合作。近期正式加入智元的羅劍嵐博士將全面領導智元具身智能研究中心,同時推進雙方的深度合作。