大模型軍備競賽升級:GPT-4.5/Grok 3同日官宣
OpenAI宣布未來幾周發(fā)布GPT-4.5(代號Orion),馬斯克則將發(fā)布號稱“地球最聰明AI”的Grok 3,聲稱其解決方案“強大到令人害怕”。谷歌Gemini 2.0已全面開放,Meta同期推出Pippo模型(單圖生成1K多視角視頻)。
OpenAI稱DeepSeek和Kimi發(fā)現o1的秘密,Kimi研究員解密破解過程
近日,OpenAI發(fā)布研究報告稱,DeepSeek和Kimi通過獨立研究,利用思維鏈學習方法顯著提升模型在數學解題與編程挑戰(zhàn)中的綜合表現。Kimi研究員Flood Sung發(fā)文表示,長思維鏈的有效性曾在內部得到驗證,在實際訓練中發(fā)現模型會隨著訓練提升表現并不斷增加 token數,證明強化訓練過程中模型可以自己涌現。1月20日,DeepSeek、Kimi同天發(fā)布推理模型R1和k1.5。
谷歌AI智能體執(zhí)行復雜任務完成度已達85%
據媒體報道,谷歌CEO桑達爾·皮查伊表示,接下來的2-4年中,“代理式工作流”(Agentic Workflows)將迎來重大進展。借助這項技術,用戶在通過自然語言描述任務之后,AI便能幫助用戶執(zhí)行并最終完成任務。谷歌正在推進兩個相關項目,其中之一為瀏覽器擴展程序“Mariner”——AI可以代替用戶瀏覽網頁、執(zhí)行復雜任務,并提供完整結果。他表示,這項技術在一年前的完成度僅為50%,如今已經提升到85%。
微軟OmniParser最新版本可將DeepSeek等模型轉化為計算機智能體
2月17日,根據微軟官網,微軟日前發(fā)布視覺Agent解析框架OmniParser最新版本V2,可將OpenAI(4o/o1/o3-mini)、DeepSeek(R1)、Qwen(2.5VL)、Anthropic(Sonnet)等大模型,轉化為“計算機使用智能體”(Computer Use Agent)。相比前代版本,OmniParser V2在檢測更微小可交互元素時精度更高、推理速度更快。具體而言,V2通過使用更大規(guī)模的交互元素檢測數據集和圖標功能描述數據進行訓練,并通過縮小圖標描述模型的輸入圖像尺寸,推理延遲較前代降低60%。
Meta成立新團隊專注AI人形機器人研發(fā)
近日,Meta宣布在Reality Labs硬件部門內成立了一個新團隊,專注于AI人形機器人的研發(fā)。該團隊將由經驗豐富的Marc Whitten領導,計劃在今年招聘約100名工程師。Meta的人形機器人項目,不僅聚焦于技術層面的突破,更將實際應用場景鎖定在了日常生活之中。這一舉措展現了Meta在AI技術探索上的雄心和決心。
全球首款人形機器人“天工”再升級
全球首個實現擬人奔跑的全尺寸純電驅人形機器人“天工”再升級,通過具身小腦所帶來的全身控制能力升級,面對復雜環(huán)境的移動能力大幅提升。其奔跑時速提高至12km/h,能在雪地進行高速奔跑,同時具備更強的抗干擾能力。