OpenAI周四在System Card報告中推出OpenAI GPT-4.5的研究預覽版,這是其迄今最大、知識最豐富的模型,現已向每月訂閱費用200美元的ChatGPT Pro訂閱用戶開放。下周,該模型也將向每月20美元的ChatGPT Plus訂閱用戶開放。OpenAI首席執行官Altman表示,屆時該公司將增加數萬塊GPU,提供算力支撐。OpenAI表示,在GPT-4o的基礎上,GPT-4.5進一步擴展了預訓練,并被設計成比其強大的stem推理模型更通用。早期測試表明,與GPT-4.5互動感覺更自然。它擁有更廣泛的知識庫,更符合用戶意圖,情商更高,因此非常適合寫作、編程和解決實際問題等任務,而且幻覺更少。
黃仁勛:Blackwell需求驚人
英偉達CEO黃仁勛表示,對Blackwell的需求是驚人的,因為推理人工智能增加了另一條擴展定律——增加訓練計算使模型更智能,增加長期思考計算使答案更智能。英偉達已經成功地大規模生產了Blackwell人工智能超級計算機,在其首個季度實現了數十億美元的銷售額。
DeepSeek開源三項優化并行策略,梁文鋒參與研發
DeepSeek于2月27日在X上宣布這次開源的是三項優化并行策略,并在Github上詳細展開了DeepSeek-V3和R1模型背后的并行計算優化技術,通過這些闡述可以清晰了解團隊是如何精細地優化計算和通信,最大限度利用GPU能力的。這三項優化并行策略其中包括DualPipe,這是一種用于V3/R1模型訓練中計算與通信重疊的雙向流水線并行算法,這種算法能夠完全重疊前向和后向計算通信階段,與傳統方法相比減少了“流水線氣泡”(設備在某些時刻的空閑等待)。在DualPipe的開發團隊署名中,包括創始人梁文鋒。
知情人士稱谷歌在云計算部門裁員,或僅影響少數團隊
知情人士稱,谷歌在云計算部門裁掉部分員工,尚不清楚裁員規模。據悉,本輪裁員僅影響少數團隊。谷歌發言人在一份聲明中表示,公司將繼續做出調整,以“滿足客戶需求和適應未來重大機遇”。
Figure機器人進廠打工,成物流分揀大師!
Figure公司幾天前才發布了第一款自研視覺-語言-動作(VLA)模型Helix,統一了感知、語言理解和學習控制,他們又在一個全新場景中實現了機器人應用的落地——物流包裹操作和分揀,而且,只用了短短30天。
我國牽頭制定,養老機器人國際標準正式發布
近日,國際電工委員會(IEC)正式發布由我國牽頭制定的養老機器人國際標準(IEC 63310《互聯家庭環境下使用的主動輔助生活機器人性能準則》),該項標準依據老年人生理和行為特點,為各類養老機器人的產品設計、制造、測試和認證等提供基準,將引領全球養老機器人產業健康發展。