OpenAI向部分用戶開放GPT-4o語音模式 今秋將擴大至所有付費用戶
7月31日訊 當地時間周二(7月30日),美國AI研究公司OpenAI宣布,即日起開始向部分ChatGPT Plus用戶推出GPT-4o的語音模式。據OpenAI介紹,高級語音模式能提供更自然的實時對話,允許用戶隨時打斷,并能感知和響應用戶的情緒,實時響應和可打斷對話是目前語音助手公認的技術難點。OpenAI在今年5月推出了新版本大模型GPT-4o,同時還展示出了語音模式,該公司原定于6月底開始逐步向用戶開放語音模式,但最終決定推遲至7月發布。語音模式將于今年秋季向所有ChatGPT Plus用戶開放。
“史上最大IT事故”一周多后 微軟再次出現服務中斷
7月31日訊 當地時間周二(7月30日),微軟再次出現服務中斷,該公司稱其已經在解決相關問題。就在一周多前,微軟在全球范圍內出現了重大服務中斷,超過800萬臺使用微軟系統的計算機出現故障,影響了航空、醫療和金融等多個行業,被稱為“史上最大規模IT故障”。據微軟日本子公司稱,此次故障與美國網絡安全企業CrowdStrike旗下軟件更新有關。根據追蹤網站Downdetector匯編的用戶報告,有關微軟云服務Azure和Microsoft 365中斷的報告在美東時間周二早上7點后不久開始激增,在事件高峰期包含數百起投訴。微軟表示,該公司已開始嘗試修復問題,并顯示出改善跡象,正在監控情況以確保問題完全修復。
黃仁勛與扎克伯格首次公開對話:支持AI大模型開源策略
當地時間7月29日晚間,在美國丹佛舉行的SIGGRAPH 2024計算機圖形大會上,英偉達CEO黃仁勛(Jensen Huang)和 Meta 創始人 CEO 扎克伯格進行談話,這也是兩人首次公開對話。扎克伯格表示,“即使現在AI基礎模型的進步停止了,我們仍然會有5年的產品創新,但我實際上認為基礎模型和基礎研究的進展正在加速。”黃仁勛也對Meta開發的開源大型模型給予了高度評價,并且他和扎克伯格都認為應該繼續支持大型模型的開源策略。
Meta開源分割一切2.0模型,視頻也能分割了
Meta 在 SIGGRAPH 上重磅宣布 Segment Anything Model 2 (SAM 2) 來了。在其前身的基礎上,SAM 2 的誕生代表了領域內的一次重大進步 —— 為靜態圖像和動態視頻內容提供實時、可提示的對象分割,將圖像和視頻分割功能統一到一個強大的系統中。SAM 2 可以分割任何視頻或圖像中的任何對象 —— 甚至是它以前沒有見過的對象和視覺域,從而支持各種不同的用例,而無需自定義適配。在與黃仁勛的對話中,扎克伯格提到了 SAM 2:能夠在視頻中做到這一點,而且是在零樣本的前提下,告訴它你想要什么,這非常酷。
英偉達加速人形機器人發展 黃仁勛:面向全球機器人公司開放訪問
當地時間7月29日,英偉達在SiGGRAPH大會上宣布,為全球領先的機器人制造商、AI模型開發者和軟件制造商提供一整套服務、模型及軟件平臺,以開發、訓練并構建下一代人形機器人。整套產品包括用于機器人仿真和學習的NVIDIA NIM微服務和框架,用于運行多階段機器人工作負載的NVIDIA OSMO編排服務,以及支持AI和仿真的遠程操作工作流,允許開發者使用少量人類演示數據來訓練機器人。英偉達創始人CEO黃仁勛表示:“AI下一波浪潮是機器人,其中最令人興奮的發展之一是人形機器人。我們正在推進整個英偉達機器人堆棧的發展,面向全球機器人開發者和公司開放訪問,讓他們能夠使用最符合其需求的平臺、加速庫和AI模型。”
深圳:推進深圳開放智算中心建設 2024年建成并投入運營算力規模達4000PFLOPS
中共深圳市委辦公廳、深圳市人民政府辦公廳印發《深圳市加快打造人工智能先鋒城市行動方案》。其中提出,構建“一超多強總調度”智能算力體系。加快推進深圳先進算力基礎設施建設,推動“鵬城云腦Ⅲ”連接全國資源打造核心節點。推進深圳開放智算中心建設,2024年建成并投入運營算力規模達4000PFLOPS(每秒浮點運算次數)。鼓勵各區選取一批工業上樓項目配建智算中心。建設全光網絡,持續擴大深圳市智慧城市算力統籌調度平臺、粵港澳大灣區一體化算力服務平臺的調度規模,加速推進粵港澳大灣區算力調度平臺運營,2024年年底前調度規模達30000P FLOPS。支持面向企業、高校、科研機構等發放算力券,降低使用智能算力的成本。
又一國產版Sora全球上線!清華朱軍創業團隊,視頻生成僅需30秒
早在三個月前,國內外視頻生成領域還一片沉寂之時,生數科技突然曝出自家最新視頻大模型 Vidu 的宣傳視頻,憑借其生動逼真、不輸 Sora 的效果,驚艷了一眾網友。7月31日,Vidu 正式上線。無需申請,只要有個郵箱,就能上手體驗。此外,Vidu 的生成效率也賊拉猛,實現了業界最快的推理速度,僅需 30 秒就能生成一段 4 秒鏡頭。現階段,Vidu 有兩大核心功能:文生視頻和圖生視頻。Vidu底層基于完全自研的 U-ViT 架構,該架構由團隊在 2022 年 9 月提出,早于 Sora 采用的 DiT 架構,是全球首個 Diffusion 和 Transformer 融合的架構。
工信部發布《工業機器人行業規范條件(2024版)》
據工信部網站,工業和信息化部對《工業機器人行業規范條件》和《工業機器人行業規范管理實施辦法》進行了修訂,形成了《工業機器人行業規范條件(2024版)》和《工業機器人行業規范條件管理實施辦法(2024版)》,現予以公告。
深圳:建設國產人工智能生態源頭創新中心
近日,中共深圳市委辦公廳、深圳市人民政府辦公廳印發《深圳市加快打造人工智能先鋒城市行動方案》。方案提出,建設國產人工智能生態源頭創新中心。配置國產算力及算法、算子庫、數據庫、工具鏈、模型庫等工具,形成2個行業大模型,賦能50家企業打造典型應用場景。鼓勵企業、高校、科研院所共建國產人工智能聯合實驗室,形成一批“人工智能+”行業解決方案。支持成立粵港澳大灣區人工智能產業聯盟。