當前位置：云計算 → 行業動態 → 正文

D1net閱聞：OpenAI向部分用戶開放GPT-4o語音模式今秋將擴大至所有付費用戶

責任編輯：cres |來源：企業網D1Net 2024-07-31 10:14:14 原創文章企業網D1Net

OpenAI向部分用戶開放GPT-4o語音模式今秋將擴大至所有付費用戶

7月31日訊當地時間周二（7月30日），美國AI研究公司OpenAI宣布，即日起開始向部分ChatGPT Plus用戶推出GPT-4o的語音模式。據OpenAI介紹，高級語音模式能提供更自然的實時對話，允許用戶隨時打斷，并能感知和響應用戶的情緒，實時響應和可打斷對話是目前語音助手公認的技術難點。OpenAI在今年5月推出了新版本大模型GPT-4o，同時還展示出了語音模式，該公司原定于6月底開始逐步向用戶開放語音模式，但最終決定推遲至7月發布。語音模式將于今年秋季向所有ChatGPT Plus用戶開放。

“史上最大IT事故”一周多后微軟再次出現服務中斷

7月31日訊當地時間周二（7月30日），微軟再次出現服務中斷，該公司稱其已經在解決相關問題。就在一周多前，微軟在全球范圍內出現了重大服務中斷，超過800萬臺使用微軟系統的計算機出現故障，影響了航空、醫療和金融等多個行業，被稱為“史上最大規模IT故障”。據微軟日本子公司稱，此次故障與美國網絡安全企業CrowdStrike旗下軟件更新有關。根據追蹤網站Downdetector匯編的用戶報告，有關微軟云服務Azure和Microsoft 365中斷的報告在美東時間周二早上7點后不久開始激增，在事件高峰期包含數百起投訴。微軟表示，該公司已開始嘗試修復問題，并顯示出改善跡象，正在監控情況以確保問題完全修復。

黃仁勛與扎克伯格首次公開對話：支持AI大模型開源策略

當地時間7月29日晚間，在美國丹佛舉行的SIGGRAPH 2024計算機圖形大會上，英偉達CEO黃仁勛(Jensen Huang)和 Meta 創始人 CEO 扎克伯格進行談話，這也是兩人首次公開對話。扎克伯格表示，“即使現在AI基礎模型的進步停止了，我們仍然會有5年的產品創新，但我實際上認為基礎模型和基礎研究的進展正在加速。”黃仁勛也對Meta開發的開源大型模型給予了高度評價，并且他和扎克伯格都認為應該繼續支持大型模型的開源策略。

Meta開源分割一切2.0模型，視頻也能分割了

Meta 在 SIGGRAPH 上重磅宣布 Segment Anything Model 2 (SAM 2) 來了。在其前身的基礎上，SAM 2 的誕生代表了領域內的一次重大進步 —— 為靜態圖像和動態視頻內容提供實時、可提示的對象分割，將圖像和視頻分割功能統一到一個強大的系統中。SAM 2 可以分割任何視頻或圖像中的任何對象 —— 甚至是它以前沒有見過的對象和視覺域，從而支持各種不同的用例，而無需自定義適配。在與黃仁勛的對話中，扎克伯格提到了 SAM 2：能夠在視頻中做到這一點，而且是在零樣本的前提下，告訴它你想要什么，這非常酷。

英偉達加速人形機器人發展黃仁勛：面向全球機器人公司開放訪問

當地時間7月29日，英偉達在SiGGRAPH大會上宣布，為全球領先的機器人制造商、AI模型開發者和軟件制造商提供一整套服務、模型及軟件平臺，以開發、訓練并構建下一代人形機器人。整套產品包括用于機器人仿真和學習的NVIDIA NIM微服務和框架，用于運行多階段機器人工作負載的NVIDIA OSMO編排服務，以及支持AI和仿真的遠程操作工作流，允許開發者使用少量人類演示數據來訓練機器人。英偉達創始人CEO黃仁勛表示：“AI下一波浪潮是機器人，其中最令人興奮的發展之一是人形機器人。我們正在推進整個英偉達機器人堆棧的發展，面向全球機器人開發者和公司開放訪問，讓他們能夠使用最符合其需求的平臺、加速庫和AI模型。”

深圳：推進深圳開放智算中心建設 2024年建成并投入運營算力規模達4000PFLOPS

中共深圳市委辦公廳、深圳市人民政府辦公廳印發《深圳市加快打造人工智能先鋒城市行動方案》。其中提出，構建“一超多強總調度”智能算力體系。加快推進深圳先進算力基礎設施建設，推動“鵬城云腦Ⅲ”連接全國資源打造核心節點。推進深圳開放智算中心建設，2024年建成并投入運營算力規模達4000PFLOPS(每秒浮點運算次數)。鼓勵各區選取一批工業上樓項目配建智算中心。建設全光網絡，持續擴大深圳市智慧城市算力統籌調度平臺、粵港澳大灣區一體化算力服務平臺的調度規模，加速推進粵港澳大灣區算力調度平臺運營，2024年年底前調度規模達30000P FLOPS。支持面向企業、高校、科研機構等發放算力券，降低使用智能算力的成本。

又一國產版Sora全球上線！清華朱軍創業團隊，視頻生成僅需30秒

早在三個月前，國內外視頻生成領域還一片沉寂之時，生數科技突然曝出自家最新視頻大模型 Vidu 的宣傳視頻，憑借其生動逼真、不輸 Sora 的效果，驚艷了一眾網友。7月31日，Vidu 正式上線。無需申請，只要有個郵箱，就能上手體驗。此外，Vidu 的生成效率也賊拉猛，實現了業界最快的推理速度，僅需 30 秒就能生成一段 4 秒鏡頭。現階段，Vidu 有兩大核心功能：文生視頻和圖生視頻。Vidu底層基于完全自研的 U-ViT 架構，該架構由團隊在 2022 年 9 月提出，早于 Sora 采用的 DiT 架構，是全球首個 Diffusion 和 Transformer 融合的架構。

工信部發布《工業機器人行業規范條件（2024版）》

據工信部網站，工業和信息化部對《工業機器人行業規范條件》和《工業機器人行業規范管理實施辦法》進行了修訂，形成了《工業機器人行業規范條件（2024版）》和《工業機器人行業規范條件管理實施辦法（2024版）》，現予以公告。

深圳：建設國產人工智能生態源頭創新中心

近日，中共深圳市委辦公廳、深圳市人民政府辦公廳印發《深圳市加快打造人工智能先鋒城市行動方案》。方案提出，建設國產人工智能生態源頭創新中心。配置國產算力及算法、算子庫、數據庫、工具鏈、模型庫等工具，形成2個行業大模型，賦能50家企業打造典型應用場景。鼓勵企業、高校、科研院所共建國產人工智能聯合實驗室，形成一批“人工智能+”行業解決方案。支持成立粵港澳大灣區人工智能產業聯盟。

關鍵字：AI 大模型算力