DeepSeek放出了開源周首日的重磅炸彈——FlashMLA。這是DeepSeek專為英偉達Hopper GPU打造的高效MLA解碼內核,特別針對變長序列進行了優化,目前已正式投產使用。注意,DeepSeek訓練成本極低的兩大關鍵,一個是MoE,另一個就是MLA。經實測,FlashMLA在H800 SXM5平臺上(CUDA 12.6),在內存受限配置下可達最高3000GB/s,在計算受限配置下可達峰值580 TFLOPS。
蘋果計劃未來四年在美國投資超過5000億美元 為其有史以來最大規模的支出承諾
蘋果公司宣布了其有史以來最大規模的支出承諾,計劃在未來四年內在美國投入和投資超過5000億美元。這項新承諾建立在Apple投資于美國創新和先進高技能制造的悠久歷史之上,并將支持一系列專注于人工智能、芯片工程和全國學生和工人技能發展的計劃。這筆5000億美元的承諾包括Apple與全美50個州的數千家供應商合作、直接就業、AppleIntelligence基礎設施和數據中心、企業設施,以及20個州的AppleTV+制作。
消息稱英偉達包下臺積電今年超70%的先進封裝產能
業界消息稱,英偉達最新Blackwell構架GPU芯片需求強勁,已包下臺積電今年超過70%的CoWoS-L先進封裝產能,出貨量以每季環比增長20%以上逐季沖高。
消息稱AMD擬以40億美元出售數據中心工廠,部分臺企成潛在買家
據彭博社援引知情人士消息稱,AMD 正在與幾家亞洲企業就出售其去年收購的數據中心制造工廠展開談判。這些企業包括臺灣地區的廣達電子、英業達、和碩聯合以及緯創資通等。知情人士表示,這些工廠的總價值可能在30-40億美元之間,包括債務。消息人士表示,交易可能會在今年第二季度宣布。談判仍在進行中,目前尚不確定 AMD 是否能夠達成協議。
多地政務系統接入DeepSeek
“整體上,DeepSeek大模型的接入,對‘智慧政府’有較大的推進作用。”香港科技大學助理教授、香港生成式人工智能研發中心預研部主任韓斯睿告訴澎湃新聞記者,隨著人工智能技術的快速發展,“AI+政務”成為推動政府治理現代化的重要路徑。各地接入DeepSeek大模型,通過智能問答、政策解讀等功能提升服務效率,推動“一網通辦”“跨省通辦”等模式創新,并賦能智慧城市建設。AI大模型技術快速發展,已成為推動各行各業變革的核心力量之一。近日,DeepSeek的“朋友圈”快速擴容。各級地方政府接入DeepSeek向公民提供政務服務成為熱潮。深圳、廣州、呼和浩特、贛州、無錫、臨沂等地政府均宣布在政務系統中接入DeepSeek模型,將在內容生成和智能交互等方面顯著提升政務辦公效率。
深圳:大力發展平臺經濟等各種經濟形態 加強人工智能等前沿技術研究應用
深圳市委書記孟凡利2月24日參加市政協七屆五次會議聯組討論“推動深圳平臺經濟與實體經濟融合發展”座談會,與委員們深入交流,聽取大家的意見建議。孟凡利指出,深圳要圍繞建設具有深圳特點和深圳優勢的現代化產業體系的目標,大力發展平臺經濟等各種經濟形態,堅定支持各類平臺規范健康持續快速發展。加強人工智能等前沿技術研究應用,加快發展壯大工業互聯網,大力培育、引進各種功能的大中小平臺,加快提升產品和服務國際競爭力。發揮好平臺經濟推動新質生產力發展、推動制造業優化升級、促進消費擴大需求、開拓國際市場、穩就業惠民生等方面重要作用,加快平臺經濟高質量發展,使平臺更好為實體經濟發展、為經濟中心城市建設作更大貢獻,充分發揮平臺經濟在全市高質量發展中的重要作用。
Anthropic發布新模型Claude 3.7 Sonnet!兼備“推理模式”與“傳統模式”
Anthropic周一發布名為Claude 3.7 Sonnet的模型,該公司表示,這是其有史以來“最智能”的AI模型,稱這種“混合型”模型同時具備“推理模式”(停下來思考復雜答案)與傳統模式(實時生成答案)的能力,并表示該模型是市面上唯一的此類“混合”模型。分析認為,這一舉措或許能為Anthropic在與對手OpenAI以及那些投入巨資開發AI模型的大型科技公司的競爭中贏得急需的優勢。