“紫東太初”人工智能基礎(chǔ)大模型榮獲“算力平臺”先鋒案例
2022中國算力大會是我國算力領(lǐng)域首個全國性會議,作為大會發(fā)布的重要獎項,“創(chuàng)新先鋒”優(yōu)秀成果評選旨在從設(shè)備技術(shù)、軟硬件系統(tǒng)、成果應(yīng)用、能效水平、賦能情況、流程優(yōu)化等多個方面優(yōu)中選優(yōu),充分發(fā)揮典型標(biāo)桿的示范引領(lǐng)作用。
“紫東太初”是全球首個三模態(tài)大模型,開拓性實現(xiàn)了圖像、文本、語音三個模態(tài)數(shù)據(jù)之間的“統(tǒng)一表示”與“相互生成”,理解和生成能力更接近人類,向通用人工智能邁出了重要一步。紫東太初作為多模態(tài)大模型代表作,正在全力助推AI研發(fā)規(guī)則和產(chǎn)業(yè)應(yīng)用模式變革,加速各行業(yè)智能化轉(zhuǎn)型實踐。
當(dāng)下,多模態(tài)大模型受產(chǎn)學(xué)研用多方關(guān)注,原因在于人工智能產(chǎn)業(yè)高速發(fā)展帶來全新研究、應(yīng)用需求。目前,網(wǎng)絡(luò)數(shù)據(jù)90%以上為圖像與視頻,音頻數(shù)據(jù)也保持高增長,但當(dāng)下用于預(yù)訓(xùn)練的模型大多是以文本、圖像為主的單模態(tài)或雙模態(tài),只能涵蓋互聯(lián)網(wǎng)一小部分?jǐn)?shù)據(jù),不僅與人類多模態(tài)交互能力差別很大,也無法充分發(fā)揮數(shù)據(jù)的生產(chǎn)要素作用,限制了下一階段人工智能應(yīng)用創(chuàng)新。
因此,推動預(yù)訓(xùn)練模型從單模態(tài)向多模態(tài)方向發(fā)展,打通圖像、文字、語音壁壘,進而使AI應(yīng)用更貼合人類行為習(xí)慣與現(xiàn)實需求,成為當(dāng)前人工智能行業(yè)攻堅點之一。
中科院自動化所以昇騰AI平臺為基礎(chǔ),基于武漢人工智能計算中心算力,研發(fā)面向超大規(guī)模的高效分布式訓(xùn)練框架,在圖、文、音三個基礎(chǔ)模型上加入跨模態(tài)編碼和解碼網(wǎng)絡(luò),基于昇思MindSpore AI框架,打造了全球首個千億參數(shù)三模態(tài)大模型“紫東.太初”,性能領(lǐng)跑業(yè)界,可以靈活支撐圖、文、音全場景AI應(yīng)用,更加接近人類真正的感情和思考,靈活性更高,通用性更強。基于紫東太初打造的虛擬人“小初”,具備視頻生成、視頻描述、圖像生成、智能問答、語音識別等多個功能,甚至能在紡織生產(chǎn)線上通過聲音就能“聽”出紗線斷頭的質(zhì)檢缺陷。
去年底,國內(nèi)首個多模態(tài)人工智能產(chǎn)業(yè)聯(lián)盟成立,吸引了新華社技術(shù)局、長安汽車、中國移動、千博手語等30余個成員單位加盟,通過開源的多模態(tài)大模型快速進行自身業(yè)務(wù)AI融合創(chuàng)新,基于“紫東太初” 陸續(xù)孵化出新媒體內(nèi)容檢索平臺、智能座艙、南宋御街?jǐn)?shù)字人、手語教考一體機等場景化行業(yè)應(yīng)用,充分展現(xiàn)了人工智能大模型的產(chǎn)業(yè)價值。
從“紫東太初”大模型的研發(fā),到產(chǎn)業(yè)聯(lián)盟的組建,AI研發(fā)規(guī)則和產(chǎn)業(yè)應(yīng)用模式迎來深刻變革,昇騰AI正在加速推動AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化,助力中國人工智能搶占智能時代新高地。