微軟相信 2018 會(huì)是“人工智能之年”,并且投資了多個(gè) AI 項(xiàng)目,比如幾天前發(fā)布的一款能夠讀取和回答問(wèn)題、準(zhǔn)確水平與人類(lèi)文件相當(dāng)?shù)?AI,且希望將這類(lèi)技術(shù)用到解密免疫系統(tǒng)上。今天,微軟公布了當(dāng)前正在開(kāi)發(fā)的另一項(xiàng)全新的 AI 技術(shù) —— 你只需口述、它就可以幫你畫(huà)出相關(guān)內(nèi)容。基于語(yǔ)音轉(zhuǎn)譯的文本內(nèi)容,該“繪畫(huà)機(jī)器人”(drawing bot)可以創(chuàng)作出細(xì)節(jié)程度相當(dāng)之高的圖像。
與之前考慮過(guò)的頂級(jí)技術(shù)相比,drawing bot 帶來(lái)了三重改進(jìn)。有趣的是,即便口述內(nèi)容中并未提及,畫(huà)作中仍可包含諸多微小的細(xì)節(jié)。微軟表示,這表明該 AI 已經(jīng)自帶“想象力”。
微軟研究院首席研究院兼研究主管何曉東解釋到:“當(dāng)你通過(guò)必應(yīng)搜索鳥(niǎo)類(lèi)的時(shí)候,返回的圖像其實(shí)是由計(jì)算機(jī)的一個(gè)個(gè)像素組成的。這些鳥(niǎo)兒可能不存在于現(xiàn)實(shí)世界中,而是計(jì)算機(jī)幫你想象出來(lái)的”。
打造這款 drawing bot,同時(shí)涉及計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理領(lǐng)域的大量研究。作為一項(xiàng)困難的任務(wù),研究人員在圖像生成方面傾注了很多的努力。
值得一提的是,該 AI 也是微軟“生成對(duì)抗網(wǎng)絡(luò)”(Generative Adversarial Network)的一個(gè)重要組成部分。不過(guò)這家科技巨頭認(rèn)為當(dāng)前的技術(shù)還不夠完善。
在計(jì)算機(jī)生成的圖像中,仍有肉眼可見(jiàn)的幾處小瑕疵,然而這已經(jīng)算是邁出了人工智能發(fā)展道路的重要一步。微軟相信,未來(lái)該 AI 的改進(jìn)版本,可以作為一個(gè)繪圖助手,甚至根據(jù)電影劇本而創(chuàng)作動(dòng)畫(huà)電影。