国产精品原创巨作av,亚洲免费视频在线,欧美一级片在线视频

亞馬遜推出AWS Inferentia芯片專門用于部署帶有GPU的大型AI模型

責(zé)任編輯：zsheng

2018-12-03 20:02:29

摘自：電子發(fā)燒友網(wǎng)

亞馬遜宣布推出Inferentia，這是由AWS設(shè)計(jì)的芯片，專門用于部署帶有GPU的大型AI模型，該芯片將于明年推出。

Inferentia將與TensorFlow和PyTorch等主要框架協(xié)同工作，并與EC2實(shí)例類型和亞馬遜的機(jī)器學(xué)習(xí)服務(wù)SageMaker兼容。

“你將能夠在每個(gè)芯片上獲得數(shù)百個(gè)TOPS; 如果你愿意的話，你可以將它們捆綁在一起以獲得數(shù)千個(gè)TOPS，“AWS首席執(zhí)行官Andy Jassy今天在年度re：Invent會(huì)議上表示。

Inferentia還將與Elastic Inference合作，這是一種加速使用GPU芯片部署AI的方法，這也是今天宣布的。

彈性推理適用于1到32 teraflops的數(shù)據(jù)范圍。Inferentia檢測(cè)主要框架何時(shí)與EC2實(shí)例一起使用，然后查看神經(jīng)網(wǎng)絡(luò)的哪些部分將從加速中受益最多; 然后將這些部分移動(dòng)到彈性推理以提高效率。

Jassy說(shuō)，今天推出AI模型所需的兩個(gè)主要流程是培訓(xùn)和推理，推理占了近90%的成本。

“我們認(rèn)為運(yùn)營(yíng)成本可以通過(guò)Elastic Inference節(jié)省75%的成本，如果你將Inferentia放在其上，這是成本的另一個(gè)10倍的提升，所以這是一個(gè)重大的改變游戲規(guī)則，這兩個(gè)推出推斷我們的客戶，“他說(shuō)。

Inferentia的發(fā)布是在周一首次亮相的一款芯片之后由AWS專門用于執(zhí)行通用工作流程。

Inferentia和Elastic Inference的首次亮相是今天發(fā)布的幾個(gè)AI相關(guān)公告之一。今天還宣布：推出AWS市場(chǎng)，供開發(fā)人員銷售他們的AI模型，以及DeepRacer League和AWS DeepRacer汽車的推出，該汽車在模擬環(huán)境中使用強(qiáng)化學(xué)習(xí)訓(xùn)練的AI模型上運(yùn)行。

今天預(yù)覽中還提供了許多不需要預(yù)先知道如何構(gòu)建或訓(xùn)練AI模型的服務(wù)，包括Textract用于從文檔中提取文本，Personalize用于客戶建議，以及Amazon Forecast，這是一種生成私有預(yù)測(cè)模型的服務(wù)。

部署芯片 AWS 亞馬遜