阿里和微軟開發(fā)的AI模型在斯坦福閱讀測(cè)試中勝過人類

責(zé)任編輯：editor004 作者：宋星 |來源：企業(yè)網(wǎng)D1Net 2018-01-17 10:41:25 本文摘自：TechWeb.com.cn

1月16日消息，據(jù)國(guó)外媒體報(bào)道，阿里和微軟各自開發(fā)的AI（人工智能）模型，在日前舉行的斯坦福閱讀測(cè)試中勝過人類。

TIM圖片20180116095039

在上周進(jìn)行的測(cè)試中，參賽公司讓各自的人工智能系統(tǒng)解答斯坦福問答數(shù)據(jù)集(Stanford Question Answering Dataset)的提問，該數(shù)據(jù)集評(píng)估閱讀理解能力。計(jì)算機(jī)的答案被與普通人的答復(fù)進(jìn)行比較，然后據(jù)此排名。

該項(xiàng)測(cè)試提出的問題包括：“尼古拉特斯拉(Nikola Tesla)是什么種族的人”，以及“亞馬遜雨林有多大？”

斯坦福大學(xué)的測(cè)試題基于500多篇維基百科文章編制而成，旨在通過這套試題梳理出線索，看機(jī)器學(xué)習(xí)模型是否能夠在經(jīng)過大量信息處理后給出問題的確切答案。

這些題目所構(gòu)成的試卷被認(rèn)為是當(dāng)前世界檢測(cè)機(jī)器閱讀水平的最權(quán)威標(biāo)準(zhǔn)之一。

微軟和阿里巴巴開發(fā)的AI模型以微小優(yōu)勢(shì)勝出，在回答的精確匹配度上比人類的82.3%高出幾個(gè)基點(diǎn)。

阿里數(shù)據(jù)科學(xué)研究院的自然語言處理首席科學(xué)家Luo Si稱，這個(gè)勝利是一個(gè)里程碑，該技術(shù)有很多用途，包括客戶服務(wù)、博物館講解、醫(yī)療查詢，其中一些在全球范圍內(nèi)已經(jīng)由聊天機(jī)器人（chatbot）處理。

類似的技術(shù)已被用于買家提出的常見問題（比如“我的包裹在哪里？”）。在阿里的光棍購(gòu)物節(jié)期間，這類問題會(huì)大量涌入。

關(guān)鍵字：閱讀理解能力微軟