中國企業在全球機器閱讀理解水準測試折桂

據微軟官方公佈消息,最新的全球機器閱讀理解標準水準測試(MSMARCO)中,中國企業“猿輔導”名列第一,其數據模型在閱讀理解能力上超過了人類的平均水準。

 

圖片默認標題_fororder_猿輔導

 

“猿輔導”標誌

 

MSMARCO是全球人工智能領域行業中,公認的機器閱讀理解標準水準測試,也是該領域的頂級賽事。賽事舉辦目標是創造出能夠像人類一樣思考的機器,吸引世界頂尖科技公司的人工智能研究團隊參與。微軟公司從搜索引擎中抽取10萬個問題,然後由人類和參賽團隊數據模型進行答題。

 

參賽的“猿輔導”是國內一家在線教育創業公司。此次該企業研究團隊的MARS數據模型,答題在兩項官方評測指標上分別得分49.72、48.02,位列參賽團隊榜首,且超越人類47、46的基準水準。百度NLP團隊、微軟AI研究團隊分列二、三名。

 

“猿輔導”研究團隊武漢分部負責人柳景明表示,猿輔導此次提交的MARS模型,採用層疊式的注意力機制在多候選文檔,採樣出多個候選答案區域,並在此基礎上使用交叉投票模型,優化最終的答案,實現機器找出的答案比普通人找的更準確。

 

微軟全球機器閱讀理解標準水準測試項目負責人表示,人工智能得分超過人類,將意味著人工智能在探索和學習人類知識時,將能夠更快、更有效地獲取信息,“如果能讓機器像人類一樣閱讀和理解文檔,將為所有可能的情形開啟大門。”