亚洲福利视频网站_亚洲美女av黄_91蜜桃婷婷狠狠久久综合9色_日韩一区二区电影在线

天津都市網(wǎng)-天津都市門戶網(wǎng)站 歡迎您!

?

人工智能的崛起:智商測試得分超過四歲兒童

正有 0 人評(píng)論 我來說兩句

2015年10月31日 21:46  來源:

研究人員最近對(duì)一個(gè)名叫ConceptNet的人工智能系統(tǒng)進(jìn)行了測評(píng)。在一項(xiàng)為檢測兒童智商而設(shè)計(jì)的測中,ConceptNet的得分超過了一名智商正常的四歲兒童。該測試共包含五項(xiàng)與詞語推理和詞匯有關(guān)的測驗(yàn),ConceptNet的總得分為69分,與之進(jìn)行對(duì)比的學(xué)齡前兒童得分則為50分。并且專家認(rèn)為,該系統(tǒng)的智能程度還會(huì)進(jìn)一步加強(qiáng)。

在測試過程中,試題會(huì)通過語言處理工具轉(zhuǎn)換成ConceptNet 4能夠理解的語言,如“我們?yōu)槭裁匆帐郑?rdquo;、“我們?yōu)槭裁匆谙奶齑魈栫R?”和“為什么將刀子放入嘴中是不好的行為?”等等。

新浪科技訊 北京時(shí)間10月31日消息,如果你本來就擔(dān)心自己的工作有一天會(huì)被機(jī)器人取而代之,那么下面這則來自麻省理工學(xué)院的最新消息可能會(huì)讓你更加惶恐。

研究人員最近對(duì)一個(gè)名叫ConceptNet的人工智能系統(tǒng)進(jìn)行了測評(píng)。在一項(xiàng)為檢測兒童智商而設(shè)計(jì)的測試中,ConceptNet的得分超過了一名智商正常的四歲兒童。

該測試共包含五項(xiàng)與詞語推理和詞匯有關(guān)的測驗(yàn),ConceptNet的總得分為69分,與之進(jìn)行對(duì)比的學(xué)齡前兒童得分則為50分。并且專家認(rèn)為,該系統(tǒng)的智能程度還會(huì)進(jìn)一步加強(qiáng)。

ConceptNet是一項(xiàng)由麻省理工學(xué)院常識(shí)計(jì)算計(jì)劃團(tuán)隊(duì)(MIT Common Sense Computing Initiative)管理的開源項(xiàng)目。該團(tuán)隊(duì)研發(fā)的ConceptNet 4運(yùn)用了所謂的“關(guān)系”這一概念。例如,當(dāng)讓該系統(tǒng)解釋什么是“小鹿”時(shí),它會(huì)明白“小鹿是一種鹿”,而不是”鹿是一種小鹿“。也就是說,它能夠理解這種動(dòng)物的概念,以及“小鹿”和“鹿”這兩個(gè)詞匯和概念之間的關(guān)系。同時(shí),該系統(tǒng)還可以使用所謂的“對(duì)立標(biāo)記”表示負(fù)相關(guān)關(guān)系,比如“企鵝不會(huì)飛”等。

研究人員讓ConceptNet 4參與了“韋克斯勒學(xué)齡前兒童智力量表”測試(WPPSI-III),并將研究結(jié)果發(fā)表在論文《Measuring an Artificial Intelligence System's Performance on a Verbal IQ Test For Young Children》上。WPPSI-III測試包含14項(xiàng)測驗(yàn)項(xiàng)目,以及一份針對(duì)操作智商和言語智商的完整評(píng)估表。

在對(duì)單項(xiàng)測試計(jì)分時(shí),研究人員先使用每道題目得分最高的答案計(jì)分,然后再使用每道題目得分最高的前五個(gè)答案中最好的答案計(jì)分。他們將前者稱為“嚴(yán)格計(jì)分”,后者稱為“放松計(jì)分”。圖中左側(cè)為ConceptNet得分,右側(cè)為受測兒童得分。

操作智商測驗(yàn)通常會(huì)要求受測人完成繪畫、解謎、記憶等任務(wù)。言語智商測驗(yàn)則會(huì)考察兒童的詞語推理、詞匯及理解能力。每種智商得分的平均分都為100分。本次研究則主要針對(duì)言語智商進(jìn)行測試。

在測試過程中,試題會(huì)通過語言處理工具轉(zhuǎn)換成ConceptNet 4能夠理解的語言,如“我們?yōu)槭裁匆帐郑?rdquo;、“我們?yōu)槭裁匆谙奶齑魈栫R?”和“為什么將刀子放入嘴中是不好的行為?”等等。

該研究由芝加哥大學(xué)的斯特蘭?奧爾森(Stellan Ohlsson)帶領(lǐng)。在對(duì)單項(xiàng)測試計(jì)分時(shí),研究人員先使用每道題目得分最高的答案計(jì)分,然后再使用每道題目得分最高的前五個(gè)答案中最好的答案計(jì)分。他們將前者稱為“嚴(yán)格計(jì)分”,后者稱為“放松計(jì)分”。

在“信息”測試中,ConceptNet得到了20分,而同時(shí)參加測試的四歲兒童通過轉(zhuǎn)換后的得分為10分。這名兒童在詞語推理和理解上得分更高,均為7分,而ConceptNet在這兩項(xiàng)上的得分分別為2和3分。此外,ConceptNet表現(xiàn)出了更豐富的詞匯量,詞匯得分為20分,而兒童得分為13分。

“ConceptNet系統(tǒng)的得分與四歲兒童相仿,但低于五至七歲兒童的平均得分,”研究人員解釋道,“該系統(tǒng)在每個(gè)單項(xiàng)中得分差異很大,說明還有改進(jìn)的空間。在所有測試中,‘理解’是最關(guān)乎人類常識(shí)的測試項(xiàng)目。得分差異大、常識(shí)方面表現(xiàn)一般,這說明ConceptNet尚不具有四歲兒童的語言能力。但本次研究說明,兒童智商測試可以為人工智能系統(tǒng)的評(píng)估和比較提供一種客觀的度量手段。”

ConceptNet是一項(xiàng)由麻省理工學(xué)院常識(shí)計(jì)算計(jì)劃團(tuán)隊(duì)(MIT Common Sense Computing Initiative)管理的開源項(xiàng)目。該團(tuán)隊(duì)研發(fā)的ConceptNet 4運(yùn)用了所謂的“關(guān)系”這一概念。例如,當(dāng)讓該系統(tǒng)解釋什么是“小鹿”時(shí),它會(huì)明白“小鹿是一種鹿”,而不是”鹿是一種小鹿“。也就是說,它能夠理解這種動(dòng)物的概念,以及“小鹿”和“鹿”這兩個(gè)詞匯和概念之間的關(guān)系。

“此外,許多由ConceptNet給出的錯(cuò)誤答案和兒童給出的錯(cuò)誤答案不僅相去甚遠(yuǎn),而且違反常識(shí)。”

例如,在關(guān)于“獅子”的詞語推理測驗(yàn)中,該AI系統(tǒng)和首測兒童被給予三條線索——“雄性長著鬃毛”,“該動(dòng)物生活在非洲”,以及“它是一種體型很大的棕黃色貓科動(dòng)物”。

由ConceptNet給出的排名前五的答案按順序排列為:狗,農(nóng)場,生物,家庭,貓。

研究團(tuán)隊(duì)解釋道,“生物”和“貓”尚且還能與“獅子”沾邊,但其它的答案就明顯有悖于常識(shí)了。

“按照常識(shí),受測者應(yīng)該至少能將答案限制在動(dòng)物的范圍內(nèi),同時(shí)能做出簡單的推理:“既然線索說它是貓科動(dòng)物,那只有貓科動(dòng)物能夠被列入考慮范圍。”

該論文被發(fā)表在期刊《arXiv》上,共同作者包括羅伯特?斯隆(Robert Sloan)、捷爾吉?圖蘭(Gy?rgy Turán)和阿隆?尤拉斯基(Aaron Urasky)。

ConceptNet系統(tǒng)的得分與四歲兒童相仿,但低于五至七歲兒童的平均得分。這說明該系統(tǒng)并不具備“四歲兒童”的語言能力,但可以為評(píng)估類似系統(tǒng)提供指導(dǎo)方法。

測試方法

研究人員讓ConceptNet 4參與了“韋克斯勒學(xué)齡前兒童智力量表”測試(WPPSI-III),并將研究結(jié)果發(fā)表在論文《Measuring an Artificial Intelligence System's Performance on a Verbal IQ Test For Young Children》上。WPPSI-III測試包含14項(xiàng)測驗(yàn)項(xiàng)目,以及一份針對(duì)操作智商和言語智商的完整評(píng)估表。

操作智商測驗(yàn)通常會(huì)要求受測人完成繪畫、解謎、記憶等任務(wù)。言語智商測驗(yàn)則會(huì)考察兒童的詞語推理、詞匯及理解能力。每種智商得分的平均分都為100分。本次研究則主要針對(duì)言語智商進(jìn)行測試。

在測試過程中,試題會(huì)通過語言處理工具轉(zhuǎn)換成ConceptNet 4能夠理解的語言,如“我們?yōu)槭裁匆帐郑?rdquo;、“我們?yōu)槭裁匆谙奶齑魈栫R?”和“為什么將刀子放入嘴中是不好的行為?”等等。

該研究由芝加哥大學(xué)的斯特蘭?奧爾森(Stellan Ohlsson)帶領(lǐng)。在對(duì)單項(xiàng)測試計(jì)分時(shí),研究人員先使用每道題目得分最高的答案計(jì)分,然后再使用每道題目得分最高的前五個(gè)答案中最好的答案計(jì)分。他們將前者稱為“嚴(yán)格計(jì)分”,后者稱為“放松計(jì)分”。

什么是ConceptNet

ConceptNet是一項(xiàng)由麻省理工學(xué)院常識(shí)計(jì)算計(jì)劃團(tuán)隊(duì)(MIT Common Sense Computing Initiative)管理的開源項(xiàng)目。該團(tuán)隊(duì)研發(fā)的ConceptNet 4運(yùn)用了所謂的“關(guān)系”這一概念。

例如,當(dāng)讓該系統(tǒng)解釋什么是“小鹿”時(shí),它會(huì)明白“小鹿是一種鹿”,而不是”鹿是一種小鹿“。也就是說,它能夠理解這種動(dòng)物的概念,以及“小鹿”和“鹿”這兩個(gè)詞匯和概念之間的關(guān)系。

同時(shí),該系統(tǒng)還可以使用所謂的“對(duì)立標(biāo)記”表示負(fù)相關(guān)關(guān)系,比如“企鵝不會(huì)飛”等。(葉子)

查看所有評(píng)論正有(0)人在評(píng)論

網(wǎng)友評(píng)論僅供網(wǎng)友表達(dá)個(gè)人看法,并不表明本網(wǎng)同意其觀點(diǎn)或證實(shí)其描述

驗(yàn)證碼: 驗(yàn)證碼,看不清楚?請(qǐng)點(diǎn)擊刷新驗(yàn)證碼 換一張
?
主站蜘蛛池模板: 激情综合网婷婷| 午夜精品一区二区三区在线| 午夜一区二区三区| 欧美激情国产日韩| 91国产在线播放| 丁香六月激情婷婷| 国产一区二区精品免费| 日韩欧美精品久久| 日韩免费一区二区三区| 色综合久久天天综线观看| 91精品国产一区| 国产极品精品在线观看| 国产成人精品综合久久久| 久久久久国产精品熟女影院| 欧美综合国产精品久久丁香| 欧美亚洲另类在线一区二区三区| 欧美一区二区三区精品电影| 欧美在线中文字幕| 欧美日韩精品综合| 久久久亚洲国产| 黄色片视频在线播放| 国产精品在线看| 国产精品久久久久av免费| 97精品在线观看| 久久亚洲精品网站| 国产av不卡一区二区| 高清av免费一区中文字幕| 777午夜精品福利在线观看 | 精品一区二区不卡| 国产精品视频二| 中文字幕日韩精品一区二区| 国产精品91久久| 日韩免费一区二区三区| 丁香六月激情婷婷| 久久五月天综合| 色天天综合狠狠色| 国产精品大片wwwwww| 欧美专区在线视频| 亚洲欧美日韩精品在线| 国外色69视频在线观看| 一区二区三区四区欧美日韩|