AI心理推斷能力或與人類(lèi)相當 但不意味著(zhù)它們有像人那樣的情商

  來(lái)源:科技日報張夢(mèng)然2024-05-23
打印本文
核心提示:科技日報北京5月22日電 (記者張夢(mèng)然)新一期《自然·人類(lèi)行為》發(fā)表論文顯示,在測試追蹤他人心理狀態(tài)能力——也稱(chēng)心智理論(Theory of Mind)的任務(wù)中,兩類(lèi)大語(yǔ)言模型(

科技日報北京5月22日電 (記者張夢(mèng)然)新一期《自然·人類(lèi)行為》發(fā)表論文顯示,在測試追蹤他人心理狀態(tài)能力——也稱(chēng)心智理論(Theory of Mind)的任務(wù)中,兩類(lèi)大語(yǔ)言模型(LLM)在特定情況下的表現與人類(lèi)相似,甚至更好。

心智理論對人類(lèi)社交互動(dòng)十分重要,是人類(lèi)溝通交流和產(chǎn)生共鳴的關(guān)鍵。之前的研究表明,LLM這類(lèi)人工智能(AI)可以解決復雜的認知任務(wù),如多選決策。不過(guò),人們一直不清楚LLM在心智理論任務(wù)(被認為是人類(lèi)獨有的能力)中的表現是否也能比肩人類(lèi)。

此次,德國漢堡—埃彭多夫大學(xué)醫學(xué)中心團隊選擇了能測試心智理論不同方面的任務(wù),包括發(fā)現錯誤想法、理解間接言語(yǔ)以及識別失禮。他們隨后比較了1907人與兩個(gè)熱門(mén)LLM家族——GPT和LLaMA2模型完成任務(wù)的能力。

團隊發(fā)現,GPT模型在識別間接要求、錯誤想法和誤導方面的表現能達到甚至超越人類(lèi)平均水平,而LLaMA2的表現遜于人類(lèi)水平;在識別失禮方面,LLaMA2強于人類(lèi)但GPT表現不佳。研究人員指出,LLaMA2的成功是因為回答的偏見(jiàn)程度較低,而不是因為真的對失禮敏感;GPT看起來(lái)的失利,其實(shí)是因為對堅持結論的超保守態(tài)度,而不是因為推理錯誤。

研究團隊認為,LLM在心智理論任務(wù)上的表現堪比人類(lèi),不等于它們具有人類(lèi)般的“情商”,也不意味著(zhù)它們能掌握心智理論。但他們也指出,這些結果是未來(lái)研究的重要基礎,并建議進(jìn)一步研究LLM在心理推斷上的表現,以及這些表現會(huì )如何影響人類(lèi)在人機交互中的認知。

【總編輯圈點(diǎn)】

情商,就是情緒智力,主要是指人在情緒、情感、意志、耐受挫折等方面的品質(zhì)。有時(shí)候,我們不知道如何回復上司的一句“辛苦了”,親戚的一句“你這工作能掙多少”,也會(huì )求助大模型,希望這凝聚了人類(lèi)智慧的語(yǔ)言模型能給出一些緩解尷尬或令人愉悅的建議。但大模型有情商嗎?大模型可以表現出有情商的樣子,但它顯然無(wú)法揣測人心的幽微之處,也無(wú)法體會(huì )出所謂話(huà)外有話(huà),這些獨屬于人類(lèi)社交互動(dòng)的復雜之處,大模型還需要進(jìn)一步學(xué)習。

(編輯:映雪)

AI心理推斷能力或與人類(lèi)相當 但不意味著(zhù)它們有像人那樣的情商

 
[責任編輯: 315xwsy_susan]

免責聲明:

1、本網(wǎng)內容凡注明"來(lái)源:315記者攝影家網(wǎng)"的所有文字、圖片和音視頻資料,版權均屬315記者攝影家網(wǎng)所有,轉載、下載須通知本網(wǎng)授權,不得商用,在轉載時(shí)必須注明"稿件來(lái)源:315記者攝影家網(wǎng)",違者本網(wǎng)將依法追究責任。
2、本文系本網(wǎng)編輯轉載,轉載出于研究學(xué)習之目的,為北京正念正心國學(xué)文化研究院藝術(shù)學(xué)研究、宗教學(xué)研究、教育學(xué)研究、文學(xué)研究、新聞學(xué)與傳播學(xué)研究、考古學(xué)研究的研究員研究學(xué)習,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責。
3、如涉及作品、圖片等內容、版權和其它問(wèn)題,請作者看到后一周內來(lái)電或來(lái)函聯(lián)系刪除。