![]()
圖片來源:圖片由編輯團(tuán)隊(duì)使用人工智能生成,僅供參考。
來源:https://techxplore.com/news/2026-05-humans-bad-complex-decisions-ai.html
當(dāng)羅列優(yōu)缺點(diǎn)不足以解決問題時(shí),康奈爾大學(xué)研究人員開發(fā)的一種新型決策工具可以利用人工智能來輔助做出艱難的決定。但其中有個(gè)特別之處:不是檢驗(yàn)人工智能的結(jié)論,而是人工智能檢驗(yàn)?zāi)恪?/p>
這款工具由康奈爾大學(xué)安·S·鮑爾斯計(jì)算機(jī)與信息科學(xué)學(xué)院計(jì)算機(jī)科學(xué)助理教授阿貝·戴維斯的實(shí)驗(yàn)室開發(fā),旨在幫助用戶對(duì)一系列選項(xiàng)進(jìn)行排序,例如求職者、研究生院,甚至是奧斯卡候選人。雖然最終決定由人做出,但該工具可以利用人工智能和優(yōu)化技術(shù),使過程更加高效、易于解釋且公平。
戴維斯說:“利用科技替我們做決定往往充滿風(fēng)險(xiǎn)。這項(xiàng)工作令人興奮的地方在于,我們不是讓科技替我們做決定,而是利用科技來幫助我們做出更好的決定。”
信息科學(xué)領(lǐng)域的博士生、該項(xiàng)新研究的第一作者張超在計(jì)算機(jī)協(xié)會(huì)人機(jī)交互系統(tǒng)會(huì)議 (CHI) 上發(fā)表了題為“交互式可解釋排名”的論文,并獲得了最佳論文獎(jiǎng)。
戴維斯在評(píng)估他計(jì)算機(jī)圖形學(xué)學(xué)生每年提交的數(shù)百個(gè)創(chuàng)意十足、開放式項(xiàng)目時(shí),萌生了開發(fā)這款工具的想法。即使制定了一套清晰的評(píng)分標(biāo)準(zhǔn),并安排了多名訓(xùn)練有素的助教對(duì)每份作業(yè)進(jìn)行評(píng)估,他的助教團(tuán)隊(duì)仍然難以確保評(píng)分標(biāo)準(zhǔn)的完全一致性。
“這真的讓我很困擾,”他說。“我們?nèi)绾尾拍芙⒁粋€(gè)更好、更具可擴(kuò)展性的評(píng)估流程呢?”
戴維斯指出,問題的根源在于一致性和偏見之間的矛盾。人們?cè)谥苯颖容^不同選項(xiàng)時(shí),比主觀地對(duì)多個(gè)選項(xiàng)進(jìn)行評(píng)分時(shí),更容易做出一致的決定。例如,問別人一盞燈是否比另一盞燈更亮,答案很容易回答。但如果讓他們用1到10的等級(jí)來評(píng)價(jià)每盞燈的亮度,答案可能千差萬別。
另一方面,這種一致性有時(shí)可能源于無意識(shí)的偏見,而這正是該工具旨在發(fā)現(xiàn)的問題。
戴維斯說:“我們要求用戶描述他們重視的事物,并根據(jù)不同的排名標(biāo)準(zhǔn)進(jìn)行加權(quán),然后找出價(jià)值觀和排名之間的矛盾之處。如果存在矛盾,用戶可以更改排名或嘗試用新的標(biāo)準(zhǔn)來解釋,但無論哪種方式,他們都必須對(duì)自己的選擇給出清晰一致的解釋。”
![]()
出處:2026 年人機(jī)交互系統(tǒng)會(huì)議論文集(2026)。DOI:10.1145/3772318.3790810
該工具的工作原理如下:假設(shè)有人正在決定買哪輛車。首先,用戶對(duì)幾個(gè)標(biāo)準(zhǔn)的重要性進(jìn)行排序——價(jià)格、可靠性、燃油效率。然后,該工具會(huì)要求用戶在幾組車型中做出選擇,以了解他們的偏好。工具會(huì)利用人工智能來確定要問哪些問題以及問題的順序。
如果僅基于標(biāo)稱值得出的排名與用戶實(shí)際偏好的車輛不符,該工具會(huì)突出顯示這些不一致之處。用戶可以調(diào)整每個(gè)標(biāo)準(zhǔn)的權(quán)重來糾正這種不符,或者該工具可以預(yù)測(cè)是否存在遺漏的因素。
或許用戶無意識(shí)地選擇了紅色汽車,而忽略了其他顏色更佳的選擇。在這種情況下,該工具可以向用戶展示這種偏好,以便他們調(diào)整排名或?qū)㈩伾鳛楦郊訕?biāo)準(zhǔn)。最終結(jié)果將是一個(gè)最優(yōu)且完全可解釋的最佳選擇。
用戶也可以在不適宜使用人工智能的敏感應(yīng)用場(chǎng)景中完全關(guān)閉人工智能功能。
張說:“這個(gè)項(xiàng)目最重要的部分之一不是用人工智能來替我們做決定,而是用人工智能來幫助我們思考我們想要什么。”
張和戴維斯通過兩項(xiàng)案例研究測(cè)試了該工具。首先,他們邀請(qǐng)四位參與者對(duì)一系列短片進(jìn)行排名。參與者表示,該工具幫助他們從憑直覺或情緒判斷影片,轉(zhuǎn)變?yōu)檫\(yùn)用具體標(biāo)準(zhǔn)進(jìn)行評(píng)判。
在第二個(gè)實(shí)驗(yàn)中,他們請(qǐng)四位助教對(duì)之前計(jì)算機(jī)圖形學(xué)課程中的十個(gè)學(xué)生項(xiàng)目進(jìn)行排名。最終排名結(jié)果與學(xué)生的最終成績(jī)一致,并且四位助教的排名結(jié)果高度一致,這表明該工具能夠提供準(zhǔn)確且可重復(fù)的評(píng)估結(jié)果。
戴維斯現(xiàn)在使用這款公開可用的決策工具來給他的課堂作業(yè)評(píng)分——但人工智能功能是關(guān)閉的。
“這是針對(duì)那些事關(guān)重大的決策而言的,”他說,“做出更好決策的價(jià)值值得付出額外的努力。”
閱讀最新前沿科技趨勢(shì)報(bào)告,請(qǐng)?jiān)L問21世紀(jì)關(guān)鍵技術(shù)研究院的“未來知識(shí)庫”
![]()
未來知識(shí)庫是 “21世紀(jì)關(guān)鍵技術(shù)研究院”建 立的在線知識(shí)庫平臺(tái),收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級(jí)智能,數(shù)智大腦、能源、軍事、經(jīng)濟(jì)、人類風(fēng)險(xiǎn)等等領(lǐng)域的前沿進(jìn)展與未來趨勢(shì)。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進(jìn)入。
截止到2月28日 ”未來知識(shí)庫”精選的百部前沿科技趨勢(shì)報(bào)告
(加入未來知識(shí)庫,全部資料免費(fèi)閱讀和下載)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.