網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

人類不擅長(zhǎng)做出復(fù)雜的決策。人工智能可以指出這些錯(cuò)誤。

2026-05-15 16:11:41　來源: 人工智能學(xué)家

北京舉報(bào)

分享至

圖片來源：圖片由編輯團(tuán)隊(duì)使用人工智能生成，僅供參考。

來源：https://techxplore.com/news/2026-05-humans-bad-complex-decisions-ai.html

當(dāng)羅列優(yōu)缺點(diǎn)不足以解決問題時(shí)，康奈爾大學(xué)研究人員開發(fā)的一種新型決策工具可以利用人工智能來輔助做出艱難的決定。但其中有個(gè)特別之處：不是檢驗(yàn)人工智能的結(jié)論，而是人工智能檢驗(yàn)?zāi)恪?/p>

這款工具由康奈爾大學(xué)安·S·鮑爾斯計(jì)算機(jī)與信息科學(xué)學(xué)院計(jì)算機(jī)科學(xué)助理教授阿貝·戴維斯的實(shí)驗(yàn)室開發(fā)，旨在幫助用戶對(duì)一系列選項(xiàng)進(jìn)行排序，例如求職者、研究生院，甚至是奧斯卡候選人。雖然最終決定由人做出，但該工具可以利用人工智能和優(yōu)化技術(shù)，使過程更加高效、易于解釋且公平。

戴維斯說：“利用科技替我們做決定往往充滿風(fēng)險(xiǎn)。這項(xiàng)工作令人興奮的地方在于，我們不是讓科技替我們做決定，而是利用科技來幫助我們做出更好的決定。”

信息科學(xué)領(lǐng)域的博士生、該項(xiàng)新研究的第一作者張超在計(jì)算機(jī)協(xié)會(huì)人機(jī)交互系統(tǒng)會(huì)議 (CHI) 上發(fā)表了題為“交互式可解釋排名”的論文，并獲得了最佳論文獎(jiǎng)。

戴維斯在評(píng)估他計(jì)算機(jī)圖形學(xué)學(xué)生每年提交的數(shù)百個(gè)創(chuàng)意十足、開放式項(xiàng)目時(shí)，萌生了開發(fā)這款工具的想法。即使制定了一套清晰的評(píng)分標(biāo)準(zhǔn)，并安排了多名訓(xùn)練有素的助教對(duì)每份作業(yè)進(jìn)行評(píng)估，他的助教團(tuán)隊(duì)仍然難以確保評(píng)分標(biāo)準(zhǔn)的完全一致性。

“這真的讓我很困擾，”他說。“我們?nèi)绾尾拍芙⒁粋€(gè)更好、更具可擴(kuò)展性的評(píng)估流程呢？”

戴維斯指出，問題的根源在于一致性和偏見之間的矛盾。人們?cè)谥苯颖容^不同選項(xiàng)時(shí)，比主觀地對(duì)多個(gè)選項(xiàng)進(jìn)行評(píng)分時(shí)，更容易做出一致的決定。例如，問別人一盞燈是否比另一盞燈更亮，答案很容易回答。但如果讓他們用1到10的等級(jí)來評(píng)價(jià)每盞燈的亮度，答案可能千差萬別。

另一方面，這種一致性有時(shí)可能源于無意識(shí)的偏見，而這正是該工具旨在發(fā)現(xiàn)的問題。

戴維斯說：“我們要求用戶描述他們重視的事物，并根據(jù)不同的排名標(biāo)準(zhǔn)進(jìn)行加權(quán)，然后找出價(jià)值觀和排名之間的矛盾之處。如果存在矛盾，用戶可以更改排名或嘗試用新的標(biāo)準(zhǔn)來解釋，但無論哪種方式，他們都必須對(duì)自己的選擇給出清晰一致的解釋。”

出處：2026 年人機(jī)交互系統(tǒng)會(huì)議論文集(2026)。DOI：10.1145/3772318.3790810

該工具的工作原理如下：假設(shè)有人正在決定買哪輛車。首先，用戶對(duì)幾個(gè)標(biāo)準(zhǔn)的重要性進(jìn)行排序——價(jià)格、可靠性、燃油效率。然后，該工具會(huì)要求用戶在幾組車型中做出選擇，以了解他們的偏好。工具會(huì)利用人工智能來確定要問哪些問題以及問題的順序。

如果僅基于標(biāo)稱值得出的排名與用戶實(shí)際偏好的車輛不符，該工具會(huì)突出顯示這些不一致之處。用戶可以調(diào)整每個(gè)標(biāo)準(zhǔn)的權(quán)重來糾正這種不符，或者該工具可以預(yù)測(cè)是否存在遺漏的因素。

或許用戶無意識(shí)地選擇了紅色汽車，而忽略了其他顏色更佳的選擇。在這種情況下，該工具可以向用戶展示這種偏好，以便他們調(diào)整排名或?qū)㈩伾鳛楦郊訕?biāo)準(zhǔn)。最終結(jié)果將是一個(gè)最優(yōu)且完全可解釋的最佳選擇。

用戶也可以在不適宜使用人工智能的敏感應(yīng)用場(chǎng)景中完全關(guān)閉人工智能功能。

張說：“這個(gè)項(xiàng)目最重要的部分之一不是用人工智能來替我們做決定，而是用人工智能來幫助我們思考我們想要什么。”

張和戴維斯通過兩項(xiàng)案例研究測(cè)試了該工具。首先，他們邀請(qǐng)四位參與者對(duì)一系列短片進(jìn)行排名。參與者表示，該工具幫助他們從憑直覺或情緒判斷影片，轉(zhuǎn)變?yōu)檫\(yùn)用具體標(biāo)準(zhǔn)進(jìn)行評(píng)判。

在第二個(gè)實(shí)驗(yàn)中，他們請(qǐng)四位助教對(duì)之前計(jì)算機(jī)圖形學(xué)課程中的十個(gè)學(xué)生項(xiàng)目進(jìn)行排名。最終排名結(jié)果與學(xué)生的最終成績(jī)一致，并且四位助教的排名結(jié)果高度一致，這表明該工具能夠提供準(zhǔn)確且可重復(fù)的評(píng)估結(jié)果。

戴維斯現(xiàn)在使用這款公開可用的決策工具來給他的課堂作業(yè)評(píng)分——但人工智能功能是關(guān)閉的。

“這是針對(duì)那些事關(guān)重大的決策而言的，”他說，“做出更好決策的價(jià)值值得付出額外的努力。”

閱讀最新前沿科技趨勢(shì)報(bào)告，請(qǐng)?jiān)L問21世紀(jì)關(guān)鍵技術(shù)研究院的“未來知識(shí)庫”

未來知識(shí)庫是 “21世紀(jì)關(guān)鍵技術(shù)研究院”建立的在線知識(shí)庫平臺(tái)，收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級(jí)智能，數(shù)智大腦、能源、軍事、經(jīng)濟(jì)、人類風(fēng)險(xiǎn)等等領(lǐng)域的前沿進(jìn)展與未來趨勢(shì)。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進(jìn)入。

截止到2月28日 ”未來知識(shí)庫”精選的百部前沿科技趨勢(shì)報(bào)告

（加入未來知識(shí)庫，全部資料免費(fèi)閱讀和下載）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.