<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      MIT團隊用AI檢驗AI:AI給出的“最優解”真的公平嗎?

      0
      分享至


      (來源:麻省理工科技評論)

      AI 正越來越多地被用于輔助高風險場景下的決策。比如一個自主系統可以找出一種電力分配策略,在保持電壓穩定的前提下把成本降到最低。

      這些由 AI 給出的方案雖然在技術上可能是最優的,它們真的公平嗎?如果一個低成本的電力分配策略讓條件不佳的社區比高收入地區更容易遭遇停電,這算不算問題?

      為了幫助相關方在 AI 系統部署之前就能快速發現潛在的倫理困境,MIT 的研究人員開發了一套自動化評估方法。這套方法的目標是在可量化指標(比如成本或穩定性)與那些定性或主觀的價值(比如公平性)之間找到平衡。

      該系統把客觀評估與用戶定義的人類價值觀分開處理,使用一個大語言模型作為“人類代理”來捕捉和整合相關方的偏好。

      這套自適應框架會挑選出最值得進一步評估的場景,從而簡化原本需要耗費大量人力和時間的手工流程。這些測試用例既能展示自動系統與人類價值觀高度吻合的情況,也能揭示那些意外偏離倫理標準的情境。

      “我們可以給 AI 系統加上很多規則和護欄,但這些防護只能攔住我們事先能想到的那些風險。不能因為 AI 是在這些數據上訓練過的,就覺得讓它直接上崗就行。我們想做的是找到一種更系統的方法,把那些‘未知的未知’提前挖出來,在壞事發生之前就預判到它。”論文的通訊作者、MIT 航空航天系(AeroAstro)副教授、MIT 信息與決策系統實驗室(LIDS)首席研究員范楚楚(Chuchu Fan)說。

      論文的第一作者是機械工程系研究生安嘉麗·帕拉沙爾(Anjali Parashar),合著者包括 AeroAstro 博士后 Yingke Li,以及 MIT 和薩博公司(Saab)的其他研究人員。該研究將在國際學習表征大會(ICLR)上發表。



      為倫理打分

      在電網這樣的大型系統里,要全面評估 AI 推薦方案是否符合倫理,兼顧所有目標,是一件特別困難的事。

      大多數測試框架依賴預先收集的數據,但涉及主觀倫理標準的標注數據往往很難拿到。另外,倫理價值觀和 AI 系統本身都在不斷變化,基于成文規則或監管文件的靜態評估方法需要頻繁更新。

      范楚楚和她的團隊從另一個角度切入這個問題。他們借鑒了自己之前在機器人系統評估方面的工作,開發出一套實驗設計框架,專門用來識別那些最有信息量的場景,供人類相關方進一步仔細評估。

      這套由兩部分組成的系統叫做 SEED-SET(Scalable Experimental Design for System-level Ethical Testing,系統級倫理測試的可擴展實驗設計),結合了量化指標與倫理標準。它既能識別出那些既滿足可量化要求、又符合人類價值觀的場景,也能找出反過來的情況。

      “我們不想把所有資源都花在隨機評估上。所以關鍵是讓框架聚焦在我們最關心的那些測試用例上,”Yingke Li 說。

      SEED-SET 的一個重要優勢是:它不需要預先存在的評估數據,而且可以適配多個目標。以一個電網為例,它可能有多個用戶群體,比如一個較大的農村社區和一個數據中心。兩類用戶都希望電力便宜又可靠,但從倫理角度看,他們各自的優先級可能差異很大。

      這些倫理標準往往沒有明確定義,因此無法用分析方法直接度量。電網運營方想要找到一種最具成本效益的策略,同時盡可能滿足所有相關方的主觀倫理偏好。

      SEED-SET 應對這個挑戰的方法是把問題拆成兩層,按層級結構處理。第一層是客觀模型,評估系統在成本等具體指標上的表現;第二層是主觀模型,在客觀評估的基礎上,考慮相關方的判斷,比如他們感受到的公平程度。

      “我們方法中客觀的那一部分對應的是 AI 系統,主觀的那一部分對應的是評估它的用戶。通過以層級方式拆解偏好,我們可以用更少的評估次數生成理想的場景,”帕拉沙爾說。



      把主觀評價編碼進來

      為了完成主觀評估,系統用一個大語言模型來替代人類評估者。研究人員把每個用戶群體的偏好編碼成自然語言提示詞交給模型,大語言模型按照這些指令對兩個場景進行比較,根據倫理標準選出更合意的那個。

      “一個人類評估者在看過幾百甚至幾千個場景之后會疲勞,評估也會變得不一致,所以我們用基于大語言模型的策略來代替,”帕拉沙爾解釋說。SEED-SET 會用選出的場景來模擬整個系統(在這個例子里就是電力分配策略)。模擬結果又會反過來引導系統去尋找下一個最值得測試的候選場景。

      最終,SEED-SET 能智能地篩選出最具代表性的場景,無論是那些同時達標客觀指標和倫理標準的場景,還是那些明顯偏離的場景。用戶可以據此分析 AI 系統的表現,并調整它的策略。

      舉個例子,SEED-SET 能精準找出那些在用電高峰期優先保障高收入區域、讓條件較差的社區更容易停電的電力分配方案。

      為了測試 SEED-SET,研究人員對若干真實的自主系統做了評估,包括一個 AI 驅動的電網和一個城市交通調度系統。他們測量了所生成的場景與倫理標準的吻合程度。在相同時間里,該系統生成的最優測試用例數量超過了基準方法的兩倍,還發現了許多其他方法忽略的場景。

      “當我們改變用戶偏好時,SEED-SET 生成的場景集合也會發生明顯變化。這說明評估策略對用戶的偏好反應靈敏,”帕拉沙爾說。

      要驗證 SEED-SET 在實際應用中的價值,研究人員還需要開展一項用戶研究,看看它生成的場景能不能幫助真實的決策過程。

      除了這項用戶研究,研究人員還計劃探索使用更高效的模型,把這套方法擴展到規模更大、評估標準更多的問題上,比如用來評估大語言模型自己的決策過程。

      https://news.mit.edu/2026/evaluating-autonomous-systems-ethics-0402

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      她是留美碩士,后官至副國級,享年106歲,曾以八個字評價毛主席

      她是留美碩士,后官至副國級,享年106歲,曾以八個字評價毛主席

      興趣知識
      2026-05-01 19:49:37
      五一檔電影:10間敢死隊全差評,寒戰1994拉胯,沒想到這部爆冷

      五一檔電影:10間敢死隊全差評,寒戰1994拉胯,沒想到這部爆冷

      往史過眼云煙
      2026-05-01 19:28:30
      中方不得不投出棄權票

      中方不得不投出棄權票

      第一財經資訊
      2026-05-01 17:17:06
      湖人隊里夫斯在G5復出后,是否會和東契奇在G6打火箭隊傷病名單?

      湖人隊里夫斯在G5復出后,是否會和東契奇在G6打火箭隊傷病名單?

      好火子
      2026-05-01 23:42:46
      15年前在“中國黃金”買的20克金條,檢測發現僅有9克且不含一點黃金……女子呼吁:快檢查家中投資金條;商場回應

      15年前在“中國黃金”買的20克金條,檢測發現僅有9克且不含一點黃金……女子呼吁:快檢查家中投資金條;商場回應

      深圳晚報
      2026-05-01 22:52:48
      25歲南開大學研究生李一帆確診癌癥,身高1米8長得帥,體重僅70斤

      25歲南開大學研究生李一帆確診癌癥,身高1米8長得帥,體重僅70斤

      閱微札記
      2026-04-25 09:03:45
      弘一法師:當你開始冷漠、獨來獨往、殺伐果斷——恭喜,你重生了

      弘一法師:當你開始冷漠、獨來獨往、殺伐果斷——恭喜,你重生了

      杏花煙雨江南的碧園
      2026-04-30 13:15:03
      快訊!俄羅斯正式宣布了!

      快訊!俄羅斯正式宣布了!

      達文西看世界
      2026-05-01 08:55:14
      不看歐冠看英甲?瓜帥打趣:巴黎vs拜仁是一場災難級的比賽

      不看歐冠看英甲?瓜帥打趣:巴黎vs拜仁是一場災難級的比賽

      懂球帝
      2026-05-01 20:05:08
      兩度離婚+生死手術!墨菲坎坷人生揭秘,與奧沙利文恩怨塵封數十年

      兩度離婚+生死手術!墨菲坎坷人生揭秘,與奧沙利文恩怨塵封數十年

      夢憶之淺
      2026-05-01 10:17:07
      俄羅斯前10大煉油廠停產5個!彼爾姆石油樞紐遭受重創

      俄羅斯前10大煉油廠停產5個!彼爾姆石油樞紐遭受重創

      項鵬飛
      2026-04-29 19:13:54
      1978年起陳云地位迅速上升,跨越多級“臺階”,背后原因何在

      1978年起陳云地位迅速上升,跨越多級“臺階”,背后原因何在

      鶴羽說個事
      2026-04-30 22:47:23
      中方表示遺憾,不得不投棄權票

      中方表示遺憾,不得不投棄權票

      極目新聞
      2026-05-01 13:03:40
      “零關稅”生效第一天,24噸南非蘋果連夜來了,中國向非洲敞開的不只是市場

      “零關稅”生效第一天,24噸南非蘋果連夜來了,中國向非洲敞開的不只是市場

      上觀新聞
      2026-05-01 13:21:07
      五糧液在為誰擦屁股?

      五糧液在為誰擦屁股?

      不正確
      2026-05-01 20:54:58
      徐帆澄清離婚僅8個月,馮小剛近況曝出,曾和養女徐朵貼臉引爭

      徐帆澄清離婚僅8個月,馮小剛近況曝出,曾和養女徐朵貼臉引爭

      南方城市網
      2026-05-01 23:14:46
      實力說話!澤連斯基態度突變非常強勢

      實力說話!澤連斯基態度突變非常強勢

      名人茍或
      2026-04-30 22:35:43
      董璇獨自到北京4s店買車,打扮得跟少女似的!當場下單,豪氣十足

      董璇獨自到北京4s店買車,打扮得跟少女似的!當場下單,豪氣十足

      小娛樂悠悠
      2026-05-01 08:26:14
      炸裂!高校教授136頁PDF丑聞:玩弄女學生,出軌已婚女,細節曝光

      炸裂!高校教授136頁PDF丑聞:玩弄女學生,出軌已婚女,細節曝光

      李晚書
      2026-04-30 13:36:16
      李小冉50歲登熱搜,手臂無運動痕跡,反自律卻贏麻了

      李小冉50歲登熱搜,手臂無運動痕跡,反自律卻贏麻了

      明星爆料客
      2026-05-01 16:41:44
      2026-05-02 00:51:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16650文章數 514912關注度
      往期回顧 全部

      科技要聞

      DeepSeek發布多模態論文又連夜刪除

      頭條要聞

      美國也搞起"人肉代購" "去墨西哥買中國車"教程瘋傳

      頭條要聞

      美國也搞起"人肉代購" "去墨西哥買中國車"教程瘋傳

      體育要聞

      無奈!約基奇:這要在塞爾維亞 全隊早被炒了

      娛樂要聞

      馬筱梅產后身材恢復超好 現身戶外直播

      財經要聞

      GPU神話松動,AI真正的戰場變了

      汽車要聞

      限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

      態度原創

      本地
      旅游
      親子
      房產
      軍事航空

      本地新聞

      用青花瓷的方式,打開西溪濕地

      旅游要聞

      擠爆了!五一首日周莊人山人海,這才是真正的江南

      親子要聞

      教孩子預防侵犯,分辨危險身體觸碰并且拒絕!

      房產要聞

      所有戶型全賣爆!海口TOP級豪宅,景觀樣板間五一全線開放!

      軍事要聞

      伊朗:持續推進海上封鎖的行為不可容忍

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲va久久久噜噜噜久久狠狠| 男女性高爱潮免费网站| 最新中文字幕一区二区三区| 香蕉久人久人青草青草| 狠狠色婷婷丁香综合久久韩国电影 | 成人黄色av播放免费| 国产一区二区三精品久久久无广告 | 上司人妻互换hd无码| 日韩欧群交p片内射中文 | 亚洲综合极品香蕉久久网| 成人区人妻精品一区二区不卡视频| 曰韩无码二三区中文字幕| 五月情婷婷| 色婷婷久久| 青草视频在线观看入口| 国产精品网站夜色| 伊人激情影院| 亚洲精品无码你懂的网站| 女人爽到高潮免费视频大全| 人人做人人爽国产视| 202丰满熟女妇大| 伦精品一区二区三区视频| 伊人春色激情综合激情网| 中文字幕日本有码| 免费av网站| 无码午夜福利片在线观看| 日韩中文字幕精品一区| 东乡族自治县| 亚洲精品午夜天堂网页| 亚洲激情一区二区三区在线| 国产粗大| 久久伊人蜜桃av一区二区 | 国产无套白浆一区二区| 精品少妇一区二区三区免费观| 国产亚洲无线码一区二区| 在线观看一区二区三区四区五区 | 波多野结衣一区二区三区视频| 国产麻豆福利av在线播放| 国产呦精品一区二区三区下载 | 欧美激情肉欲高潮视频| 国产在线观看免费人成视频|