<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      社會模擬邁入可控、可量化時代:為AI Agent加上「認知滑條」

      0
      分享至



      用大模型做社會模擬,你能保證換個模型, Agent 還會做出一樣的決策嗎?在 LLM-based 社會模擬中,研究者通常用一段自然語言描述來定義 Agent 的行為,例如「John Lin 是一個社區藥店老板,他熱心助人……」。這種基于人設的 Agent 定義方式已被廣泛采用,幾乎成為社會模擬領域的標準范式。然而:這些描述究竟是在「定義 Agent 」,還是只是提供了一種松散且無法穩定復現的行為暗示?

      UCSD 團隊在 CHI 2026 Best Paper 論文CoBRA (眼鏡蛇)中提出了一套可量化、可驗證、可復現的 Agent 控制框架。它將經典社會科學實驗轉化為可復用的校準環境,使 Agent 行為可被測量、反饋與收斂,建立類似實驗科學的變量控制機制,并在輸入、激活與參數空間實現定量化控制。

      CoBRA 標志著AI 社會模擬從經驗式敘述走向可控、可復現的實驗科學范式。


      視頻鏈接:https://mp.weixin.qq.com/s/FJULL6lcvqIFE4NaCEOx7w

      • 論文標題:CoBRA: Programming Cognitive Bias in Social Agents Using Classic Social Science Experiments
      • 論文鏈接:https://arxiv.org/abs/2509.13588
      • 代碼鏈接:https://github.com/AISmithLab/CoBRA
      • 項目主頁:https://cobra.clawder.ai

      自然語言人設的可控性困境

      研究者首先做了一組先導實驗。他們用經典社會科學實驗——亞洲疾病問題——來測試 Agent 的框架效應。這是行為決策研究中的經典范式:當同一個結果被描述為「 200 人被救活」或「 400 人將死亡」時,人類會系統性地改變決策偏好。

      他們設計了三種 Agent 人設——經濟學家、普通人和空白(無描述)——并在 Mistral 7B 、 Gemma2 9B 、 GPT-4o Mini 、 DeepSeek-v3 四個模型上進行了測試。

      結果令人反思:

      • 同一描述,不同模型,行為完全不同。結果顯示所有條件下跨模型行為差異顯著。例如, Mistral 7B 的回答嚴重偏向正面框架,而 Gemma2 9B 的回答接近中性。
      • 隱式描述無法可靠地產生預期行為。社會科學研究表明,經濟學專家往往比普通人更不容易受到框架效應的影響。但四個模型中,只有 GPT-4o 的結果勉強符合這一預期; DeepSeek 中經濟學家反而比普通人更容易受影響; Mistral 三種人設幾乎沒有區別。

      一句話總結:用自然語言給 Agent 寫人設,在科學意義上是不可控的、不可復現的。

      CoBRA:用經典實驗為 Agent 行為「標定刻度」



      圖:CoBRA 工作流

      CoBRA 的核心思路出奇地優雅:把經過幾十年驗證的經典社會科學實驗當作 Agent 的「考試」,測完再調,調到達標。

      例如,我們希望精確指定一個 Agent 受到「框架效應」這種認知偏差的影響程度,就可以讓它參加經典的「亞洲疾病問題」等實驗,測量其決策差異,將這種差異量化為偏差指數,并根據目標水平調節控制系數,再次測量,直至其偏差程度達到預設值。

      CoBRA 以「認知偏差」作為試點。認知偏差不同于抽象的價值觀或道德判斷,它具有明確的實驗定義、可計算的行為指標以及可驗證的干預路徑,因此更適合作為構建可量化調節的工程起點。

      具體來說, CoBRA 包含兩個核心組件:

      1. 認知偏差指數——量化 Agent 的偏差程度

      CoBRA 的認知偏差指數建立在經典社會科學實驗范式之上,系統性地覆蓋四類具有代表性的認知偏差(權威效應、從眾效應、確認偏差與框架效應),每類偏差均對應兩種經典實驗范式,用于交叉校準與驗證。 Agent 在這些實驗中的表現被量化為一個 0-4 的連續分數。同一偏差類型的兩個范式相互驗證——在一個范式上校準的控制系數,在另一個范式上也應產生一致的效果。

      2. 行為調節引擎——從三個層次調控 Agent

      行為調節引擎覆蓋 LLM 的三個基本干預空間:

      輸入空間(Prompt Numerical Control):用數值化指令(如「你的權威偏差程度是 65% 」)替代模糊的定性描述,無需訓練。該方法適用于所有模型。

      激活空間(Representation Engineering):通過三組對比樣本(偏差正例 / 中性 / 反例),提取出干凈的偏差方向向量,并與安全拒絕信號分離,在推理時注入隱藏狀態。注入方式有兩種: Linear Control 像是均勻放大或減弱偏差強度,表達范圍更廣; Projection Control 則根據當前語境自適應調節,控制曲線更平滑穩定。該方法適用于開源模型。

      參數空間(Fine-tuning with Task Vectors):分別訓練一個「有偏差」和「無偏差」的 LoRA ,然后用 task vector 差值作為控制信號,通過控制系數精確調節。

      每種方法都通過一個控制系數與認知偏差指數形成閉環: CoBRA 自動掃描控制系數,測量 Agent 在實驗中的表現,直到達到目標指數。

      跨模型一致性與魯棒性驗證

      論文在多類開源與閉源系統上開展系統評測,驗證了 CoBRA 的跨模型、跨推理模式與跨場景穩定性:其顯著降低行為方差,在 0.1–1.0 溫度區間內保持統計等價,并在不同推理模式下呈現高度一致的控制曲線。

      在此基礎上,作者進一步從單調性、平滑度、表達范圍與泛化性四個維度系統評估其可控性。結果顯示,激活空間的控制在單調性與平滑度上表現最佳,輸入空間控制則提供更大的表達范圍。同時,控制系數可在不同實驗范式間遷移,并在不同人設設定下保持高度一致,展現出良好的泛化能力。

      開放任務驗證

      論文進一步模擬了經典的情緒傳染場景,以展示 CoBRA 的實際應用價值。在實驗中, Agent 瀏覽包含不同比例負面帖子的社交媒體信息流,隨后生成新的內容。研究者通過分析其生成文本的情緒變化,衡量情緒傳染的強度。

      基線方法僅通過自然語言描述調節偏差強度,結果顯示不同偏差等級的 Agent 情緒傳染曲線幾乎完全重疊,難以有效區分。相比之下, CoBRA 呈現出清晰的劑量——響應關系:從眾效應認知偏差指數越高, Agent 表現出的情緒傳染程度也越強,不同等級之間具有明確且穩定的區分度。

      該情緒傳染實驗基于開放式任務,體現出 CoBRA 明確的實際應用價值。

      從「像那么回事」到「可控和可復現」

      這項工作的意義,可以概括為從「看起來像那么回事」到「可控、可復現的科學研究」的跨越。過去的 LLM 社會模擬依賴自然語言人設來塑造行為,直觀卻缺乏穩定的控制結構。 CoBRA 將經典社會科學實驗轉化為可復用的校準環境,使 Agent 行為能夠被持續測量與調節,從而建立起類似實驗科學的變量控制機制。

      CoBRA 讓 Agent 擁有清晰的刻度與調節旋鈕。當 Agent 行為可以被標定和收斂,社會模擬也就真正進入了可復現的工程階段。

      作者信息

      劉萱:加州大學圣地亞哥分校(UCSD)博士生, 2025 年本科畢業于香港理工大學。研究方向聚焦人工智能與人機交互,關注 AI 系統的類人認知與社會智能機制,構建面向科學研究的 AI 工具,以及其隱私與安全問題。個人主頁:https://xuanl17.github.io/

      商昊暘:獨立學者, 2025 年本科畢業于上海交通大學,將于 2026 年秋季加入英屬哥倫比亞大學(UBC)深造。

      金浩健:加州大學圣地亞哥分校(UCSD)助理教授,博士畢業于卡內基梅隆大學人機交互研究所(CMU HCII),本科就讀于華中科技大學。研究方向涵蓋人機交互、隱私與安全及人本系統設計。個人主頁:https://www.haojianj.in/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      賴昌星的情人蔡玲玲:悔不該委身于他,58歲的她現狀如何?

      賴昌星的情人蔡玲玲:悔不該委身于他,58歲的她現狀如何?

      細品名人
      2026-04-29 07:06:35
      張繼科預言成真!林詩棟惜敗歐洲新星,國乒的老本還能吃多久?

      張繼科預言成真!林詩棟惜敗歐洲新星,國乒的老本還能吃多久?

      曹老師評球
      2026-05-03 21:21:07
      距離很近,芥蒂很深?中國和越南為何注定不可能情同手足?

      距離很近,芥蒂很深?中國和越南為何注定不可能情同手足?

      靜夜史君
      2026-04-23 23:49:01
      羽協主席張軍涉醉駕違紀被查,奧運擋箭牌再引討論

      羽協主席張軍涉醉駕違紀被查,奧運擋箭牌再引討論

      風雨與陽光
      2026-05-03 18:14:38
      2換1!離譜交易方案!美記提議杜蘭特聯手約基奇

      2換1!離譜交易方案!美記提議杜蘭特聯手約基奇

      籃球實戰寶典
      2026-05-03 20:42:25
      5月第一天,伊朗傳出爆炸聲,美國鬧了大笑話,高市糊弄特朗普

      5月第一天,伊朗傳出爆炸聲,美國鬧了大笑話,高市糊弄特朗普

      浪子阿邴聊體育
      2026-05-02 15:18:25
      藍月亮被質疑同規格內衣洗衣液不同價,有電商平臺客服:一款針對汗味等,一款針對血漬

      藍月亮被質疑同規格內衣洗衣液不同價,有電商平臺客服:一款針對汗味等,一款針對血漬

      紅星資本局
      2026-05-02 18:50:05
      明星都心疼!演員王寧去杭州吃面,2188元一碗吃不起,老板戴金牌

      明星都心疼!演員王寧去杭州吃面,2188元一碗吃不起,老板戴金牌

      一娛三分地
      2026-02-25 18:20:47
      張雪發出請求

      張雪發出請求

      第一財經資訊
      2026-05-03 17:12:30
      韓媒:韓國隊尤伯杯奪冠鞏固女羽霸主地位 韓網友贊金佳恩創造奇跡

      韓媒:韓國隊尤伯杯奪冠鞏固女羽霸主地位 韓網友贊金佳恩創造奇跡

      勁爆體壇
      2026-05-03 21:52:12
      心態崩了!遼寧單節狂輸20分 近7分鐘被轟一波18-0徹底崩盤

      心態崩了!遼寧單節狂輸20分 近7分鐘被轟一波18-0徹底崩盤

      狼叔評論
      2026-05-03 21:32:04
      88%中國博士留下建設美國,550萬在美華人數據全公開...

      88%中國博士留下建設美國,550萬在美華人數據全公開...

      深度報
      2026-05-02 22:15:49
      賴清德竟敢偷偷離臺,大陸火速行動!國民黨的狐貍尾巴藏不住了

      賴清德竟敢偷偷離臺,大陸火速行動!國民黨的狐貍尾巴藏不住了

      夢史
      2026-05-03 13:58:28
      湯杯決賽對陣出爐:小波波夫放棄雙打專注一單

      湯杯決賽對陣出爐:小波波夫放棄雙打專注一單

      懂球帝
      2026-05-03 17:20:24
      主要產油國宣布6月增產

      主要產油國宣布6月增產

      界面新聞
      2026-05-03 18:46:57
      番茄被發現!研究發現:吃得越多,高血壓患者壽命或越長?真假?

      番茄被發現!研究發現:吃得越多,高血壓患者壽命或越長?真假?

      健身狂人
      2026-05-03 16:04:54
      山東大勝16分!二哥或退役,廣東贏10分!8強出爐,廣東遇老對手

      山東大勝16分!二哥或退役,廣東贏10分!8強出爐,廣東遇老對手

      老吳說體育
      2026-05-03 21:36:01
      游客拍到公廁內衛生狀況惡劣 被文旅工作人員圍堵要求刪視頻 兩次報警才脫身

      游客拍到公廁內衛生狀況惡劣 被文旅工作人員圍堵要求刪視頻 兩次報警才脫身

      閃電新聞
      2026-05-03 15:24:10
      慘無人道!以軍用軍犬強奸巴勒斯坦囚犯,全程錄像,受害者:想死

      慘無人道!以軍用軍犬強奸巴勒斯坦囚犯,全程錄像,受害者:想死

      史行途
      2026-05-01 12:29:39
      半導體芯片,成長最快的10家公司

      半導體芯片,成長最快的10家公司

      新浪財經
      2026-05-03 17:42:46
      2026-05-03 22:48:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12905文章數 142639關注度
      往期回顧 全部

      科技要聞

      庫克罕見"拒答"!蘋果正被AI供應鏈卡脖子

      頭條要聞

      美國空軍C-17運輸機降落北京 中美開啟一連串密集互動

      頭條要聞

      美國空軍C-17運輸機降落北京 中美開啟一連串密集互動

      體育要聞

      裁判準備下班,結果吳宜澤進了決賽

      娛樂要聞

      黃曉明五一帶娃去游樂場 父子幸福同框

      財經要聞

      后巴菲特時代,首場股東會透露了啥

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      教育
      旅游
      親子
      家居
      公開課

      教育要聞

      考不上985/211,報這19所部屬普本,分不高,畢業照樣進央國企!

      旅游要聞

      洛陽孟津:百年古村煥新潮 咖啡+文旅受熱捧

      親子要聞

      曝光毒繪本:薩琪想要個小寶寶,明顯教唆兒童學壞,家長朋友避坑

      家居要聞

      靈動實用 生活藝術場

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成人免费视频试看120秒| 国产九九免费视频| 国产精品国产三级专区不卡| 无码国模在线观看| 无人区日本高清完整版| 亚洲精品漫画一二三区| 91色拍| 免费在线观看污视频| 精品亚洲一区二区视频| 国产麻豆精品久久一二三| 国产真实伦在线观看视频| 国产成人精选视频在线观看 | 亚洲AV无码乱码精品| 亚洲激情av| 色午夜一av男人的天堂| 欧美亚洲色欲色一欲WWW| 久久天天躁夜夜躁一区| 国产成人久久蜜一区二区| 国产精品久久久久久人妻| 国产在线资源| 欧美成人黄在线观看| 日韩精品欧美精品中文精品| 麻豆最新国产AV原创精品| 亚洲综合伦理| 婷婷视频在线| https//:www.haiouchat.com/| 久久久精品国产视频在线| 亚洲色无码专区在线播放| 狠狠色综合7777久夜色撩人| 欧美亚洲精品在线| 91丨国产丨白浆秘?网站| 亚洲精品成人福利网站 | 亚洲熟女乱综合一区二区| 美女视频久久久| 久操国产| 午夜三级理论在线观看无| 尼玛县| 国产精品久久亚洲不卡| 国产精品午夜无码体验区| 色欲av在线| 人人爽人人爽人人片a∨|