<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      僅需12美元就能讓大語言模型"相信"一個徹頭徹尾的謊言

      0
      分享至


      又一項實驗證明,污染大語言模型的門檻低得令人擔憂。

      與搜索引擎不同,搜索引擎允許用戶自行判斷不同來源的可信度,而接入網絡搜索的 AI 聊天機器人則可能將來源存疑的網頁內容轉化為聽起來言之鑿鑿的答案。一個典型案例是:一位安全工程師成功讓多款 AI 機器人"相信"他是一款熱門德國紙牌游戲的現任世界冠軍——盡管這項錦標賽根本不存在。

      如果你在上周末之前查看維基百科,會看到 Ron Stoner 的名字出現在《6 Nimmt!》(英文名 Take 5)的詞條頁面上,被標注為 2025 年世界冠軍。該詞條將官方外觀的 6nimmt.com 列為信息來源,而訪問該網址確實能看到一篇慶祝 Stoner 奪冠的簡短新聞稿。

      問題在于,Stoner 本人承認,無論是維基百科上的冠軍詞條,還是托管這唯一"證據"的 6 Nimmt! 域名,都是他自己創建的。即便如此,當他向多款 AI 聊天機器人詢問時,它們仍然告訴他:他就是世界冠軍。

      "我的網站沒有任何獨立佐證,完全是憑空捏造的,"Stoner 在博客文章中寫道,"整座紙牌屋的根基,不過是我喝咖啡時花 12 美元注冊的一個域名。"

      換句話說,這是一次針對檢索增強生成(RAG)層的投毒攻擊。它并非提示詞注入,但攻擊的是同一個 AI 功能平面——即負責網絡搜索的那一層。

      正如 Stoner 所解釋的,許多讀者可能也早已意識到,AI 并不真正關心所引用來源的出處,而這正是他在設計這個實驗時想要利用的漏洞。

      "所有具備網絡搜索能力的前沿大語言模型,都會將答案建立在檢索排名最高的內容之上,"Stoner 寫道。在這個并不存在的《6 Nimmt!》錦標賽案例中,他植入的來源是唯一的信息源,再加上維基百科賦予的表面權威性,這就成了一種萬無一失的欺騙手段,足以讓 AI 將謊言呈現為事實——而且這種操作簡單到非技術用戶也能輕松復制。

      "我沒有做任何新奇的事,這不過是將老派的 SEO 和虛假信息手段包裹在新的大語言模型技術與界面之中,"Stoner 在接受采訪時表示,"真正改變的是:AI 現在會將這些結果以權威的方式呈現出來,而大多數用戶根本不知道背后的數據管道是如何運作的。"

      "大語言模型最難識別的,恰恰是它們被設計來做的事——信任文本和資源,"Stoner 在文章中指出,"答案不是'模型會自己搞清楚',因為模型根本無法區分一個真實來源和一個我上周二剛注冊的域名。就像它也搞不清楚'strawberry'這個詞里到底有幾個字母'r'一樣。"

      Stoner 在實驗中揭示的問題涉及三種獨立的失效模式,這些模式可能被用于比偽造紙牌游戲冠軍更具破壞性的目的。

      第一是檢索層。任何依賴網絡搜索來生成答案的大語言模型,都會繼承其檢索結果的可信度,而這一層可以立即導致模型輸出錯誤信息。

      第二是模型訓練語料庫。Stoner 表示,如果他對維基百科的修改存在足夠長的時間被爬蟲抓取,就可能進入模型的訓練數據。該詞條已于上周五他發布文章時被刪除,但他早在 2025 年 2 月就完成了這次修改,這意味著在此期間爬取過維基百科的 AI 公司,都可能將這段虛構的奪冠經歷納入訓練數據。

      "即使維基百科的編輯事后被撤銷,任何基于撤銷前數據訓練的模型仍然會保留我留下的'遺產',"Stoner 寫道,"語料庫投毒的清理問題,截至 2026 年仍是一個真正未解決的難題。"

      Stoner 表示,他計劃在六個月后進行驗證——屆時新模型已經發布,如果在不聯網的情況下模型仍然返回他的冠軍頭銜,就證明這個謊言已經進入了訓練數據。

      第三是 AI 智能體,Stoner 認為這才是真正對惡意攻擊者最具吸引力的目標。

      "聊天模型產生錯誤信息是聲譽問題,而擁有工具訪問權限的智能體產生錯誤行動則是安全問題,"他指出。通過污染智能體檢索到的來源,攻擊者可以指定希望智能體執行的操作。

      "這次攻擊和測試只用了一個 12 美元的域名、一次維基百科編輯,以及大約二十分鐘的時間,"Stoner 在博客中總結道,"如果換成一個有動機的攻擊者,配合幾個預先布局的域名,以及針對十幾篇低流量文章的協同編輯行動,攻擊面會迅速變得相當可觀。"

      Stoner 表示,檢索投毒是大語言模型服務商需要正視并向用戶明確警示的問題,他預計 AI 聊天機器人在不久的將來將開始引入某種警告機制,尤其是針對 RAG 來源的結果。

      他希望 AI 公司能將數據來源可信度作為核心流程要素,同時對近期網絡內容進行啟發式過濾,以識別可疑模式。在《6 Nimmt!》這個案例中,這類過濾本可輕易發現問題:一個引用指向的域名注冊時間與維基百科詞條更新時間高度吻合,理應觸發警報,但實際上并沒有。

      這個虛假的冠軍頭銜已經從維基百科和 RAG 響應中消失,但 Stoner 指出,使這一切成為可能的錯誤信任模式依然真實存在,并將成為 AI 開發者面臨的一個迫在眉睫的問題。

      "我很高興我的文章引發了關于大語言模型、信息來源、信任機制以及這一切運作方式的討論,"Stoner 說,"這正是我的目標,而我似乎已經實現了它。"

      Q&A

      Q1:什么是 RAG 層投毒攻擊?它和提示詞注入有什么區別?

      A:RAG(檢索增強生成)層投毒是指攻擊者通過在網絡上植入虛假內容,讓 AI 在檢索信息時抓取并引用這些錯誤來源,從而輸出錯誤答案。提示詞注入則是直接在用戶輸入中嵌入惡意指令來操控模型行為。兩者攻擊的都是 AI 的信息獲取環節,但 RAG 投毒針對的是外部數據源,而非模型本身的推理過程。

      Q2:這次實驗為什么只花了 12 美元就成功了?

      A:Stoner 只需注冊一個 12 美元的域名,搭建一個看起來像官方新聞稿的頁面,再在維基百科上添加一條引用該域名的詞條,就完成了整個攻擊鏈。由于大語言模型在網絡搜索時會直接信任檢索排名靠前的內容,而不驗證來源的真實性,這個"單一來源+維基百科背書"的組合足以讓多款 AI 將虛假信息當作事實輸出。

      Q3:AI 智能體在檢索投毒攻擊中面臨哪些特殊風險?

      A:與普通聊天模型不同,AI 智能體通常擁有調用外部工具、執行實際操作的能力。如果智能體檢索到被污染的來源,攻擊者不僅能讓它輸出錯誤信息,還可能誘導它執行特定的惡意操作,例如發送錯誤指令或觸發自動化流程。Stoner 指出,聊天模型產生錯誤信息是聲譽問題,而智能體產生錯誤行動則是真正的安全問題。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      其實從某個角度來說,李自成才是真正挽救了華夏民族的人

      其實從某個角度來說,李自成才是真正挽救了華夏民族的人

      掠影后有感
      2026-05-06 09:58:38
      不管有錢沒錢,盡快扔掉家里的這7樣東西!不是瞎說,有科學依據

      不管有錢沒錢,盡快扔掉家里的這7樣東西!不是瞎說,有科學依據

      家居設計師宅哥
      2026-05-04 12:45:59
      撤離!莫斯科直接亮明底線,若紅場閱兵受擾,基輔中心將被夷平

      撤離!莫斯科直接亮明底線,若紅場閱兵受擾,基輔中心將被夷平

      潮鹿逐夢
      2026-05-06 16:38:28
      已致3人死亡!暴發病毒疫情郵輪將抵達西班牙,“所有人將被遣返各自國家”

      已致3人死亡!暴發病毒疫情郵輪將抵達西班牙,“所有人將被遣返各自國家”

      南方都市報
      2026-05-07 12:26:12
      突發,馬斯克xAI解散了!22萬張GPU忍痛全給Claude

      突發,馬斯克xAI解散了!22萬張GPU忍痛全給Claude

      新智元
      2026-05-07 09:13:46
      日經225指數漲幅擴大至5%

      日經225指數漲幅擴大至5%

      每日經濟新聞
      2026-05-07 09:32:06
      吳宜澤姐姐曝光!反差感拉滿:顏值出眾+愛掐弟弟臉蛋 喜歡騎機車

      吳宜澤姐姐曝光!反差感拉滿:顏值出眾+愛掐弟弟臉蛋 喜歡騎機車

      念洲
      2026-05-07 11:06:01
      一批年輕女性靠 “崩老頭” 賺快錢,而80、90后成為被崩的“老頭”!

      一批年輕女性靠 “崩老頭” 賺快錢,而80、90后成為被崩的“老頭”!

      品牌新
      2026-05-06 16:28:30
      GDP增速再墊底!西北第一城,怎么了?

      GDP增速再墊底!西北第一城,怎么了?

      西部城市
      2026-05-06 21:27:23
      央視世界杯天價轉播后續!國際足聯做出回應,中國球迷有話要說

      央視世界杯天價轉播后續!國際足聯做出回應,中國球迷有話要說

      以茶帶書
      2026-05-06 14:51:22
      國乒男團VS韓國隊,比賽時間公布,王皓是否換人,央視解說引爭議

      國乒男團VS韓國隊,比賽時間公布,王皓是否換人,央視解說引爭議

      體育大學僧
      2026-05-07 10:52:38
      網友曝三亞4只皮皮蝦收費1035元,涉事飯店半年前變更經營者

      網友曝三亞4只皮皮蝦收費1035元,涉事飯店半年前變更經營者

      齊魯壹點
      2026-05-07 10:54:16
      破防!女子五一旅游偶遇丈夫辛苦拉貨掙錢養家!

      破防!女子五一旅游偶遇丈夫辛苦拉貨掙錢養家!

      搗蛋窩
      2026-05-06 12:51:08
      第三輪第六批中央生態環境保護督察全面啟動

      第三輪第六批中央生態環境保護督察全面啟動

      生態環境部
      2026-05-07 10:04:40
      洪迪厄斯號豪華郵輪毒株確認可人傳人,可通過同床共枕或共享食物傳播,該郵輪上共149人

      洪迪厄斯號豪華郵輪毒株確認可人傳人,可通過同床共枕或共享食物傳播,該郵輪上共149人

      極目新聞
      2026-05-07 10:54:57
      美國郁悶到了極點,為什么別人都不還手,中國老是還手呢?

      美國郁悶到了極點,為什么別人都不還手,中國老是還手呢?

      混沌錄
      2026-05-06 18:04:25
      剛剛,馬斯克官宣xAI解散,22萬張GPU算力租給Anthropic

      剛剛,馬斯克官宣xAI解散,22萬張GPU算力租給Anthropic

      機器之心Pro
      2026-05-07 10:25:42
      三峽“無縫大壩”締造者落馬!功勛滿身,卻沒管住心中一道縫

      三峽“無縫大壩”締造者落馬!功勛滿身,卻沒管住心中一道縫

      甜檸聊史
      2026-03-25 18:43:05
      世乒賽震撼一幕:王曼昱狂掃11-0,劉詩雯馬龍驚嘆!8強對決即將揭曉

      世乒賽震撼一幕:王曼昱狂掃11-0,劉詩雯馬龍驚嘆!8強對決即將揭曉

      海闊山遙YAO
      2026-05-07 00:52:32
      世界杯國際足聯開出天價版權:對中國開價近3億美元,是印度的17倍,現“降”至1.2至1.5億美元;電視轉播談判陷僵局

      世界杯國際足聯開出天價版權:對中國開價近3億美元,是印度的17倍,現“降”至1.2至1.5億美元;電視轉播談判陷僵局

      浙江之聲
      2026-05-07 08:24:22
      2026-05-07 13:52:49
      至頂頭條 incentive-icons
      至頂頭條
      記錄和推動數字化創新
      18202文章數 49703關注度
      往期回顧 全部

      科技要聞

      凌晨突發!馬斯克租22萬塊GPU給“死敵”

      頭條要聞

      北京三位女大學生青海自駕游2死1傷 傷者一審獲刑4年

      頭條要聞

      北京三位女大學生青海自駕游2死1傷 傷者一審獲刑4年

      體育要聞

      阿森納巴黎會師歐冠決賽!5月31日開戰

      娛樂要聞

      小S阿雅重返大S母校,翻看大S畢業照

      財經要聞

      特朗普:美伊“很有可能”達成協議

      汽車要聞

      理想為什么不做轎車,有了解釋……

      態度原創

      教育
      藝術
      家居
      游戲
      公開課

      教育要聞

      高考倒計時30天,華南理工楊中民校長向您發出誠摯邀約!

      藝術要聞

      這位老教授筆下的青年,活力滿滿

      家居要聞

      破繭成蝶 土味精裝房爆改

      靠說話打架的游戲,是怎么讓人喊出“爺青回”的?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中文字幕av一区二区三区| 国产熟妇另类久久久久久| 成年日韩片av在线网站| 久久国产精品乱子乱精品| 欧美成人18| 亚洲精品成人福利网站| 亚洲中文字幕在线观看| 午夜剧场黄色| av永远在线免费观看| 国产偷窥熟女精品视频| 成人午夜在线观看日韩| 3P性视频| 国产杨幂AV在线播放| 男女啪啪永久免费网站| 免费人成激情视频在线观看| 大尺度国产一区二区视频| 亚洲最大成人AV在线天堂网| 久久精品国产亚洲AV麻| 尤物一区| 图片区小说区激情区偷拍区| 亚洲欧美日韩久久精品| 久久国产毛片| 日韩电影在线观看视频| 亚洲午夜福利网在线观看| 亚洲AV片不卡无码久久欣赏网| 中文字幕无码AV激情不卡| www.亚洲精品| 人妻制服OL熟女の美脚| 国产年成美女网站视频免费看 | 亚洲国产精品500在线观看| 日韩av综合中文字幕| 国产精品第八页| 人人射精油| 韩国中文字幕轮理天堂| 日韩国产中文字幕精品| 国产999精品成人网站| 亚洲av尤物一区二区| 免费午夜无码片在线观看影院| 草逼网123| 国内精品少妇在线播放| 国产精品久久二区二区|