<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      AI 寫代碼太快,人類測試跟不上了,Meta 用新方法把 bug 檢出率提升 4 倍

      0
      分享至


      作者 | Leela Kumili

      譯者 | 田橙

      Meta 報告稱,通過一種 即時(Just-in-Time,JiT)測試方法 提升了軟件質量。該方法在代碼評審期間動態生成測試,而不是依賴長期存在、需要人工維護的測試套件。根據 Meta 的工程博客及相關研究,這一方法在 AI 輔助開發環境中將缺陷檢測能力提升了約 4 倍。

      這一轉變源于代理式工作流的興起,在這種工作流中,AI 系統越來越多地生成或修改大段代碼。在這種環境下,傳統測試套件面臨更高的維護開銷且效果下降,因為脆弱的斷言和過時的覆蓋率難以及時跟上快速變化。

      正如 ICT 系統測試工程師 Ankit K. 所 觀察到的:

      AI 生成代碼和測試的速度已經超過了人類的維護能力,JiT 測試因此幾乎成了必然選擇。

      JiT 測試通過在拉取請求階段基于具體代碼差異生成測試來解決這一問題。與靜態驗證不同,該系統會推斷開發者意圖,識別潛在的失效模式,并構建有針對性的測試,在存在回歸問題時使其失敗。它專注于捕獲回歸的測試——這些測試在提議的更改上失敗,但在父版本上通過。這是通過一個結合大語言模型、程序分析和變異測試的流水線實現的,其中會注入合成缺陷以驗證生成的測試是否能夠檢測到它們。

      正如 Meta 研究科學家 Mark Harman 所 指出 的:

      這項工作體現了一種根本性的轉變:不再只是讓現有測試更穩,而是轉向去發現未來可能出現的問題。

      一個關鍵組件是 Dodgy Diff 與意圖感知工作流架構,它將代碼變更重新定義為語義信號,而非文本差異。系統會分析 diff,以提取行為意圖和風險區域,然后執行意圖重建和變更風險建模,以理解哪些內容可能因此而出錯。這些信號被輸入到變異引擎中,生成“可疑”的代碼變體,用以模擬真實的失敗場景。隨后,一個基于 LLM 的測試合成層會生成與推斷意圖一致的測試,并通過過濾去除噪聲或低價值測試,最終在拉取請求中呈現結果。

      Meta 報告稱,通過一種 即時(Just-in-Time,JiT)測試方法 提升了軟件質量。該方法在代碼評審期間動態生成測試,而不是依賴長期存在、需要人工維護的測試套件。根據 Meta 的工程博客及相關研究,這一方法在 AI 輔助開發環境中將缺陷檢測能力提升了約 4 倍。

      這一轉變源于代理式工作流的興起,在這種工作流中,AI 系統越來越多地生成或修改大段代碼。在這種環境下,傳統測試套件面臨更高的維護開銷且效果下降,因為脆弱的斷言和過時的覆蓋率難以及時跟上快速變化。

      正如 ICT 系統測試工程師 Ankit K. 所 觀察到的:

      AI 生成代碼和測試的速度已經超過了人類的維護能力,JiT 測試因此幾乎成了必然選擇。

      JiT 測試通過在拉取請求階段基于具體代碼差異生成測試來解決這一問題。與靜態驗證不同,該系統會推斷開發者意圖,識別潛在的失效模式,并構建有針對性的測試,在存在回歸問題時使其失敗。它專注于捕獲回歸的測試——這些測試在提議的更改上失敗,但在父版本上通過。這是通過一個結合大語言模型、程序分析和變異測試的流水線實現的,其中會注入合成缺陷以驗證生成的測試是否能夠檢測到它們。

      正如 Meta 研究科學家 Mark Harman 所 指出 的:

      這項工作體現了一種根本性的轉變:不再只是讓現有測試更穩,而是轉向去發現未來可能出現的問題。

      一個關鍵組件是 Dodgy Diff 與意圖感知工作流架構,它將代碼變更重新定義為語義信號,而非文本差異。系統會分析 diff,以提取行為意圖和風險區域,然后執行意圖重建和變更風險建模,以理解哪些內容可能因此而出錯。這些信號被輸入到變異引擎中,生成“可疑”的代碼變體,用以模擬真實的失敗場景。隨后,一個基于 LLM 的測試合成層會生成與推斷意圖一致的測試,并通過過濾去除噪聲或低價值測試,最終在拉取請求中呈現結果。


      Dodgy diff 和意圖感知工作流用于生成即時捕獲(Just-in-Time Catches)的架構

      Meta 表示,該系統在超過 22,000 個生成測試上進行了評估。結果顯示,與基線生成測試相比,缺陷檢測能力提升了 4 倍;與偶然結果相比,在檢測有意義失敗方面最高提升達 20 倍。在一個評估子集中,共識別出 41 個問題,其中 8 個被確認是真實缺陷,包括若干可能影響生產環境的問題。

      Mark Harman 在另一篇 LinkedIn 帖子 中強調:

      變異測試在學術圈沉寂了幾十年之后,終于開始走向工業界,并正在重塑實用且可擴展的軟件測試 2.0。

      捕獲型 JiT 測試專為 AI 驅動的開發設計,按每次變更生成,用于在無需持續維護的情況下檢測嚴重且意外的缺陷。它們通過隨著代碼演進自動適配并將工作從人類轉移到機器,從而減少脆弱的測試套件。只有在發現有意義的問題時才需要人工審查。這將測試從靜態正確性驗證重新定義為面向特定變更的故障檢測。

      https://www.infoq.com/news/2026/04/meta-jit-testing-ai-detection/

      聲明:本文由 InfoQ 翻譯,未經許可禁止轉載。

      會議推薦

      世界模型的下一個突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發體系不重構,還能撐多久?

      AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構。14 個專題全面開放征稿。

      誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。

      今日薦文

      你也「在看」嗎?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      奉勸大家:這6樣東西千萬“別用紙巾擦”,一擦就壞,很難修復

      奉勸大家:這6樣東西千萬“別用紙巾擦”,一擦就壞,很難修復

      室內設計師有料兒
      2026-05-06 12:09:03
      廣東加時險勝北京!楊鳴指導犀利點評:韌性定勝負,細節決輸贏!

      廣東加時險勝北京!楊鳴指導犀利點評:韌性定勝負,細節決輸贏!

      田先生籃球
      2026-05-09 23:38:48
      14記ACE球仍遭前法網冠軍逆轉,鄭欽文遺憾止步羅馬32強

      14記ACE球仍遭前法網冠軍逆轉,鄭欽文遺憾止步羅馬32強

      極目新聞
      2026-05-10 00:18:29
      2013年,金正哲聯手張成澤發動朝鮮兵變,因一細節敗露,雙遭反殺

      2013年,金正哲聯手張成澤發動朝鮮兵變,因一細節敗露,雙遭反殺

      阿胡
      2025-03-11 13:28:03
      我年過六十歲才恍然大悟:為什么大多數女人都對六十歲以上的男人敬而遠之,甚至會主動回避,兩個原因

      我年過六十歲才恍然大悟:為什么大多數女人都對六十歲以上的男人敬而遠之,甚至會主動回避,兩個原因

      心理觀察局
      2026-05-04 08:51:10
      這就是公開辱華的后果!取消冠軍頭銜只是開始,職業生涯也全毀了

      這就是公開辱華的后果!取消冠軍頭銜只是開始,職業生涯也全毀了

      阿鳧愛吐槽
      2025-12-17 17:24:39
      蔣萬安被問懵:不認中國人身份,憑何遷兩蔣靈柩回大陸?

      蔣萬安被問懵:不認中國人身份,憑何遷兩蔣靈柩回大陸?

      娛樂的宅急便
      2026-05-08 13:39:15
      國際油價本周大跌7%

      國際油價本周大跌7%

      每日經濟新聞
      2026-05-09 09:16:42
      光纖+存儲芯片+商業航天+算力租賃,深度布局的10家潛力公司

      光纖+存儲芯片+商業航天+算力租賃,深度布局的10家潛力公司

      粵語音樂噴泉
      2026-05-08 18:52:45
      人不會無緣無故患帶狀皰疹!調查發現:得帶狀皰疹,離不開這5點

      人不會無緣無故患帶狀皰疹!調查發現:得帶狀皰疹,離不開這5點

      岐黃傳人孫大夫
      2026-05-01 14:35:03
      夢幻開局!上海久事2-0橫掃山東,時隔四年重返 CBA 四強

      夢幻開局!上海久事2-0橫掃山東,時隔四年重返 CBA 四強

      友誼第一
      2026-05-10 00:55:25
      緊急!停招電氣工程專業!

      緊急!停招電氣工程專業!

      新浪財經
      2026-05-08 16:42:06
      鄉鎮女大學生曬“低審美”穿搭,網友眼前一黑:求求你都扔了吧!

      鄉鎮女大學生曬“低審美”穿搭,網友眼前一黑:求求你都扔了吧!

      妍妍教育日記
      2026-05-09 10:34:34
      國內規模最大的資金外流渠道,并非地下錢莊,也不是虛擬貨幣

      國內規模最大的資金外流渠道,并非地下錢莊,也不是虛擬貨幣

      流蘇晚晴
      2026-05-06 20:24:48
      大量硼砂,別再給家里人吃了!這10類食物最易摻硼砂,超危險

      大量硼砂,別再給家里人吃了!這10類食物最易摻硼砂,超危險

      笑熬漿糊111
      2026-04-13 00:05:12
      烏拉圭河底撈出納粹巨鷹,重達半噸鷹爪抓萬字符,20年沒人敢處置

      烏拉圭河底撈出納粹巨鷹,重達半噸鷹爪抓萬字符,20年沒人敢處置

      老謝談史
      2026-04-26 21:14:12
      網紅痞幼拿下張雪機車,純粹蹭熱度

      網紅痞幼拿下張雪機車,純粹蹭熱度

      喜歡歷史的阿繁
      2026-05-09 01:27:27
      曾被馬來西亞侵占的瓊臺礁,戰略價值遠超黃巖島,后來怎么樣了?

      曾被馬來西亞侵占的瓊臺礁,戰略價值遠超黃巖島,后來怎么樣了?

      泠泠說史
      2026-05-09 20:07:27
      立夏后,每天杯子里泡點它,清肝明目排熱毒,舒舒服服迎夏天

      立夏后,每天杯子里泡點它,清肝明目排熱毒,舒舒服服迎夏天

      江江食研社
      2026-05-06 18:10:55
      丑鞋出海賣爆了,賣家狂賺400萬

      丑鞋出海賣爆了,賣家狂賺400萬

      跨境派Pro
      2026-05-09 14:14:21
      2026-05-10 02:48:49
      AI前線 incentive-icons
      AI前線
      面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
      1481文章數 149關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      多地號召,公職人員帶頭繳納物業費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      數碼
      教育
      房產
      本地
      公開課

      數碼要聞

      有鴻蒙·更美的——全球首臺鴻蒙智選美的智能空調上市

      教育要聞

      天津女教師懟家長!完整錄音曝光,老師很囂張,飯碗恐不保了

      房產要聞

      低價甩賣!海口這個地標商業,無人接盤!

      本地新聞

      用蘇繡的方式,打開江西婺源

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产av亚洲精品久久久久李知恩| 日本精品极品视频在线| 久久69国产精品久久69软件| 久久av无码精品人妻系列果冻| 久久人人爽人人爽人人片av东京热| 亚洲精品在线亚洲人妻| 在线看免费无码的av天堂 | 岛国在线观看无码不卡| 国产精品一卡二卡三卡| 米奇影视第四色| 亚洲tv精品一区二区三区| 婷婷五月综合色中文字幕| 性少妇中国内射xxxx狠干| 亚洲 小说区 图片区 都市| 韩国精品一区二区三区无码视频| 久久内射| 国际视频久久久久久久久国产| 亚国产亚洲亚洲精品视频| 国产一级av在线播放| 亚洲视频欧美视频| 国产精品国产精品国产专区| 国产男女嘿咻视频在线观看 | 罗平县| 国产成人高清亚洲综合| 97激情| 男女视频在线一区二区| 久久天天躁夜夜躁狠狠85麻豆| 国产精品青草久久福利不卡| 国产美女一区二区三区| 亚洲色欲色欲大片www无码| 欧美成人论坛| 久久精品www人人做人人爽| 一本高清码二区三区不卡| 制服.丝袜.亚洲.中文.综合懂 | 久久青青草原亚洲av无码| 亚洲乱亚洲乱妇小说网| 久久久国产精品VA麻豆| av入口一区二区三区| 色综合欧美五月俺也去| 亚洲中文久久久精品无码| jizzjizz欧美|