<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      Claude Opus 4.7 來了,編程能力又炸了

      0
      分享至

      今天繼續聊 Claude —— Anthropic 剛剛正式發布了 Claude Opus 4.7,編程能力這次又是一次暴擊

      Benchmark 一覽

      下圖是 Anthropic 給出的跨領域 benchmark 對比,Opus 4.7 在大多數任務上超過了 Opus 4.6,以及 GPT-5.4 和 Gemini 3.1 Pro:


      Claude Opus 4.7 跨領域 Benchmark 對比 它比 Opus 4.6 強在哪?

      Anthropic 官方說,Opus 4.7 在高級軟件工程上是 Opus 4.6 的「顯著提升」,尤其是在那些最難的任務上

      這話我本來要打個折,但看了一圈測試用戶的反饋之后,我信了

      幾個讓我印象深刻的數據:

      • Cursor :在 93 個編程任務的 benchmark 上,任務解決率比 Opus 4.6 **提升了 13%**,包括 4 個 Opus 4.6 和 Sonnet 4.6 都搞不定的任務

      • Rakuten :在 SWE-bench 上,Opus 4.7 解決的真實生產 bug 是 Opus 4.6 的 3 倍

      • XBOW(自主滲透測試) :視覺準確性從 Opus 4.6 的 54.5% 直接干到 **98.5%**,這簡直是量變引發質變

      • Notion :工具調用準確率和規劃能力提升超過 **10%**,更難得的是,它是第一個通過隱式需求測試(implicit-need tests)的模型

      視覺能力:分辨率翻了 3 倍多

      這次 Opus 4.7 的視覺升級幅度相當大

      之前的 Claude 模型能接受的圖片分辨率,現在 Opus 4.7 可以接受最長邊 2,576 像素(約 3.75 百萬像素),是之前版本的 3 倍以上

      這意味著什么?

      • 讀密集截圖的 computer-use agent,再也不會因為文字太小看不清而出錯

      • 從復雜圖表里提取數據,精度大幅提升

      • 科學、法律文檔里那些需要像素級精準的工作,終于能干了

      來自 Solve Intelligence(生命科學專利工作流)的反饋印證了這一點:從化學結構式到復雜技術圖紙,理解能力大幅躍升

      注意這是模型層面的變化,不是 API 參數,圖片會自動以更高精度處理。但因為高分辨率圖片消耗 token 更多,如果你不需要那么高的精度,可以在發送前先降采樣

      指令遵循:這次是認真的

      Opus 4.7 在指令遵循上大幅提升

      聽起來是好事,但 Anthropic 自己也提醒了:之前給舊模型寫的 prompt,有時候會跑出意外結果——因為舊模型對指令是「松散理解」甚至跳過某些部分,現在 Opus 4.7 是字面意思照單全收

      所以如果你是 API 用戶,升級前最好重新審視一下你的 prompt,該精確的地方要精確,該刪掉的廢話要刪掉

      新功能:xhigh 努力等級

      Opus 4.7 引入了全新的 xhigh(extra high)努力等級,介于原來的 highmax 之間

      這給用戶提供了更細粒度的控制:在硬問題上,你可以選擇在「思考質量」和「響應延遲」之間找到更合適的平衡點

      在 Claude Code 里,現在默認把所有計劃的努力等級提升到了 xhigh

      官方建議在編程和 Agent 場景下測試時,從 highxhigh 開始

      下圖是不同努力等級下,token 使用量和任務得分的關系:


      不同努力等級下的 token 使用量與任務得分對比 網絡安全:先邁一步,但很謹慎

      Anthropic 上周公布了 Project Glasswing,直面 AI 在網絡安全領域的兩面性——風險與機遇。

      Opus 4.7 是 Glasswing 框架下第一個正式落地的模型,它的網絡安全能力不如 Claude Mythos Preview(目前最強的 Anthropic 模型),Anthropic 在訓練階段專門做了差異化處理,有意限制了部分網絡安全能力

      同時,Opus 4.7 配備了自動檢測和攔截高危網絡安全請求的防護機制

      真正有合法需求的安全研究人員、滲透測試工程師,可以通過 Cyber Verification Program 加入白名單

      這條路子我覺得挺對的:先在能力較弱的模型上驗證防護機制是否有效,積累經驗后,再逐步向更強的 Mythos 級別模型開放

      安全性測評
      Claude Opus 4.7 行為審計評分

      在安全對齊方面,Opus 4.7 和 Opus 4.6 整體差不多——欺騙行為、諂媚、濫用配合率都處于低水平

      部分維度(比如誠實性、對抗 prompt 注入攻擊)比 4.6 有改進,少數地方(比如有害物質信息的過度詳細回復)略微退步

      整體結論:「大體對齊、基本可信,但還沒達到理想狀態」

      Mythos Preview 依然是 Anthropic 目前對齊效果最好的模型

      價格 & 可用性

      好消息:價格不變,和 Opus 4.6 一樣:

      • 輸入:**$5 / 百萬 tokens**

      • 輸出:**$25 / 百萬 tokens**

      支持平臺:

      • Claude 全產品線

      • Claude API(模型 ID: claude-opus-4-7

      • Amazon Bedrock

      • Google Cloud Vertex AI

      • Microsoft Foundry

      還有這些新東西一起上

      隨 Opus 4.7 一起發布的還有幾個配套更新:

      1. /ultrareview 命令 (Claude Code):一鍵啟動深度代碼審查,像一個認真的 reviewer 一樣幫你找 bug 和設計問題,Pro 和 Max 用戶各有 3 次免費試用額度。

      2. Task Budgets(公測) (API):給開發者一個新機制,引導 Claude 在長任務中合理分配 token 預算,避免前緊后松或前松后緊

      3. Auto Mode 擴展 :Max 用戶現在也可以開啟 Auto Mode,讓 Claude 在長任務里自主決策權限請求,減少中斷

      升級注意事項

      如果你在生產上用 Opus 4.6,升級到 4.7 有兩個點要注意:

      1. 新 tokenizer :同樣的輸入,token 數大約會增加 1.0–1.35 倍 ,取決于內容類型

      2. 更高努力等級下思考更多 :尤其是 Agent 場景的后續對話輪次,輸出 token 會增加

      Anthropic 提供了遷移指南,建議先在真實流量上測一下差異

      總結

      Opus 4.7 的核心關鍵詞:編程更強、視覺更清、指令更準、安全更嚴

      如果你是:

      • Claude Code 用戶 :直接用,默認已升級到 xhigh 努力等級,新的 /ultrareview 也很值得試

      • API 開發者 :記得重新調 prompt,關注 token 用量變化,遷移指南先讀一遍

      • 網絡安全從業者 :有合法需求的走 Cyber Verification Program

      最讓我感興趣的其實是這個關于「更好同事」的描述——一個會在技術討論中反駁你、幫你做出更好決定的 AI

      這可能才是 AI 應該有的樣子,不是附和你,是真的幫你。

      .7

      制作不易,如果這篇文章覺得對你有用,可否點個關注。給我個三連擊:點贊、轉發和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      賴清德專機繞路返航,4架戰機護航盡顯心虛

      賴清德專機繞路返航,4架戰機護航盡顯心虛

      音樂時光的娛樂
      2026-05-05 14:30:00
      倫敦世乒賽:8強賽對陣出爐,林詩棟3-0完成救贖,龍隊劉詩雯觀戰

      倫敦世乒賽:8強賽對陣出爐,林詩棟3-0完成救贖,龍隊劉詩雯觀戰

      晚霧空青
      2026-05-06 00:58:31
      不是文班 不是福克斯!馬刺爆冷輸球揪出水貨 33歲老將今夏恐退役

      不是文班 不是福克斯!馬刺爆冷輸球揪出水貨 33歲老將今夏恐退役

      籃球圈里的那些事
      2026-05-05 17:15:20
      五一假期結束別難過 還有45天又放假了!端午節放假通知正式出爐:6月19日-21日連放三天,不補班不調休

      五一假期結束別難過 還有45天又放假了!端午節放假通知正式出爐:6月19日-21日連放三天,不補班不調休

      每日經濟新聞
      2026-05-05 23:40:29
      美國人的歷史課本,是怎樣寫中國的?僅有20頁,記載了6個中國人

      美國人的歷史課本,是怎樣寫中國的?僅有20頁,記載了6個中國人

      抽象派大師
      2026-05-03 00:24:53
      1958年毛澤東視察濟南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

      1958年毛澤東視察濟南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

      史海孤雁
      2026-05-05 17:07:19
      突發!趙繼偉深夜11點做出重大決定,球迷:要加盟上海或北控?

      突發!趙繼偉深夜11點做出重大決定,球迷:要加盟上海或北控?

      呀古銅
      2026-05-06 06:09:06
      2001年,夫妻簽離婚協議時發現沒筆,妻子獨自上樓取筆時遇刺身亡

      2001年,夫妻簽離婚協議時發現沒筆,妻子獨自上樓取筆時遇刺身亡

      明月清風閣
      2026-05-05 21:25:06
      “新型霸凌”正在校園悄悄流行,孩子不敢說,但家長一定牢記這些

      “新型霸凌”正在校園悄悄流行,孩子不敢說,但家長一定牢記這些

      木言觀
      2026-05-05 07:09:57
      舌吻3小時、喊兒子小狼狗,狄鶯的畸形母愛終于反噬了

      舌吻3小時、喊兒子小狼狗,狄鶯的畸形母愛終于反噬了

      子芫伴你成長
      2026-05-02 22:50:39
      39歲何潔直播公布三婚,這姐還結啊,頭發都白了

      39歲何潔直播公布三婚,這姐還結啊,頭發都白了

      夢想總會變成真
      2026-05-05 21:36:52
      連沉7船!美軍動真格,真相曝光,德黑蘭權力失控,革命衛隊玩火

      連沉7船!美軍動真格,真相曝光,德黑蘭權力失控,革命衛隊玩火

      最美的巧合
      2026-05-05 16:00:24
      FIFA徹底慌了!多國集體拒高價買世界杯版權,天價泡沫徹底破裂

      FIFA徹底慌了!多國集體拒高價買世界杯版權,天價泡沫徹底破裂

      行者聊官
      2026-05-05 10:20:23
      比黃金貴3倍!1公斤賣165萬,以前農村隨手扔,看看你家有嗎

      比黃金貴3倍!1公斤賣165萬,以前農村隨手扔,看看你家有嗎

      三農雷哥
      2026-05-04 11:49:13
      百億私募暴雷,52人近1億血汗錢被套!

      百億私募暴雷,52人近1億血汗錢被套!

      三農老歷
      2026-05-05 05:42:41
      醫生發現:一旦吃上降血壓藥,這幾件事就別做了,別害了自己

      醫生發現:一旦吃上降血壓藥,這幾件事就別做了,別害了自己

      敘說醫療健康
      2026-05-06 05:00:06
      比亞迪這波降價,不只是真香,而是把一部分人直接推到了分岔路口

      比亞迪這波降價,不只是真香,而是把一部分人直接推到了分岔路口

      三農老歷
      2026-05-05 15:01:13
      球迷態度:阿森納英超領跑+歐冠進決賽,本賽季結局將如何?

      球迷態度:阿森納英超領跑+歐冠進決賽,本賽季結局將如何?

      懂球帝
      2026-05-06 05:45:10
      曾10分鐘賣500萬桶,半個娛樂圈為它帶貨!昔日網紅美食要破產了,杭州有便利店已下架

      曾10分鐘賣500萬桶,半個娛樂圈為它帶貨!昔日網紅美食要破產了,杭州有便利店已下架

      都市快報橙柿互動
      2026-05-06 00:20:04
      吳千語住進上海別墅,裝修剛完就搬了家,中產生活悄悄變了樣

      吳千語住進上海別墅,裝修剛完就搬了家,中產生活悄悄變了樣

      孤傲何妨初
      2026-05-06 04:31:12
      2026-05-06 06:56:49
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3372文章數 11146關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內娛真情誼!楊紫為謝娜演唱會送花籃

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      本地
      藝術
      手機
      時尚
      公開課

      本地新聞

      用青花瓷的方式,打開西溪濕地

      藝術要聞

      這些勞動圖畫最美!

      手機要聞

      iPhone 20周年機型或配備固態按鈕,iPhone 18再次確認工藝降級!

      衣服不用準備太多,找到一些實用的單品才最重要,百搭又有性價比

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 四虎女优在线视频免费看| 护士奶头又大又软又好摸| 国产高清在线a视频大全| 亚洲人妻中文字幕一区| 一区二区三区午夜| 国产亚洲精品2021自在线| 四虎影视永久无码精品| 18禁美女裸体爆乳无遮挡| 亚洲AV熟女| 狼群影院www| 免费无码无遮挡裸体视频在线观看| 在线天堂最新版资源| 国产尤物精品福利视频| 一区一区三区产品乱码| 精品自拍一区国产精品| 亚欧免费视频一区二区三区 | 国产精品丝袜一区二区三区| 久热爱精品视频在线◇| 真人无码作爱免费视频| 中文原创av| 高清无码午夜福利视频| 麻豆av无码蜜臀av| 亚洲国产欧美在线人成| 免费毛儿一区二区十八岁| wwwjizzjizz| 国产精品永久免费嫩草研究院| 日本午夜精品伦理一区| 精品麻豆丝袜高跟鞋av| 四虎国产精品免费久久 | 午夜福利10000| 色悠久久久久久久综合网| 日韩美女视频一区二区三区| 午夜精品久久久久久久99| 精品成人毛片一区二区| 狠狠爱五月丁香亚洲综| 亚洲国产精品久久久久秋霞| 热久久亚洲| 久久天堂av综合色无码专区 | 爆乳日韩尤物无码一区| 99久久精品午夜一区二区| 国产乱辈通伦影片在线播放亚洲|