<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      GPT5.5:更貴不更燒,主角給到Codex,逼Claude慌忙修復降智問題

      0
      分享至


      作者 | 貓貓頭
      郵箱 | cathy@pingwest.com

      GPT-5.5來了。API定價$5/$30每百萬token,GPT-5.4的兩倍。

      但它并不更燒token。


      Sam Altman在公布定價的同一條推文里補了一句:"Remember, you will need less tokens per task than 5.4!" 貴一倍,但每個任務token更少——"其實更劃算"。OpenAI總裁Greg Brockman在發布會上給了更大的詞:"a new class of intelligence."


      先看模型本身。

      主戰場是agentic coding和長文本:Terminal-Bench 2.0上82.7%,碾壓Opus 4.7的69.4%;1M token context window讓長文本檢索(MRCR v2)從GPT-5.4的36.6%跳到74.0%,Opus 4.7只有32.2%。GDPval(覆蓋44個職業的知識工作基準)84.9%。但SWE-Bench Pro(代碼修復)只有58.6%,Opus 4.7拿了64.3%——不是所有維度都贏。


      用例方面,三個數字值得記住:24,771份K-1稅表(71,637頁)自動審閱省了兩周;GPT-5.5參與了一個Ramsey數漸近證明,研究者說原本需要數月人工分析;OpenAI內部85%的員工每周都在用Codex。


      所以最大亮點不是"更聰明"。是更貴但更高效——定價翻倍但單任務token消耗顯著下降,推理速度通過與NVIDIA GB200/GB300的co-design提升了20%。加上Codex同步升級了瀏覽器控制、Sheets/Docs處理、系統級語音——GPT-5.5本質上是一個為Codex生態量身定制的模型。


      這是官方敘事。但4月23日的故事不止一個模型。

      1

      Benchmark先打起來了

      發布當天,獨立開發者@bridgemindai發了兩條推文
      第一條:"Claude Opus 4.7 dominates GPT 5.5 on SWE Bench Pro."


      幾小時后:"Claude Opus 4.7 is no longer the best model in the world. Not even close."


      同一個人,同一天,結論完全相反。兩邊的數據都是真的:

      SWE-Bench Pro(編碼):GPT-5.5不及Opus 4.7。@deedydas指出OpenAI刻意沒在發布材料里報這個成績——"trying really hard to bury the lede."

      Terminal-Bench 2.0(長時間推理):GPT-5.5 82.7% vs Opus 4.7 69.4%。碾壓。

      幻覺率(AA-Omniscience):GPT-5.5為86%,Opus 4.7為36%。上一代GPT-5.4是89%——兩代之間只降了3個百分點。

      Vending-Bench Arena(多人博弈):GPT-5.5策略干凈,照樣贏了耍賴的Opus 4.7。

      賓夕法尼亞大學教授Ethan Mollick在給了個框架:jagged frontier。AI的能力邊界不是平線推進,是鋸齒膨脹。選報道哪顆齒,就決定你講什么故事。

      這說明:當"誰最強"不再有統一答案,競爭重心就必須轉移。


      1

      Codex才是主菜

      轉移到哪?

      GPT-5.5發布同天,Codex桌面端上線了瀏覽器控制、Sheets/Slides/Docs處理、系統級語音、自動審查。Mollick的分析框架值得借用:AI有三層——Models、Apps、Harnesses。4月23日OpenAI三層同時升級。

      更重要的是生態卡位。


      Anthropic封殺了OpenClaw通過訂閱接口調用Claude。OpenAI則雇了OpenClaw創始人Peter Steinberger,宣布Codex訂閱可以在任何第三方工具里用——JetBrains、Xcode、Pi,甚至Claude Code。

      OpenAI開發者體驗主管Romain Huet的原話:"We want people to be able to use Codex, and their ChatGPT subscription, wherever they like!"


      Django Web 框架發起人Simon Willison用Claude Code逆向了Codex認證機制,做了個插件直接用訂閱調GPT-5.5。OpenAI沒封,還半官方鼓勵。Codex CLI已開源。

      Anthropic守API利潤率。OpenAI把訂閱制變成了開放平臺。

      再看API延遲發布。官方說"working on security and safeguards"。客觀效果:API上線前想用GPT-5.5,唯一路徑是Codex生態。用戶被鎖進了應用層。


      漲價兩倍 + API延后 + Codex全面升級開放第三方。三個同步決策,一個意圖:不賣算力,搶入口。

      競爭不在于模型本身了,主角是一整個生態的配套能力,搶的是未來的入口。

      1

      加速才剛開始

      GPT-5.5距GPT-5.4只隔了一個多月。OpenAI 首席科學家Jakub Pachocki在發布會上說了句讓人意外的話:"I would say the last few years have been surprisingly slow."


      過去幾年——外界看來AI狂飆的幾年——在OpenAI首席科學家眼里是慢的。

      OpenAI員工@tszzl透露已有研究者用GPT-5.5做"隔夜實驗":給個算法idea,通宵跑,醒來dashboard就緒。他的措辭是"competent AI research partner"。不是assistant,是partner。


      Mollick四個prompt拿到一篇完整學術論文,統計方法正確,文獻綜述真實。問題不在能力——"假設不夠有趣"。

      AI的瓶頸從能力滑向了品味。模型的競賽,從跑分滑向了生態。

      OpenAI在4月23日押注的不是更聰明的模型。是一個讓用戶走不掉的入口。

      而對于OpenAI新模型最大的背書,來自死敵Anthropic。

      此前兩者的競爭里,勢頭已經被Anthropic拿走,但這一次OpenAI的勢頭回來了。在發布當天,Claude官方開發平臺賬號發布公告,承認了大家詬病已久的“降智”問題,并表示已經修復。


      網友揶揄道:被用戶指責了足足一個月后,在對手發布更強模型后你來承認和修復了。


      這可能是GPT 5.5能力之強的最好背書。


      點個愛心,再走 吧

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      5月1日起全額繳納社保,全民創業時代正式謝幕,但請不要難過

      5月1日起全額繳納社保,全民創業時代正式謝幕,但請不要難過

      月滿大江流
      2026-05-06 17:01:05
      曹操撩寡婦說的10字金句,如今成約會萬能開場白!男人常掛在嘴邊

      曹操撩寡婦說的10字金句,如今成約會萬能開場白!男人常掛在嘴邊

      小豫講故事
      2026-05-06 08:09:51
      充電6分鐘續航2000公里!國產固態電池大突破,寧德時代或將量產

      充電6分鐘續航2000公里!國產固態電池大突破,寧德時代或將量產

      胖福的小木屋
      2026-05-06 18:47:23
      海參崴的街頭,中國孩子究竟在為誰歡呼?

      海參崴的街頭,中國孩子究竟在為誰歡呼?

      梳子姐
      2026-05-07 11:08:44
      成都龍泉驛通報民辦學校舉辦方代表不當言論處理情況:對羅某某作出行政處罰

      成都龍泉驛通報民辦學校舉辦方代表不當言論處理情況:對羅某某作出行政處罰

      澎湃新聞
      2026-05-07 11:40:27
      行業第一瘋!張雪直播10萬+連線讓用戶公開罵,“真誠殺”太狠了

      行業第一瘋!張雪直播10萬+連線讓用戶公開罵,“真誠殺”太狠了

      商悟社
      2026-05-07 00:07:04
      3孩2個非親生后續:妻子真容曝光社死,男方工作遭牽連,已起訴

      3孩2個非親生后續:妻子真容曝光社死,男方工作遭牽連,已起訴

      阿訊說天下
      2026-05-06 11:40:01
      歐冠決賽對陣出爐:巴黎力爭衛冕!阿森納盼復仇+沖首冠 31日打響

      歐冠決賽對陣出爐:巴黎力爭衛冕!阿森納盼復仇+沖首冠 31日打響

      我愛英超
      2026-05-07 05:06:13
      伊朗外長太聰明了:不求中國給飛機大炮,只求中國一件事!

      伊朗外長太聰明了:不求中國給飛機大炮,只求中國一件事!

      安安說
      2026-05-07 11:09:34
      NBA球員投票出爐:申京當選最被高估球員 約翰遜懷特并列最被低估

      NBA球員投票出爐:申京當選最被高估球員 約翰遜懷特并列最被低估

      羅說NBA
      2026-05-07 06:19:23
      王海稱胖東來套取國家補貼資金,情節嚴重負責人可承擔刑事責任

      王海稱胖東來套取國家補貼資金,情節嚴重負責人可承擔刑事責任

      映射生活的身影
      2026-05-06 23:38:17
      暗黑界10大G系女神天花板,凪光只能排在第二

      暗黑界10大G系女神天花板,凪光只能排在第二

      吃瓜黨二號頭目
      2026-05-07 10:28:15
      女子和表弟偷情,丈夫半夜來捉奸,2008年殺表弟后妻子嫌讓她丟臉

      女子和表弟偷情,丈夫半夜來捉奸,2008年殺表弟后妻子嫌讓她丟臉

      漢史趣聞
      2026-05-03 15:27:31
      院長和女研究員在國際頂刊大肆造假,同濟大學通報:院長免職降級,第一作者被解聘

      院長和女研究員在國際頂刊大肆造假,同濟大學通報:院長免職降級,第一作者被解聘

      高分子科學前沿
      2026-05-06 21:26:12
      人心是怎么壞的?女子被救后,反手一巴掌給施救者,后續來了!

      人心是怎么壞的?女子被救后,反手一巴掌給施救者,后續來了!

      眼光很亮
      2026-05-07 07:35:40
      3-0!3-2!世乒賽男團8強全部出爐:中國隊對手確定 日本兇多吉少

      3-0!3-2!世乒賽男團8強全部出爐:中國隊對手確定 日本兇多吉少

      侃球熊弟
      2026-05-07 06:18:00
      男子稱爺爺30年前向天津美院捐贈唐伯虎、黃庭堅、蘇軾等40件名家書畫,如今部分去向不明,天津美院回應:正處理此事

      男子稱爺爺30年前向天津美院捐贈唐伯虎、黃庭堅、蘇軾等40件名家書畫,如今部分去向不明,天津美院回應:正處理此事

      江西晨報
      2026-05-07 09:00:53
      800萬人狂喊“老婆”:“韓國棒球女神”被扒外衣!

      800萬人狂喊“老婆”:“韓國棒球女神”被扒外衣!

      聽心堂
      2026-05-06 17:41:16
      黃仁勛:中國絕不能獲得最先進芯片!

      黃仁勛:中國絕不能獲得最先進芯片!

      中國半導體論壇
      2026-05-06 12:43:35
      每體:穆里尼奧與老佛爺視頻通話,表示自己不會與平圖斯共事

      每體:穆里尼奧與老佛爺視頻通話,表示自己不會與平圖斯共事

      懂球帝
      2026-05-07 09:30:51
      2026-05-07 12:32:51
      硅星人 incentive-icons
      硅星人
      硅(Si)是創造未來的基礎,歡迎來到這個星球。
      3061文章數 10495關注度
      往期回顧 全部

      科技要聞

      凌晨突發!馬斯克租22萬塊GPU給“死敵”

      頭條要聞

      北京三位女大學生青海自駕游2死1傷 傷者一審獲刑4年

      頭條要聞

      北京三位女大學生青海自駕游2死1傷 傷者一審獲刑4年

      體育要聞

      阿森納巴黎會師歐冠決賽!5月31日開戰

      娛樂要聞

      小S阿雅重返大S母校,翻看大S畢業照

      財經要聞

      特朗普:美伊“很有可能”達成協議

      汽車要聞

      理想為什么不做轎車,有了解釋……

      態度原創

      數碼
      游戲
      藝術
      健康
      公開課

      數碼要聞

      微軟委托報告:Win11筆記本比蘋果MacBook Neo更有競爭力

      《文明7》更新“Test of Time”5月19日上線 新系統導入

      藝術要聞

      這位老教授筆下的青年,活力滿滿

      干細胞治燒燙傷面臨這些“瓶頸”

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日本无码中出| 莒南县| 午夜夫妻试看120国产| 蜜桃AV在线| 日韩成人无码影院| 国产免费的野战视频| 内射无码专区久久亚洲| 人妻少妇邻居少妇好多水在线 | 日韩精品久久久久久久午夜片| 人妻无码中文久久久久专区| 欧美白妞大战非洲大炮| 国产精品美女在线播放| 最新A片| 精品亚洲国产成人a片app| 久久国产欧美日韩精品免费| 国产一区二区三区不卡在线观看 | 日本xxx69| 漂亮人妻被中出中文字幕色| 欧美国产激情二区三区| 麻豆最新国产AV原创精品| 亚洲综合激情在线| 日韩AV中文字幕在线| 亚洲av综合网| 国产高清在线精品一本大道| 福利二区| 亚洲ⅴ欧洲第一的日产av| 成人无码视频免费播放| 亚洲无码社区| 99视频精品全部免费 在线| 无码人妻一区二区三区线| 欧美特黄三级在线观看| 伊人激情av一区二区三区| 国产欧美日韩视频一区二区三区| 亚洲一区二区av高清| 日韩一区二区三区av| 亚洲综合精品一区二区三区| 乌克兰少妇videos高潮| 日韩大片免费观看视频播放| 亚洲 欧洲 日韩 综合二区| 波多野结衣办公室双飞 | 蜜桃视频免费版在线观看|