<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      GPT5.5突襲發(fā)布,編程成功率創(chuàng)新高,員工已跨部門使用

      0
      分享至



      曾經(jīng),OpenAI CEO奧特曼用“嚇暈癱坐在椅子上,佛看到原子彈爆炸”來形容自己初次使用GPT5的體驗(yàn)。當(dāng)人們最終發(fā)現(xiàn)這次更新遠(yuǎn)沒有期待中的驚艷時(shí),這段夸張的描述反而成為了人們反復(fù)嘲諷OpenAI的網(wǎng)梗。

      然而在4月24日,OpenAI在事前并沒有進(jìn)行預(yù)告鋪墊的情況下半夜發(fā)布的GPT5.5,卻帶來了不小的驚喜。官方稱GPT5.5是一種面向?qū)嶋H工作和智能體的新型智能,主打Agent編程、知識(shí)工作、科學(xué)研究等。目前,GPT5.5已經(jīng)面向ChatGPT和Codex的Plus、Business、Enterprise用戶推出,API也將隨后發(fā)布。

      雖然沒人被“嚇癱”,但從各類第三方網(wǎng)站的評(píng)分看,GPT5.5的綜合表現(xiàn)確實(shí)優(yōu)異,不僅比GPT5.4大幅進(jìn)步,也在多個(gè)領(lǐng)域超越了Claude Opus 4.7、Gemini 3.1 Pro等主要競(jìng)爭(zhēng)對(duì)手。可以說,在過去一段時(shí)間里飽受質(zhì)疑的OpenAI今天打了個(gè)漂亮的翻身仗。

      在OpenAI內(nèi)部設(shè)立的,針對(duì)20小時(shí)長(zhǎng)周期軟件工程的Expert-SWE測(cè)評(píng)中,GPT-5.5的成功率來到了驚人的73.1%,顯著高于上一代GPT5.4的68.5%。

      在衡量復(fù)雜命令行工作流的Terminal-Bench2.0的測(cè)試中,GPT5.5的評(píng)分達(dá)到82.7%,遠(yuǎn)高于Claude的69.4%。在知識(shí)工作任務(wù)GDPval、高級(jí)數(shù)學(xué)測(cè)試FrontierMath、衡量真實(shí)電腦操作能力的OSWorld-Verified等維度,GPT5.5的評(píng)分均高出競(jìng)爭(zhēng)對(duì)手一截。

      GPT5.5的編程能力較為出色,但Opus4.7在SweetBench Pro測(cè)試中的表現(xiàn)依然保持領(lǐng)先地位。GPT5.5在測(cè)試中的得分為58.6%,低于Opus4.7的64.3%。但是對(duì)于這個(gè)成績(jī),OpenAI也進(jìn)行了進(jìn)一步說明,稱行業(yè)內(nèi)已有報(bào)告指出該評(píng)測(cè)存在過擬合現(xiàn)象,無法代表真實(shí)的編程能力。

      GPT還有一個(gè)顯著提升的維度就是網(wǎng)絡(luò)安全。在CyberGym測(cè)試中,GPT5.5的得分為81.8%,高過了Opus 4.7的73.1%。在CTF“奪旗”挑戰(zhàn)中,GPT5.5的得分為881%,高于GPT5.4的83.7%。

      雖然GPT在多個(gè)領(lǐng)域正在變得更聰明,但OpenAI更樂于強(qiáng)調(diào)這是一個(gè)專為真實(shí)工作和智能體任務(wù)打造的模型。OpenAI的X官方賬號(hào)稱,GPT5.5“旨在理解復(fù)雜目標(biāo)、使用工具、檢查其工作,并將更多任務(wù)進(jìn)行到底”,而它的出現(xiàn)“標(biāo)志著完成計(jì)算機(jī)工作的全新方式”。

      用更直白的話說,這次升級(jí)讓GPT有了能自己干活的能力,從輔助決策變成了參與執(zhí)行。人類直接把一個(gè)亂糟糟的復(fù)雜任務(wù)丟給GPT5.5,它就可以通過理解目標(biāo)、拆解步驟、調(diào)用工具、修正過程的流程交付出最終結(jié)果。

      為了更好說明這一點(diǎn),OpenAI還公布了公司內(nèi)部對(duì)產(chǎn)品的使用情況。目前,OpenAI有超過85%的員工每周跨部門使用搭載GPT5.5的Codex。而公司的財(cái)務(wù)團(tuán)隊(duì)已經(jīng)用GPT5.5完成了24771份,共計(jì)7萬余頁的稅表審核,比往年提前兩年完工。

      不過,這次升級(jí)似乎還沒有一步到位,讓人們可以完全放手。多個(gè)第三方評(píng)測(cè)都提到了 GPT-5.5 對(duì)任務(wù)邊界的依賴更強(qiáng)。當(dāng)人們的需求描述不清楚時(shí),它不會(huì)主動(dòng)幫你補(bǔ)全,而是會(huì)按現(xiàn)有信息執(zhí)行。這種“服從”在某些場(chǎng)景是優(yōu)點(diǎn),在另一些場(chǎng)景反而是缺陷。

      AI大模型的智慧和速度往往被視為不可兼得,更大的模型和更多的參數(shù)就意味著更長(zhǎng)的思考時(shí)間。但在這次更新中,OpenAI官方稱GPT5.5在智能水平大幅提高的同時(shí),真實(shí)服務(wù)中的速度與GPT5.4保持了一致。

      GPT5.5的另一大特征就是更加節(jié)省Token,將Token消耗降低到了前一代的36分之一。在同類的Codex任務(wù)里,GPT5.5也只需要更少的Token就能完成。這也意味著,雖然此次API的價(jià)格大幅上漲至每百萬Token 5美元,pro版30美元,但因?yàn)樾实奶嵘蚑oken消耗的減少,實(shí)際增加的成本不多。

      OpenAI聯(lián)合創(chuàng)始人兼總裁格雷格·布羅克曼(Greg Brockman)提到這一點(diǎn)時(shí)表示,“讓企業(yè)和普通用戶都能用上更前沿的 AI 能力”是公司的目標(biāo)之一。

      當(dāng)OpenAI帶著新模型重回巔峰時(shí),Anthropic最近卻比較煩。長(zhǎng)期主打安全牌卻爆出了安全丑聞、對(duì)重度付費(fèi)用戶嚴(yán)厲限流、大面積無差別封號(hào)等事件都引發(fā)了巨大爭(zhēng)議,日益高企的Token費(fèi)用和Token消耗也讓很多人直呼“用不起”。

      此前OpenAI在內(nèi)部郵件中說自己相對(duì)于Anthropic的優(yōu)勢(shì)是算力?,F(xiàn)在,隨著算力充足的OpenAI大秀肌肉,而Anthropic在算力吃緊中體驗(yàn)不斷打折,這兩位一度“貼身肉搏”的死對(duì)頭似乎又有了拉開差距的趨勢(shì)。

      聲明:個(gè)人原創(chuàng),僅供參考

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      安徽18歲男子蹊蹺失聯(lián) 警方通報(bào)

      安徽18歲男子蹊蹺失聯(lián) 警方通報(bào)

      黃河新聞網(wǎng)呂梁
      2026-05-01 18:20:55
      冰箱可靠性排名出爐:第一名不是LG也不是三星

      冰箱可靠性排名出爐:第一名不是LG也不是三星

      灰度測(cè)試中
      2026-05-01 04:59:13
      紅場(chǎng)閱兵涼了:去年27國捧,今年只剩4家“自己人”

      紅場(chǎng)閱兵涼了:去年27國捧,今年只剩4家“自己人”

      斯德哥爾摩的帕金森
      2026-05-01 12:29:58
      懂事!劉國梁倫敦世乒賽看望國乒,王楚欽停步給劉主席王勵(lì)勤讓路

      懂事!劉國梁倫敦世乒賽看望國乒,王楚欽停步給劉主席王勵(lì)勤讓路

      818體育
      2026-05-01 21:55:54
      暴雨!大風(fēng)!最強(qiáng)時(shí)段確定!江蘇天氣最新預(yù)測(cè)

      暴雨!大風(fēng)!最強(qiáng)時(shí)段確定!江蘇天氣最新預(yù)測(cè)

      江南晚報(bào)
      2026-05-02 03:34:14
      三項(xiàng)“罪證”實(shí)錘,莎拉沒有亂說,她真打算要馬科斯一家的命?

      三項(xiàng)“罪證”實(shí)錘,莎拉沒有亂說,她真打算要馬科斯一家的命?

      溫讀史
      2026-05-02 06:13:59
      生理旺盛的女性,大多有這3個(gè)特征,超準(zhǔn)!

      生理旺盛的女性,大多有這3個(gè)特征,超準(zhǔn)!

      皓皓情感說
      2026-04-25 19:09:10
      中途散伙!針對(duì)中國的軍演,美日菲發(fā)現(xiàn)自己真實(shí)身份,排隊(duì)跑路了

      中途散伙!針對(duì)中國的軍演,美日菲發(fā)現(xiàn)自己真實(shí)身份,排隊(duì)跑路了

      阿雹娛樂
      2026-05-01 11:28:27
      勞拉新形象太丑胸圍被大砍!祖國人看了都沒食欲

      勞拉新形象太丑胸圍被大砍!祖國人看了都沒食欲

      游民星空
      2026-04-29 16:11:32
      申花蓉城之戰(zhàn)創(chuàng)造上海體育場(chǎng)新紀(jì)錄,61815人現(xiàn)場(chǎng)觀戰(zhàn)背后的“經(jīng)濟(jì)賬”

      申花蓉城之戰(zhàn)創(chuàng)造上海體育場(chǎng)新紀(jì)錄,61815人現(xiàn)場(chǎng)觀戰(zhàn)背后的“經(jīng)濟(jì)賬”

      上觀新聞
      2026-05-02 05:11:13
      伊朗最高領(lǐng)袖致辭

      伊朗最高領(lǐng)袖致辭

      揚(yáng)子晚報(bào)
      2026-04-30 20:46:28
      爆冷淘汰掘金!森林狼主帥賽后扎心懟掘金:是你們挑的我們

      爆冷淘汰掘金!森林狼主帥賽后扎心懟掘金:是你們挑的我們

      仰臥撐FTUer
      2026-05-01 14:26:14
      動(dòng)容!東莞街頭一男子突然倒地失去呼吸脈搏,3歲幼童在一旁茫然……他們出現(xiàn)了!

      動(dòng)容!東莞街頭一男子突然倒地失去呼吸脈搏,3歲幼童在一旁茫然……他們出現(xiàn)了!

      廣東活動(dòng)
      2026-05-01 12:09:07
      基輔急瘋了!俄拿下盧甘斯克,美國無暇顧及,乘勝拿下決定性勝利

      基輔急瘋了!俄拿下盧甘斯克,美國無暇顧及,乘勝拿下決定性勝利

      愛吃醋的貓咪
      2026-04-28 20:27:46
      “只顧自己紋眉,不管女兒死活?”14歲女孩生日照,臉上全是槽點(diǎn)

      “只顧自己紋眉,不管女兒死活?”14歲女孩生日照,臉上全是槽點(diǎn)

      蝴蝶花雨話教育
      2026-04-25 00:45:03
      首個(gè)退群北約的國家來了:已走程序,退意已決!

      首個(gè)退群北約的國家來了:已走程序,退意已決!

      福建睿平
      2026-04-27 11:46:08
      海航空姐賣貨,真的是太拼了

      海航空姐賣貨,真的是太拼了

      微微熱評(píng)
      2026-05-01 15:58:13
      美伊一旦結(jié)束,這幾個(gè)國家下場(chǎng)會(huì)很慘,特朗普已列出名單!

      美伊一旦結(jié)束,這幾個(gè)國家下場(chǎng)會(huì)很慘,特朗普已列出名單!

      深度報(bào)
      2026-04-29 22:37:38
      兒子深夜生幻覺屢次性侵母親,婦女終于無法忍受,凌晨揮刀

      兒子深夜生幻覺屢次性侵母親,婦女終于無法忍受,凌晨揮刀

      長(zhǎng)安一孤客
      2026-04-26 13:18:18
      Q1國內(nèi)激活量數(shù)據(jù)出爐,華為第一,蘋果第二

      Q1國內(nèi)激活量數(shù)據(jù)出爐,華為第一,蘋果第二

      科技鋒說
      2026-05-02 05:45:39
      2026-05-02 07:04:49
      熱點(diǎn)一觸即發(fā)
      熱點(diǎn)一觸即發(fā)
      精彩聚焦:全球熱點(diǎn),一觸即發(fā)!
      604文章數(shù) 117關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek發(fā)布多模態(tài)論文又連夜刪除

      頭條要聞

      美國也搞起"人肉代購" "去墨西哥買中國車"教程瘋傳

      頭條要聞

      美國也搞起"人肉代購" "去墨西哥買中國車"教程瘋傳

      體育要聞

      無奈!約基奇:這要在塞爾維亞 全隊(duì)早被炒了

      娛樂要聞

      馬筱梅產(chǎn)后身材恢復(fù)超好 現(xiàn)身戶外直播

      財(cái)經(jīng)要聞

      GPU神話松動(dòng),AI真正的戰(zhàn)場(chǎng)變了

      汽車要聞

      限時(shí)9.67萬起 吉利星越L/星瑞i-HEV智擎混動(dòng)上市

      態(tài)度原創(chuàng)

      本地
      數(shù)碼
      旅游
      公開課
      軍事航空

      本地新聞

      用青花瓷的方式,打開西溪濕地

      數(shù)碼要聞

      索尼推出HT-A7100回音壁:搭60智能穹頂聲場(chǎng)2.0技術(shù),5282元

      旅游要聞

      暢游“寶藏城市” 品味多元中國(外國游客感受“中國之美”)

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗:持續(xù)推進(jìn)海上封鎖的行為不可容忍

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产白嫩护士在线播放| 伊人久久大香线蕉在观看| 91久久精品美女高潮不断| 国产欧美VA天堂在线观看视频 | 无码一区二区三区在线在看| 蜜桃视频婷婷狼人看在线视频| 人妖精品视频在线观看| 亚州在线播放免费视频| 久久大香伊蕉在人线国产h| 国产三级精品三级在线看| 亚洲精品2| 成人av午夜在线观看| 好了av四色综合无码| 欧美成人一区二免费视频| 国产亚洲欧美日韩在线一区| 一区二区三区四区av| 大地资源网第二页免费观看| 国产偷国产偷亚洲欧美高清| 亚洲色欲色欲www在线观看| 亚洲综合av一区二区三区| 国内少妇偷人精品视频| 亚洲一级毛片在线观播放| 欧美丰满熟妇bbbbbb百度| 成人福利国产午夜AV免费不卡在线| 伊人久久大香线蕉avapp下载| 欧美亚韩国产| 国产超碰AV人人做人人爽| 久久精品国产精品亚洲蜜月| 国产无遮挡18禁无码网站免费| 国产无套乱子伦精彩是白视频| 996热re视频精品视频这里| 夜色福利导航| 五月天国产亚洲AV麻豆| 亚洲伊人久久大香线蕉av| 国产亚洲婷婷香蕉久久精品 | 亚洲女人天堂成人av在线| 亚洲综合在线一区二区三区| 色猫咪av在线网址| 国产清纯在线一区二区vr| 国产一区二区波多野结衣| 亚洲国产一区在线播放|