<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5.5 Instant:首個被標記「高能力」的即時模型

      0
      分享至

      Model

      今天凌晨,OpenAI 更新了 ChatGPT 的默認模型,從 GPT-5.3 Instant 升級到 GPT-5.5 Instant。你沒看錯...ChatGPT 的默認模型,一直都是 5.3


      ChatGPT 模型選擇器,最新三檔都是 5.5 了

      這個模型也以 API 的方式向外提供,代號 chat-last:400k 上下文,$5/$30 每百萬 token,與 GPT-5.5 默認版本保持一致

      Instant 是 ChatGPT 里每天被數億人用到的那個模型。每次你打開 ChatGPT 隨手問一句話,跑的就是它。這次升級做了三件事:把幻覺砍了一半,把記憶接到了 Gmail,把安全評級拉到了前沿模型的標準


      https://developers.openai.com/api/docs/models/chat-latest

      按照官方說法,這次升級做了三件事:把幻覺砍了一半、把記憶接到了 Gmail、把安全評級拉到了前沿模型的標準

      至于其他要點,我整理在了下方表格,掃一眼就行:

      幻覺 高危領域(醫療、法律、金融)的幻覺率比 GPT-5.3 Instant 降了 52.5%

      跑分 AIME 2025 數學測試從 65.4 跳到 81.2,MMMU-Pro 多模態推理從 69.2 到 76

      記憶 能檢索過往對話、上傳文件和 Gmail 郵件來個性化回答,先開放給 Plus 和 Pro 用戶

      安全 第一個被 OpenAI 標記為「高能力」的 Instant 模型(網絡安全 + 生化領域)

      開發者 API 代號 chat-latest,GPT-5.3 保留三個月后退役

      另外就是:上一版 GPT-5.3 Instant 是 3 月 3 日發的,而 GPT-5.4 并沒有出現在 ChatGPT 里面過

      幻覺減了多少

      高危問答是這次升級改善最大的地方。OpenAI 的內部測試分了三個場景:日常事實類、用戶標記過錯誤的對話、以及醫療法律金融類高風險問答

      在高風險場景下,GPT-5.5 Instant 比 GPT-5.3 Instant 產生的錯誤聲明少了 52.5%。在用戶標記的歷史失敗對話上,錯誤率降了 37.3%

      OpenAI 同時發了 System Card,里面給了 HealthBench 的成績:整體從 49.6 漲到 51.4,HealthBench Professional(面向臨床場景)從 32.9 漲到 38.4。漲幅不算炸裂,但方向是對的

      注:HealthBench 的評分做了長度調整。回答越長越容易得高分,OpenAI 這次對回答長度做了懲罰系數


      System Card 幻覺測試結果:三個場景下 GPT-5.5 Instant 均優于前代

      跑分怎么樣

      Instant 系列一直被定位為「快而輕」的日常模型,跑分不是它的長項。但這一版的數字還是有些意思

      AIME 2025 數學測試 81.2,上一版 65.4。這個 16 分的跳躍,放在 Instant 這個量級的模型上相當少見。MMMU-Pro 多模態推理 76,上一版 69.2。視覺推理、圖表理解、科學題都有進步


      還有一點就是回答變短了。OpenAI 說整體用詞量少了約 30%,行數少了約 29%。表情符號也砍了,官方用詞是「不再濫用 emoji」


      5.3 vs 5.5 解題演示:新版直接給出準確答案,舊版走了彎路但最終也能檢查出錯誤

      With this update, the model's responses are tighter and more to-the-point without losing substance, while keeping the warmth and personality that makes ChatGPT enjoyable to use.

      回答更緊湊、更直達要點,但沒有丟掉讓 ChatGPT 好用的那種溫度和個性

      打通記憶、打通 Gmail

      在 ChatGPT 當中,GPT-5.5 Instant 現在可以調用過去的對話記錄、上傳過的文件、以及你授權接入的 Gmail 郵件,來給出更貼合個人情況的回答。先開放給 Plus 和 Pro 的網頁端用戶,移動端和免費用戶后續跟進

      同步上線的還有一個叫 Memory Sources 的功能。每次 ChatGPT 用了你的記憶來回答問題,會在回答旁邊顯示它引用了哪些記憶來源。你可以刪掉過時的,也可以糾正錯誤的

      分享對話時,對方看不到你的記憶來源。不想被記住的對話,可以開「臨時聊天」模式


      Memory Sources 功能:顯示 ChatGPT 引用了哪些記憶來源來個性化回答

      安全評級升了

      這是第一個被 OpenAI 的 Preparedness Framework 標記為 「高能力」(High) 的 Instant 模型。之前只有 GPT-5.5 Thinking 這種重量級推理模型才拿到過這個評級

      高能力的意思是:模型在網絡安全和生化領域的能力,已經需要額外的安全護欄。OpenAI 給它加了對應的防護措施:模型層面的拒絕訓練、自動化的對話監控、以及賬號級別的執行機制

      網絡安全方面,GPT-5.5 Instant 在 CTF(奪旗賽)挑戰上的表現超過了 GPT-5.4 Thinking,但低于 GPT-5.5 Thinking。Cyber Range(模擬真實網絡入侵)綜合通過率 76.9%,和 GPT-5.3 Codex 持平

      生化領域,在專家基準測試(TroubleshootingBench)上,GPT-5.5 Instant 的表現低于對比模型,也低于專家基線的 36.4%。但在標準化的多選題測試上已經接近甚至超過了共識專家水平


      CTF 網絡安全挑戰:GPT-5.5 Instant 介于 GPT-5.4 Thinking 和 GPT-5.5 Thinking 之間

      注:網絡安全評測是在高推理檔位下跑的,實際部署時 Instant 用的是低推理檔位,能力會更低。

      退步的地方

      System Card 里有幾個數字值得單獨拎出來看。

      在「不安全內容」的基準測試中,GPT-5.5 Instant 相比 GPT-5.3 Instant 在兩個類別上出現了統計顯著的退步:暴力血腥內容(gore) 從 0.867 降到 0.703,違禁色情內容(sexual) 從 0.857 降到 0.806。數字越高越好,退步幅度不小

      OpenAI 的解釋是:對色情內容加了系統級防護來兜底,對疑似未成年用戶加了額外的年齡保護。但模型本身的能力確實退步了

      越獄測試(Jailbreak)也有退步。OpenAI 在 System Card 里直接說了:這些結果是「方向性的而非結論性的」,他們還在迭代評測方法本身

      Extremism(極端主義)從 1.0 降到 0.943,Hate(仇恨言論)從 0.904 降到 0.827。雖然 OpenAI 說這些變化沒有達到統計顯著性,但趨勢值得關注


      System Card 越獄測試:GPT-5.5 Instant 相比前代有所退步

      價格和 API

      GPT-5.5 Instant 在 API 中的代號是 chat-latest,即日起替代 GPT-5.3 Instant 成為默認。定價和 GPT-5.5 Thinking 相同:每百萬輸入 token 5 美元,每百萬輸出 token 30 美元


      橫向對比一下 OpenAI 的其他模型價格:


      在哪能用

      GPT-5.5 Instant 今天開始向所有 ChatGPT 用戶滾動更新。免費用戶也能用。付費用戶可以在設置里手動切回 GPT-5.3 Instant,保留三個月

      增強個性化(記憶 + Gmail)先給 Plus 和 Pro 的網頁端用戶,Free、Go、Business、Enterprise 后續幾周內跟進。Memory Sources 功能對所有消費者套餐開放

      → 官方公告:openai.com/index/gpt-5-5-instant

      → System Card:deploymentsafety.openai.com/gpt-5-5-instant

      → API 文檔:developers.openai.com/api/docs/models/gpt-5.5

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國對美國攤牌!關于臺灣問題,當著特朗普面,中方把話直接說死

      中國對美國攤牌!關于臺灣問題,當著特朗普面,中方把話直接說死

      影孖看世界
      2026-05-15 06:35:50
      印軍辛杜爾行動戰果猛漲:11個巴機場被炸,13架飛機毀在地面

      印軍辛杜爾行動戰果猛漲:11個巴機場被炸,13架飛機毀在地面

      矚望云霄
      2026-05-12 18:52:21
      廣州一網紅粥店被曝用掃把洗鍋,食客:那口鍋剛炒完我們的粉

      廣州一網紅粥店被曝用掃把洗鍋,食客:那口鍋剛炒完我們的粉

      齊魯壹點
      2026-05-14 21:12:34
      同樣是冠軍家長:梁爸低調接機,蒯曼父親高調護短,差距一目了然

      同樣是冠軍家長:梁爸低調接機,蒯曼父親高調護短,差距一目了然

      悠悠說世界
      2026-05-15 06:17:33
      印度,第一個被AI撕碎的國家?

      印度,第一個被AI撕碎的國家?

      美第奇效應
      2026-05-14 00:02:54
      三甲醫院“違規開具”死亡證明背后:司法鑒定稱病歷被集中修改,61歲患癌男子死亡地點存爭議

      三甲醫院“違規開具”死亡證明背后:司法鑒定稱病歷被集中修改,61歲患癌男子死亡地點存爭議

      紅星新聞
      2026-05-14 21:22:52
      閃存之父的詛咒:日本如何親手葬送了自己的存儲帝國

      閃存之父的詛咒:日本如何親手葬送了自己的存儲帝國

      X博士
      2026-05-14 14:13:24
      劉和然站臺魏平政藏玄機,侯友誼鄭麗文和解,瓦解反鄭麗文戰線

      劉和然站臺魏平政藏玄機,侯友誼鄭麗文和解,瓦解反鄭麗文戰線

      補懂事的孩紙
      2026-05-15 05:51:19
      章子怡“潑墨門”主謀,葉劍英兒媳,離婚后轉戰商圈竟成資本大鱷

      章子怡“潑墨門”主謀,葉劍英兒媳,離婚后轉戰商圈竟成資本大鱷

      財叔
      2026-05-11 08:40:12
      深蹲,被嚴重低估了!研究提示:每天堅持5分鐘,能預防6種疾病

      深蹲,被嚴重低估了!研究提示:每天堅持5分鐘,能預防6種疾病

      增肌減脂
      2026-04-30 19:15:09
      到了初中你會發現:補課真補不出學霸,學霸都是自己悟出來的

      到了初中你會發現:補課真補不出學霸,學霸都是自己悟出來的

      好爸育兒
      2026-05-07 16:31:02
      中國最好吃的6個城市,50歲前要去一次

      中國最好吃的6個城市,50歲前要去一次

      簡食記工作號
      2026-05-14 00:06:06
      馬斯克帶兒子到人民大會堂,5歲X娃穿中式馬甲,金發凌亂很可愛

      馬斯克帶兒子到人民大會堂,5歲X娃穿中式馬甲,金發凌亂很可愛

      譯言
      2026-05-14 20:55:30
      四川追打事件升級:哨兵出動有法撐腰,女子剛一出手,性質就變了

      四川追打事件升級:哨兵出動有法撐腰,女子剛一出手,性質就變了

      探源歷史
      2026-05-14 01:09:14
      心理學研究40年發現:被人算計后,拼命反擊是在喂養對方惡意,選擇示弱只會越陷越深,真正看透“投射反噬”的人沒人敢惹

      心理學研究40年發現:被人算計后,拼命反擊是在喂養對方惡意,選擇示弱只會越陷越深,真正看透“投射反噬”的人沒人敢惹

      心理觀察局
      2026-05-12 09:06:31
      黑龍江省第十四屆人民代表大會常務委員會關于接受隋洪波辭去黑龍江省人民政府副省長職務的請求的決定 (2026年5月13日黑龍江省第十四屆人民代表大會常務委...

      黑龍江省第十四屆人民代表大會常務委員會關于接受隋洪波辭去黑龍江省人民政府副省長職務的請求的決定 (2026年5月13日黑龍江省第十四屆人民代表大會常務委...

      黑龍江新聞網
      2026-05-14 11:16:52
      我在伊拉克開工廠,娶了4個老婆,雖然年入千萬,如今卻很焦慮!

      我在伊拉克開工廠,娶了4個老婆,雖然年入千萬,如今卻很焦慮!

      千秋文化
      2026-04-16 20:12:45
      危言聳聽?博主稱央視若不妥協購買天價世界杯版權將引發公共災難

      危言聳聽?博主稱央視若不妥協購買天價世界杯版權將引發公共災難

      塵語者
      2026-05-14 16:13:55
      連奪6金+打破世界紀錄!中國選手一鳴驚人,女子項目不敵朝鮮隊

      連奪6金+打破世界紀錄!中國選手一鳴驚人,女子項目不敵朝鮮隊

      羅掌柜體育
      2026-05-14 11:00:15
      32連勝+距金大師只差2勝!辛納橫掃盧布,超越德約成大師賽第一人

      32連勝+距金大師只差2勝!辛納橫掃盧布,超越德約成大師賽第一人

      搏擊江湖
      2026-05-14 21:16:14
      2026-05-15 07:16:49
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      439文章數 53關注度
      往期回顧 全部

      科技要聞

      馬斯克說會談很順利 黃仁勛點贊 庫克比耶

      頭條要聞

      馬斯克幼子裝扮“火”了 衣服包包都是中國造

      頭條要聞

      馬斯克幼子裝扮“火”了 衣服包包都是中國造

      體育要聞

      爭議抽象天王山,和季后賽最穩定中鋒

      娛樂要聞

      何九華官宣當爸!全程不提孩子媽

      財經要聞

      李強會見美國工商界代表

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      藝術
      數碼
      健康
      手機
      公開課

      藝術要聞

      花園里,花叢中

      數碼要聞

      與“AMD+AMG”賽道相見,英特爾、邁凱倫F1車隊達成戰略合作

      專家揭秘干細胞回輸的安全風險

      手機要聞

      榮耀600/Pro手機規格曝光,搭載驍龍7 Gen4 /天璣8550

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精成人品日日拍夜夜免费| 色二区| 国内精品久久久久久久97牛牛 | 精品无码久久久久久尤物| 中文字幕无码中文字幕有码在线| 国产肥白大熟妇bbbb视频 | 人妻丰满熟妇av一区二区| 国产成人精品微拍视频网址| 日韩色图区| 成人区人妻精品一区二蜜臀| www.亚洲精品长腿丝袜| 少妇高潮喷水惨叫久久久久电影 | 成人做受黄大片| 亚洲乱码国产乱码精品精姦| 免费av深夜在线观看| 日本无码中出| 亚洲色欲网| 97久久精品人妻人人搡人人玩| 国产精品白丝jkav网站| 天堂а√中文最新版在线| 草久视频| 国产一区二区在线视频观看| 少妇极品熟妇人妻无码| 国产亚洲精品自在久久不卡| 最新国产精品剧情在线ss| 中文字幕爆乳julia女教师| 思思久久96热在精品国产10| 欧美人与性动交α欧美精品| 亚洲av第三区国产精品| 18禁免费无码无遮挡不卡网站 | 熟女人妻av五十路六十路| 91久久国产熟女精品| 亚洲一区二区经典在线播放| 日本一区二区更新不卡| 伊人性网| 成人欧美日韩一区二区三区| 亚洲一区二区三区免费av在线| 免费观看在线A级毛片| 99热成人精品国产免费| 性欧美vr高清极品| av无码小缝喷白浆在线观看|