![]()
智東西
作者 王涵
編輯 冰倩
智東西5月6日報道,今天,OpenAI正式推出GPT?5.5 Instant版,將從今天開始向所有ChatGPT用戶逐步推出,取代GPT?5.3 Instant成為默認模型。
此次更新主要體現在日常交互上,GPT?5.5 Instant的對話語氣更加自然,回答準確率更高且更緊湊,并且當用戶使用個性化功能時,模型還能夠調取過往的對話記錄,補充背景信息。
Sam Altman第一時間轉發官宣推文“強推”這一模型,并稱:“速度、智能、個性,再加上強大的記憶與個性化能力,這幾方面的改進組合在一起,當它們同時發揮作用時,給人的感覺已經遠不止是各部分簡單的相加,而是一種整體大于部分之和的體驗。”
![]()
在內部評估中,在醫學、法律和金融等領域,GPT?5.5 Instant的幻覺率比GPT?5.3 Instant減少了52.5%。
基準測試方面,在衡量科學圖表推理準確度的CharXiv-reasoning中,GPT-5.5 Instant比GPT-5.3 Instant提升了6.6%。多模態專家推理測試MMMU-Pro中,GPT-5.5 Instant的準確率提升了6.8%。
在文檔解析任務中,GPT-5.5 Instant的錯誤率降低了2.1%,相對降幅約14.4%。在博士級科學問答測試中,GPT-5.5 Instant的準確率提升了7.1%。在數學競賽AIME 2025中,其準確率漲了15.8%。
![]()
![]()
![]()
在API中,GPT?5.5 Instant的名稱為“chat?latest”。對于付費用戶,GPT?5.3 Instant在退役前還將保留三個月,可通過模型配置設置進行訪問。
基于過往對話、上傳文件及已連接Gmail的增強個性化功能,正在向網頁端的Plus和Pro用戶推出,即將登陸移動端,并計劃在未來幾周內擴展至Free、Go、Business和Enterprise用戶。
記憶來源功能正在向網頁端所有ChatGPT個人版套餐用戶推出,并將很快登陸移動端。特定個性化來源的可用性可能因地區而異。
在OpenAI官宣推文下方有,網友注意到了該模型的AIME成績的提升,認為“這表面上是產品更新,實則是純粹的推理能力升級,絕不僅僅是聊天的微調。這是一種“偷偷”發布思考模型的方式。”
![]()
還有網友發現:“‘更溫暖、更簡潔’這兩點恰恰是用戶真正抱怨過的地方。有意思的是,今年最大的一次模型升級,本質上卻更像是一次‘性格補丁’。”
![]()
但也有不少網友對這次升級并不買賬,他們想要的是更實用的功能更新。甚至還有網友在懷念GPT-4o。
![]()
![]()
一、圖像解析能力提高,虛假信息減少52.5%
在內部評估中,對于涵蓋醫學、法律和金融等領域的高風險提示,GPT?5.5 Instant生成的虛假信息比GPT?5.3 Instant減少了52.5%。在用戶曾標記存在事實錯誤的特別具有挑戰性的對話中,它也減少了37.3%的不準確說法。
GPT-5.5 Instant提升了圖像解析、STEM學科(科學、技術、工程和數學)問答水平,還可智能判斷是否調用網絡搜索,從而給出更優質的回復。
從案例中可以看出,GPT?5.5 Instant一開始認可了錯誤的解法,但隨后發現將x=3代回原方程時不成立。它識別出了實際的代數錯誤(用戶移項有誤),然后使用求根公式得出了正確的解。
![]()
而GPT?5.3 Instant雖然也發現了x=3不成立,但就此止步,錯誤地得出沒有實數解的結論,而不是重新檢查代數步驟并求解修正后的二次方程。
![]()
二、回答更緊湊,字數減少30.2%
此外,GPT?5.5 Instant的回答更加緊湊、切中要點,同時在保持溫暖感和個性化。
該模型能夠在傳達相同信息且更具實用性的同時,減少冗長和過度格式化導致的回答過長問題。其還會減少不必要的追問,并避免如隨意添加表情符號等讓回答顯得雜亂。
![]()
![]()
GPT?5.5 Instant使用的字數減少了30.2%,行數減少了29.2%。其回答語氣把握得當:非正式、實用且適合工作場合,同時避免了過度解釋。該模型針對不同情況提供了可實際使用的腳本,始終圍繞“界限”來闡述問題。
GPT?5.3的回答則更完整,尤其是“不要做什么”的部分,但對于一個非正式的日常建議類提示來說,略顯過于復雜,其結構和推敲程度可能超出了用戶的實際需求。
三、自動檢索歷史對話,記憶來源功能全系上線
GPT?5.5 Instant還能利用過往聊天記錄、上傳的文件以及Gmail中的上下文信息,從而使回答更具個性化。
該模型可智能判斷何時融入個性化元素以優化回復,同時其檢索歷史對話、匹配上下文的速度大幅提升,無需用戶反復重復表述。
![]()
![]()
可以看到,GPT?5.5 Instant的回答能夠更好地引用過往對話和相關的已連接數據,從而提供更細致、高度個性化的建議。而GPT?5.3 Instant的回答雖然考慮到了用戶位于舊金山這一因素,但對于推薦嘗試的地方,給出的建議仍較為籠統。
ChatGPT全系模型現已上線記憶來源功能。用戶可查看個性化回答所引用的上下文依據,并獲得自主管控權限。
當模型生成個性化回復時,用戶能夠追溯答案所依托的具體上下文,包括已保存記憶及歷史對話記錄;對于過時、失效或無關的信息,可隨時進行刪除與更正。
此外,用戶分享對話內容時,記憶來源信息不會對外展示。同時該功能支持多種隱私管控方式:可單獨刪除不愿被引用的歷史對話,在設置界面編輯或清空已保存記憶,也可使用臨時對話模式,全程不調用、不更新個人記憶。
![]()
結語:交互質量與用戶可控性提升
在基礎能力趨于收斂的背景下,“怎么讓模型回答地更讓用戶舒服?”成為大模型廠商思考的問題。
GPT?5.5 Instant的更新給出了OpenAI的答案::其一,其減少了在專業知識問答方面的幻覺率;其二,回答的簡潔度與語氣調控被納入優化目標;其三,記憶來源功能建立信任基礎。
客觀而言,這類“體驗型更新”難以通過傳統基準測試完全量化其價值,其真實效果還將取決于用戶在長期使用中的主觀感受。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.