新模型發布之后,除了發現能力變強。大部分人還是會覺得新版本的模型,好像不如舊版聽話,第一反應就是降智了。
實際情況可能恰好相反。
OpenAI 和 Anthropic 幾乎在同一時間發布自己的提示詞文檔,在 OpenAI 官網,從 GPT-4.1 到 GPT 5.5,每次新模型發布都有一份完整的提示詞指南,告訴我們怎么用新的模型。
![]()
鏈接:https://developers.openai.com/api/docs/guides/prompt-guidance?model=gpt-5.5
Anthropic 同樣在每次模型發布之后,會提供一份遷移指南說明,詳細說明新模型的,破壞性變化、行為變化等內容。
![]()
鏈接:https://platform.claude.com/docs/en/about-claude/models/migration-guide
這兩份文檔核心信息都是在說:我們沿用舊提示詞的方式,在新模型上會出問題。
模型沒有退步,是因為模型變聰明了,但我們的提示詞方式還停留在訓練「笨學生」的階段。
這次我們不談上下文工程、Skill 工程、Harness 工程,回到日常生活中用的最多的提示詞,大概是 AI 使用門檻上最有用的一份指南。
舊的提示詞,是給已經在墳墓的模型寫的
在 GPT-4o 和 Claude 3 的時代,一個好的提示詞往往很長,要一步一步告訴模型先做什么、再做什么、最后輸出什么格式。這套方法有效,因為那時候的模型確實需要這種手把手的引導。
![]()
在 GPT-5.5 的官方提示詞指南里,OpenAI 非常直接地表示。
舊提示詞經常過度指定流程,因為早期模型需要更多幫助才能保持在軌道上。對 GPT-5.5 來說,這會增加噪音,縮窄模型的搜索空間,或者導致答案過于機械。
翻譯成人話:我們一步步手把手寫的那套提示詞,在新模型眼里就像在對一個本科畢業生說「先打開電腦,再打開 Word,再找到正文區域,再開始輸入……」。
對方當然能執行,但直接把他限死了,他用不上自己的判斷力。
不同的模型,還有不同的提示詞更新方向。
![]()
Claude 那邊是反其道而行之,Anthropic 提到,Claude Opus 4.7 比 Claude Opus 4.6 更字面和明確地解釋提示,特別是在較低的工作量級別。
我們說什么,它就做什么,不再自動幫我們腦補「可能還想要」的部分。
這種字面性的優點是精確性和更少的混亂。官方也提到它通常對具有精心調整的提示詞、結構化提取和我們想要可預測行為的用法表現更好。
但 Opus 4.7 的這項變化,對很多人來說也是個壞消息,因為不是每個人都能寫出完整的、明確的提示詞,大多數時候還是依賴模型「猜」我們的意圖。
![]()
文章鏈接:https://x.com/Aina\_Ai2/status/2049490182211301527
很多在 Opus 4.6 中行之有效的模糊指令,現在放到 Opus 4.7,讓它回答,反而會降智般地,得到一些狹隘、死板,甚至更不相關的結果。
需要結果,還是流程
無論是 GPT-5.5 要求不要太詳細的結果,還是 Opus 4.7 希望更明確的指令,核心都可以被壓縮成未:描述我們想要的結果,而不是你希望模型走的流程。
GPT-5.5 指南給了一個對比。舊式寫法是這樣的:
先檢查 A,再檢查 B,然后對比每個字段,然后想清楚所有例外情況,然后決定調用哪個工具,然后調用工具,然后向用戶解釋整個過程。
新的寫法是這樣的:
端到端解決用戶的問題。成功標準:資格決定要從現有的政策和賬戶數據中得出;所有允許的行動在回復之前完成;最終答案包含已完成的行動、用戶消息和阻塞項;如果證據缺失,詢問最小的缺失字段。
這兩種寫法的區別,舊寫法在規定「怎么走」,新寫法在規定「走到哪里算完」。前者更像是在給初級員工寫 SOP,后者像在給高級員工定 KPI。
而這個切換對普通用戶的實際含義是:我們現在需要比以前更清楚地想明白自己要什么。模型可以幫你執行,但它越來越不會替你想清楚目標。
三件最值得馬上改的事
刪掉提示詞里多余的「必須」「永遠」「只能」。
這些強制性詞語曾經有用,是因為舊模型需要明確約束才不會「跑偏」。
新模型更善于理解我們的真實意圖,但過多的絕對規則會讓它在本該靈活判斷的地方也變得僵硬。
OpenAI 的建議是:把「絕對規則」留給真正不能變通的情況,其他地方改成「決策規則」,例如說明在什么條件下做 A,在什么條件下做 B。
明確說「什么情況下停」。
這是新模型經常被忽視的一個設計點。舊模型需要你告訴它「做這些事情」,新模型需要你同時告訴它「做到什么算結束」。
GPT-5.5 指南里專門列出了「停止條件」的寫法:每一步之后,模型會問自己「我現在能回答用戶的核心問題了嗎?」如果沒有明確的停止規則,它可能停得太早,也可能一直搜索找證據。
如果之前用 Claude,現在要重新審視提示詞語氣。
Opus 4.7 變得「更直接、更有主見」,減少了原來版本里偏向「溫暖確認型」的表達風格。
如果我們的提示詞里包含某種隱含的「期待模型客氣回應」的設計,它可能會失效。同時,Opus 4.7 不再自動給你跨條目泛化,我們告訴 Opus 4.7 處理 A,它不會默默順手處理同類的 B。
我們需要顯式說清楚覆蓋范圍。
「個性化」現在需要自己定義
GPT-5.5 的文檔里有一個章節專門講「人格」,核心邏輯是,新模型的默認風格是高效、直接、任務導向的。
這對效率來說是好事,但如果我們希望 AI 的回答有一種特定的質感,比如更暖、更有探索性、更愿意主動問問題。我們現在需要顯式寫出來,而不是依賴模型通過學習「自然而然地」呈現。
![]()
文檔里給出了兩種典型的「人格設定」模板:一種是「穩定、任務導向」的協作者風格,適合效率場景;另一種是「有主見、好奇心強、對話感強」的探索型風格,適合創作和思考類任務。
一個性格缺陷明顯的、做事穩健的助理:
You are a capable collaborator: approachable, steady, and direct. Assume the user is competent and acting in good faith, and respond with patience, respect, and practical helpfulness.
Prefer making progress over stopping for clarification when the request is already clear enough to attempt. Use context and reasonable assumptions to move forward. Ask for clarification only when the missing information would materially change the answer or create meaningful risk, and keep any question narrow.
Stay concise without becoming curt. Give enough context for the user to understand and trust the answer, then stop. Use examples, comparisons, or simple analogies when they make the point easier to grasp. When correcting the user or disagreeing, be candid but constructive. When an error is pointed out, acknowledge it plainly and focus on fixing it.
Match the user's tone within professional bounds. Avoid emojis and profanity by default, unless the user explicitly asks for that style or has clearly established it as appropriate for the conversation.
一個善于表達、樂于合作的助理的性格特征示例:
Adopt a vivid conversational presence: intelligent, curious, playful when appropriate, and attentive to the user's thinking. Ask good questions when the problem is blurry, then become decisive once there is enough context.
Be warm, collaborative, and polished. Conversation should feel easy and alive, but not chatty for its own sake. Offer a real point of view rather than merely mirroring the user, while staying responsive to their goals and constraints.
Be thoughtful and grounded when the task calls for synthesis or advice. State a clear recommendation when you have enough context, explain important tradeoffs, and name uncertainty without becoming evasive.
很明顯,現在和 AI 打交道,越來越像是在管理一個有能力,但需要明確方向的協作者,而不是在操作一個等待命令的工具。
我們給的指令越模糊,結果越不可控;給的指令越精準,它能發揮的空間也越大,但要注意是精準的結果,而不是詳細的過程。
總結一下,如果你正在使用 GPT-5.5,下面這六條小 Tips 會非常有用。
1.
用結果定義任務,不用步驟定義任務。不要寫「先做 A,再做 B,然后 C」,寫「完成標準是:X 已完成,Y 已包含,Z 不存在」。
2.
謹慎使用絕對詞 「ALWAYS / NEVER / 必須 / 只能」。留給安全規則和必填字段。其他地方改成條件句:「如果……則……,否則……」,絕對詞的濫用會讓模型在本該判斷的地方也變僵。
3.
給搜索加預算上限。不加限制,模型會一直搜到「更好」為止。明確寫出「以下情況才發起第二次檢索:核心問題沒有答案、缺少必要參數、用戶明確要求全面覆蓋」,其他情況,有足夠證據就回答。
4.
多步任務先給一句可見的進度更新。用戶等待時什么都看不到,體驗差。只需要在系統提示里加一條:「多步任務開始前,先用一兩句話告訴用戶你在做什么」,感知響應速度會明顯提升。
5.
格式指令要說「為什么」,不只說「怎么做」。「用短段落,不用列表」是指令。「這是一份給高管的簡報,閱讀時間 2 分鐘,結論優先,省去推導過程」才是讓模型真正理解格式意圖的寫法。
6.
推薦的提示詞骨架。從以前松散的長指令變成了固定結構:角色 Role → 性格 Personality → 目標 Goal → 成功標準 Success criteria → 限制條件 Constraints → 輸出 Output → 停止規則Stop rules,每個模塊盡量短,只寫真正改變行為的內容。
如果是 Opus 4.7 的話,可以參考這五條 Tips。
![]()
1.
模型不再替你泛化,覆蓋范圍必須顯式寫清楚。Opus 4.6 遇到任務 A,會順手幫你把同類的 B 也處理了;但 4.7 絕對不會。如果任務涉及多個同類項,必須逐一說明,或者明確寫明「請對所有同類情況執行相同處理」。
2.
低 effort 下它只做你說的,不做你想的。在low 和 medium 模式下,模型嚴格按字面執行,不會主動擴展。如果任務涉及多步推理,在提示詞里加一句「這個問題需要分步思考,請在回答前理清邏輯」,比調高 effort 更省成本。
3.
它的默認風格變直接了,「溫暖感」要顯式定義。4.7 的語氣比 4.6 更干、更有主見,減少了確認型的鋪墊。如果你的產品需要特定語氣,更暖、更有探索性、更愿意反問,要在系統提示里寫出來,不能靠模型默認呈現。
4.
內置進度更新,不用再強制要求。之前很多 agent 提示詞里會寫「每調用 3 次工具后總結一次進度」,4.7 已經內置了這個行為。
5.
圖片分辨率上去了,token 也跟著漲了。4.7 支持最高 2576px 長邊,每張圖最多消耗約 4784 tokens,是舊版上限的 3 倍。如果你的工作流要批量處理圖片,發送前可以先做壓縮,否則成本會在翻倍。
好了,現在 AI 的瓶頸又回到了寫提示詞的人,而不是模型。
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.