小學三年級,為了拿到一臺任天堂游戲機,我被迫啃完800頁的《喬布斯傳》。四年后交蘋果公司的作業(yè)報告,我卻偷偷打開了韓國維基百科。這件事讓我困惑了很久:為什么800頁的書,能被一個百科詞條替代?
從游戲機到提示詞
![]()
作者小時候的經(jīng)歷藏著一條暗線。六年前,父親用Switch做誘餌,讓他讀完那本磚頭厚的傳記。800頁,六個月,對一個三年級學生來說是"brutal lift"(殘酷的重負)。四年后中學作業(yè),他直接搜了Namuwiki——韓國學生常用的輕量百科,專門用來"quick skim"(快速掃讀)。
這個轉(zhuǎn)變的關鍵在于:作業(yè)不需要知道喬布斯花了40小時研究窗口重疊技術,也不需要蘋果早期的瑣碎細節(jié)。Namuwiki就是《喬布斯傳》的壓縮版,剝離冗余,保留骨架。
作者把這個發(fā)現(xiàn)遷移到了提示詞工程。他提出的核心概念叫"Token Deadbeats"——那些占用token卻不產(chǎn)生價值的冗余信息。處理它們的方法,就是壓縮。
第一層:同層重復
壓縮的第一把刀砍向"same-layer duplication"(同層重復)。
作者舉的例子很直白:"cold and cool ice cream"(冰冷又涼爽的冰淇淋)應該壓縮成"cool ice cream";"hot and warm water"(滾燙又溫熱的水)變成"warm water"。兩個詞描述同一層溫度感受,留一個就夠了。
這種重復在口語里常見,在提示詞里卻是token殺手。大語言模型按token計費,每一個重復形容詞都在白燒錢。
更隱蔽的是句子級別的重復。一段話里如果有兩句意思相同,刪掉一句。這不是損失信息,是去除噪音。
第二層:過度修飾
第二把刀對準"fussy add-ons"(繁瑣的附加說明)。
作者用買牛仔褲打比方。正常人說"出去買條牛仔褲",沒人會說"出去買一條直筒版型、赤耳丹寧材質(zhì)的牛仔褲"——除非你是"mutant nerds"(變異極客),作者自嘲地把自己歸入此類。
但附加信息并非一律砍掉。如果順路還要買辣炒年糕(tteokbokki),這件事和買牛仔褲同等重要,那就該說"出去買牛仔褲,吃完辣炒年糕回來"。
判斷標準是:這個修飾是否改變了核心動作?赤耳丹寧不改變"買牛仔褲"的本質(zhì),但"吃完辣炒年糕回來"改變了行程結(jié)構(gòu)。
提示詞的壓縮實操
作者把這套方法總結(jié)為逐句處理:先在詞匯層面去除同層重復,再控制過度生長的修飾句。
他留下一個待辦:讓讀者復制一段提示詞,自己壓縮一遍。文末標注了測試環(huán)境——"GPT 5.4 Pro or above"。這個數(shù)字很具體,不是模糊的"最新版GPT"。
原文里還散落著一些系統(tǒng)殘留:關于模板功能的說明、隱藏評論的確認彈窗、舉報濫用的提示。這些是發(fā)布平臺的界面元素,不是文章主體,但說明這段文字可能來自某個內(nèi)容管理系統(tǒng)或論壇帖子。
為什么這件事值得技術人關注
提示詞壓縮不是寫作技巧,是成本控制。大模型API按token計價,冗余就是真金白銀。但比省錢更深一層的是認知效率——壓縮迫使你想清楚:我到底想讓它做什么?
那個為了Switch讀傳記的小學生,和用Namuwiki趕作業(yè)的中學生,中間隔了四年。四年里他學會了一件事:信息的價值取決于使用場景。800頁的傳記不會消失,但作業(yè)只需要其中5%的骨架。
提示詞工程正在經(jīng)歷同樣的分化。有人寫小作文式的提示詞,有人寫電報式的指令。后者省下的不只是token,是模型理解你的路徑長度。
作者最后沒給壓縮后的示例,只留了一個動作指令。這本身也是一種壓縮:相信讀者能自己走完最后一步。
畢竟,他三年級就能為了游戲機啃完800頁。你也行。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.