AI 根本不是神,它只是個“一無所知,但干勁十足的頂配實習生”。
作者 | 吳恩達
編譯 | 王啟隆
出品丨AI 科技大本營(ID:rgznai100)
昨天,DeepLearning.AI 發布了吳恩達最新的《2026 提示詞工程大師課》。
如果你對提示詞工程還有一點 2023 年式的想象,看到這套課,第一反應大概率會是,原來這一行已經不是當年那套玩法了。
過去兩年,大語言模型一邊在變強,Agent 出來之后大家都在研究 Skill 怎么玩,但其實提示詞這件事本身一點也不能落下。早期大家熱衷的,還是那些短促、漂亮、帶點技巧感的咒語式指令,比如讓模型一步一步思考、給它一個角色、套一個固定模板,仿佛誰手里掌握了幾條秘訣,誰就比別人更懂 AI。但吳恩這次出山要做的,就是不斷拆這些舊想象。
![]()
他并沒有把提示詞講得更玄,反而講得更冒犯。
在這套最新課程里,吳恩達反復在說一件事,很多人之所以還用不好 AI,不是因為模型不夠強,而是因為他們還在把 AI 當搜索框、當許愿機、當一個會自動腦補你真實意圖的聰明人。可現實是,今天真正會用 AI 的人,早就不是靠幾個“金句提示詞”取勝了,而是靠一整套新的協作方式,給足上下文、把 AI 當思維伙伴、讓它先做研究再下結論、先搭骨架再寫正文、先按評分標準批判再決定采不采納。
過去那套流行的提示詞技巧,很多已經過時了。那些年被反復傳播的口訣并沒有完全錯,但它們已經越來越像新手教程,而不是今天的高階工作流。真正拉開差距的,也不再是你會不會寫一句漂亮 prompt,而是你知不知道什么時候該上傳更多背景材料,什么時候該讓模型深度思考,什么時候該新開對話清空上下文,什么時候該讓 AI 只先列大綱、不要急著吐正文。
以下為這套 DeepLearning.AI 最新發布的吳恩達 2026 提示詞大師課內容整理,以吳恩達第一視角敘述,讓我們看看它相較于舊提示詞技巧,到底升級在了哪里。
![]()
引言
時間來到 2026 年,如今的 AI 提示詞工程,與 2022 年 ChatGPT 剛問世時早已不可同日而語。毫無疑問,熟練駕馭 AI 是當下最具影響力的技能之一。那些尚未觸及 AI 時代前沿的人,常常會因為 AI 生成的糟糕結果而感到挫敗。為了讓你成為一名提示詞專家,充分駕馭如今比一年前強大得多的 AI 工具,讓我們先來看看兩種截然不同的體驗:AI 新手與AI 高階玩家。
許多 AI 專家已經學會用它來解答復雜的難題。相比之下,包括新手在內的許多人,可能仍習慣于像用谷歌搜索一樣,向 AI 拋出簡單的問題。比如你會問:“塔可鐘(Taco Bell)現在還有雙層塔可餅嗎?” 得到一個簡單的答案,這當然沒問題。但如果你面臨更棘手的難題,你完全可以把它交給 AI,并給它留出“思考”的時間。
例如,如果你打算買車,你可以向 ChatGPT、Gemini、Anthropic 的 Claude 等主流商業模型上傳一系列文件,包括成本規格、報價單、保險計劃等,然后問它:“我正在考慮這幾款車,它們各自的利弊是什么?” 并在提示詞中要求它“閱讀所有材料,并在回答前進行深度思考”。這會促使 AI 花費幾十秒甚至幾分鐘的時間去推理,最終為你生成一份詳盡的報告。在處理許多日常事務時,我發現這能節省海量的時間。
再舉個例子:AI 高階玩家懂得為 AI 提供正確的上下文(Context)或背景信息,為其成功解答問題鋪平道路。反觀一些新手,他們往往只給出簡短的提示詞,然后奢望 AI 能自己“腦補”出缺失的細節。你不妨把 AI 想象成一個極其聰明的名校應屆畢業生——他干勁十足,但對你的實際情況一無所知。如果你給的提示詞太短,他根本沒有足夠的背景信息來準確作答。所以,如果你對 AI 說:“請幫我寫一份出色的年終自評發給老板。” 因為你根本沒告訴它你過去一年做了什么,它只能寫出一份毫無用處的套話。
相比之下,我發現 AI 高階玩家對 AI 幾乎有一種“同理心”。我不想過度將 AI 擬人化,但如果你能換位思考,站在接收指令者的角度問問自己:“它真的足夠了解我、能勝任這項任務嗎?” 那么,高階玩家的做法是向 AI 上傳大量信息——也許是展示工作內容的項目進度截圖、近期的項目文檔,或者是你口述項目細節的語音備忘錄,然后再告訴它“寫一份發給老板的自評”。這樣寫出來的東西,才能完美捕捉到你最引以為傲的工作成果。
AI 開發者計劃開放申請,免費領 50 小時云算力券
支持主流 AI 框架與模型部署
![]()
破解 AI 的“迎合效應”
高階玩家掌握的另一項絕技,是如何引導 AI 給出真實的反饋。
AI 的一個大毛病是它太想取悅你了。事實上,許多 AI 系統在訓練時,初衷就是努力讓用戶開心。如果你問了一個帶有傾向性的問題,它通常會順著你的心意,給出一個帶有偏見的答案。
例如,如果你說:“我有一個絕妙的商業點子:移動扎染。請評價一下。” 因為你已經給它定性為“絕妙的點子”,而且強調這是“你的”主意,AI 自然會想順著你,夸贊道:“真是個好主意!”
我們將這種現象稱為“迎合效應(Sycophancy)”。眾所周知,只要你稍微暗示一下你心里期待的答案,AI 極大概率只會把你的偏好或成見像照鏡子一樣反射給你。
相反,AI 高階玩家傾向于使用中立的提問方式,不給 AI 留下任何關于“你期待什么答案”的蛛絲馬跡。或者,你可以給 AI 提供一個評分量表(Rubric)或評估標準,以此作為它回答的基礎,這能強迫它保持客觀。比如你可以這樣下指令:“請客觀分析以下商業理念:移動扎染。不要憑空捏造觀點。請使用上述評分標準,例如:‘是否存在痛點?’ ‘是否有市場?’ ‘我是否有競爭優勢?’”
當你給出這樣的指令時,AI 就不知道你到底是希望它夸你,還是希望它勸你別在一個糟糕的點子上浪費時間。此時,它更有可能告訴你:“哦,這個點子只能打 8 分(滿分 100),以下是得分較低的原因。”
(順便說一句,如果你真的在經營移動扎染業務,我祝你好運,AI 也能通過提出有用的問題,幫你思考如何改進業務。)
![]()
拒絕“AI 工業糖精”
新手和高階玩家讓 AI 寫作的方式截然不同。新手只會下達類似“寫一篇關于黑莓手機的博客文章”的指令,然后 AI 就會生成一堆看起來像“AI 漿糊(AI slop)”的文字——一堆空洞無物、占據篇幅的套話。
相比之下,高階玩家通常不會讓 AI 直接開始正文寫作,而是要求它先列出文章大綱,然后對大綱進行批判性修改,與 AI 迭代幾次來塑造文章的骨架,最后才讓 AI 開始起草正文。
你可以上傳一份筆記作為背景信息,像專家一樣下達指令:“根據我的筆記,列出一篇關于黑莓手機的博客大綱,確保你知道我想談論的核心內容。” AI 會給出一份初步大綱。接著,你可以向 AI 提供反饋,告訴它你喜歡什么、不喜歡什么。甚至可以來回切磋幾個回合,直到你對大綱完全滿意。然后,你再讓它把大綱擴展成核心要點(Bullet points)。同樣,對要點進行幾輪審視和修改,直到你滿意后,再讓它擴寫成最終的文本。
這種高階玩家的工作流,極大概率能生成讓你滿意的文字,而不是一堆 AI 廢話。在這個過程中,你實際上是把 AI 當作一個思維伙伴(Thinking partner),幫助你進行頭腦風暴,探索不同的寫作方向。
![]()
理性看待 AI 的錯誤
AI 系統確實會犯錯,但可能比大多數人想象的要少,尤其是當你提示得當的時候。相比于 2022 或 2023 年,它們現在的錯誤率已經大幅下降。然而,一些在社交媒體上瘋傳的 AI 翻車案例,讓人們誤以為它經常犯錯。
有個廣為人知的例子:有人問 AI “Strawberry(草莓)這個詞里有幾個 R?” 之前的 AI 認為只有兩個。還有一個讓我覺得很搞笑的例子:“我想去洗車,我應該步行還是開車去?” AI 回答“步行”,這簡直會讓你洗個寂寞。但這些病毒式傳播的案例,并不能代表 AI 真正的實力。
高階玩家深知,AI 能夠通過執行復雜任務來創造巨大價值,比如進行深度研究并撰寫報告,或者分析你的個人健康數據(心率、跑步配速等),甚至(我們稍后會講到的)為你搭建網站。我親眼見證了成為 AI 高階玩家是如何極大地造福個人及其企業的。它能為你節省時間,提升職業與個人生活質量,并幫你創造許多酷炫的東西。無論你身處什么崗位,達到專家級別的提示詞水平都是一項極具需求的工作技能。
在接下來的內容中,我希望能帶你完成向 AI 高階玩家的蛻變。關于 AI 的實用性已經談得夠多了,但我發現使用 AI 其實也非常有趣,你將在后續內容中看到這樣的例子。
![]()
AI 是如何獲取知識的?
為了更好地與 AI 協同工作,一項基礎知識至關重要:你需要了解 AI 是從哪里獲取知識的。這樣你就能更好地預測它什么時候是對的,什么時候你需要質疑它的答案。
你小時候是怎么學會寫作的?大概率是通過大量的閱讀。AI 也是如此。AI 系統通過閱讀互聯網上海量的文本來學習其中的規律。只要理解了 AI 讀過什么,你就能預測它的行為。
AI 模型能回答五花八門的問題。如果你問:“我的手機掉進湯里了,該怎么辦?” 它希望能給出些實用的建議。或者問:“為什么貓總是盯著墻看,好像看到了鬼一樣?”(我女兒很喜歡貓,她真的很好奇這個。)AI 會告訴你,原來貓能察覺到人類經常忽略的細微聲音和動作。
因為 AI 閱讀了互聯網上的海量信息,它甚至掌握了鮮為人知的冷知識。如果你問幾十年前發射到太空的黑膠唱片里都有什么,AI 會知道這是 NASA 在上世紀 70 年代發射的“旅行者 1 號”探測器(目前距地球約 250 億英里),并能準確告訴你唱片里的內容。我覺得 NASA 選擇用 55 種不同的語言向可能遇到該探測器的外星生命致以問候,這事兒簡直酷斃了。
![]()
預訓練知識的奧秘
AI 模型的訓練數據來源極其廣泛,主要來自互聯網,這些海量且多樣化的知識源構成了它的“預訓練知識(Pre-trained knowledge)”。你不需要糾結“預訓練”這個術語,這只是 AI 訓練的最初階段,它代表了 AI 學習的基石。
這些知識源可能包括 Reddit 等社交媒體上的海量文本,里面有類似“必看電影清單”的答案;它可能讀過關于樂高微型城市的書,或者維基百科上關于“仙女面包(Fairy bread)”的詞條;它還讀過大量的新聞報道和學術論文。數以萬億計的詞匯就這樣注入了 AI 模型的“大腦”。
要知道,不同類型的數據在互聯網上出現的頻率是不同的,因此預訓練知識會反映出訓練數據中的頻率或模式。例如,烹飪是全人類的共同體驗,網上有海量的烹飪文章;名人八卦和電影資訊也多如牛毛,所以 AI 對這些話題了如指掌。相反,像“類星體(Quasars,一種由超大質量黑洞驅動的極亮天體)”這樣高度專業的話題,網上的文章就比烹飪少得多。
雖然互聯網上大部分內容是英文,但 AI 系統也學習了其他語言的數據,比如粵語。全球有超過 8000 萬人說粵語,但這遠少于英語人口,粵語數據可能只占互聯網總內容的不到 0.1%。最后,有些東西 AI 是一無所知的,比如你公司的核心商業機密——希望這些數據沒有泄露在公開網絡上,因此 AI 也就無從學起。
所以,我總結出一個經驗法則:思考某類數據在互聯網上出現的頻率,能幫你很好地評估 AI 回答的可靠性。
由于 AI 學習過這些數據,有時它能展現出令人驚訝的理解力。如果你飛快地打出帶有錯別字的句子:“微潑爐能煮雞蛋嘛?(can u cook eggs in microwave?)”,它能像理解標準句子一樣完美領會你的意思。(順便說一句,我自己就在微波爐里炸過幾次雞蛋,如果你想避免這種慘劇,不妨問問 AI 怎么做,別像我一樣付出慘痛代價。)
它之所以這么擅長理解錯別字,是因為它在學習時就看過大量帶有拼寫錯誤的信息源。所以,當你在使用 AI 時,我并不是鼓勵你故意用錯語法,但如果你打字太快,出現了一些甚至很多錯別字,別太在意。直接把提示詞發給 AI 就行,沒必要把時間浪費在糾正每一個語法小錯誤上。
但壞消息是,AI 的許多信息源也包含錯誤觀念和過時信息。因此,駕馭 AI 的一項核心技能,就是如何通過提示詞引導它,讓它給出的答案盡可能規避錯誤,并且不過度依賴過時的信息。
![]()
突破時間凍結:網絡搜索與深度研究
構建 AI 模型的人必須在某個時刻停止訓練,所以 AI 的知識庫有一個“截止日期(Knowledge cutoff date)”。也就是說,AI 只閱讀了該日期之前的互聯網信息,它的認知被“凍結”在了那一刻。但世界依然在運轉,新事件不斷發生。讓我們看看 AI 如何通過網絡搜索來收集新信息,從而回答那些超出其知識截止日期的問題。
如果你使用的是 ChatGPT、Gemini 或 Claude 等主流 AI 模型,某些問題大概率會觸發它的網絡搜索功能。比如你問:“2025 年的 67 梗是什么意思?” 它很可能會去網上搜索,然后告訴你“67 梗”(發音就是“六七”,讀起來挺順口)是在幾個社交平臺上廣泛傳播的流行語。
為什么這個問題會觸發搜索?因為“2025 年”這個時間線索讓 AI 意識到,它需要更新的信息,這可能是一個在它知識截止日期之后才出現的梗。
以 OpenAI 的 GPT-4.5 模型為例,它的知識截止日期是 2025 年 8 月。在這之前,互聯網上關于 6 和 7 的文本大多是“6 * 7 = 42”,或者是那個經典的兒童冷笑話:“為什么 6 害怕 7?因為 7 吃了 9(7 8 9 / seven ate nine)”。所以,當 67 梗在這個日期之后爆發時,它并不在 GPT-4.5 的預訓練知識里。
有些問題 AI 會直接用預訓練知識回答,而另一些則傾向于觸發搜索。比如你問:“請幫我在加州山景城找一家評價很高的健身房。” 健身房的評價、開業或倒閉狀態是隨時間變化的,這大概率會觸發搜索。如果你問:“什么是庫珀山滾奶酪比賽?” 因為這是個極其冷門的知識,它在網上沒看過太多相關信息,也很可能會去搜索以給你一個準確的答案。(如果你好奇的話,這是一項非常有趣的活動,人們會追著一塊滾下山的奶酪跑。)
總結一下觸發搜索的場景:
預訓練知識足以應對:手機掉湯里怎么辦、貓為什么盯墻、旅行者 1 號里有什么(因為這些是互聯網上的常識)。
需要網絡搜索:時事熱點、特定地理位置信息、高度冷門的信息。
對于大多數主流 AI,網絡搜索可以自動觸發,也可以由你明確指定(比如點擊界面上的搜索按鈕,或者在提示詞里寫“請在網上搜索這個”)。
![]()
駕馭搜索:過濾互聯網的雜音
網絡搜索雖然極具價值,但并不完美。就像你自己用谷歌搜索一樣,有時也會搜到過時或不準確的來源。
如果你問 AI:“灰色市場的多肽(一種補充劑)有多安全?” 它可能會搜到社交媒體、Reddit 或 Quora 上的帖子,或者干脆搜到那些靠賣多肽賺錢的網站,這些網站當然傾向于說它安全。你得到的答案可能準確,也可能非常離譜。
但如果你在提示詞中引導 AI 使用官方組織的來源,或參考嚴謹的科學研究,它就更有可能去查閱世界衛生組織、美國食品藥品監督管理局(FDA)或歐洲藥品管理局的資料,從而給你更可靠、更具科學可信度的答案。
無論是人類還是 AI,網絡搜索都傾向于提取“熱門”來源。有報告顯示,AI 模型引用最多的網站是 Reddit,其次是維基百科、YouTube、谷歌本身、Yelp 等。互聯網上充斥著社交媒體和論壇的文本,而經過科學驗證的高可靠性文本相比之下少得可憐。如果你不去引導模型,它極有可能“撿到籃里都是菜”,抓取最容易獲得的信息,而不是最可靠的信息。
AI 搜索的另一個局限是網頁可能已經過時。最近,我用 AI 幫我在內華達州亨德森市找個跑步的地方。這是個特定地點的冷門查詢,觸發了搜索,它給我列出了一些跑步地點。但遺憾的是,它抓取的是二十多年前的網頁信息,推薦的一所學校現在早已不對公眾開放跑步了。
![]()
AI 搜索的底層邏輯
為了讓你更好地理解 AI 如何利用搜索信息,我簡要解釋一下它底層的運作機制。這是一個多步驟的過程。
想象一下,你在向一個由兩人組成的客服團隊提問:
面向用戶的 AI 模型(你在和它對話)。
助手 AI 模型(專門負責搜索)。
當你發送提示詞時,面向用戶的模型會決定是否需要呼叫助手模型:“嘿,幫我上網搜一下這個信息。” 助手模型會在類似谷歌或必應的搜索引擎上進行搜索,掃描結果,過濾掉無關內容,下載最相關的網頁并進行總結。然后,助手模型把總結匯報給面向用戶的模型,后者再利用這些總結為你生成最終答案。
這里有一個有趣的細節需要注意:面向用戶的 AI 模型并沒有完整閱讀它為你引用的所有網頁,它看到的只是摘要。這有時會導致它誤解網頁的真實含義。這就是為什么你有時會看到一種滑稽的現象:AI 引用了一個網頁,聲稱該網頁支持某個結論,但當你自己點開那個網頁時,發現它根本不是 AI 說的那個意思。
那么,何時該用谷歌,何時該用 AI 呢?
如果你想快速瀏覽多個來源、尋找特定網站,或者查看原始數據(比如買個 2013 款本田思域的空氣濾清器),傳統的搜索引擎是最好的選擇。
但如果你需要綜合多個來源的信息,權衡利弊,或者對比不同觀點得出深入的結論,AI 模型能高效地為你匯總多個網頁的結果,省去你自己閱讀大量網頁的時間。
![]()
終極武器:深度研究(Deep Research)
有時候,你希望 AI 綜合的不是幾個來源,而是幾十個來源,并進行深度思考,為你提供最詳盡的研究答案。目前主流的 AI 界面(如 ChatGPT、Gemini、Claude)都具備“深度研究模式”。我發現這是一個極具價值卻被嚴重低估的工具。
假設你想用 AI 幫你策劃一個萬圣節鬼屋。你可以寫一段提示詞,告訴它你的地理位置、前院的面積、你想要的恐怖體驗等詳細的上下文。
接到這樣的提示詞后,AI 模型會制定一個研究計劃,思考需要查找哪些類型的資料。許多系統會讓你有機會批準或修改這個計劃。如果沒問題,我會直接啟動它。
在這個例子中,它會先收集帕洛阿爾托市關于許可證、萬圣節條例的規定,閱讀并綜合這些信息。然后,它可能決定進一步搜索消防安全指南,接著再去尋找裝飾靈感。它會在遵循初始計劃的同時,保持靈活性,隨時深入挖掘需要的信息。
經過一段時間(可能長達幾分鐘)的搜索,它最終會為你寫出一份詳細的研究報告。順便說一句,這個過程是智能體 AI(Agentic AI)的一個典型例子——在深度研究過程中,AI 有一定的自主決策權,能自己決定下一步該做什么(比如是否需要進行額外的搜索)。
最終的輸出是一份極其詳盡、考慮周全的計劃,包含結構、法規、安全等各個維度的章節。如果你使用的是谷歌的 Gemini,它甚至能輕松地將這份深度研究轉化為網頁或信息圖表,包含預算餅圖、噪音條例的可視化圖表,甚至還有一個幫你統籌活動的核對清單(Checklist)。
深度研究是如何運作的?在制定計劃后,AI 會同時發出多個網絡搜索請求,并同時獲取多個網頁。這是它的巨大優勢——無需一次次單線程搜索,效率極高。系統會快速評估哪些來源相關,哪些無關,并決定是否需要使用新的搜索詞進行補充搜索。經過幾輪“搜索-評估-補充”的循環后,它認為資料足夠了,就會將下載的所有頁面進行總結、提煉,添加引用,最終呈現給你。
何時使用哪種模式?
預訓練知識:“手機掉湯里怎么辦?”(耗時幾秒,無需聯網,適合尋找常識、定義)。
普通網絡搜索:“幫我找個高分健身房。”(耗時十幾秒,下載少數來源,適合獲取最新信息)。
深度研究:“日常步數對長期健康的影響是什么?”(耗時幾分鐘甚至更長,下載幾十個來源,適合需要綜合海量信息、進行復雜推理的任務)。
![]()
將 AI 視為你的思維伙伴
AI 最強大的用途之一是作為“思維伙伴”。當我在思考復雜問題或做艱難決定時,如果身邊沒有人類專家,知識淵博的 AI 就是一個極佳的探討對象。
我們先從頭腦風暴說起。很多人只是讓 AI 列個清單,但這遠非最高效的用法。讓我告訴你如何進階。
根據 OpenAI 的數據,約一半的 ChatGPT 對話是尋求寫作和實用指導,而創意構思占了近 4%。我發現 AI 在提供選項方面非常出色。有一個經典的創造力測試:說出磚頭的 200 種用途。這對人類來說很難(鎮紙?花盆?蓋房子?),但 AI 能輕松列出長長的一串,而你的任務就是從中評估并挑選出你喜歡的。在頭腦風暴中,“量變引起質變”是常理,讓 AI 生成大量想法供你挑選,是找到好點子的有效途徑。
但我更想展示一種進階的頭腦風暴形式:提供更多上下文,并與 AI 進行更長時間的迭代對話。
如果你只說:“幫我制定一個健身計劃。我 38 歲,初學者,有 10 磅的啞鈴,每天有 15 分鐘。” 它會給出非常中規中矩的答案:深蹲、俯臥撐等。很合理,但很普通。
如果你想要更有創意的選項,可以增加上下文:“我堅持不下來這些。給我一些保持動力的黑客技巧。我有一個蹦床和一只貓。”
通過強迫它將蹦床和貓納入健身選項(這是一種非常規的思路),它可能會建議你進行“蹦床休息法”,或者“貓咪觸發的微型健身”——比如每次看到貓搖尾巴,就做個微型運動。這些想法顯然更有創意。
為什么基本提示詞只能得到平庸的答案?因為 AI 的輸出帶有一定的隨機性,但它更傾向于給出“常識性”的回應。如果你畫一個坐標軸,橫軸是回答的獨特性/創意度,縱軸是 AI 給出該回答的概率。你會發現,像“啞鈴彎舉”這樣的常識性回答概率極高,而“貓咪觸發健身”的概率極低。這是因為它是在互聯網文本上訓練出來的,網上談論啞鈴彎舉的內容比貓咪健身多得多。
對于尋求事實(比如“世界最高樓是什么”),這種傾向是好事,因為網上的主流觀點通常是事實。但在頭腦風暴中,主流觀點就意味著平庸。
如何打破平庸?答案就是上下文(Context)。當你告訴它你討厭深蹲、有蹦床、有貓、缺乏動力時,這些上下文就像一個力場,把 AI 從“常識區間”推向了“高度相關且充滿創意的定制區間”。
如果你不知道該給 AI 提供什么上下文,有一個非常實用的技巧:與 AI 迭代。
假設我想讓 AI 幫我制定還債計劃,我列出了我的信用卡債務、學生貸款和家庭借款。首先,不要讓 AI 直接給你“一個”方案,而是讓它提供 3 到 5 個選項。它可能會給出:方案一(保留現金流)、方案二(先還高息貸款)、方案三(優先還家人錢)。這些都很合理,但它還不知道你偏好哪一種。
此時,你對這些選項的反饋,就是最完美的上下文。你可以說:“我不喜歡方案一,太保守了。我喜歡先還 19% 利息的想法。哦對了,我忘了說,我馬上有一筆 450 美元的現金進賬,而且我最近要搬家。”
有了這些反饋,AI 就能為你生成三個全新的計劃。你可以再次給出反饋,如此循環往復,直到它拿出一個讓你滿意的完美計劃。對 AI 認為的好主意進行反饋,是高效提取并輸入有用上下文的最佳機制。
總結頭腦風暴的秘訣:盡可能提供預先背景 -> 索要多個選項 -> 給出反饋 -> 索要新選項 -> 循環迭代。
![]()
駕馭上下文(Context)的魔力
心理學家說,人類的工作記憶(Active working memory)同時只能容納大約 7 個事物。這就是為什么記住 7 件雜貨勉強可行,但記住 20 件就極其困難。但有趣的是,現代 AI 模型可以處理海量的上下文,有些甚至能容納數十萬字。
比如在選公寓時,你可以上傳數百頁的租賃合同、租客評價和街區統計數據,讓 AI “閱讀所有內容,并告訴我每個選項的利弊”。(順便提一句,告訴 AI “深度思考/Think hard”是另一個常見的高階提示詞技巧)。
上下文是如何運作的?目前頂尖的 AI 模型可以接受約 75 萬字的上下文,這相當于前四五本《哈利·波特》的總字數,或者連續幾天的語音對話。很多人嚴重低估了 AI 的胃口。
當你提問時,AI 的上下文里默認包含了幾樣東西:
系統提示詞(System prompt):告訴 AI 當前日期、它的名字、基本能力以及“要樂于助人”的通用指令。
工具定義:如果 AI 能聯網,系統會告訴它什么是搜索引擎以及如何使用。
你的提示詞與附件:你輸入的文本和上傳的文件。
聊天記錄(Chat history):你們之前的所有對話都會被增量添加到上下文中。
這意味著,只要在同一個對話窗口里,AI 就“記得”你們聊過的所有內容。但是,如果你突然轉換話題,比如從“我的健身計劃”跳到“給我媽制定一個健身計劃”,之前海量的上下文就會變成干擾信息,導致 AI 表現下降。這就是為什么在討論全新話題時,強烈建議開啟一個“新對話(New chat)”,清空上下文,輕裝上陣。
![]()
AI 桌面應用:讓 AI 自己尋找上下文
AI 正在超越單純的聊天界面。你可能聽說過 Claude Computer Use、微軟 Copilot Workspace 或谷歌 Project Astra。這些應用在獲得你的權限后,可以自主地(Agentically)在你的電腦上收集上下文——也就是自己找文件看,從而完成任務。
假設你做了一堆研究,文件夾里亂七八糟地堆滿了 PDF、報告和圖片。你可以讓 AI 桌面應用瀏覽這個文件夾,并提出整理方案。AI 會自動查看文件命名,理解內容,提出一個重命名、新建子文件夾并移動文件的提案。如果你不滿意,可以給它反饋;如果你滿意,點擊確認,它就會在你的電腦上自動執行這些操作。
最佳工作流:告訴它任務 -> 讓 AI 提出行動計劃(但先別執行) -> 你審查并修改計劃 -> 確認無誤后,讓它執行。
安全警告:這些應用可以讀取、修改甚至刪除你的文件。雖然誤刪很少見,但確實發生過(而且通常不會進回收站,無法恢復)。因此,建議你只在特定文件夾內運行它,不要給它整個硬盤的權限。當它請求權限時,仔細審查它到底要讀寫什么。在完全熟悉這些工具之前,保持謹慎。
![]()
喚醒 AI 的深度推理能力(Reasoning)
最新的 AI 模型具備極強的推理能力。只要給足上下文,它們能對復雜任務進行長時間的嚴密思考。我越來越傾向于把 AI 當作一個“推理引擎”。
隨著模型不斷進化,它們執行長期任務的能力突飛猛進。一項研究表明,在 2024-2025 年,模型已經能以不錯的成功率完成人類需要耗費數小時才能完成的復雜任務(如審查法律合同、挖掘網絡安全漏洞)。
還記得那個“Strawberry 里有幾個 R”的例子嗎?這幾年前是個難題。那個年代(2023-2024),人們流行在提示詞里加一句“請一步步思考(Think step by step)”。在當時,這是個好建議;但在今天,這個技巧已經過時了。
現在,我不再叫它一步步思考,而是直接告訴它“深度思考(Think hard)”或“終極思考(Ultra think)”。現代模型完全懂這是什么意思,它們會進入復雜的推理狀態,可能耗時幾十秒到十幾分鐘,甚至在思考中途決定去搜索更多信息,然后再回來繼續思考,直到得出完美的答案。
對于這些具備推理能力的模型,我強烈建議你給它們派發真正困難的任務。不要只問簡單的問題,把你在創業、工作中的真實難題扔給它,給足人類專家也需要的上下文,看看它能為你創造什么奇跡。
![]()
寫作與編輯:告別“AI 工業糖精”
寫作是人們使用 AI 最頻繁的場景(占 ChatGPT 任務的 24%)。寫作本質上是一種思考,而擅長推理的 AI 絕對是你的好幫手。但如果只是簡單地讓 AI “幫我寫”,往往會得到“AI 漿糊/工業糖精”。
什么是 AI 漿糊?它乍一看文筆不錯,但經不起推敲。句子空洞、缺乏實質內容。AI 寫作有明顯的痕跡:
濫用破折號(Em dash)。
詞匯匱乏,過度偏愛某些詞(比如“深入探討/Delve”、“細微差別/Nuanced”)。
喜歡用“排比三段論”。
喜歡用“不是 X 而是 Y”的模糊句式(比如“這不僅僅關乎速度,更關乎可用性”)。 有趣的是,因為人類看多了 AI 生成的文本,連人類自己說話都開始帶上這種“AI 味”了。
如何避免?使用“漸進式大綱(Progressive Outlining)”不要讓 AI 直接寫正文。
寫大綱:給出觀點和素材,讓 AI 提供 3 個大綱選項。
改大綱:挑選一個,給出修改意見(比如“把故事一移到前面,加一個皮克斯的類比”)。
擴充要點:滿意大綱后,讓 AI 把標題擴展成核心要點(Bullet points)。
改要點:再次審閱、修改要點。
寫正文:最后一步,才讓 AI 生成完整文章。
為什么這樣做?因為如果 AI 直接寫了一長篇文章,你發現結構不對,修改起來牽一發而動全身。而修改大綱,只需改動幾個字,就能撬動最終文章里整段整節的變化。這是一種杠桿率極高的寫作方式。
![]()
建立客觀的評分矩陣(Rubric)
當你自己寫了一篇文章,想讓 AI 幫忙潤色時,最好的方法是一段一段地改,而不是把整篇文章扔給它。
如果你需要對整篇文章進行宏觀的評價,記得防范我們前面提到的“迎合效應”。如果你問:“我寫了篇科幻小說,你覺得怎么樣?” 它一定會把你夸上天。
要獲得有價值的批評,你必須給 AI 一個評分量表/評估矩陣(Rubric)。 不要給出模糊的指令(比如“滿分 100,給人物、情節打分”),這會導致 AI 先拍腦袋定個分數,然后再去圓謊。
你需要制定極其明確、非黑即白的客觀標準。例如:
人物(25 分):每一個有名字的角色是否都有明確的目標?(是得 10 分,否得 0 分)。
沖突(15 分):角色目標之間是否有沖突?
把這套標準連同你的文章發給 AI,并下令:“請客觀評價,嚴格按照每個類別打分,最后再匯總總分。” 這種毫無歧義的客觀標準,能強迫 AI 摘下“老好人”的面具,給你真正有用的修改建議。如果你不知道怎么制定這個量表,完全可以讓 AI 幫你頭腦風暴一個出來。
跨模型審查與“參差不齊的智能”還有一個有趣的技巧:讓 Claude 來評價 ChatGPT 寫的文章,或者反過來。這種交叉審查有時能帶來更好的效果。
這引出了一個概念:AI 模型擁有“參差不齊的智能(Jagged intelligence)”。AI 在某些方面(如速讀海量網頁)遠超人類,但在另一些方面又不如人類。而且,不同的 AI 模型“偏科”的方向也不同。
目前的 AI 市場競爭極其激烈,最強模型的王座每個月都在輪換。因此,我經常把同一個提示詞喂給不同的模型,對比它們的表現。這能不斷打磨我的直覺,讓我知道在當下,哪個模型最適合干哪種活。
![]()
超越文本,邁向多模態與編程
在前面的模塊中,我們只談了文本。但現代 AI 已經具備了生成圖像、視頻、聲音甚至代碼的“多模態(Multimodal)”能力。雖然多模態交互成本更高、速度更慢,但它能讓你完成不可思議的工作。
我曾用谷歌的 Imagen 模型為我女兒生成了一張“貓咪在夜間偷偷經營咖啡館”的圖片,她非常喜歡,我們甚至找面包師把它做成了真實的 3D 生日蛋糕。AI 還能生成極其逼真的克隆語音,甚至連我父母都分辨不出那是不是我本人的聲音。
理解生成成本差異:
文本:最便宜、最快。
語音:稍貴、稍慢。
圖像:更貴、更慢(一張圖可能需要幾十秒和幾美分)。
視頻:最昂貴、最耗時。
當你要求 AI 生成圖像時,它使用的技術(通常是擴散模型 Diffusion model)與生成文本完全不同。它不是一個像素一個像素地畫,而是從一團純粹的噪點開始,逐步“去除”噪點,最終顯現出清晰的圖像。這就是為什么 AI 有時會畫出奇怪的手指或亂碼文字,但最新的模型已經在這些問題上取得了巨大進步。
給 AI “看”圖片的技巧:一圖勝千言。如果你在白板上畫了一堆復雜的數學公式,直接拍照發給 AI 問:“這節課講了什么?” 它不僅能識別出“卷積神經網絡”,甚至能猜出你接下來要講什么。
強項:識別手寫體、發票、會議白板上的便利貼。
弱項:缺乏對細微差別的分辨力。如果你拍一張健身房器械的圖,它可能會認錯,因為在 AI 粗略的視覺里,那些器械長得都差不多。但如果你拍一個極具辨識度的“真人尺寸倉鼠滾輪跑步機”,它絕不會認錯。
![]()
零代碼開發:讓 AI 為你寫代碼、做分析
這曾經是專業程序員的專利,但現在,只要你會寫提示詞,你就能構建簡單的軟件和網站。
比如,你可以輸入:“構建一個游戲,用戶可以放置障礙物和目標,并模擬運行。” 就這么簡單的一句話,Claude 就能為你生成一個可玩的網頁游戲。你可以用它做番茄鐘、賬單計算器、單詞記憶卡,甚至是一個絢麗的煙花模擬器。
構建簡單應用的提示詞三要素:
目標:你想創造什么(比如:一個好玩的煙花模擬器)。
輸入:用戶需要做什么(比如:在屏幕上點擊)。
輸出:應用會展示什么(比如:絢麗的煙花爆炸效果)。
我強烈建議你從最簡單的想法開始嘗試,如果失敗了也沒關系,這正是你建立“AI 能做什么、不能做什么”直覺的過程。
數據分析神器:如果你有智能手表導出的跑步數據,或者奶茶店的月度銷售報表(Excel 格式),你可以直接把文件傳給 AI 并問:“本月銷售額有什么值得關注的?”
此時,AI 會調用它的“代碼執行工具(Code execution tool)”。它不會用嘴說,而是直接在后臺用 Python 寫一段代碼,運行這些數據,計算出平均值,然后為你生成一張精美的折線圖,并告訴你:“我發現草莓抹茶在春季賣得最好,而新品椰奶茶在秋季異軍突起。”
如果你在提示詞里加上“請仔細/深度分析(Analyze carefully)”,它甚至會進入我們之前提到的自主分析流程,思考好幾分鐘,為你制作一份極其專業的“年度回顧幻燈片”。這比你自己吭哧吭哧拉 Excel 表格要快得多,也極具啟發性。
![]()
結語
恭喜你完成了這門課程!掌握了這些技巧,你已經做好了成為AI 高階玩家的準備。
我希望你能在生活和工作中找到無數個應用這些技能的場景:用它來頭腦風暴,用“深度研究”來撰寫詳盡的報告,用“漸進式大綱”來輔助寫作,甚至生成多模態內容和代碼。
AI 模型仍在以驚人的速度進化。請保持對新模型的好奇心,不斷給 AI 拋去困難的任務,提供高質量的上下文,持續打磨你對 AI 潛力的直覺。我深信,這項不可思議的技術將為你帶來巨大的回報。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.