![]()
(來源:麻省理工科技評論)
今年 2 月,我在倫敦一場反 AI 游行上拿到了一張傳單。我不確定寫這張傳單的人是不是在致敬《南方公園》里的“內褲精靈”,但如果是的話,他們模仿得非常到位。傳單上寫著:“第一步:培育一個數字超級大腦。第二步:?第三步:?”
《南方公園》的“精靈”那集于 1998 年首播。肯尼、凱爾、卡特曼和斯坦發現一群小精靈每晚偷偷溜出來從衣柜里偷內褲。為什么?精靈們展示了自己的商業計劃書:“第一階段:收集內褲。第二階段:?第三階段:盈利。”
這套精靈商業計劃后來成了互聯網上最經典的梗之一,用來諷刺那些愿景宏大但中間路徑完全空白的計劃。馬斯克也曾在一次演講中引用它,解釋他打算怎么為火星任務籌錢。眼下,它精準地捕捉了 AI 行業的現狀:公司造出了技術(第一步),許諾了變革(第三步)。至于怎么從第一步走到第三步,仍然是一個大大的問號。
這張傳單出自 Pause AI,一個參與組織了這次抗議活動的國際激進組織。傳單的結尾向讀者發出呼吁:“在我們搞清楚第二步到底是什么之前,暫停 AI。”
在 Pause AI 看來,第二步必須包含某種形式的監管。但具體要監管什么、由誰來執行,還遠沒有定論。
AI 的擁躉們則堅信第三步是救贖,傾向于對中間那一段含糊帶過。他們認為我們正騎著一項“具有經濟變革性的技術”奔向光明的未來——這是 OpenAI 首席科學家雅庫布·帕喬基(Jakub Pachocki)幾周前對我說的話。他們知道自己要去哪里,或者說是大概知道;但山頂上霧蒙蒙的,而且還有一段距離。但每個人走的路不一樣。他們都能到達嗎?有人能到達嗎?
每一個關于未來的宏大宣言背后,都有一個更冷靜的現實評估在給熱度降溫。看看最近兩項研究就知道了:一項來自 Anthropic,預測了哪些類型的工作最容易受到 LLM 的影響(Anthropic 認為,經理、建筑師和媒體從業者應該做好準備迎接變化;園林工人、建筑工人和酒店從業者暫時不用太擔心)。但這些預測說到底只是猜測,依據的是 LLM 看起來擅長什么類型的任務,而不是它們在實際工作場景中的真實表現。
另一項研究于 2 月由 AI 招聘初創公司 Mercor 的研究人員發布。他們用 OpenAI、Anthropic 和 Google DeepMind 的頂級模型驅動了幾個 AI 智能體,讓它們完成 480 項銀行家、咨詢師和律師日常工作中常見的任務。結果是:每一個智能體都未能完成大部分工作。
為什么各方說法差這么遠?原因有兩個:
第一,要看是誰在說這些話。Anthropic 本身就是一家 AI 公司,它預測 AI 影響力越大,對自己的生意越有利。第二,大多數喊著“大事要來了”的人,依據主要是 AI 編程工具進步得有多快,但寫代碼只是職場任務中的一小部分。需要做戰略判斷、權衡利弊的工作,LLM 目前還做得很差。
更重要的是,這些工具在部署時不是被放進一間無菌室,它們要在有人、有既定工作流程的混亂環境中運轉,有時候加入 AI 反而會讓事情變得更糟。當然,也許這些工作流程確實需要被推倒重來,圍繞新技術重新設計,這項技術才能真正達到變革性的地位。但那需要時間,也需要膽量。
那個巨大的空白?它正好在第二步應該在的位置。對于究竟要發生什么、怎么發生,業界缺乏共識,由此產生的信息真空就被每周最新的瘋狂宣言所填充,證據靠邊站。我們對于即將到來的東西以及它將如何落地,已經失去了任何扎實的理解根基,以至于一條社交媒體帖子就能(而且確實在)撼動市場。
我們需要的是更少的猜測、更多的證據。但這需要模型開發者的透明度,需要研究人員與企業之間的協調,也需要新的評估方法來告訴我們:這項技術在真實世界中部署后,到底發生了什么。
整個科技行業(連帶全球經濟)都建立在一個懸而未決的承諾上:AI 真的會具有變革性,但這目前還不是板上釘釘的事。下次你聽到關于未來的大膽宣言時,記住:大多數企業還像“內褲精靈”一樣,卡在第二步。
https://www.technologyreview.com/2026/04/27/1136456/the-missing-step-between-hype-and-profit/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.