![]()
當普通人還在用大模型寫周報、薅羊毛時,華爾街的警報已經拉響。
4月24日,老牌電商巨頭eBay的股價單日下跌5.3%,跌至97.94美元。直接導火索是eBay宣布關閉舊金山辦公室、裁減員工,以及多位華爾街分析師在財報前集體將其評級下調至“持有”。
但與此同時,科技與投資圈正密切關注另一場幾乎同期曝光的硅谷內部實驗。
在這場實驗中,AI替代了人類在交易中的角色,自主拿著預算去市場上議價。它們還展示了一條值得關注的商業邏輯:算力差距,直接轉化為交易中的議價優勢。
今天,我們來拆解這兩起分別發生在中美兩地的代表性壓力測試,看看當大模型掌握了資金調度權,商業世界會發生什么。
一場完全由機器驅動的內部交易實驗
事情要從AI實驗室Anthropic的一場內部壓力測試說起。這場實驗代號「Project Deal」。
![]()
玩法很簡單:Anthropic給舊金山辦公室的69名員工,每人發了大約100美元的真實預算。然后,員工只需花10分鐘和AI(Claude)聊聊天,告訴它自己想賣掉什么閑置、想買點什么,底價是多少。接下來,人類就不再參與。
被接入Slack內部交易頻道的AI代理們,開始了一場完全自主的交易博弈。
全網檢索匹配、精準拋出報價、多輪來回拉扯——它們在沒有任何人類干預的情況下,自主起草并鎖定了交易合同。
整整一周時間,這群AI處理了500多件真實物理商品,達成了186筆交易,總交易額突破4000美元。連一袋裝滿19個乒乓球的塑料袋,都被AI以3美元的價格買下,理由是這是“充滿可能性的完美球體”。
人類唯一需要做的事情,就是根據AI談妥的契約,在線下見個面,把實物交接一下。
但這場實驗真正引人注目的地方,并不在于AI會買東西。而在于Anthropic在底層做的變量控制。
算力差距如何轉化為議價優勢
在員工們毫不知情的情況下,Anthropic把測試環境物理隔離了。一部分人的代理,是當時最強的旗艦大模型Claude Opus 4.5;另一部分人的代理,則是推理成本更低的輕量級模型Claude Haiku 4.5。
測試結果的數據曲線,揭示了顯著的模型能力差距。
在模型代差的對決中,Opus在議價能力上表現出了顯著優勢:作為賣家,Opus平均能多獲得3.64美元的利潤;作為買家,它平均能把采購成本壓低2.45美元。
最典型的案例是一輛破舊的折疊自行車。同樣的需求,同樣的底線。當買賣雙方都是Haiku代理時,成交價是38美元;而當Opus接管談判時,它將成交價推高至65美元。單一標的物的算力價差,高達70%。
更具隱蔽性的是,這場算力差距帶來的劣勢,參與者很難察覺。在經歷了不同模型交叉測試的28名員工中,有11人甚至覺得表現更弱的Haiku為自己爭取到了更好的條件。他們甚至沒有意識到自身處于議價劣勢。
實驗還提示,提示詞的修辭策略對議價結果影響有限。有員工要求AI扮演“落魄的德州牛仔”去賣慘砍價。無論采用何種角色設定,AI的表現都很投入,但對最終成交價沒有產生顯著影響。在明顯的模型能力差距下,語言策略的邊際效果有限。
這就是代理人商業(Agentic Commerce)的底層邏輯。以前,你買東西吃虧,是因為渠道壟斷或信息差。未來,你在交易中處于劣勢,一個可能的原因是模型能力的差距——你的AI代理參數不夠大、推理不夠深。
從議價博弈到物理世界:1000萬杯奶茶的壓力測試
如果說硅谷在測試機器博弈的“深度”,那么大洋彼岸的阿里巴巴,則直接測試了AI調度物理世界的“廣度”。
2026年春節,阿里投入30億元人民幣,給通義千問(Qwen)大模型做了一場極限壓力測試。
用戶不需要再打開眼花繚亂的商品列表。你只需要對著通義千問APP說一句:“我想喝奶茶。”
在這個瞬間,千問化身為中樞神經。它領走一張25元代金券,向下調用淘寶小時達的接口,定位你附近的喜茶或蜜雪冰城,自動算好折扣,喚醒支付寶免密支付,然后把指令發給同城的外賣騎手。
極簡的指令,展現出了極強的端到端執行效率。前3個小時,100萬杯奶茶訂單涌向全國門店。9個小時內,真實交易訂單突破1000萬筆。通義千問直接登頂蘋果App Store免費榜第一。
但這本質上是一場針對物理供應鏈的壓力測試。
全國超30萬家參與活動的飲品店遭遇了大規模的產能壓力。出單機吐出幾米長的紙條,部分門店因杯具耗盡被迫暫停營業,外賣騎手在街頭排起長龍。云端AI幾毫秒生成的購買決策,超出了現實供應鏈的承載能力。通義千問的系統也因超出并發承載能力,臨時啟用了限流機制。
傳統電商模式的黃昏
把硅谷的“二手交易實驗”和阿里的“送奶茶測試”放在一起看,一個共同趨勢就清晰了:大模型正在從“理解知識”進化到“執行動作”。
傳統電商是怎么賺錢的?做極其復雜的UI界面,賣廣告位,收競價排名的錢,賺信息撮合的差價,商家精心研究話術,試圖刺激消費者的"欲望"。
但現在,當機器可以直接跨過界面,相互用API對話、議價、下單時,一切都變了。
如果傳統電商平臺不能迅速把自己的底層接口改造得對AI友好(Machine-readable),它們龐大的流量入口就可能被繞過,逐漸退化為單純的后端供貨商。這也是為什么代理人商業的興起,讓傳統互聯網平臺的商業模式面臨根本性挑戰。
當然,AI接管所有商業鏈路的那一天,并沒有那么快到來。眼下,代理人商業還卡在三道障礙上:
1. 支付成本過高
現在的金融管道是為人類低頻、大額交易設計的。信用卡刷一筆要收0.35美元的固定手續費外加2%到3%的變動費。但AI代理在比價、拼單時,可能會發起海量0.5美元的微交易。高昂的手續費,直接讓高頻機器交易在經濟學上不成立。
2. 責任歸屬不清
AI代理目前沒有“法律人格”。如果你的AI代理產生嚴重偏差(即算法幻覺),花1000美元買了個與實際價值嚴重不符的商品,誰來承擔損失?大模型公司早已寫好免責條款,最后買單的還是人類用戶。在責任歸屬理清之前,AI代理注定只能停留在買奶茶、買二手的階段,無法介入大額資產交易。
3. 機器間的信任機制尚未成熟
不用掃臉、不用輸密碼,商家怎么確認這筆錢真的是你的授權,而不是AI被植入了惡意提示詞?
為了解決這個信任問題,谷歌近期牽頭,聯合萬事達卡、PayPal等60多家企業推出了AP2協議(Agent Payments Protocol)。它驗證的核心不再是“你是誰”,而是通過密碼學簽名,驗證“這是否符合你最初始的授權意圖”(Intent Mandate)。只有意圖驗證通過,商家才會放行資金。
2026年,商業社會的底層規則正在重寫。
對創業者來說,如果你還在死磕前端UI的優化,可能已經跑錯了賽道。未來的機會,藏在給AI提供原生基礎設施——對機器友好的API、低摩擦的微支付網絡,以及代理人責任保險。
而對于每一個普通人來說,便利的代價是讓渡控制權。當代碼接管了我們的錢包,一場基于"算力深度"的隱性財富再分配已經開始。在這個新世界里,理解并防范自己被高階模型在議價中占據優勢,是我們需要面對的新課題。(本文首發鈦媒體APP,作者 | 硅谷Tech_news,編輯 | 林深)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.