網易首頁 > 網易號 > 正文申請入駐

AI自主炒二手：從議價到送奶茶，AI正在繞過人類直接做生意

2026-05-06 08:51:12　來源: 鈦媒體APP

北京舉報

分享至

當普通人還在用大模型寫周報、薅羊毛時，華爾街的警報已經拉響。

4月24日，老牌電商巨頭eBay的股價單日下跌5.3%，跌至97.94美元。直接導火索是eBay宣布關閉舊金山辦公室、裁減員工，以及多位華爾街分析師在財報前集體將其評級下調至“持有”。

但與此同時，科技與投資圈正密切關注另一場幾乎同期曝光的硅谷內部實驗。

在這場實驗中，AI替代了人類在交易中的角色，自主拿著預算去市場上議價。它們還展示了一條值得關注的商業邏輯：算力差距，直接轉化為交易中的議價優勢。

今天，我們來拆解這兩起分別發生在中美兩地的代表性壓力測試，看看當大模型掌握了資金調度權，商業世界會發生什么。

一場完全由機器驅動的內部交易實驗

事情要從AI實驗室Anthropic的一場內部壓力測試說起。這場實驗代號「Project Deal」。

玩法很簡單：Anthropic給舊金山辦公室的69名員工，每人發了大約100美元的真實預算。然后，員工只需花10分鐘和AI（Claude）聊聊天，告訴它自己想賣掉什么閑置、想買點什么，底價是多少。接下來，人類就不再參與。

被接入Slack內部交易頻道的AI代理們，開始了一場完全自主的交易博弈。

全網檢索匹配、精準拋出報價、多輪來回拉扯——它們在沒有任何人類干預的情況下，自主起草并鎖定了交易合同。

整整一周時間，這群AI處理了500多件真實物理商品，達成了186筆交易，總交易額突破4000美元。連一袋裝滿19個乒乓球的塑料袋，都被AI以3美元的價格買下，理由是這是“充滿可能性的完美球體”。

人類唯一需要做的事情，就是根據AI談妥的契約，在線下見個面，把實物交接一下。

但這場實驗真正引人注目的地方，并不在于AI會買東西。而在于Anthropic在底層做的變量控制。

算力差距如何轉化為議價優勢

在員工們毫不知情的情況下，Anthropic把測試環境物理隔離了。一部分人的代理，是當時最強的旗艦大模型Claude Opus 4.5；另一部分人的代理，則是推理成本更低的輕量級模型Claude Haiku 4.5。

測試結果的數據曲線，揭示了顯著的模型能力差距。

在模型代差的對決中，Opus在議價能力上表現出了顯著優勢：作為賣家，Opus平均能多獲得3.64美元的利潤；作為買家，它平均能把采購成本壓低2.45美元。

最典型的案例是一輛破舊的折疊自行車。同樣的需求，同樣的底線。當買賣雙方都是Haiku代理時，成交價是38美元；而當Opus接管談判時，它將成交價推高至65美元。單一標的物的算力價差，高達70%。

更具隱蔽性的是，這場算力差距帶來的劣勢，參與者很難察覺。在經歷了不同模型交叉測試的28名員工中，有11人甚至覺得表現更弱的Haiku為自己爭取到了更好的條件。他們甚至沒有意識到自身處于議價劣勢。

實驗還提示，提示詞的修辭策略對議價結果影響有限。有員工要求AI扮演“落魄的德州牛仔”去賣慘砍價。無論采用何種角色設定，AI的表現都很投入，但對最終成交價沒有產生顯著影響。在明顯的模型能力差距下，語言策略的邊際效果有限。

這就是代理人商業（Agentic Commerce）的底層邏輯。以前，你買東西吃虧，是因為渠道壟斷或信息差。未來，你在交易中處于劣勢，一個可能的原因是模型能力的差距——你的AI代理參數不夠大、推理不夠深。

從議價博弈到物理世界：1000萬杯奶茶的壓力測試

如果說硅谷在測試機器博弈的“深度”，那么大洋彼岸的阿里巴巴，則直接測試了AI調度物理世界的“廣度”。

2026年春節，阿里投入30億元人民幣，給通義千問（Qwen）大模型做了一場極限壓力測試。

用戶不需要再打開眼花繚亂的商品列表。你只需要對著通義千問APP說一句：“我想喝奶茶。”

在這個瞬間，千問化身為中樞神經。它領走一張25元代金券，向下調用淘寶小時達的接口，定位你附近的喜茶或蜜雪冰城，自動算好折扣，喚醒支付寶免密支付，然后把指令發給同城的外賣騎手。

極簡的指令，展現出了極強的端到端執行效率。前3個小時，100萬杯奶茶訂單涌向全國門店。9個小時內，真實交易訂單突破1000萬筆。通義千問直接登頂蘋果App Store免費榜第一。

但這本質上是一場針對物理供應鏈的壓力測試。

全國超30萬家參與活動的飲品店遭遇了大規模的產能壓力。出單機吐出幾米長的紙條，部分門店因杯具耗盡被迫暫停營業，外賣騎手在街頭排起長龍。云端AI幾毫秒生成的購買決策，超出了現實供應鏈的承載能力。通義千問的系統也因超出并發承載能力，臨時啟用了限流機制。

傳統電商模式的黃昏

把硅谷的“二手交易實驗”和阿里的“送奶茶測試”放在一起看，一個共同趨勢就清晰了：大模型正在從“理解知識”進化到“執行動作”。

傳統電商是怎么賺錢的？做極其復雜的UI界面，賣廣告位，收競價排名的錢，賺信息撮合的差價，商家精心研究話術，試圖刺激消費者的"欲望"。

但現在，當機器可以直接跨過界面，相互用API對話、議價、下單時，一切都變了。

如果傳統電商平臺不能迅速把自己的底層接口改造得對AI友好（Machine-readable），它們龐大的流量入口就可能被繞過，逐漸退化為單純的后端供貨商。這也是為什么代理人商業的興起，讓傳統互聯網平臺的商業模式面臨根本性挑戰。

當然，AI接管所有商業鏈路的那一天，并沒有那么快到來。眼下，代理人商業還卡在三道障礙上：

1. 支付成本過高

現在的金融管道是為人類低頻、大額交易設計的。信用卡刷一筆要收0.35美元的固定手續費外加2%到3%的變動費。但AI代理在比價、拼單時，可能會發起海量0.5美元的微交易。高昂的手續費，直接讓高頻機器交易在經濟學上不成立。

2. 責任歸屬不清

AI代理目前沒有“法律人格”。如果你的AI代理產生嚴重偏差（即算法幻覺），花1000美元買了個與實際價值嚴重不符的商品，誰來承擔損失？大模型公司早已寫好免責條款，最后買單的還是人類用戶。在責任歸屬理清之前，AI代理注定只能停留在買奶茶、買二手的階段，無法介入大額資產交易。

3. 機器間的信任機制尚未成熟

不用掃臉、不用輸密碼，商家怎么確認這筆錢真的是你的授權，而不是AI被植入了惡意提示詞？

為了解決這個信任問題，谷歌近期牽頭，聯合萬事達卡、PayPal等60多家企業推出了AP2協議（Agent Payments Protocol）。它驗證的核心不再是“你是誰”，而是通過密碼學簽名，驗證“這是否符合你最初始的授權意圖”（Intent Mandate）。只有意圖驗證通過，商家才會放行資金。

2026年，商業社會的底層規則正在重寫。

對創業者來說，如果你還在死磕前端UI的優化，可能已經跑錯了賽道。未來的機會，藏在給AI提供原生基礎設施——對機器友好的API、低摩擦的微支付網絡，以及代理人責任保險。

而對于每一個普通人來說，便利的代價是讓渡控制權。當代碼接管了我們的錢包，一場基于"算力深度"的隱性財富再分配已經開始。在這個新世界里，理解并防范自己被高階模型在議價中占據優勢，是我們需要面對的新課題。（本文首發鈦媒體APP，作者 | 硅谷Tech_news，編輯 | 林深）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.