在硅谷,有了一種新的炫富方式——每天燒了多少token。
對(duì)于這個(gè)炫富方式,現(xiàn)在有一個(gè)新詞叫:Token-maxxing,意思是“把token用量拉到極限”。它變成了公司內(nèi)外人們攀比的新方式:你每天消耗多少token、你能同時(shí)調(diào)度多少個(gè)agent運(yùn)行、你的token throughput(吞吐量)有多高,這些都正在變成衡量一個(gè)人“有多AI原生”的新指標(biāo)。
![]()
不過(guò),對(duì)于這種新競(jìng)賽,全球AI圈的巨頭們正在進(jìn)行著一場(chǎng)激烈的辯論:公司是否應(yīng)該不設(shè)限制地鼓勵(lì)員工們?nèi)ナ褂胻oken?
而在這場(chǎng)辯論的背后,是一場(chǎng)圍繞token展開(kāi)的新軍備競(jìng)賽。硅谷大廠們?yōu)槭裁丛诏偪窬韙oken用量,這背后到底有沒(méi)有道理?大模型公司是怎么給token定價(jià)的?中國(guó)模型如何憑借“物美價(jià)廉”殺入全球開(kāi)發(fā)者市場(chǎng),在OpenRouter上霸榜?“Token套利”的新模式,怎么來(lái)賺差價(jià)?以及在所有這些背后,一個(gè)更大的問(wèn)題:中國(guó)的token出海,會(huì)不會(huì)成為下一個(gè)結(jié)構(gòu)性的產(chǎn)業(yè)機(jī)會(huì)?如果上一個(gè)時(shí)代中國(guó)出口的是襯衫,這個(gè)時(shí)代是電動(dòng)車,下一個(gè)時(shí)代會(huì)是token嗎?
(本文為視頻改寫,歡迎大家收看以下視頻)
01
Token-maxxing之辯
用得越多就越好嗎?
4月初,Meta被爆內(nèi)部有一個(gè)名為“Claudeonomics”排行榜,這個(gè)排行榜匯集了超過(guò)85000名Meta員工的AI使用數(shù)據(jù),列出了token消耗量最高的前250名“超級(jí)用戶”。
在最近一個(gè)月,排行榜上的總使用量突破了60萬(wàn)億token,如果按照Anthropic Opus 4.6的定價(jià),大約每百萬(wàn)token平均15美元來(lái)粗略換算的話,這些token的價(jià)值高達(dá)約9億美元。排名第一的那位員工,燒掉的token價(jià)值高達(dá)數(shù)百萬(wàn)美元。
![]()
這個(gè)消息曝光之后,立馬在硅谷引發(fā)了一場(chǎng)大辯論。
AI創(chuàng)業(yè)公司W(wǎng)riter的CEO May Habib,直接說(shuō)這是“生死存亡級(jí)別的問(wèn)題”。她自己公司內(nèi)部也有一個(gè)token消耗排行榜,而且她明確告訴員工,她本人在盯這個(gè)數(shù)據(jù)。她認(rèn)為如果不全力擁抱AI,就會(huì)被淘汰。
Uber也很激進(jìn)。目前Uber后端系統(tǒng)中,11%的新代碼更新已經(jīng)由agent完成,而三個(gè)月前這個(gè)比例還不到1%。Uber CTO的原話很直白:“我的愿景是把軟件工程轉(zhuǎn)型為agent軟件工程。”
![]()
但反對(duì)Token-maxxing的聲音同樣尖銳。
HubSpot的CEO Yamini Rangan,在LinkedIn上發(fā)了一句被廣泛轉(zhuǎn)發(fā)的話:“Outcome maxxing>>token maxxing”。意思是,比起瘋狂消耗token,不如看看你產(chǎn)出了什么結(jié)果。她代表了另一種重要觀點(diǎn):純粹的token使用量,是一個(gè)錯(cuò)誤的指標(biāo)。
AI軟件工程公司Jellyfish的CEO Andrew Lau,說(shuō)得更直白:“你可以一天到晚刷token,但得到的結(jié)果可能完全不是你想要的。”
![]()
這兩派的吵得不可開(kāi)交。但更多的中間派似乎還是形成了共識(shí):不充分利用AI的公司,會(huì)被競(jìng)爭(zhēng)對(duì)手超越并變得過(guò)時(shí)。在這種信念下,哪怕排行榜和激勵(lì)制度不完美,哪怕一些AI使用最終被證明是浪費(fèi)的,大廠創(chuàng)始人和高層們也被卷起來(lái)了,認(rèn)為必須要這樣做才能讓公司轉(zhuǎn)型成為更AI-native(AI原生)的公司。
自O(shè)penClaw爆火以來(lái),agent任務(wù)燒掉的token量直線上升。科技巨頭們可以不顧成本的燒token,但對(duì)于創(chuàng)業(yè)公司和個(gè)人開(kāi)發(fā)者來(lái)說(shuō),token的成本帶來(lái)的是焦慮。
![]()
Nathan Wang 資深A(yù)I Agent開(kāi)發(fā)者 比如像OpenClaw,你可能跑一個(gè)任務(wù),稍微復(fù)雜一點(diǎn),幾千萬(wàn)的token量都是非常有可能的。
![]()
錢宇靖 GMI Cloud工程主管 如果你去跑一個(gè)最貴的Claude的模型,你可能讓它做一個(gè)很小的事情就要花十幾二十刀,這是真的有點(diǎn)貴。
Uber的CTO在接受采訪時(shí)透露,公司2026年的AI預(yù)算在開(kāi)年幾個(gè)月內(nèi)就已經(jīng)全部用完了,主要是因?yàn)楣こ處焸儗?duì)Claude Code的使用量暴增。他的原話是:“我得重新回去做預(yù)算了,因?yàn)槲乙詾閴蛴靡荒甑腻X,已經(jīng)沒(méi)了。”
硅谷知名投資人Chamath Palihapitiya最近也公開(kāi)抱怨,他投資的一家軟件公司自從團(tuán)隊(duì)開(kāi)始用AI編程工具后,運(yùn)營(yíng)成本在幾個(gè)月內(nèi)翻了三倍多,照這個(gè)趨勢(shì)年化AI支出將達(dá)到千萬(wàn)美元級(jí)別。他半開(kāi)玩笑地說(shuō)了一句在社交媒體上廣為流傳的話:感謝VC們掏錢為這場(chǎng)AI盛宴買單。
![]()
可以看到,對(duì)于企業(yè)來(lái)說(shuō),特別是軟件SaaS行業(yè),AI時(shí)代的成本結(jié)構(gòu)跟過(guò)去完全不一樣了。以前做一個(gè)SaaS產(chǎn)品,研發(fā)投入是一次性的,用戶越多邊際成本越低,這是一門越賣越賺的生意。但現(xiàn)在,每個(gè)用戶的每一次操作背后都有一筆token賬單在跑,用戶用得越深、功能越智能, 作為產(chǎn)品方,反而要付更多錢給模型廠商。這個(gè)成本不會(huì)像傳統(tǒng)軟件那樣攤薄到接近零,它是跟著用量線性增長(zhǎng)的。
這也是為什么token正在變成AI創(chuàng)業(yè)公司最核心的“彈藥”,也有風(fēng)投基金開(kāi)始嘗試直接給被投企業(yè)提供token額度,作為投資的一部分。這個(gè)邏輯很簡(jiǎn)單:對(duì)很多AI創(chuàng)業(yè)項(xiàng)目來(lái)說(shuō),拿到錢之后第一件事就是去買token,那為什么不直接給token呢?
順著這個(gè)邏輯來(lái)講,是不是token正在變成一種新的貨幣?那token又到底是如何定價(jià)的呢?
02
拆解Token賬單
大模型公司到底怎么算錢?
Token的定價(jià)是怎么算的?這個(gè)問(wèn)題的答案,遠(yuǎn)不是“一個(gè)單價(jià)乘以數(shù)量”這么簡(jiǎn)單。我們以一次最簡(jiǎn)單的對(duì)話交互為例,你的賬單上至少有三種不同價(jià)格的token在運(yùn)轉(zhuǎn):
![]()
第一是Input token(輸入token),也就是你發(fā)給模型的內(nèi)容。
第二是Cached input token(被緩存的輸入 token),意思是如果某些prompt、上下文或文件內(nèi)容之前已經(jīng)被模型系統(tǒng)緩存過(guò),再次調(diào)用時(shí),這部分token的價(jià)格會(huì)更便宜。
第三是Output token(輸出token),也就是模型生成回答時(shí)產(chǎn)生的token。
研究芯片與token efficiency(詞元效率)方向的肖志斌在接受硅谷101采訪時(shí)就說(shuō),平均來(lái)說(shuō),在對(duì)話任務(wù)上,這三者的價(jià)格大概是:1:0.1:6的水平。
![]()
肖志斌 ZFLOW AI創(chuàng)始人&CEO、華美半導(dǎo)體協(xié)會(huì)前主席與董事會(huì)顧問(wèn) 如果是對(duì)話類應(yīng)用,調(diào)用就比較簡(jiǎn)單。你喂給它的input context(輸入上下文)、你提供的上下文和文件,這一部分都作為input。如果你提供的prompt已經(jīng)在緩存里被緩存過(guò),那這個(gè)成本基本上就是input token成本的1/10。然后最后輸出的成本,就是output token的成本,基本上是input token成本的6倍,這是OpenAI目前的情況。
不同公司根據(jù)模型的能力給出的定價(jià)是不同的。舉個(gè)例子,GPT-5的API價(jià)格上,Input是每百萬(wàn)token 1.25美元,Cached input是每百萬(wàn)token 0.125美元,Output token是每百萬(wàn)token 10美元。
而OpenAI發(fā)布的最新模型GPT-5.5,分了長(zhǎng)短上下文兩檔,長(zhǎng)上下文的價(jià)格是2倍。短上下文Input是每百萬(wàn)token 5美元,Cached input是每百萬(wàn)token 0.5美元,Output token是每百萬(wàn)token 30美元。
![]()
如果直接對(duì)比價(jià)格的話,是不是覺(jué)得漲價(jià)了好幾倍,其實(shí)不能這么算。
這里面有一個(gè)特別反直覺(jué)的悖論:越貴的模型,可能反而總成本更低。因?yàn)閺?qiáng)模型一次就做對(duì)了,弱模型可能要反復(fù)重試,中間如果出錯(cuò)就還需要人工介入,這也是綜合成本。也就是說(shuō),雖然token價(jià)格在漲,但“每個(gè)有效結(jié)論的成本”反而在下降。
所以,最貴的GPT-5.5-pro和GPT-5.4-pro,短上下文Input是每百萬(wàn)token 30美元,Output token是每百萬(wàn)token 180美元,長(zhǎng)上下文還要再貴一倍。但如果能力足夠強(qiáng),完成任務(wù)足夠準(zhǔn)確,在一些復(fù)雜任務(wù)和場(chǎng)景上,反而是能把開(kāi)發(fā)者的成本價(jià)格給打下來(lái)的。
![]()
特別是在agent場(chǎng)景,因?yàn)閍gent不是一問(wèn)一答,它會(huì)來(lái)回調(diào)用模型,每一步可能調(diào)用不同的工具,工具又會(huì)產(chǎn)生新的日志和上下文,返回給agent繼續(xù)循環(huán)調(diào)用。
肖志斌 ZFLOW AI創(chuàng)始人&CEO、華美半導(dǎo)體協(xié)會(huì)前主席與董事會(huì)顧問(wèn) agent loop(循環(huán))會(huì)重新、持續(xù)調(diào)用,所以對(duì)于agent來(lái)說(shuō),整體是比較復(fù)雜的,除了單次模型調(diào)用的input和output token消耗,還有持續(xù)產(chǎn)生的日志,以及調(diào)用工具成本,實(shí)際上相當(dāng)復(fù)雜。 最終完成任務(wù)用的token數(shù),取決于任務(wù)調(diào)用了多少次agent loop(循環(huán))。如果是質(zhì)量高的模型,可能一次就生成了你想要的答案,調(diào)用的工具也合適,返回的output也是你想要的。但如果用了便宜模型,可能需要花更多時(shí)間做iteration(迭代),來(lái)來(lái)回回調(diào)用,甚至中間出錯(cuò)。所以現(xiàn)在有個(gè)悖論:越貴的模型,完成任務(wù)的成本反而可能越低。
所以,不同的模型公司如何定價(jià),一方面是由模型的推理成本以及大模型研發(fā)費(fèi)用來(lái)決定的,但更關(guān)鍵的是按模型質(zhì)量和任務(wù)完成度。
肖志斌 ZFLOW AI創(chuàng)始人&CEO、華美半導(dǎo)體協(xié)會(huì)前主席與董事會(huì)顧問(wèn) 首先是推理成本,這是最基本的成本,就是單次推理的成本,比如你調(diào)用一次模型。第二是要在模型里攤平大模型的研發(fā)費(fèi)用,這也是一部分。但最重要的,其實(shí)是按照模型質(zhì)量去定價(jià),不同的模型類型,有沒(méi)有推理能力?上下文窗口的大小?完成任務(wù)的次數(shù),能不能快速找到正確的output?很多公司是按推理成本定價(jià)的,但這樣其實(shí)不可取,應(yīng)該按模型質(zhì)量或?qū)θ蝿?wù)的完成度去定價(jià),這里面的價(jià)值空間是比較大的。
這里還有一派玩家,就是像微軟Azure、亞馬遜AWS或者國(guó)內(nèi)的阿里和火山引擎這樣的云廠商。有的企業(yè)是通過(guò)這些云廠商去調(diào)用模型,他們收到的token賬單就是從云廠商這邊給出的。
云廠商對(duì)token的收費(fèi)與大模型公司的API官方收費(fèi)不會(huì)相差太多,但有時(shí)候云廠商會(huì)因?yàn)樘峁┝烁嗟姆?wù)和能力,比如說(shuō)區(qū)域部署、特定數(shù)據(jù)駐留、企業(yè)合規(guī)、優(yōu)先推理、托管能力,以及私有化或?qū)S猛掏碌倪@些服務(wù),使得價(jià)格更貴。
這時(shí)候,token賬單就是:模型token費(fèi)+云服務(wù)封裝+企業(yè)級(jí)基礎(chǔ)設(shè)施溢價(jià)。
錢宇靖 GMI Cloud工程主管 大部分云服務(wù)商的計(jì)價(jià)方式,是根據(jù)當(dāng)下模型在這臺(tái)機(jī)器上能跑出多少token每秒,再根據(jù)這個(gè)性能反向推算GPU本來(lái)的成本是多少,再加上一個(gè)premium(溢價(jià)),就變成最終的價(jià)格。
但有的時(shí)候,云廠商也會(huì)因?yàn)槠髽I(yè)折扣,或者需要激進(jìn)搶占市場(chǎng),來(lái)讓價(jià)格更便宜,這種情況也是有的。
而就在后OpenClaw時(shí)期,當(dāng)硅谷開(kāi)始卷我們開(kāi)頭說(shuō)到的Token-maxxing這件事情的時(shí)候,大家發(fā)現(xiàn),這個(gè)賬單還是很可怕的。于是出現(xiàn)了一個(gè)現(xiàn)象:來(lái)自中國(guó)的開(kāi)源模型,因?yàn)樾詢r(jià)比,開(kāi)始在國(guó)際開(kāi)發(fā)者社區(qū)中,大受歡迎。
Nathan Wang 資深A(yù)I Agent開(kāi)發(fā)者 Kimi的價(jià)格,我記得爆出來(lái)的input大概是不到55美分,output大概是2.6美元。
![]()
知縣 北京大學(xué)計(jì)算機(jī)系本碩,AI愛(ài)好者和社區(qū)項(xiàng)目OwliaBot builder 比如MiniMax,我記得是受到了OpenClaw官方推薦的。在做設(shè)置、選模型的時(shí)候,OpenClaw軟件里,MiniMax后面會(huì)有一個(gè)推薦的標(biāo)識(shí),這也相當(dāng)于給中國(guó)模型做了不少宣傳。宣傳之后,大家可能就試了一下,發(fā)現(xiàn)確實(shí)還可以,雖然頂級(jí)能力差一些,但很多工作也不是非要那么高的推理能力。很多時(shí)候,執(zhí)行反而需要你不要想太多,instruction following(指令遵循)比較好,做得快,最重要的還是便宜。
在一些任務(wù)上,中美模型的價(jià)差可以高達(dá)50-70倍。這就解釋了為什么,當(dāng)OpenClaw這類agent工具,讓token消耗從萬(wàn)級(jí)跳到百萬(wàn)級(jí)的時(shí)候,全球開(kāi)發(fā)者幾乎本能地轉(zhuǎn)向了中國(guó)的便宜模型。
03
登頂token調(diào)用排行榜
中國(guó)模型如何做到超高性價(jià)比
OpenClaw爆火之后,因?yàn)閍gent任務(wù)對(duì)開(kāi)源模型調(diào)用的需求飆升,已經(jīng)上市的中國(guó)模型廠商,比如說(shuō)Zhipu AI和MiniMax在股價(jià)上迎來(lái)了瘋狂的漲幅。
與此同時(shí),2026年3月掀起了一波集體漲價(jià)潮。從阿里云到百度智能云,從智譜到騰訊云混元系列模型,幾乎所有主要廠商,都在同一個(gè)月內(nèi)宣布上調(diào)AI相關(guān)產(chǎn)品價(jià)格,漲幅從5%到400%不等。
![]()
錢宇靖 GMI Cloud工程主管 現(xiàn)在大家看到開(kāi)源模型的token消耗量上升,是因?yàn)殚_(kāi)源模型的能力已經(jīng)越過(guò)了某個(gè)門檻,比如智譜或者Kimi,在編程上最近都有比較大的提升。編程這個(gè)賽道本來(lái)就是大模型token消耗最大的賽道之一,當(dāng)程序員發(fā)現(xiàn)開(kāi)源模型可能跟幾個(gè)月前的Anthropic模型一樣好用,但價(jià)格又極其便宜的時(shí)候,自然就會(huì)換到開(kāi)源模型,這也是為什么開(kāi)源模型的價(jià)格上升了。
對(duì)于個(gè)人開(kāi)發(fā)者和創(chuàng)業(yè)公司來(lái)說(shuō),處理不那么復(fù)雜任務(wù)的時(shí)候,轉(zhuǎn)向開(kāi)源模型是無(wú)可厚非的。
拿MiniMax M2.5和Claude Opus 4.6做個(gè)直接對(duì)比:在SWE-Bench Verified軟件工程基準(zhǔn)測(cè)試中,兩者得分分別是80.2%和80.8%,說(shuō)實(shí)話,這點(diǎn)差距在實(shí)際使用中幾乎感受不到。但打開(kāi)價(jià)格表就完全不同了:MiniMax M2.5的輸入價(jià)格是每百萬(wàn)token 0.3美元,Claude Opus 4.6是5美元。同樣的活,前者的價(jià)格只有后者的十七分之一。對(duì)于一個(gè)每天要跑幾千萬(wàn)token的OpenClaw用戶來(lái)說(shuō),這不是省一杯咖啡錢的問(wèn)題,而是賬單從幾百美元直接降到幾十美元的區(qū)別。
![]()
那中國(guó)模型為什么能做到這么便宜?
肖志斌 ZFLOW AI創(chuàng)始人&CEO、華美半導(dǎo)體協(xié)會(huì)前主席與董事會(huì)顧問(wèn) 第一是技術(shù)層面上它用了MoE(混合專家模型),非常深度的MoE,專家的size變得越來(lái)越小,每一次運(yùn)行的專家數(shù)目也不大,通過(guò)這種方法在技術(shù)上可以節(jié)省。第二是生態(tài)的問(wèn)題,大家通過(guò)補(bǔ)貼去搶占生態(tài)。第三是有些公司像阿里,它是云廠商,自己的成本定價(jià)可以比外面計(jì)價(jià)更低,它有更高的margin(利潤(rùn)率)去把模型價(jià)格打得更低。
![]()
不同的模型其實(shí)給了開(kāi)發(fā)者們不同的選擇,比如說(shuō)復(fù)雜的任務(wù)就交給更高性能的模型,簡(jiǎn)單一些或者重復(fù)性高的任務(wù)就給便宜一點(diǎn)的模型,這樣的混合使用,成為了agent時(shí)代的新token模式。
黃仁勛在GTC 2026上給出了一個(gè)更宏觀的token定價(jià)框架。
他把token分成了五個(gè)價(jià)格區(qū)間:免費(fèi)層(高吞吐、低交互速度,靠廣告變現(xiàn))、中級(jí)層(每百萬(wàn)token 3美元)、高級(jí)層(每百萬(wàn)token 6美元)、高速層(每百萬(wàn)token 45美元)到超高速層(每百萬(wàn)token 150美元)。黃仁勛的意思很明確,token不再是一種同質(zhì)的商品,它的價(jià)格應(yīng)該由交互速度和使用場(chǎng)景決定,就像電力有峰谷電價(jià)一樣。
![]()
當(dāng)然,這些暴增的需求背后,也有一個(gè)不容忽視的問(wèn)題:到底是不是真的需要消耗這么多token?一些業(yè)內(nèi)人士就批評(píng)說(shuō),當(dāng)前全球企業(yè)級(jí)AI應(yīng)用中,可能有近一半的token沒(méi)有產(chǎn)生實(shí)際價(jià)值。
道理很簡(jiǎn)單,agent不像人類那樣知道“夠了就停”,它在執(zhí)行一個(gè)任務(wù)的過(guò)程中,會(huì)反復(fù)讀取整個(gè)對(duì)話歷史、重新掃描已經(jīng)處理過(guò)的文件、把早就過(guò)期的上下文一遍又一遍地喂進(jìn)模型。每多跑一輪,這些冗余信息就像滾雪球一樣越滾越大,但真正跟當(dāng)前任務(wù)相關(guān)的,可能只占其中一小部分。
怎么讓Agent少燒冤枉錢,正在成為一個(gè)新的技術(shù)和商業(yè)賽道。而Token Efficiency(Token效率)成為了下個(gè)階段的關(guān)鍵詞。其中值得提的一個(gè)例子,就是OpenRouter這家公司。
04
OpenRouter
從NFT到AI的“貨架之王”
OpenRouter這個(gè)平臺(tái)已經(jīng)成了觀察全球模型使用趨勢(shì)的一面鏡子。你看到的很多關(guān)于中國(guó)模型調(diào)用和排名的數(shù)據(jù)圖都出自于這個(gè)平臺(tái)。
OpenRouter背后的人很有意思,創(chuàng)始人Alex Atallah的上一個(gè)身份,是全球最大NFT交易所OpenSea的聯(lián)合創(chuàng)始人兼CTO。
![]()
2023年,他開(kāi)始做OpenRouter,這門生意的邏輯其實(shí)很簡(jiǎn)單:市面上模型越來(lái)越多,開(kāi)發(fā)者不想每家單獨(dú)注冊(cè)、單獨(dú)充值、單獨(dú)對(duì)接API格式,OpenRouter就做了一個(gè)統(tǒng)一入口,所有模型一個(gè)接口搞定,平臺(tái)從中抽取約5%的費(fèi)用。據(jù)Information報(bào)道,a16z在2025年對(duì)OpenRouter領(lǐng)投了4000萬(wàn)美元,當(dāng)時(shí)估值約5億美元,而最新一輪融資已將估值推至接近13億美元。
讓這門生意真正起飛的,是OpenClaw的爆發(fā)。當(dāng)全球開(kāi)發(fā)者瘋狂調(diào)用各種模型來(lái)驅(qū)動(dòng)Agent工作流時(shí),他們需要一個(gè)能快速切換模型的中間層,而OpenRouter恰好就在那里等著,這個(gè)時(shí)機(jī)簡(jiǎn)直不要抓得太好。
Atallah曾將OpenRouter與他上一次創(chuàng)業(yè)做過(guò)類比,兩次做的都是把分散的供給,整合到一個(gè)平臺(tái)上。他賭的是:供給越分散,中間商越值錢。
肖志斌 ZFLOW AI創(chuàng)始人&CEO、華美半導(dǎo)體協(xié)會(huì)前主席與董事會(huì)顧問(wèn) 它加了一層API調(diào)用層,跟OpenAI的API調(diào)用是兼容的。如果你需要做一個(gè)任務(wù),可以自動(dòng)做不同模型的切換,統(tǒng)一API、統(tǒng)一定價(jià)。這樣對(duì)大部分用戶來(lái)說(shuō),特別是從0到1的AI初創(chuàng)公司,快速上線、快速試錯(cuò)、快速找到匹配的模型,是最重要的。另外它還有fallback(后備)機(jī)制,一個(gè)模型出了問(wèn)題,或者latency(延遲)突然很高,或者下線了,可以快速切換到另一個(gè)模型。
當(dāng)然,OpenRouter也有它的數(shù)據(jù)局限性。
肖志斌 ZFLOW AI創(chuàng)始人&CEO、華美半導(dǎo)體協(xié)會(huì)前主席與董事會(huì)顧問(wèn) 很多token的使用量是統(tǒng)計(jì)不到的。從0到1的初創(chuàng)公司可能會(huì)用OpenRouter,但從1到10,就會(huì)混用OpenRouter和直接API調(diào)用。大廠或者業(yè)務(wù)非常明確的公司,會(huì)直接調(diào)用Anthropic、OpenAI或者Google的API。所以O(shè)penRouter對(duì)token使用量有一定的指向性,也能做一些prediction(預(yù)測(cè)),但并不包含所有的token調(diào)用量。
換句話說(shuō),OpenRouter的數(shù)據(jù),更像是創(chuàng)業(yè)公司和獨(dú)立開(kāi)發(fā)者群體的風(fēng)向標(biāo),而不是整個(gè)AI行業(yè)的全景圖。但正是這個(gè)群體,對(duì)價(jià)格最敏感、對(duì)新模型最愿意嘗鮮、遷移成本最低,構(gòu)成了中國(guó)模型出海的第一波“自來(lái)水”用戶。
05
Metronome
誰(shuí)在給Token“裝電表”?
如果token是AI時(shí)代的“電”,那總得有人給這些電裝電表。這件事聽(tīng)上去不夠性感,但看一眼客戶名單就知道它有多重要:OpenAI、NVIDIA、Anthropic、Databricks,全在用同一家公司的計(jì)費(fèi)系統(tǒng),這家公司就是Metronome。
![]()
Metronome創(chuàng)始團(tuán)隊(duì)的背景很說(shuō)明問(wèn)題,兩位創(chuàng)始人都出自Dropbox,在那里親身經(jīng)歷過(guò)一個(gè)讓所有SaaS工程師頭疼的事情:改定價(jià)。表面上只是把月費(fèi)調(diào)幾塊錢,背后卻要?jiǎng)右淮蠖褜懰涝诖a里的計(jì)費(fèi)邏輯。
到了AI時(shí)代,這個(gè)痛點(diǎn)被放大了幾個(gè)數(shù)量級(jí),收費(fèi)單位不再是“一個(gè)人頭一個(gè)月多少錢”,而是變成了token數(shù)、API調(diào)用次數(shù)、GPU時(shí)長(zhǎng)這些顆粒度極細(xì)的指標(biāo),而且每個(gè)客戶的合同條款、折扣結(jié)構(gòu)、用量階梯可能都不一樣。
知縣 北京大學(xué)計(jì)算機(jī)系本碩,AI愛(ài)好者和社區(qū)項(xiàng)目OwliaBot builder SaaS的成本相對(duì)穩(wěn)定,就是服務(wù)器成本,甚至都是跟云廠商預(yù)先商定好的價(jià)格。但token公司確實(shí)挺tricky(復(fù)雜)的,跟卡本身的情況有關(guān),跟電的情況有關(guān),同時(shí)還跟請(qǐng)求量有關(guān),峰值的時(shí)候會(huì)擠到一起。大家也有體感,就是哪怕買了最頂級(jí)的套餐,有時(shí)候也需要排隊(duì)。而且你做的任務(wù)不一樣,對(duì)token的消耗成本也完全不同。
Metronome做的事情,就是“清晰地記住誰(shuí)在什么時(shí)間調(diào)用了什么東西,花了多少token。”但大部分公司自己做這件事做不好,因?yàn)椤鞍l(fā)生了什么”和“該怎么收費(fèi)”,是兩套完全不同的邏輯,把它們耦合在一起就會(huì)越改越脆弱。
![]()
Metronome的核心設(shè)計(jì)就是把這兩件事徹底拆開(kāi),工程團(tuán)隊(duì)只管上報(bào)用量數(shù)據(jù),產(chǎn)品和銷售團(tuán)隊(duì)自己配置價(jià)格和合同條款,中間的換算、出賬、對(duì)賬全部自動(dòng)化。
知縣 北京大學(xué)計(jì)算機(jī)系本碩,AI愛(ài)好者和社區(qū)項(xiàng)目OwliaBot builder 他的做法我覺(jué)得挺不錯(cuò)的。首先不考慮計(jì)費(fèi),站在技術(shù)角度,用戶跟API的交互,到底做了哪些事情?是讀還是寫?模型在做思考?還是命中了緩存?這些不同的事件先記下來(lái),因?yàn)檫@些事件代表多少成本,本身可能是動(dòng)態(tài)的。所以先不把它跟錢掛鉤,記下事件流之后,再有另外一層:這些事件流分別怎么定價(jià)?比如命中緩存的可能只要一分錢,沒(méi)命中就要一塊錢。第三層就是我們能接觸到的:訂閱制是一種計(jì)費(fèi)方式,直接買API是一種,設(shè)定限額再加超額是一種。第四層可能就是為了賣出去而要打折,比如Opus 200刀是100刀的兩倍成本但用量是四倍,他們就說(shuō)在打五折。我看完這四層覺(jué)得非常合理。
![]()
這家公司的發(fā)展速度很快。據(jù)公開(kāi)報(bào)道,Metronome累計(jì)融資約1.28億美元,今年1月被Stripe收購(gòu)。一個(gè)做計(jì)費(fèi)基礎(chǔ)設(shè)施的100人團(tuán)隊(duì),估值追上了很多做模型的公司,這本身就說(shuō)明,在token經(jīng)濟(jì)里,“怎么算錢”也變得越來(lái)越重要。
而在這樣的一個(gè)產(chǎn)業(yè)中,“套利”的機(jī)會(huì)也出現(xiàn)了。
06
Token套利
當(dāng)“中間商”開(kāi)始賺差價(jià)
我們?cè)谇拔闹姓f(shuō)到,現(xiàn)在開(kāi)發(fā)者們會(huì)不同的模型混著用:復(fù)雜任務(wù)用Claude、GPT等昂貴模型,簡(jiǎn)單任務(wù)用MiniMax、kimi等中國(guó)的性價(jià)比模型。
而對(duì)應(yīng)的,在token經(jīng)濟(jì)學(xué)里,一種新的商業(yè)模式正在浮出水面,業(yè)內(nèi)叫它Token Arbitrage(Token套利)。
知縣 北京大學(xué)計(jì)算機(jī)系本碩,AI愛(ài)好者和社區(qū)項(xiàng)目OwliaBot builder 這有點(diǎn)像國(guó)內(nèi)買運(yùn)營(yíng)商套餐,1千兆下行帶寬只配了40兆上行帶寬,但普通用戶感受不到。token上也是類似的,很有可能你全用便宜模型,和全用貴模型,用戶看來(lái)區(qū)別不大,那這時(shí)候就有套利空間了。本質(zhì)上最后買單的是用戶,只要用戶覺(jué)得ok,那就是ok的。這在我看來(lái)真的有點(diǎn)像稅務(wù)審計(jì)師:你自己報(bào)稅可能要交1萬(wàn)美金,你花5000美金雇了個(gè)審計(jì)師,他幫你報(bào)只報(bào)了2000美金的稅,他更專業(yè)、懂優(yōu)化,優(yōu)化出來(lái)的部分兩邊各拿一半。token arbitrage(套利)好好做就是這樣的生意。
肖志斌 ZFLOW AI創(chuàng)始人&CEO、華美半導(dǎo)體協(xié)會(huì)前主席與董事會(huì)顧問(wèn) 像我們自己搭建OpenClaw這種agent,肯定會(huì)有一個(gè)便宜模型,可能是國(guó)內(nèi)的大模型,高端的可能用Anthropic的Sonnet或者更好的OpenAI模型。我們公司也做了一個(gè)OpenClaw的token auto tuner(自動(dòng)調(diào)優(yōu)器),針對(duì)不同的任務(wù)可以進(jìn)一步細(xì)分,甚至用一個(gè)模型去判斷這個(gè)任務(wù)的復(fù)雜度,看能不能用便宜模型來(lái)做。
更進(jìn)階的套利方式不只是“批發(fā)轉(zhuǎn)零售”,而是去搭建一個(gè)“智能路由器”,用戶需求進(jìn)來(lái)后,先用一個(gè)模型去判斷任務(wù)的復(fù)雜程度,簡(jiǎn)單任務(wù)分配給便宜模型,只有真正復(fù)雜的任務(wù)才給Claude或GPT。對(duì)用戶來(lái)說(shuō)是黑盒,但中間商在不斷優(yōu)化成本結(jié)構(gòu)。
錢宇靖 GMI Cloud工程主管 作為模型提供商,大家可能都會(huì)有自己的路由模型。它就是一個(gè)小模型,來(lái)判斷當(dāng)下這個(gè)任務(wù)的難易程度,然后assign(分配)給合適的模型來(lái)最小化成本。還有一種方式是通過(guò)一個(gè)agent產(chǎn)品,比如Genspark或者M(jìn)anus,他們內(nèi)部對(duì)不同模型的能力有認(rèn)知,會(huì)針對(duì)不同任務(wù)做模型分發(fā)。
![]()
Nathan Wang 資深A(yù)I Agent開(kāi)發(fā)者 我覺(jué)得省token是正常的。你先有個(gè)用戶定價(jià),設(shè)好一個(gè)margin(利潤(rùn)率),比如按復(fù)雜模型的使用量定價(jià),設(shè)定了30%的margin(利潤(rùn)率)。之后,一旦用戶接受了這個(gè)價(jià)格,你其實(shí)是拿便宜的token換掉高價(jià)token給到用戶。如果用戶感知不出來(lái),覺(jué)得體感上、表現(xiàn)上沒(méi)有變化,那用戶其實(shí)還是在付原來(lái)高價(jià)值token的錢。
知縣也是一個(gè)典型的“混合調(diào)度”用戶。他每天跟AI互動(dòng)幾百次,同時(shí)使用Claude、GPT和中國(guó)模型,但給它們分配了完全不同的角色。
![]()
知縣 北京大學(xué)計(jì)算機(jī)系本碩,AI愛(ài)好者和社區(qū)項(xiàng)目OwliaBot builder Opus最強(qiáng)的是腦洞,我更愿意把Opus當(dāng)產(chǎn)品經(jīng)理來(lái)對(duì)待,它想問(wèn)題比較發(fā)散。我跟它聊的時(shí)候發(fā)現(xiàn),我有些想法跟它一點(diǎn)就透,我說(shuō)想做一個(gè)這樣的事情,它基本上就能順著我沒(méi)說(shuō)的話,把我腦子里沒(méi)說(shuō)出來(lái)的東西都列出來(lái)。GPT就稍微nerd(書呆子)一點(diǎn),有點(diǎn)像在跟技術(shù)負(fù)責(zé)人講產(chǎn)品,收到的都是挑戰(zhàn)。所以O(shè)pus適合做設(shè)計(jì),天馬行空;Codex適合做把關(guān)、做復(fù)盤。中間的執(zhí)行,只要方案寫好了、分得足夠精細(xì),主要需要的是有一定的智能,并且快、便宜,因?yàn)檫@是最耗token的時(shí)候,真正往外寫代碼是非常非常耗的,輸出是最貴的。這個(gè)場(chǎng)景里,就用國(guó)產(chǎn)模型去做執(zhí)行,把代碼寫好、寫出來(lái)。
Agent開(kāi)發(fā)者Nathan從工程化實(shí)現(xiàn)上,幫我們解釋了一下怎么做:
Nathan Wang 資深A(yù)I Agent開(kāi)發(fā)者 從最簡(jiǎn)單的方式入手,可以拿一個(gè)模型來(lái)分辨用戶的問(wèn)題,用戶基本上都在問(wèn)問(wèn)題,就拿個(gè)簡(jiǎn)單模型去detect(檢測(cè))用戶意圖,告訴它一定的metrics(指標(biāo))怎么區(qū)分,再加上不同的threshold(閾值),這是最簡(jiǎn)單的工程化方式,就可以把任務(wù)做基本的區(qū)分。到后期抓到一些用戶數(shù)據(jù),可以通過(guò)簡(jiǎn)單的RL(強(qiáng)化學(xué)習(xí))或者訓(xùn)練的方式去優(yōu)化這個(gè)小模型。前期先用prompt方式抓數(shù)據(jù),數(shù)據(jù)夠了再fine-tune(微調(diào)),一步步下來(lái),它就會(huì)更高效地區(qū)分復(fù)雜場(chǎng)景和簡(jiǎn)單場(chǎng)景。最終讓用戶無(wú)法區(qū)分,讓他付高價(jià)值token的錢,用低價(jià)值的token來(lái)服務(wù)。
那問(wèn)題來(lái)了:這種套利可持續(xù)嗎?
![]()
肖志斌 ZFLOW AI創(chuàng)始人&CEO、華美半導(dǎo)體協(xié)會(huì)前主席與董事會(huì)顧問(wèn) 我覺(jué)得短期內(nèi)是有機(jī)會(huì)的。但對(duì)于單個(gè)模型,比如Anthropic,其實(shí)已經(jīng)把這個(gè)能力build(內(nèi)置)到它的coding agent(編程智能體)里面了,它最近加了一個(gè)Advisor模式,先用貴的模型判斷哪些任務(wù)可以用便宜模型做、哪些用貴的模型做,大模型廠商自己會(huì)把這個(gè)東西build in(內(nèi)置)到自己的生態(tài)里。
但跨模型的調(diào)度空間遠(yuǎn)沒(méi)有被窮盡。因?yàn)槊考掖竽P凸局粌?yōu)化自己的模型。然而,市場(chǎng)上的模型太多了,跨模型的智能調(diào)度不會(huì)只是短期機(jī)會(huì)。
肖志斌 ZFLOW AI創(chuàng)始人&CEO、華美半導(dǎo)體協(xié)會(huì)前主席與董事會(huì)顧問(wèn) 這個(gè)是有創(chuàng)業(yè)空間的,不僅僅是針對(duì)模型定價(jià)去做這件事,這里要做很多任務(wù)和模型匹配的工作:除了任務(wù)精準(zhǔn)度,還有模型延遲的判斷、模型質(zhì)量的判斷,以及任務(wù)完成度的判斷。而且現(xiàn)在還只是做了比較初步的API聚合,加了一些pricing(定價(jià)策略),還沒(méi)有做到模型質(zhì)量和任務(wù)的匹配,甚至是模型和硬件的匹配,也就是延遲和吞吐量的匹配。 到底誰(shuí)會(huì)贏?我的判斷是,最會(huì)調(diào)度token的系統(tǒng)會(huì)贏。但這種系統(tǒng)不會(huì)止步于OpenRouter這個(gè)程度,因?yàn)檫€有比如prompt壓縮這類功能,大模型廠商會(huì)把這些做進(jìn)自己的ecosystem(生態(tài)系統(tǒng))。如果你做通用的token調(diào)度系統(tǒng),一定要做得更深。
07
中國(guó)Token出海
結(jié)構(gòu)性的產(chǎn)業(yè)機(jī)會(huì)?
講到這里,我們可以把視角再拉大一點(diǎn)。想一想,當(dāng)一個(gè)倫敦的程序員,用MiniMax的API跑OpenClaw的時(shí)候,物理層面發(fā)生了什么?
他的請(qǐng)求從英國(guó)出發(fā),穿過(guò)海底光纜,落在貴州的數(shù)據(jù)中心里。GPU開(kāi)始工作,風(fēng)扇開(kāi)始轉(zhuǎn),電表開(kāi)始跳。幾秒鐘后,結(jié)果原路返回。整個(gè)過(guò)程中,沒(méi)有一度電離開(kāi)過(guò)中國(guó)的電網(wǎng),但這度電的價(jià)值,已經(jīng)通過(guò)API賬單,以token的形式完成了跨境結(jié)算。
![]()
某種意義上,這是一種全新形態(tài)的“出口”對(duì)不對(duì)?
中國(guó)過(guò)去出口日用品、襯衫、家電,后來(lái)是電動(dòng)車,但這些都是實(shí)物要過(guò)海關(guān)。Token出海不需要集裝箱,甚至不需要任何實(shí)體商品離開(kāi)國(guó)境。電力在本地消耗,算力在本地運(yùn)轉(zhuǎn),但創(chuàng)造的價(jià)值通過(guò)互聯(lián)網(wǎng),瞬間交付到全球任何一個(gè)開(kāi)發(fā)者手上。有人把這叫做“電力出海”,雖然電沒(méi)出去,但電的價(jià)值出去了。
那么一個(gè)自然的問(wèn)題是:中國(guó)token能賣這么便宜,很多人的第一反應(yīng)是電價(jià),這種狀態(tài)會(huì)一直持續(xù)下去嗎?實(shí)際情況還挺復(fù)雜。GMI Cloud創(chuàng)始人Alex在GTC現(xiàn)場(chǎng)給了我們一個(gè)很直率的判斷:美國(guó)其實(shí)不缺電,缺的是輸送能力。
Alex Yeh GMI Cloud創(chuàng)始人 瓶頸還是在能源供給端,實(shí)際上美國(guó)不缺電,缺的是distribution power(配電能力)。高壓電上有很多電,天然氣一燒就能發(fā)電,但問(wèn)題是distribution(分配),你要把電傳輸?shù)揭粋€(gè)點(diǎn),這需要大量審批,要建變電站,從330kV一路降到400V或800V,這個(gè)過(guò)程非常冗長(zhǎng),光是拿審批就煩到爆炸。
![]()
實(shí)際上,中美電力成本的絕對(duì)值差異并不大,中國(guó)工業(yè)用電0.4-0.6元/度,美國(guó)0.8-1.2元/度,中美兩邊的工業(yè)電價(jià)差距其實(shí)沒(méi)有想象中那么大,真正拉開(kāi)差距的是基礎(chǔ)設(shè)施的響應(yīng)速度:中國(guó)可以在西部沙漠里鋪滿光伏板,再通過(guò)特高壓電網(wǎng)把電送到東部的算力集群。
所以從電力角度看,美國(guó)的token價(jià)格一時(shí)半會(huì)很難降很多。同時(shí),Alex認(rèn)為,從存儲(chǔ)等供應(yīng)鏈角度看,token價(jià)格短期內(nèi)更難下降。
![]()
Alex Yeh GMI Cloud創(chuàng)始人 DDR4的DRAM價(jià)格,是一年前的10倍。現(xiàn)在CX7也在缺貨、電源供應(yīng)和CPU也開(kāi)始在缺貨,各個(gè)供應(yīng)鏈都開(kāi)始缺貨。我看到OpenClaw的起來(lái)、agent起來(lái)、多模態(tài)的起來(lái)以及編程的起來(lái),剛好這三個(gè)是一個(gè)完美的風(fēng)暴,所有的供應(yīng)鏈就跟不上這個(gè)節(jié)奏。
錢宇靖 GMI Cloud工程主管 最大的挑戰(zhàn)還是建足夠多的數(shù)據(jù)中心,這是物理上的限制,提效當(dāng)然也非常重要。每一個(gè)云服務(wù)商都會(huì)緊跟技術(shù)迭代的步伐去提升token效率、降低延遲,但最終我們都被限制在一件事上:我們一共有多少數(shù)據(jù)中心、有多少卡、通了多少電。
這波出海紅利,已經(jīng)實(shí)實(shí)在在地反映在了收入上。如今MiniMax海外收入占比超過(guò)七成,月之暗面在Kimi K2.5發(fā)布后,短短數(shù)周內(nèi)收入就超過(guò)了2025年全年,智譜的模型API收入也在今年出現(xiàn)了爆發(fā)式增長(zhǎng)。而token需求的天花板目前根本還看不到。
![]()
錢宇靖 GMI Cloud工程主管 每一個(gè)event(事件)都觸發(fā)了token消耗的指數(shù)級(jí)增長(zhǎng),目前還沒(méi)有看到明顯的天花板。因?yàn)楝F(xiàn)在并不是每個(gè)人都在用OpenClaw,也沒(méi)有把生活中每一個(gè)vertical(垂直方向)都AI化,所以整體token consumption(消費(fèi))還會(huì)繼續(xù)增長(zhǎng),就像老黃說(shuō)的,未來(lái)的潛力還是非常大,目前看不到天花板。
大家想想看,現(xiàn)在大部分人還只是偶爾用用OpenClaw,大部分行業(yè)還遠(yuǎn)遠(yuǎn)沒(méi)有被Agent滲透。但趨勢(shì)已經(jīng)很清楚了:token的消耗正在從“人類主動(dòng)發(fā)起”變成“機(jī)器自動(dòng)運(yùn)轉(zhuǎn)”。一個(gè)程序員手動(dòng)用AI編程助手,一天可能燒幾十萬(wàn)token。但一旦他配了一個(gè)Agent全天候在后臺(tái)跑:寫代碼、查資料、跑測(cè)試、發(fā)部署,消耗量可以直接跳到千萬(wàn)級(jí)。當(dāng)這種使用方式從少數(shù)極客擴(kuò)散到普通開(kāi)發(fā)者,再擴(kuò)散到每一個(gè)知識(shí)工作者,token的需求增長(zhǎng)就是指數(shù)級(jí)別的增長(zhǎng)了。
如果用一句話來(lái)概括這個(gè)趨勢(shì):如果上一個(gè)時(shí)代中國(guó)出口的是襯衫和家電,這個(gè)時(shí)代是電動(dòng)車,那下一個(gè)時(shí)代可能就是token。
回到開(kāi)頭的問(wèn)題:token到底意味著什么?
對(duì)Meta員工來(lái)說(shuō),它是排行榜上的勛章。對(duì)創(chuàng)業(yè)公司來(lái)說(shuō),它是每個(gè)月最大的一筆開(kāi)支。對(duì)OpenRouter來(lái)說(shuō),它是抽5%傭金的流水。對(duì)中國(guó)的云廠商來(lái)說(shuō),它是把電力變成美元的管道。對(duì)于黃仁勛來(lái)說(shuō),Token會(huì)變成大宗商品,每一個(gè)輸入和輸出都與芯片掛鉤。
![]()
錢宇靖 GMI Cloud工程主管 我覺(jué)得這是一個(gè)正常的發(fā)展方向。就像我說(shuō)的,token是一種commodity(大宗商品),那人類歷史上對(duì)于銷售commodity(大宗商品)出現(xiàn)過(guò)的所有銷售方式,都可以預(yù)計(jì)會(huì)在token上重現(xiàn)。所以最后就是看誰(shuí)更有創(chuàng)意、誰(shuí)的市場(chǎng)打得更好,因?yàn)橹灰讓幽P图夹g(shù)過(guò)硬,它們的accuracy(準(zhǔn)確性)實(shí)際上不會(huì)有太大區(qū)別。
未來(lái),Token就會(huì)是一種大宗商品。而圍繞大宗商品,人類幾千年來(lái)發(fā)明過(guò)的所有商業(yè)模式:期貨、套利、批發(fā)零售、聚合平臺(tái)、計(jì)量計(jì)費(fèi),都會(huì)在token身上重演一遍。同時(shí),token定價(jià)的方式也可能會(huì)發(fā)生巨大的變化,比如說(shuō)業(yè)界也正在開(kāi)始嘗試按“復(fù)雜度計(jì)費(fèi)”的effort-based pricing模式,或者是按任務(wù)完成度計(jì)費(fèi)的task-based pricing模式,這都使得token economy的定價(jià)方式在未來(lái)有著巨大的進(jìn)化空間。這就像原油到汽油再到續(xù)航里程,這中間定價(jià)的邏輯,也會(huì)在token到任務(wù)到業(yè)務(wù)結(jié)果,這條進(jìn)化路徑上再?gòu)?fù)現(xiàn)一遍。
我們?cè)谶@篇文章里看到的每一個(gè)概念和公司,從Token-maxxing到token套利,從OpenRouter到Metronome,本質(zhì)上都是這個(gè)古老邏輯的AI升級(jí)版本。
唯一不同的是速度。這一切不是在幾十年里慢慢展開(kāi)的,而是在幾個(gè)月內(nèi)迅速發(fā)生的。當(dāng)你讀完這篇文章的時(shí)候,OpenRouter上可能又多了一個(gè)新模型沖上了榜單,某家云廠商可能又調(diào)了一次價(jià),某個(gè)開(kāi)發(fā)者可能又發(fā)現(xiàn)了一種新的省token的方法,而這場(chǎng)游戲才剛剛開(kāi)始。
注:部分圖片來(lái)源于網(wǎng)絡(luò)
【本期節(jié)目不構(gòu)成任何投資建議】
【視頻播放渠道】
國(guó)內(nèi):B站|騰訊|視頻號(hào)|西瓜|頭條|36kr|微博|虎嗅
海外:Youtube
聯(lián)系我們:video@sv101.net
【創(chuàng)作團(tuán)隊(duì)】
監(jiān)制|泓君 陳茜
撰稿 |Edward
編輯/主持 |陳茜
剪輯|Jacob
運(yùn)營(yíng)|孫澤平
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.