<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      頻繁降智的AI產(chǎn)品們,就是新時(shí)代最離譜的盲盒

      0
      分享至


      作者 | 周一笑
      郵箱 | zhouyixiao@pingwest.com

      最近,打開 X 或者任何一個(gè)開發(fā)者社區(qū),你都會(huì)看到類似的聲音:“Opus 已經(jīng)被徹底變成了植物人?!薄ⅰ巴瑯拥?prompt,兩周前還完美,現(xiàn)在輸出直接砍半?!?、“最諷刺的是按時(shí)段分配智商。下午五點(diǎn)是重災(zāi)區(qū),深夜反而好用得多?!?/p>


      用戶們?cè)谕瑫r(shí)抱怨同一件事,還有人制作了各種meme來形容這種體驗(yàn)。

      吐槽之外,一個(gè)更深的焦慮正在蔓延。當(dāng)你覺得 AI 變差了,你甚至很難判斷,到底是模型本身變了,還是你看不見的某一層變了,還是你自己的使用方式變了。

      1

      “降智“從體感變成了事件

      Claude是這輪風(fēng)暴的中心。

      4月初,AMD AI部門高級(jí)總監(jiān)Stella Laurenzo在GitHub上提交了一份基于近7000個(gè)Claude Code session的量化分析。結(jié)論是模型在編輯文件前的閱讀次數(shù)從6.6次降到了2.0次,三分之一的代碼修改是“盲改”。


      Laurenzo隨后表示,AMD團(tuán)隊(duì)已經(jīng)切換到了另一家供應(yīng)商,因?yàn)閷?duì)方“工作質(zhì)量更好”,具體是哪家因NDA無法透露。Anthropic方面則回應(yīng)稱,Opus 4.6在2月切換到了adaptive thinking,3月又將默認(rèn)effort降到了medium,但否認(rèn)模型本身被降級(jí)。而根據(jù)Claude Code的產(chǎn)品更新日志,4月7日默認(rèn)effort已被調(diào)回high。

      AMD的分析引爆了社區(qū)情緒,但類似的觀察早已遍地都是。

      有交易員據(jù)稱用同一套1200行交易策略文檔做了對(duì)比測(cè)試?!敖抵恰鼻暗腛pus能完整執(zhí)行所有規(guī)則,覆蓋完整的場(chǎng)景分支和決策樹?!敖抵恰焙?,同樣的數(shù)據(jù)和指令,Opus跳過了兩個(gè)完整的策略清單,場(chǎng)景分支幾乎消失,輸出縮了將近一半。更意外的是,他用更便宜的Sonnet跑同一套測(cè)試,規(guī)則覆蓋率反而到了85%,高于Opus的70%。


      他的判斷是“Opus沒有丟失知識(shí),它丟失的是深度。就像給一個(gè)國(guó)際象棋大師每步只留30秒,他不會(huì)忘記怎么下棋,但會(huì)放棄計(jì)算更深的線路。”

      與此同時(shí),F(xiàn)ortune報(bào)道引述OpenAI內(nèi)部備忘錄的說法,稱Anthropic在算力規(guī)劃上犯了“戰(zhàn)略失誤”。Anthropic最近也發(fā)布了下一代模型Opus 4.7。社區(qū)里很多人把這兩條消息和“降智”聯(lián)系在一起,認(rèn)為這是在為新模型發(fā)布騰出算力和制造對(duì)比。


      1

      “降智”可能同時(shí)發(fā)生在好幾層

      Claude是這一輪最顯眼的主角,但如果拉遠(yuǎn)看,“AI變笨”的原因遠(yuǎn)不止一種。至少有四層問題在同時(shí)發(fā)生。

      模型沒換,但“思考預(yù)算”變了。 這是Claude爭(zhēng)議的核心。同一個(gè)模型名,背后可能對(duì)應(yīng)完全不同的effort檔位、adaptive thinking策略和thinking展示規(guī)則。Anthropic文檔寫明,Claude 4系列現(xiàn)在默認(rèn)返回summarized thinking,某些情況下甚至直接omitted,但計(jì)費(fèi)仍然按完整thinking tokens走。你看到的推理過程,和模型實(shí)際消耗的推理資源,已經(jīng)不是同一個(gè)東西。跑分測(cè)的是模型在特定配置下的能力上限,用戶每天碰到的,是一個(gè)會(huì)動(dòng)態(tài)調(diào)整預(yù)算和服務(wù)路徑的產(chǎn)品。


      你看到的是產(chǎn)品名,平臺(tái)控制的是真實(shí)路徑。 OpenAI官方幫助文檔明確寫著:GPT-5.4 Thinking在觸發(fā)rate limit后,會(huì)自動(dòng)fallback到GPT-5.4 mini,而mini不會(huì)出現(xiàn)在模型選擇器里。GPT-5.1退役后,使用舊模型的歷史對(duì)話會(huì)自動(dòng)續(xù)接到當(dāng)前版本。Anthropic從3月底開始在高峰時(shí)段調(diào)整session限制,部分重度Pro用戶因此比以前更容易觸發(fā)額度上限。今天的AI不是沒有版本號(hào),而是版本號(hào)只對(duì)平臺(tái)可見。

      以上說的還只是原廠服務(wù)本身的變化。更麻煩的情況是,你連自己是不是在用原廠服務(wù)都未必能確認(rèn)。

      這一層對(duì)中國(guó)用戶尤其切身。因?yàn)榈乩硐拗坪椭Ц侗趬荆罅块_發(fā)者和研究者通過API中轉(zhuǎn)站使用海外模型。今年3月,德國(guó)CISPA亥姆霍茲信息安全中心發(fā)布了一項(xiàng)審計(jì)研究,發(fā)現(xiàn)在其調(diào)查的17家中轉(zhuǎn)站中,近半數(shù)存在模型替換行為,性能偏差最高達(dá)47%。你付的是Claude的錢,跑的可能是參數(shù)量小得多的開源模型。當(dāng)你覺得AI變差了,連“是不是同一個(gè)模型在回答你”都未必成立。

      有些“降智”,可能是別的問題被算到了模型頭上。 長(zhǎng)上下文導(dǎo)致的質(zhì)量退化、agent框架和工具鏈的變化、用戶自身workflow的調(diào)整,都可能制造“模型變笨了”的體感。有開發(fā)者直接指出:“覺得Opus降智的人,大部分是把Agent框架的問題歸咎到模型上了。Anthropic在做動(dòng)態(tài)算力分配,簡(jiǎn)單問題少轉(zhuǎn)幾圈,難題多轉(zhuǎn)幾圈。不是模型變差了,是你為每次對(duì)話付的算力變少了?!边@個(gè)判斷未必完全公允,但它指向了一個(gè)真實(shí)的困難,用戶的體感未必錯(cuò),但體感未必能直接定位到問題根源。

      四層原因同時(shí)存在,互相疊加,用戶面對(duì)的不是一個(gè)可以定位的bug。

      1

      普通用戶幾乎無法歸因

      AMD總監(jiān)能發(fā)現(xiàn)問題,是因?yàn)樗幸粋€(gè)工程團(tuán)隊(duì)和近7000份session log。普通用戶只有一個(gè)聊天框。

      更麻煩的是,“看看模型在想什么”這條路也在收窄。Anthropic現(xiàn)在默認(rèn)對(duì)thinking內(nèi)容做摘要甚至省略,用戶界面上展示的推理痕跡已經(jīng)不等同于模型實(shí)際的推理過程。你沒有辦法通過觀察輸出來反推模型到底“想”了多久、多深。


      部署中的模型表現(xiàn)會(huì)隨時(shí)間變化,而且變化軌跡不一樣

      今年2月發(fā)表在PLOS One上的一項(xiàng)縱向研究,用固定prompt連續(xù)10周追蹤了多個(gè)主流模型,得出了一個(gè)很克制也很扎心的結(jié)論,部署中的大語言模型確實(shí)會(huì)發(fā)生可測(cè)量的行為漂移,但因?yàn)閺S商不公開更新日志和訓(xùn)練細(xì)節(jié),對(duì)觀察到的退化做任何歸因都純屬推測(cè)。

      這才是“AI降智”這個(gè)話題真正讓人難受的地方。你付了錢,你有體感,但你拿不出證據(jù)。平臺(tái)知道真實(shí)模型版本、fallback路徑、reasoning檔位、thinking是否被壓縮,你什么都看不見。

      1

      被逼急的用戶,各顯神通

      面對(duì)歸因困難,用戶開始自救。社區(qū)里流傳的方法五花八門,有些像偏方,比如用“市長(zhǎng)的女兒應(yīng)該叫市長(zhǎng)什么”、“我想洗車。洗車店就在50米外。我該開車去還是走路去?”這類問題去測(cè)試。



      另外有些確實(shí)有一定道理。最樸素的對(duì)照實(shí)驗(yàn)。 新對(duì)話和長(zhǎng)對(duì)話做一次對(duì)照,如果新對(duì)話明顯正常,先懷疑上下文壓縮機(jī)制。官方入口和第三方入口做一次對(duì)照,先排除中間商這一層。社區(qū)已經(jīng)有針對(duì)性的指紋驗(yàn)證工具,可以檢測(cè)返回的模型是否與聲稱的一致。

      環(huán)境變量的“手動(dòng)搶救”。 在程序員社區(qū)里,一組Claude Code配置正在被廣泛傳播,關(guān)閉adaptive thinking、把effort設(shè)為max、調(diào)高自動(dòng)壓縮閾值。有開發(fā)者說,調(diào)完之后“相對(duì)感覺不降智”。這些配置本質(zhì)上是用戶在手動(dòng)接管本該由平臺(tái)自動(dòng)管理的推理預(yù)算分配。


      甚至有人發(fā)現(xiàn),只有反復(fù)大喊“THINK HARD”才能拿到正確答案。 有用戶做了一組測(cè)試,同一道題用不同強(qiáng)度的思考指令去prompt,只有連續(xù)重復(fù)“THINK HARD”多次的版本才通過了。這已經(jīng)不是提示詞工程,更像是在和自己付費(fèi)的產(chǎn)品討價(jià)還價(jià)。


      觀察它是“不會(huì)了”還是“沒想夠”。 這個(gè)區(qū)分比具體的trick更重要。如果同一個(gè)任務(wù)在調(diào)高配置后恢復(fù)正常,那問題大概率不在模型本身,而在默認(rèn)配置。如果怎么調(diào)都不行,那可能真的是模型能力或中間層出了問題。

      這些方法都很粗糙。但它們的存在本身就說明了用戶正在用本不該由他們承擔(dān)的成本,去做本該由平臺(tái)提供的透明度。

      1

      AI產(chǎn)品至少該有一張配料表

      訂閱制AI正在出現(xiàn)一種類似縮水式通脹(shrinkflation)的體驗(yàn),你付的錢沒變,產(chǎn)品名沒變,但實(shí)際拿到的推理深度、穩(wěn)定性和完成效率可能在悄悄變化。Anthropic剛剛和Broadcom、Google簽下了3.5吉瓦的長(zhǎng)期算力合同,收入增長(zhǎng)極快,但多方信息顯示其算力供給仍然緊張,訓(xùn)練和推理的支出壓力很大。

      每次新模型發(fā)布前,舊模型都會(huì)被故意弄傻,這個(gè)在社區(qū)廣泛流傳的敘事,在Opus 4.7即將發(fā)布的當(dāng)下尤其有市場(chǎng)。它未必完全準(zhǔn)確,但廠商至今也沒有給出足夠的解釋來打消這種懷疑。


      一些行業(yè)分析師指出,所有前沿模型公司其實(shí)都面對(duì)相似的算力和成本壓力,當(dāng)使用規(guī)模繼續(xù)擴(kuò)大,節(jié)流、分層、權(quán)衡幾乎是結(jié)構(gòu)性不可避免的?!八懔Σ粔颉笨梢岳斫狻5八懔Σ粔蛩造o默降配,同時(shí)不告訴任何人”就很難讓人接受了。平臺(tái)享受了服務(wù)化AI的靈活性,卻沒有承擔(dān)相應(yīng)的透明義務(wù)。

      食品有配料表,軟件有版本號(hào)。AI產(chǎn)品至少也該告訴用戶你現(xiàn)在到底在用什么。當(dāng)前真實(shí)模型版本、是否發(fā)生了fallback、推理檔位、thinking是否被壓縮。這些不是技術(shù)細(xì)節(jié),而是最基本的知情權(quán)。


      有用戶在X上寫道,“When you pay for a model, you should get that model.” 有中國(guó)開發(fā)者說得更直白,“這個(gè)行業(yè)模式到最后沒有人敢訂閱年費(fèi)會(huì)員。”


      一個(gè)用戶為了確認(rèn)自己買到的東西是不是真貨,要去學(xué)指紋驗(yàn)證、背環(huán)境變量、在prompt里連喊三遍“給我認(rèn)真想”。這個(gè)產(chǎn)品關(guān)系已經(jīng)出了問題。如果行業(yè)不能主動(dòng)補(bǔ)上這張配料表,用戶要求的就不會(huì)只是更強(qiáng)的模型,而是監(jiān)管和消費(fèi)者保護(hù)。


      點(diǎn)個(gè)愛心,再走 吧

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      隨著巴黎6-5拜仁,殺進(jìn)歐冠決賽,產(chǎn)生了3大不可思議+2個(gè)不爭(zhēng)事實(shí)

      隨著巴黎6-5拜仁,殺進(jìn)歐冠決賽,產(chǎn)生了3大不可思議+2個(gè)不爭(zhēng)事實(shí)

      侃球熊弟
      2026-05-07 05:59:30
      廣東一女兒將母親器官活活剜出,母親臨死前哀求:媽媽錯(cuò)了

      廣東一女兒將母親器官活活剜出,母親臨死前哀求:媽媽錯(cuò)了

      紙鳶奇譚
      2024-10-13 19:29:37
      放假通知!2026中小學(xué)生暑假放假時(shí)間確定了,家長(zhǎng)卻表示難以接受

      放假通知!2026中小學(xué)生暑假放假時(shí)間確定了,家長(zhǎng)卻表示難以接受

      凱旋學(xué)長(zhǎng)
      2026-05-07 12:00:32
      金建希案二審剛判完!法官就在法院樓深夜墜亡,遺書上寫著對(duì)不起

      金建希案二審剛判完!法官就在法院樓深夜墜亡,遺書上寫著對(duì)不起

      水泥土的搞笑
      2026-05-07 12:26:42
      澤連斯基再度暗示襲擊紅場(chǎng)閱兵,俄羅斯呼吁各國(guó)從基輔撤人,若勝利日遭襲將大規(guī)模導(dǎo)彈打擊基輔

      澤連斯基再度暗示襲擊紅場(chǎng)閱兵,俄羅斯呼吁各國(guó)從基輔撤人,若勝利日遭襲將大規(guī)模導(dǎo)彈打擊基輔

      極目新聞
      2026-05-07 11:58:53
      今日最慘股,股價(jià)新低,卻又連續(xù)兩個(gè)20cm跌停,22萬股東被套!

      今日最慘股,股價(jià)新低,卻又連續(xù)兩個(gè)20cm跌停,22萬股東被套!

      丁丁鯉史紀(jì)
      2026-05-07 11:50:54
      半小時(shí)“午睡”被推翻?醫(yī)生忠告:過了70歲,午睡要盡量做到4點(diǎn)

      半小時(shí)“午睡”被推翻?醫(yī)生忠告:過了70歲,午睡要盡量做到4點(diǎn)

      任醫(yī)生聊健康
      2026-05-07 13:25:12
      許家印老婆嫁給白人小伙!王鶴棣公司出事了?

      許家印老婆嫁給白人小伙!王鶴棣公司出事了?

      八卦瘋叔
      2026-05-07 10:59:12
      2比0!一只腳踏進(jìn)東決!NBA季后賽最強(qiáng)進(jìn)攻

      2比0!一只腳踏進(jìn)東決!NBA季后賽最強(qiáng)進(jìn)攻

      籃球教學(xué)論壇
      2026-05-07 10:49:06
      上千噸香蕉爛在手里,菲律賓香蕉協(xié)會(huì):中國(guó)斷了30萬蕉農(nóng)的生計(jì)!

      上千噸香蕉爛在手里,菲律賓香蕉協(xié)會(huì):中國(guó)斷了30萬蕉農(nóng)的生計(jì)!

      據(jù)說說娛樂
      2026-05-06 14:56:48
      俄羅斯是真眼饞!中國(guó)大量東風(fēng)導(dǎo)彈將要退役,可以出口換外匯嗎?

      俄羅斯是真眼饞!中國(guó)大量東風(fēng)導(dǎo)彈將要退役,可以出口換外匯嗎?

      知鑒明史
      2026-05-06 13:35:04
      高市這一跪,“里外不是人”!

      高市這一跪,“里外不是人”!

      國(guó)是直通車
      2026-05-06 17:38:18
      太寒心!鹽城龍鳳胎事件,孩子早產(chǎn),老公把彩禮8.8萬驟降至3.8萬

      太寒心!鹽城龍鳳胎事件,孩子早產(chǎn),老公把彩禮8.8萬驟降至3.8萬

      魔都姐姐雜談
      2026-05-06 13:19:53
      賴清德回臺(tái)不到24小時(shí),美高層發(fā)聲,特朗普害怕:再晚就來不及了

      賴清德回臺(tái)不到24小時(shí),美高層發(fā)聲,特朗普害怕:再晚就來不及了

      云舟史策
      2026-05-07 07:26:09
      甲亢哥華為手機(jī)意外墜海!炸出史上最神廣告

      甲亢哥華為手機(jī)意外墜海!炸出史上最神廣告

      4A廣告文案
      2026-05-06 14:15:48
      iPhone 18 Pro 圖紙曝光,外觀大變!

      iPhone 18 Pro 圖紙曝光,外觀大變!

      果粉俱樂部
      2026-05-07 13:10:03
      3孩2個(gè)非親生后續(xù):妻子真容曝光社死,男方工作遭牽連,已起訴

      3孩2個(gè)非親生后續(xù):妻子真容曝光社死,男方工作遭牽連,已起訴

      阿訊說天下
      2026-05-06 11:40:01
      5月7日,人社部2026年養(yǎng)老金調(diào)整通知公布了嗎?調(diào)整比例會(huì)是多少

      5月7日,人社部2026年養(yǎng)老金調(diào)整通知公布了嗎?調(diào)整比例會(huì)是多少

      社保小達(dá)人
      2026-05-07 11:20:31
      不再掛小米車標(biāo)!小米首款增程SUV將定名尋天:下半年發(fā)布

      不再掛小米車標(biāo)!小米首款增程SUV將定名尋天:下半年發(fā)布

      快科技
      2026-05-07 11:48:06
      “好圣孫”人設(shè)崩塌,康熙傳位底牌揭曉,雍正根本沒沾兒子的光

      “好圣孫”人設(shè)崩塌,康熙傳位底牌揭曉,雍正根本沒沾兒子的光

      鶴羽說個(gè)事
      2026-05-06 22:20:37
      2026-05-07 14:03:00
      硅星人 incentive-icons
      硅星人
      硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個(gè)星球。
      3061文章數(shù) 10495關(guān)注度
      往期回顧 全部

      科技要聞

      凌晨突發(fā)!馬斯克租22萬塊GPU給“死敵”

      頭條要聞

      北京三位女大學(xué)生青海自駕游2死1傷 傷者一審獲刑4年

      頭條要聞

      北京三位女大學(xué)生青海自駕游2死1傷 傷者一審獲刑4年

      體育要聞

      阿森納巴黎會(huì)師歐冠決賽!5月31日開戰(zhàn)

      娛樂要聞

      小S阿雅重返大S母校,翻看大S畢業(yè)照

      財(cái)經(jīng)要聞

      特朗普:美伊“很有可能”達(dá)成協(xié)議

      汽車要聞

      理想為什么不做轎車,有了解釋……

      態(tài)度原創(chuàng)

      本地
      親子
      數(shù)碼
      時(shí)尚
      公開課

      本地新聞

      用青花瓷的方式,打開西溪濕地

      親子要聞

      日本老公在地里干活,喜娜醬也來幫忙,被蚯蚓嚇得蹦起來了

      數(shù)碼要聞

      華為MatePad Pro Max設(shè)計(jì)與核心配置曝光 將于5月7日全球亮相

      “白色闊腿褲”今年夏天又火了!這樣穿時(shí)髦又高級(jí)

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 狠狠做深爱婷婷综合一区| 无码欧美日韩二区三区蜜桃| 99re久久资源最新地址| 日日碰狠狠躁久久躁96avv| 亚洲高清成人aⅴ片在线观看| 第一福利在线视频| 影音先锋人妻啪啪AV资源网站| 精品无码国产自产拍在线观看| 免费人成视频在线观看不卡| 少妇伦子伦精品无码styles| 另类色综合| 538av| 人妻无码中字在线a| 亚洲国产日韩视频观看| 久久国产精品久久w女人spa| 亚洲精品国产综合久久一线| 国产成人精品性色av麻豆| 日韩精品一区二区在线视频| 欧美成人a在线网站| 手机看片日韩欧美| 精品无人区乱码1区2区3区在线| 日本三级吃奶头添泬| 日本在线视频网站www色下载| 国产精品久久久免费视频| 丰满少妇被猛烈进入| 国产麻豆va精品视频| 国产成人咱精品视频免费网站| 欧美a视频在线观看| 亚洲AV中文无码字幕色本草| 无码中文字幕乱在线观看| 中文字字幕在线中文乱码| 亚洲午夜免费福利视频| 日本高清在线观看WWW色| www.亚洲成人网| 中文在线中文资源| 欧美人与禽2o2o性论交| 欧美人与z0zoxxxx视频| 国产精品v片在线观看不卡| 亚洲日本一区二区三区在线不卡| 乌克兰少妇xxxx做受| 男女免费网站观看在线 |