<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>

<p id="tp1vn"></p>

<sub id="tp1vn"><p id="tp1vn"></p></sub>

<u id="tp1vn"><rp id="tp1vn"></rp></u>

<meter id="tp1vn"></meter>

<wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>

日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao

<abbr id="xmdv0"></abbr>

<dfn id="xmdv0"></dfn>

<blockquote id="xmdv0"><ul id="xmdv0"></ul></blockquote>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

GPT-5.5參數有10T？病毒式論文剛剛被打假，實際縮水至1.5T

2026-05-03 17:12:10　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：Aeneas KingHZ

【新智元導讀】五一假期前，AI社區被一篇「GPT-5.5擁有近10萬億參數」的論文刷屏，今天這項研究就被研究者打假了！研究者表示，修正論文中的各種問題后，GPT-5.5的參數很可能約為1.5T。

2026年4月底，AI界被一篇名為《不可壓縮知識探針》（Incompressible Knowledge Probes，簡稱 IKP）的論文震動了。

論文地址：https://www.alphaxiv.org/abs/2604.24827

Pine AI的首席科學家Bojie Li發表了一項研究，聲稱通過一種全新的「黑盒探測法」，推算出了那些閉源模型的真實體量。

GPT-5.5：9.7萬億（9.7T）參數
Claude Opus 4.7：4.0萬億（4.0T）參數
o1：3.5萬億（3.5T）參數

這個數據瞬間引爆了社交媒體。

要知道，如果GPT-5.5真的達到了10T規模，那意味著它比傳聞中的GPT-4（約1.8T）大了5倍有余。

一時間，這個參數瞬間傳遍全網。

然而，僅僅幾天后，反轉就來了。

邏輯的漏洞：從10T到1.5T的縮水內幕

最近，來自UC伯克利CHAI實驗室的Lawrence Chan和UK AISI的研究員Ben Sturgeon對這篇論文進行了深挖。

他們發現，這篇聲稱「逆推大模型規模」的爆火論文，竟然存在嚴重的邏輯與代碼偏差。

修復這些問題后，GPT-5.5的參數約為1.5T（90% 置信區間：256B-8.3T）。

被修飾的擬合曲線

在原始論文中，作者聲稱沒有對模型的得分進行「保底處理」（flooring）。但在復現代碼時，研究者發現作者在計算小模型得分時，偷偷地將負分歸零了。

科普：當模型遇到不知道的冷知識時，如果亂猜（幻覺），得分會是負數。

如果把這個「歸零」操作去掉，小模型的得分會大幅下降。這意味著原本陡峭的「得分-參數」擬合曲線會變得平緩。修正后，估算的GPT-5.5規模直接從9.7T暴跌至1.5T。

「人工智障」出題：25%的題目本身就有錯

研究者發現，這套用來測試模型的「冷知識題庫」質量同樣堪憂。

歧義性：約25%的專家知識題存在歧義（例如重名研究員）。
事實錯誤：部分標準答案本身就是錯的。

最戲劇性的是，原作者Bojie Li后來坦言：這篇研究是他在AI智能體的輔助下，僅用4天時間完成的早期探索。

這種「AI寫論文研究AI」的模式，被Lawrence Chan戲稱為「充滿槽點的Vibe-coding」。

核心理論依然堅挺

知識「不可壓縮」

用嚴謹的話說，論文的核心思想——IKP 得分與對數參數數量之間的線性關系——仍然成立，但參數數量的估計卻不成立。

解決這兩個問題后，基于IKP的前沿模型估計的參數數量通常會下降，置信區間會擴大：

GPT 5.5：9.7T -> 1.5T

Claude Opus 4.7：4.0T -> 1.1T

DeepSeek R1（實際大小671B）：424 B -> 760 B

難得的是，論文中的三種說法，承受住了各種測試，被證明依然是正確的。

比如，IKP分數和模型的參數呈對數線性關系。

總之，論文提出的核心模型依然得到了學界的認可：不可壓縮知識探針（IKP）。

這個理論認為，大模型的能力可以分為兩部分。

程序性能力（邏輯、推理、代碼）：這是可以壓縮的。隨著架構優化，更小的模型可以擁有更強的推理能力。
事實性知識（某人的出生日期、冷門研究領域）：這是不可壓縮的。

你可以把模型想象成一個硬盤，存一個事實就需要占幾個比特位。

因此，測試模型到底知道多少「不可壓縮」的冷知識，確實是目前探測閉源模型參數最科學的「測力計」。

誰才是真正的「知識之王」？

而且，盡管參數規模下調了，但各家模型的「有效容量」排名依然極具參考價值。

梯隊格局

第一梯隊（巔峰王者）：GPT-5.5。雖然可能只有1.5T左右，但它在T6級別的超冷門知識表現上依然冠絕群雄。
第二梯隊（貼身肉搏）：Claude Opus 4.7、o1、Grok-4。這幾款模型的有效容量高度接近，競爭進入白熱化。
MoE（混合專家模型）的秘密：研究發現，MoE模型的知識量取決于其總參數，而非每次運行時的「激活參數」。這意味著，如果你想讓模型博學，堆參數依然是唯一的硬道理。

「思考模式」的玄學

測試顯示，開啟「思維鏈」（Thinking Mode）并不能顯著增加模型的知識量。這再次印證了：思考能提高邏輯，但不能憑空變出你沒讀過的書。

最后，Lawrence Chan吐槽說：這項工作果然是AI智能體在四天內完成的，因為網站和代碼庫到處都體現著vibe coding的粗糙風格。

GPT-5.5參數有9.7T？

4月30日，Pine AI的首席科學家李博杰的這篇論文引發了熱議。

核心觀點是：事實性容量與模型規模呈對數線性關系。

論文展示了 7 個知識層級，其中T7對所有模型來說幾乎都是0%左右，這表明預訓練仍有巨大的提升空間。

Gemini 3.1 Pro很可能超過 10T，因為它被用作錨點，但論文中沒有對其直接估算。

這意味著，我們可以在一定程度上推斷不同模型的訓練成本，以及它們的后訓練效果——即在給定規模下，在某些非事實性任務上的表現。

在原作中，李博杰構建了一個包含1400個事實性問題的數據集，并將準確率與參數數量進行擬合。

通過反轉擬合，從閉源模型的數據集得分，研究人員推斷出其參數數量。

特別要注意最后一行的90%預測區間「Predicition interval, PI」非常大。

此前，就有網友注意到這些「規模只是推測，不應當作事實」。

現在許多人，想知道估算對方法論有多敏感——

李博杰直言，「同一個評估任務，結果橫跨60倍區間 → 任何單一的點估計都不誠實。」

不過，IKP本是一個起點，而非終點。

作者坦誠自己匆忙上傳了一篇未成熟的arXiv論文，只是為了把這個想法放出來。

論文、代碼、數據集和網站都是在 4 天內完成的，主要借助 Claude Code，發布前未經同行審閱。采用下限處理和 λ=?1，是為了在開放權重模型上最大化R2。

我們期待未來的工作能將它做得更好！

Scaling Law失效了嗎？

這次「參數神話」的破滅，給行業敲響了警鐘：盲目崇拜大數字的時代正在過去。

GPT-5.5從10T降到1.5T，并不意味著它變弱了，而是意味著OpenAI可能在數據質量和參數效率上做了更驚人的優化。

正如Lawrence Chan在總結中所說：「GPT-5.5到底有多少參數？我們依然不確定。但這種通過探測知識容量來反推規模的方法，為我們揭開黑盒模型的面紗提供了一條新路徑。」

在通往AGI的路上，我們需要的或許不再是更大的硬盤，而是更聰明的索引方式。

參考資料：

https://x.com/deedydas/status/2049523583517634862

https://x.com/justanotherlaw/status/2050399317782155726

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

這套題，GPT-5.5、Opus 4.7加起來沒考到1分，人類卻拿了滿分100

機器之心Pro 2026-05-03 09:22:46
2 跟貼 2
斯坦福重磅研究登Nature！AI憑空造出前所未有蛋白質，超越AlphaGo

新智元 2026-05-03 13:08:51
2 跟貼 2

突破長序列與低耗部署核心瓶頸！中國科學院發布類腦大模型瞬悉2.0

新智元 2026-05-02 14:14:33
0 跟貼 0

圖靈獎得主：勸年輕人別學計算機，行業紅利正在消失

DeepTech深科技 2026-05-02 18:30:19
9 跟貼 9
華為openJiuwen社區攜手中科大靈境造物重塑AI科研

量子位 2026-05-01 21:59:41
0 跟貼 0

神經計算機橫空出世：AI不再調用軟件，而是直接長成一臺計算機

DeepTech深科技 2026-05-03 18:24:37
0 跟貼 0

不好！1930年的AI都來搶程序員飯碗了

量子位 2026-05-03 17:40:17
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

MIT校友用AI幫人接電話，竟做成了一家獨角獸

DeepTech深科技 2026-05-03 18:30:28
0 跟貼 0
有人只用API就猜出了GPT、Claude、Gemini的參數量？社區吵翻了

機器之心Pro 2026-05-01 19:56:22
4 跟貼 4
女孩感染古老的病毒，豪斯以身試險

小飛漫 2026-05-03 14:19:14
1 跟貼 1
門禁被男子當過人道具，一番操作讓人意外，運動邏輯完全說得通！

白熊愛搞笑 2026-05-01 19:17:42
1 跟貼 1
DeepSeek V4最大的遺憾

量子位 2026-05-03 11:45:33
6 跟貼 6
英偉達巧用8B模型秒掉GPT-5 開源了

量子位 2025-12-06 14:07:18
96 跟貼 96
這就是最基礎的邏輯了，所以學校不教邏輯學

楊小楊愛看劇 2026-05-01 16:31:16
11396 跟貼 11396
GPT image 2 實用玩法合集分享～【秋芝的AI開箱】

秋芝2046 2026-05-02 17:01:39
4 跟貼 4
全網最全！50組Banana/GPT Image 2一鍵生成PPT風格提示詞（附案例及鏈接）

秋葉PPT 2026-05-02 08:22:39
2 跟貼 2
美軍新一代班用機槍，XM250輕機槍，重塑美軍火力壓制邏輯！

環球武器 2026-04-30 09:30:56
0 跟貼 0
WPS/Word 論文自動目錄生成保姆級教程

新浪財經 2026-05-03 05:43:41
0 跟貼 0
景區裝電梯無痛爬山被質疑過度開發

極目新聞 2026-05-02 17:18:12
3830 跟貼 3830
癡呆老人念叨奇怪數字代碼子女求助政府，調查后發現老人大有身份

剛蘆雪 2026-04-29 05:22:18
0 跟貼 0
一個人成長最快的底層邏輯：自我重構！

搞笑枇杷 2026-04-29 02:03:41
0 跟貼 0
五一的莫氏雞煲現場爆滿：上午客人沒吃完，下午客人又開始排隊，還有人花80元買號

極目新聞 2026-05-01 18:33:42
3373 跟貼 3373
CTO不香了？百億公司高管們為何集體轉身，去Anthropic當工程師

機器之心Pro 2026-05-03 18:06:39
0 跟貼 0
游客拍到一公園公廁滿地大小便，被工作人員圍堵要求刪視頻，兩次報警才脫身

蓬勃新聞 2026-05-02 19:27:43
2142 跟貼 2142
漢字存在缺陷？諾貝爾獎得主羅素一針見血：漢字有這3大缺點！

史之銘 2026-05-03 17:18:41
0 跟貼 0
打完“一針瘦”脈不跳了！警方摧毀特大制售假劣醫美產品犯罪網絡

新京報 2026-05-03 18:01:09
0 跟貼 0
宇宙無限膨脹理論遇挑戰，最新研究：宇宙或已過青年期，膨脹后恐“大坍縮”

紅星新聞 2026-04-29 17:37:08
79 跟貼 79
2026廣州汽車貼膜六大門店推薦正品避坑指南

每日汽車道 2026-05-03 18:56:13
0 跟貼 0
“蘇超”第四周比賽結束，最新戰報出爐：南京隊2:1常州隊，泰州隊3:1揚州隊，蘇州隊0:1淮安隊，鎮江隊1:2鹽城隊

江蘇新聞 2026-05-02 22:02:00
328 跟貼 328
古巴外長：美國對古攻擊上升至危險水平

澎湃新聞 2026-05-02 22:59:02
3201 跟貼 3201
吉利發布首款原生新能源越野架構，領越野進入AI時代

快上車Go 2026-05-02 14:35:40
0 跟貼 0
洛陽白馬寺發布鄭重聲明：不少游客因通過非官方第三方渠道購買非法倒賣的預約門票，導致無法正常入寺，切勿輕信

極目新聞 2026-04-29 18:10:47
903 跟貼 903
賀嬌龍賬號已更名商品櫥窗清空簡介內容更新

大象新聞 2026-05-02 19:42:07
85 跟貼 85
充電樁運營商，“扛不住了”

中國新聞周刊 2026-05-02 19:02:21
867 跟貼 867
博主教邏輯學，竟被舉報到公安部門說居心叵測

難得君 2026-05-03 16:52:53
2 跟貼 2
女子陪兒子玩手雷模型，手雷沒扔出尷尬了，竟被教練一腳踢飛

搞笑熱血青年 2026-05-01 09:24:17
2 跟貼 2
余華自嘲“翻車”：輔導兒子語文后兒子沒及格

大象新聞 2026-05-02 16:26:05
1839 跟貼 1839
廣東耀明糖廠喊話“求互相體諒”：不要再送帶葉、帶根的甘蔗來了；此前曾有甘蔗夾雜鐵管沙泥造成設備損壞停工

大象新聞 2026-05-03 10:14:05
364 跟貼 364
越南4月出口同比增長21%，預估17.9%

每日經濟新聞 2026-05-03 10:18:05
1989 跟貼 1989

男子將24歲女孩撞成高位截癱，得知要賠200萬，靈機一動將名下2套房過戶給女兒，女孩去要錢，男子：要錢沒有，要命一條！

男子將24歲女孩撞成高位截癱，得知要賠200萬，靈機一動將名下2套房過戶給女兒，女孩去要錢，男子：要錢沒有，要命一條！

大愛三湘

2026-04-28 19:39:24

iPhone用戶為什么突然集體裝VPN

iPhone用戶為什么突然集體裝VPN

我是一個養蝦人

2026-05-01 07:00:40

有人說：打麻將和性生活是縣城的底色？

有人說：打麻將和性生活是縣城的底色？

燈錦年

2026-04-21 12:32:46

1978年起陳云地位迅速上升,跨越多級“臺階”,背后原因何在

1978年起陳云地位迅速上升,跨越多級“臺階”,背后原因何在

鶴羽說個事

2026-04-30 22:47:23

我國急需改名的5座城市，起名太隨意，連本地人也吐槽名字有點土

我國急需改名的5座城市，起名太隨意，連本地人也吐槽名字有點土

長風文史

2026-04-30 22:08:50

張雪機車德比斯熱身賽第一，次回合正賽今晚20點打響

張雪機車德比斯熱身賽第一，次回合正賽今晚20點打響

懂球帝

2026-05-03 17:31:03

祝賀！中國女隊3-0橫掃日本隊晉級決賽，將沖擊隊史第17冠

祝賀！中國女隊3-0橫掃日本隊晉級決賽，將沖擊隊史第17冠

羅掌柜體育

2026-05-02 19:37:27

竇靖童和宋妍霏巴黎被偶遇，留著寸頭很帥氣，兩人在一起很久了

竇靖童和宋妍霏巴黎被偶遇，留著寸頭很帥氣，兩人在一起很久了

草莓解說體育

2026-05-03 09:30:29

今夜迎G3生死戰！媒體人：趙繼偉胃腸感冒病情已得到有效緩解

今夜迎G3生死戰！媒體人：趙繼偉胃腸感冒病情已得到有效緩解

狼叔評論

2026-05-03 14:40:11

美媒180度轉變，以前說中國“產能過剩”，現在說有先見之明

美媒180度轉變，以前說中國“產能過剩”，現在說有先見之明

阿器談史

2026-05-03 17:15:05

以為躲開了高峰，結果堵到懷疑人生，去了真的會崩潰！

以為躲開了高峰，結果堵到懷疑人生，去了真的會崩潰！

冷峻視角下的世界

2026-05-03 13:21:42

購買中國戰斗機不給錢，七次追債都沒還，這個囂張小國報應來了

購買中國戰斗機不給錢，七次追債都沒還，這個囂張小國報應來了

飄逸語人

2026-05-03 10:57:51

中國股市：一份“不能買”的股票名單，獻給兩億股民的最真誠忠告

中國股市：一份“不能買”的股票名單，獻給兩億股民的最真誠忠告

股經縱橫談

2026-05-01 20:40:08

紅軍長征時，有一支部隊在川西走錯方向，最遠走到了英屬緬甸境內

紅軍長征時，有一支部隊在川西走錯方向，最遠走到了英屬緬甸境內

史之銘

2026-04-16 02:05:10

毛主席晚年時，失望地說：為什么大家都沒有理想了？

毛主席晚年時，失望地說：為什么大家都沒有理想了？

海佑講史

2026-05-02 14:25:12

2016年，黎明和助理陳泳儀的合影，2年后，陳助理成了黎夫人

2016年，黎明和助理陳泳儀的合影，2年后，陳助理成了黎夫人

喜文多見01

2026-05-03 12:41:06

巴拿馬徹底傻眼了！搶完港口后，卻發現全世界都沒人敢接盤

巴拿馬徹底傻眼了！搶完港口后，卻發現全世界都沒人敢接盤

南宗歷史

2026-05-03 01:35:25

20多年前陳紅在陳凱歌家拍照，她躺在沙發上的樣子，堪稱人間尤物！

20多年前陳紅在陳凱歌家拍照，她躺在沙發上的樣子，堪稱人間尤物！

感覺會火

2026-04-28 21:18:46

騎士vs猛龍G7前瞻：生死戰鶯歌出戰成疑，哈登再遇考驗

騎士vs猛龍G7前瞻：生死戰鶯歌出戰成疑，哈登再遇考驗

體壇野秀才

2026-05-03 15:34:15

畫質對決一邊倒！英偉達技術吊打AMD 差距肉眼可見

畫質對決一邊倒！英偉達技術吊打AMD 差距肉眼可見

游民星空

2026-05-01 23:27:30

AI產業主平臺領航智能+時代

15121文章數 66832關注度

往期回顧全部

科技要聞

庫克罕見"拒答"！蘋果正被AI供應鏈卡脖子

頭條要聞

機票價大跳水接近"腰斬" 上海出發機票最高降幅達7成

頭條要聞

機票價大跳水接近"腰斬" 上海出發機票最高降幅達7成

體育要聞

裁判準備下班，結果吳宜澤進了決賽

娛樂要聞

蔡卓妍婚后首現身戴結婚戒指笑容不斷

財經要聞

后巴菲特時代，首場股東會透露了啥

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

房產

家居

公開課

軍事航空

親子要聞

90年的馬爸爸和26年的馬寶寶互動日常

房產要聞

五一樓市徹底明牌！塔尖人群都在重倉凱旋新世界

家居要聞

靈動實用生活藝術場

寂然無界簡潔風格
江景風格流動的秩序
自然肌理溫潤美學

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

軍事要聞

伊朗公布伊方最新談判方案

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：国产香港明星裸体xxxx视频 | 日韩精品一区二区亚洲| 久久人妻无码AⅤ毛片评价| 宁明县| 成人av中文字幕在线播放 | 国产免费无遮挡吸乳视频| 日本精品一区二区视频| 国产精品自拍自在自线| 久久97精品久久久久久久不卡| 大帝av| 亚洲AV无码成人精品区国产| 亚洲AV免费一区二区三区| youwu视频在线一区二区| 国产精品国产精品偷麻豆| av高清| 欧美午夜色大片在线观看免费| 在线免费成人亚洲av| 日本亚洲成a人片在线观看| 久久99久久精品视频| 成人区人妻精品一熟女| 亚洲日本va午夜在线影院| 在线看片免费人成视频在线影院| 国产成人亚洲综合图区| 精品30P| 亚洲成色综合网站在线| 激情啪啪啪一区二区三区| 无码精品国产一区二区三区免费| 久久五月丁香激情综合| 国产成人精品一区二区不卡| 婷婷综合缴情亚洲狠狠| 印度成人AV| 久久人人爽人人人人爽av| 偷拍自拍成人免费视频| 18禁免费无码无遮挡不卡网站| 丰满人妻熟妇乱又伦精品| 波多野结衣中文字幕一区二区三区| 一区二区和激情视频| 中文在线а天堂中文在线新版| 国产av国片精品| 国产成人一区二区三区| 久国产精品久久精品国产四虎 |

<meter id="8gexi"></meter>

<meter id="8gexi"><span id="8gexi"></span></meter>

<tr id="8gexi"></tr>