<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      字節跳動vsDeepSeek,中國AI的開年雙王炸

      0
      分享至



      作者|周煒皓

      編輯|閆俊豪

      2025年12月30日,字節跳動Seed團隊發布《Dynamic Large Concept Models》論文,挑戰了“Token是計算的原子單位”這一根深蒂固的假設,提出計算應當是分層、動態和抽象的

      一天之后,12月31日,DeepSeek提交了一篇有梁文鋒署名的論文,論文題目是《mHC:流形約束超連接》,這篇論文直指大模型訓練中的“信號爆炸”問題,用mHC架構為打造超大模型搭建起“腳手架”

      從打破“如何想得更快更深”的推理瓶頸,到解決“如何長得更大更穩”的現實困境,字節跳動和DeepSeek團隊分別從兩個方向,揭開了未來AI發展的圖景一隅。

      讓AI學會“速讀”與“深思”

      2011年,諾貝爾獎得主丹尼爾·卡尼曼在《思考,快與慢》中提出了System 1(快思考)和System 2(慢思考)的雙系統理論,常被用來類比AI的推理模式。

      現有的 Transformer 模型,無論規模多大,本質上都在執行System 1式的直覺反應,基于統計規律快速預測下一個詞,缺乏System 2所具備的深思熟慮、規劃和概念抽象能力。字節跳動團隊則在論文中指出,語言模型不應受限于其輸入形式,而應具備在更高維度的“概念空間”進行操作的能力

      舉個例子,人類在理解“中華人民共和國”這個詞時,大腦激活的不僅僅是七個字的字面意義,而是一個包含政治、經濟、文化和歷史背景的語義網絡。DLCM 正是試圖在神經網絡中構建這種“概念”實體。

      目前的 AI 模型存在一個通病,無論是處理無意義的虛詞,比如“的”、“是”,還是處理復雜的邏輯難題,消耗的計算資源是一樣的。這不僅效率低下,也限制了模型處理復雜任務的能力。DLCM通過引入“動態概念”機制,讓 AI 具備了類似人類的“速讀”和“慢思考”能力



      DLCM架構概述

      這套機制將處理過程分為兩步,首先,模型不再逐字逐句看書,而是自動識別語義,將“今天天氣不錯”這樣簡單的一串詞瞬間打包成一個“概念”略過,不費腦力。其次,當遇到“相對論推導”這樣的硬骨頭時,模型會停下來,在壓縮后的“概念空間”里調動深層算力進行縝密推理。

      用更容易理解的話說,過去AI就像個死板的經理,無論是審批買文具的 5 元發票,還是審批5個億的投資項目,都要花1個小時去審核。而引入DLCM后,這個經理就有了抓大放小的能力,審批文具發票只花1秒鐘,把節省下來的時間和精力,全部用來仔細研究那個5億的投資項目。

      把好鋼用在了刀刃上,比起普通AI,DLCM在處理燒腦的邏輯推理題時更聰明,推理計算量減少了約34%,處理多步邏輯推理任務時,準確率反而平均提升了2.69%。對于擁有億級用戶的字節跳動來說,這意味著可以用更低的芯片成本,提供更聰明、反應更快的 AI 服務。

      “音量守恒”魔咒

      “信號爆炸”,是過去大模型訓練中的“地雷”。一旦踩中,不管你花了多少錢進行訓練,模型都可能瞬間崩潰,前功盡棄。

      為了理解 DeepSeek 這項mHC技術的價值,我們可以把訓練大模型想象成一場幾百人參與的“傳話游戲”。

      在這個游戲中,“人”就是神經網絡的層,“話”就是數據傳輸的信號或特征信息。在最早的深度網絡中,幾百人排成一列傳話。如果每個人都只靠“聽和說”,傳到第100個人時,消息往往已經面目全非或者變得極其夸張。

      這就是早期深層網絡訓練困難的原因。過去,ResNet的解決方案是制定規則,讓每個人在傳話的同時,必須把上一給人給你的“原話”寫在小紙條上,原封不動地遞給下一個人。即使某個人腦子短路了,下一個人至少還能收到那張“小紙條”,保證了最基礎的信息不會丟,這就是恒等映射。

      但問題在于,這是一條“單行道”,隨著模型越來越大,這張“小紙條”上寫的字越來越多,想在上面塞進更多的邏輯、語法和知識,變得越來越困難。

      為了解決“單行道”擁擠的問題,字節跳動等研究者想出了一個辦法,從過去的一列隊伍改成多排幾列,并允許這幾列隊伍之間互相交流。新的問題出現了,由于沒有制定嚴格的“音量規則”,大家因為能互相交流變得非常興奮。

      第一列的人喊了一嗓子,第二列的人覺得很重要,于是拿個大喇叭復述,第三列的人聽到了,又把聲音放大幾倍傳回去。就這么一團亂麻傳到最后,聲音被放大幾千倍,全是噪音,根本聽不清原本的消息,導致訓練直接崩潰,這就是HC導致的大模型訓練的困境。



      結果表明,mHC 在損失和梯度范數方面都表現出更高的穩定性

      在這個背景下,DeepSeek的研究員意識到,多列隊伍是好主意,但必須治理“噪音爆炸”。于是他們引入了數學上的流形約束,依然是多列隊伍并行,依然允許互相交流,但每個人面前放了一個分貝儀,如果你想聽其他列的消息,可以,但你從他們那里接收的“總音量”必須嚴格等于1。

      你想多聽第一列的人在說什么,就得捂住另一只耳朵少聽其他列里的人說話,如果你要往后面傳話,你的聲音也必須是1分貝。這樣的好處在于,不管隊伍排多長,不管大家怎么互相傳八卦,整個房間的總音量始終控制在一個合理的范圍內。

      這就是mHC最關鍵的作用,將深層網絡的信號增益從3000倍壓制到1.6倍左右,實現了3個數量級的穩定性提升。DeepSeek 利用 Sinkhorn-Knopp 算法強行“熨平”了所有的信號波動,無論模型有多大,內部結構都穩如泰山

      這項技術以僅增加 6.7% 訓練時間的微小代價,換來了極度的穩定性。

      從“恐懼”到“貪婪”

      這兩篇論文發布后,市場的反應也值得關注。

      回想一年前的2025年1月27日,DeepSeek發布初代R1模型,全球資本市場曾陷入“算力通縮”的恐慌。當時,華爾街擔心中國廠商極高的算法效率會大幅減少對GPU的需求,導致英偉達股價單日暴跌17%,市值蒸發近5900億美元。

      然而,2026 年1月2日,面對mHC和DLCM這兩項進一步大幅降低算力成本、提升模型效率的“王炸”級技術,資本市場卻表現出截然不同的態度。在兩篇論文發布后的首個交易日,英偉達股價并未因“需求減少”的邏輯而下跌,反而逆勢上揚1.26%,收于188.85 美元

      這種反差背后,是“杰文斯悖論”在發揮作用。早在工業革命時代,這位英國經濟學家就發現,當技術進步提高了使用資源的效率,但成本降低導致需求增加,會令資源消耗的速度不減反增。

      比起“DeepSeek時刻”那會兒,市場擔心效率提升會導致顯卡需求下降,現在的投資者們想明白了一點,效率提升以后,還可以把AI塞進手機、眼鏡和汽車里,不僅不會少買,反而需要建設更龐大的推理集群來服務數十億用戶。

      字節跳動的DLCM通過降低34%的推理成本,為AI落地應用掃清了障礙,DeepSeek的mHC則保證了未來更大規模模型的誕生,這兩者疊加,AI的蛋糕被做得更大了。

      2026年開年的這兩篇論文,不僅是字節跳動和DeepSeek的技術秀,更是中國AI產業在高端芯片受限背景下走出的一條“不對稱競爭”之路。如果說過去兩年大家還在比拼誰的顯卡更多,那么從現在開始,比賽進入了比拼誰的腦子更快的新階段。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      王楚欽贏下比賽之后,微微一笑,王皓哭了 小布哭了 現場球迷也哭

      王楚欽贏下比賽之后,微微一笑,王皓哭了 小布哭了 現場球迷也哭

      陌識
      2026-05-10 05:55:46
      滴滴司機講述東北蕭條:一家三口一年掙兩三萬,很多老人翻垃圾桶

      滴滴司機講述東北蕭條:一家三口一年掙兩三萬,很多老人翻垃圾桶

      互聯網大觀
      2026-05-09 13:07:25
      世乒賽男團賽太殘酷了:隨著中國3-1,日本3-0,2大勁旅被送回家

      世乒賽男團賽太殘酷了:隨著中國3-1,日本3-0,2大勁旅被送回家

      側身凌空斬
      2026-05-10 05:36:00
      5月9日閱兵的俄羅斯,走向垃圾時間

      5月9日閱兵的俄羅斯,走向垃圾時間

      黔有虎
      2026-05-09 16:22:09
      央視拒付天價轉播費僅48小時,難堪的一幕發生,鄭欽文也被拉下水

      央視拒付天價轉播費僅48小時,難堪的一幕發生,鄭欽文也被拉下水

      混沌錄
      2026-05-09 16:18:09
      攤牌!!除了球隊老大!全部都賣!!!

      攤牌!!除了球隊老大!全部都賣!!!

      柚子說球
      2026-05-09 22:44:07
      臺北出現漢坦病毒致死病例!網友扒出竟早有預言,專家否認人傳人

      臺北出現漢坦病毒致死病例!網友扒出竟早有預言,專家否認人傳人

      派大星紀錄片
      2026-05-09 10:46:16
      第1現場|俄烏對峙下的紅場閱兵:36年來首次未見坦克

      第1現場|俄烏對峙下的紅場閱兵:36年來首次未見坦克

      澎湃新聞
      2026-05-09 21:40:28
      這下,很多煙草員工已經沒心情上班了!

      這下,很多煙草員工已經沒心情上班了!

      椰青美食分享
      2026-05-09 16:53:25
      霍莉·麥迪遜曝光花花公子豪宅"性夜"內幕:沒人喜歡,只想快點結束

      霍莉·麥迪遜曝光花花公子豪宅"性夜"內幕:沒人喜歡,只想快點結束

      娛圈觀察員
      2026-05-09 06:08:42
      罕見!韓媒:韓國總統、國會議長、韓執政黨黨首同日落淚

      罕見!韓媒:韓國總統、國會議長、韓執政黨黨首同日落淚

      環球網資訊
      2026-05-09 11:57:09
      難以饒恕!榴蓮僅退款女孩過分言論曝光:臉真大,不知羞恥的東西

      難以饒恕!榴蓮僅退款女孩過分言論曝光:臉真大,不知羞恥的東西

      小徐講八卦
      2026-05-09 10:31:23
      他是外交部原部長,1985年被鄧小平怒批“胡說八道”,活到了98歲

      他是外交部原部長,1985年被鄧小平怒批“胡說八道”,活到了98歲

      歷史人文2
      2026-05-09 22:00:03
      小寶與王某雷,誰探訪花的數量更多?

      小寶與王某雷,誰探訪花的數量更多?

      挪威森林
      2026-01-31 12:15:26
      “奶葵”歸來!“社恐”頂流詮釋反差美學,十年歸來仍是白月光!

      “奶葵”歸來!“社恐”頂流詮釋反差美學,十年歸來仍是白月光!

      管鮑老四級
      2026-04-28 15:55:44
      伊朗宣布:沒收262處“叛國者”房產!霍梅尼之孫:最高領袖正全面掌握國家事務;美軍稱繼續對伊海上封鎖,英國將派遣艦艇參加護航行動

      伊朗宣布:沒收262處“叛國者”房產!霍梅尼之孫:最高領袖正全面掌握國家事務;美軍稱繼續對伊海上封鎖,英國將派遣艦艇參加護航行動

      每日經濟新聞
      2026-05-10 00:12:09
      國安部發布緊急提醒:你的手機或已成“間諜站”!

      國安部發布緊急提醒:你的手機或已成“間諜站”!

      看看新聞Knews
      2026-05-09 14:54:03
      普京:伊朗戰事讓俄羅斯“處境復雜”

      普京:伊朗戰事讓俄羅斯“處境復雜”

      環球網資訊
      2026-05-10 06:56:42
      活活嚇死!網傳69歲老人查出肺癌晚期,老伴告知真相后三日便離世

      活活嚇死!網傳69歲老人查出肺癌晚期,老伴告知真相后三日便離世

      火山詩話
      2026-05-09 21:45:51
      重磅反轉 曝央視砸5億美元買近2屆世界杯轉播權 預計一周內簽合同

      重磅反轉 曝央視砸5億美元買近2屆世界杯轉播權 預計一周內簽合同

      風過鄉
      2026-05-09 19:57:32
      2026-05-10 07:36:49
      速途網 incentive-icons
      速途網
      17年歷史深度科技內容平臺,長期追蹤AI、機器人、智能出行等前沿領域,助力中國硬科技每一次躍遷。
      2344文章數 11433關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      多地號召,公職人員帶頭繳納物業費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      藝術
      教育
      游戲
      時尚
      手機

      藝術要聞

      陽光,此刻醉美

      教育要聞

      中小學教師資格考試即將開始

      Windows 11 PC上的Xbox模式不支持多顯示器

      伊姐周六熱推:電視劇《喀什戀歌》;電視劇《低智商犯罪》......

      手機要聞

      iQOO 15T首發天璣9500特別版:實測幀率無敵 穩如泰山

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 同德县| 91啪在线| 草草影院ccyy国产日本欧美 | 野花韩国视频在线观看免费高清| 国产主播av福利精品一区| 中文字幕无线码中文字幕| 亚洲丝袜精品在线视频| 91无码丝袜| 午夜福利视频极品国产83| 蜜桃无码一区二区三区| 亚洲乱码国产乱码精品精大量| 色婷婷欧美在线播放内射| 少妇一晚三次一区二区三区| 国产福利深夜在线观看| 伊人av网| 久久精品国亚洲a∨麻豆| 欧美成人精品三级网站视频| 99九九视频高清在线| 免费看无码网站成人A片| 2018高清国产一区二区三区| 美女一区二区三区| 亚洲 另类 日韩 制服 无码| 99久久婷婷| 亚洲?日韩?中文?无码?制服| 一区二区偷拍美女撒尿视频| 欧美在线黄| 免费无码国模国产在线观看| 国产成人精品一区二区三区无码| 久久久无码精品午夜| 亚洲a成人无码网站在线| 中文字幕丰满孑伦无码专区| 永久无码天堂网小说区| 国产精品色拉拉| 蜜臀av999无码精品国产专区| 国产一三四2021不卡| a男人的天堂久久a毛片| 九色综合伊人久久富二代| 97碰碰碰人妻视频无码| 麻豆亚洲精品一区二区| 黄av在线| 亚洲女同视频在线观看 |