<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      將 600 億參數(shù)大模型裝進手機的瓶頸,終于被中國 AI 公司突破了

      0
      分享至


      一個 8B 參數(shù)的大模型,通常需要約 16GB 顯存。參數(shù)越多,越吃顯存,這就是為什么,內(nèi)存價格一天比一天高。

      現(xiàn)在,有一種方法,可以省下 6 倍顯存,卻幾乎不損耗模型性能。

      過去兩年,圍繞這個看似極端的思路,一條全球性的技術(shù)競賽正在成型。而就在這條賽道上,一個完全基于國產(chǎn)算力的方案,剛剛給出了自己的第一個回答。

      模型被壓到了不到 3B,同時,能力卻可以保留 97%,甚至更進一步,如果結(jié)合 MoE 架構(gòu),未來可以直接在一部 8GB 內(nèi)存的手機,運行 600 億參數(shù)的大模型。

      聽上去匪夷所思,怎么做到的?

      三個值,能跑大模型嗎

      傳統(tǒng)大模型用非常精確的數(shù)字存儲,意味著每個權(quán)重可以取幾萬種不同的數(shù)值,精度很高,但也很占內(nèi)存。三值量化是一個極端的反向操作:直接把可選的數(shù)值從幾萬種砍到三種。技術(shù)上,這被稱為 1.58-bit,因為編碼三個值恰好需要約 1.58 個二進制位。

      這個壓縮有多極端?打個比方:如果傳統(tǒng)大模型的權(quán)重是一幅全彩照片,三值量化就是把它壓成只有黑、白、灰三色的極簡圖形。

      直覺上你會覺得這必然損失慘重。但過去兩年的研究反復(fù)證明,模型權(quán)重里存在大量冗余信息。三個值,如果分配得當(dāng),足以承載絕大部分的模型能力。


      這不是一個新概念。2024 年,微軟研究院發(fā)布了 BitNet b1.58,第一次系統(tǒng)論證了三值大模型可以逼近全精度模型的性能。微軟隨后在去年進一步發(fā)布了 BitNet b1.58 2B4T,一個 20 億參數(shù)、4 萬億 token 訓(xùn)練的開源三值模型。上個月,美國公司 PrismML 發(fā)布了 Ternary Bonsai 系列,宣稱是首批商業(yè)可用的 1.58-bit 模型。


      上:Llama FP16架構(gòu),下:微軟研究院開發(fā)的BitNet架構(gòu)

      學(xué)術(shù)界也同樣在跟進:Tequila 提出了解決三值量化中「死權(quán)重陷阱」的新方法,TernaryLM 探索了從零開始的原生三值訓(xùn)練。

      一條全球賽道正在成型。但有一個關(guān)鍵問題始終沒有被回答:

      三值大模型訓(xùn)練,能在國產(chǎn)算力上跑通嗎?

      昇騰上的第一次

      這一次,在華為鯤鵬昇騰開發(fā)者大會(KADC 2026)上,面壁智能給出了答案。

      BitCPM-CANN 是面壁智能聯(lián)合清華大學(xué)、OpenBMB 開源社區(qū)發(fā)布的三值大模型系列。它的意義不僅在于「又發(fā)了一個三值模型」。在全球賽道上,BitCPM-CANN 做到了三個此前沒有人做到的事情。

      第一次,在華為昇騰上端到端完成三值大模型訓(xùn)練。此前所有公開的三值模型訓(xùn)練都在 NVIDIA GPU 上完成。國產(chǎn)芯片陣營第一次擁有了自己的三值訓(xùn)練能力。第一次,一次性把規(guī)模推到 8B。此前昇騰上的低比特訓(xùn)練停留在較小規(guī)模的驗證階段。BitCPM-CANN 直接發(fā)布了 0.5B、1B、3B、8B 四個檔位,覆蓋從手機到 PC 的完整端側(cè)場景。第一次,實現(xiàn)了與全精度模型的完整對照評測。11 項任務(wù)、四大類評測(常識、閱讀理解、學(xué)科知識、數(shù)學(xué)推理),1B 到 8B 檔位的能力保留率在 95.7%到 97.2%之間。

      97.2%的能力保留率意味著什么?在 ARC、CMMLU、GSM8K 等主流評測中,BitCPM-CANN 三值模型與同尺寸 MiniCPM4 全精度模型的差距,已經(jīng)小于許多全精度模型之間的差距。其中,3B 檔位的保留率最高,達(dá)到 97.2%。

      而且,這不只是論文里的數(shù)字,是能真正可以「拿來就用」的成果。BitCPM-CANN 的全部尺寸版本已經(jīng)開源,0.5B 到 8B 四個檔位都可以直接下載復(fù)現(xiàn)。


      對于熟悉面壁智能 MiniCPM 系列的開發(fā)者來說,BitCPM-CANN 就是 MiniCPM 家族的三值版本,還是一套生態(tài)。在同一個 GitHub 社區(qū),家族前輩積累了 3 萬顆星、Hugging Face 總下載量超 3000 萬的「家產(chǎn)」,現(xiàn)在生長出來了新的方向。

      6 倍顯存,從服務(wù)器到手機都「吃到紅利」

      相比 BF16 全精度模型,BitCPM-CANN 節(jié)省約 6 倍顯存,這個數(shù)字開發(fā)者最能直接感知:一個 8B 參數(shù)的全精度模型需要約 16GB 顯存,BitCPM-CANN 三值版本不到 3GB,可以流暢運行在一部手機上,配合 MoE 與激活范圍約束,60B 規(guī)模的模型有望裝入終端設(shè)備。

      硬件端也已經(jīng)準(zhǔn)備好了。高通最新的旗艦芯片 8850 和 8397 支持 2-bit 原生推理,BitCPM-CANN 提供的恰好是可以直接喂進去的低比特權(quán)重。

      芯片廠商等供給,模型廠商等芯片,現(xiàn)在兩邊同時到位了,怎么不是一種「雙向奔赴」。

      手機廠商對端側(cè)大模型的投入一直在加速。上周 Google I/O 上,Gemini Intelligence 全面接管 Android 設(shè)備,從手機到手表到車機;蘋果也將在 6 月 WWDC 上展示下一代 Apple Intelligence 的重大升級。


      兩大手機操作系統(tǒng)同時發(fā)力,共同指向一個現(xiàn)實:手機端側(cè)要跑越來越強的 AI,內(nèi)存就是最硬的瓶頸。誰能用更少的內(nèi)存跑更強的模型,誰就掌握了下一輪競爭的主動權(quán)。

      實際上,如果結(jié)合整個 AI 產(chǎn)業(yè)正在經(jīng)歷的陣痛,價值又會更上一層樓:4 月時,高盛把全年 DRAM 價格漲幅預(yù)期上調(diào)到 280%,美銀預(yù)估全球 HBM 市場將達(dá)到 546 億美元。


      AI 基礎(chǔ)設(shè)施最緊缺的資源就是內(nèi)存,6 倍顯存紅利意味著不增加物理內(nèi)存,就能把模型能力提升數(shù)倍。在內(nèi)存持續(xù)漲價的情況下,這不是優(yōu)化,是剛需。

      三值量化不是「用精度換內(nèi)存」的妥協(xié)。當(dāng) 97%的能力被保留下來時,說明傳統(tǒng) 16 位模型里大量的精度可能是冗余的。三個值,足以承載一個大模型的絕大部分知識。低比特不再是工程上的節(jié)省手段,而是一種新的權(quán)重知識承載方式。

      為什么是面壁智能,為什么是現(xiàn)在

      當(dāng) AI 從云端走向終端,端側(cè)模型正在成為個人智能設(shè)備的核心能力。手機、電腦、車機,每一個貼近用戶的終端都在等一個足夠小、足夠強、足夠省內(nèi)存的模型。這條賽道的勝負(fù)手,不會是那些只會把模型做大的團隊,而是能把模型做小、做輕、做到真正能跑起來的玩家。

      為什么是面壁智能,能在端側(cè)大模型這條路上,一直走在前沿?這個問題的答案不在 BitCPM-CANN 本身,而在這家公司過去幾年,一直在做的一件看起來有些「不合群」的事。

      面壁智能從成立之初就押注效率,在國內(nèi)大多數(shù)團隊追逐更大模型的時候,他們花了大量時間做底層訓(xùn)練框架 BM-Train,解決「怎么用更少的資源,訓(xùn)出足夠好的模型」,這套基礎(chǔ)設(shè)施積累是后來一切的起點。

      在 1.58-bit 方向上,面壁智能的判斷早于行業(yè)共識。許多數(shù)團隊還在猶豫極低比特是否可行時,面壁智能就選定了這條路線,先在 GPU 上跑通了完整的訓(xùn)練流程和方法論,再整體遷移到昇騰平臺上。可以說,BitCPM-CANN 不是把一個模型移植到了國產(chǎn)芯片上,而是把一整套經(jīng)過驗證的訓(xùn)練方法、效率路線和工程體系,搬進了國產(chǎn)算力的底座。

      在模型層面,面壁智能的端側(cè)模型 MiniCPM 系列在 GitHub 上積累了超過 3 萬顆星,Hugging Face 開源總下載量超過 3000 萬,是端側(cè)大模型領(lǐng)域最受歡迎的中國開源模型家族。


      BitCPM-CANN 正是 MiniCPM 家族向三值量化的延伸,遠(yuǎn)不止一個展示性的「PPT 模型」,是一個真正可復(fù)用的工程地基。它背后的訓(xùn)練鏈路已經(jīng)被沉淀為昇騰低比特訓(xùn)練的基礎(chǔ)設(shè)施,后續(xù)所有想在昇騰上做低比特訓(xùn)練的團隊,都可以在同一套底座上起步。

      值得一提的是,BitCPM-CANN 還在華為昇騰上完成了端到端的三值訓(xùn)練,訓(xùn)練效率達(dá)到常規(guī)基線的 95%。這證明了這套方法論不依賴特定硬件平臺,國產(chǎn)算力同樣可以跑通。


      不是等硬件變得足夠強大來適應(yīng)模型,要讓模型變得足夠聰明來適應(yīng)硬件。

      從訓(xùn)練端的華為昇騰,到推理端的終端芯片,再到開源的模型和訓(xùn)練腳本,這是一條完整的國產(chǎn)閉環(huán),框架國產(chǎn),芯片國產(chǎn),模型國產(chǎn),方法論自主。面壁智能的下一步已經(jīng)明確:進一步提升模型的能力保留率,用 MoE 架構(gòu)擴展更大規(guī)模模型的容量,把 6 倍顯存紅利完整釋放到部署中。更長遠(yuǎn)的目標(biāo),是覆蓋從預(yù)訓(xùn)練到對齊的全流程低比特化。

      從底層訓(xùn)練框架 BM-Train,到端側(cè)模型家族 MiniCPM,再到 BitCPM-CANN,面壁智能用幾年時間搭建了一套完整的端側(cè)大模型技術(shù)體系。在全球賽道上,面對微軟、PrismML,面壁智能展現(xiàn)出了獨特的不同優(yōu)勢之處在于:從框架、方法論、模型到芯片適配,構(gòu)建了一條完整的端側(cè)技術(shù)路線。

      當(dāng) AI 競爭從「誰的模型更大」轉(zhuǎn)向「誰能讓智能真正跑在每一臺設(shè)備上」時,掌握端側(cè)技術(shù)話語權(quán)的人,才站在了最有利的位置。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      山西礦難,一場早有預(yù)兆的禍?zhǔn)?>
    </a>
        <h3>
      <a href=鳳凰WEEKLY
      2026-05-25 10:44:39
      新希望負(fù)債800億,一頭豬虧280元,低消費+高投資讓實業(yè)內(nèi)卷至死

      新希望負(fù)債800億,一頭豬虧280元,低消費+高投資讓實業(yè)內(nèi)卷至死

      知識圈
      2026-05-24 20:40:19
      納稅起征點調(diào)整!2026年1月1日起執(zhí)行

      納稅起征點調(diào)整!2026年1月1日起執(zhí)行

      新浪財經(jīng)
      2026-05-25 03:41:31
      沒有先進光刻機也能造出高端芯片,華為發(fā)表的“韜(τ)定律”是什么?

      沒有先進光刻機也能造出高端芯片,華為發(fā)表的“韜(τ)定律”是什么?

      每日經(jīng)濟新聞
      2026-05-25 13:46:09
      黎家盈丈夫:我停了工作,帶著三個孩子遷京,只為她上太空

      黎家盈丈夫:我停了工作,帶著三個孩子遷京,只為她上太空

      云景侃記
      2026-05-25 11:36:42
      一次補稅超5億,知名醫(yī)院怎么了?

      一次補稅超5億,知名醫(yī)院怎么了?

      中國新聞周刊
      2026-05-24 22:21:38
      只差臨門一腳!美伊協(xié)議曝光,以色列被踢出局

      只差臨門一腳!美伊協(xié)議曝光,以色列被踢出局

      上游新聞
      2026-05-24 22:12:11
      太夸張了!“捐精1L送奧迪A4L”廣告出圈,網(wǎng)友:捐精1升得一輩子

      太夸張了!“捐精1L送奧迪A4L”廣告出圈,網(wǎng)友:捐精1升得一輩子

      火山詩話
      2026-05-25 07:09:54
      女干部的金耳環(huán)!

      女干部的金耳環(huán)!

      新動察
      2026-05-25 16:18:44
      稻城亞丁景區(qū):違規(guī)放行員工已被處理,禁止社會車輛進入景區(qū)

      稻城亞丁景區(qū):違規(guī)放行員工已被處理,禁止社會車輛進入景區(qū)

      映射生活的身影
      2026-05-25 16:55:04
      極佳視界物理AGI雙金字塔體系:數(shù)據(jù)與算法如何撐起Scaling Law?

      極佳視界物理AGI雙金字塔體系:數(shù)據(jù)與算法如何撐起Scaling Law?

      機器之心Pro
      2026-05-22 21:27:28
      冷門預(yù)警!鄭欽文法網(wǎng)首輪4-6先丟一盤,若輸球?qū)⒌銮?00

      冷門預(yù)警!鄭欽文法網(wǎng)首輪4-6先丟一盤,若輸球?qū)⒌銮?00

      全景體育V
      2026-05-25 17:59:22
      42萬手封單,“一”字漲停!韓國投資者此前抄底

      42萬手封單,“一”字漲停!韓國投資者此前抄底

      新浪財經(jīng)
      2026-05-25 09:57:42
      波波G3后破門大罵!馬刺今日逼出雷霆13年最低分

      波波G3后破門大罵!馬刺今日逼出雷霆13年最低分

      體壇周報
      2026-05-25 16:36:20
      BBA電動化反擊戰(zhàn),上汽奧迪以“中國式創(chuàng)新”破局

      BBA電動化反擊戰(zhàn),上汽奧迪以“中國式創(chuàng)新”破局

      車市雷達(dá)
      2026-01-09 14:22:03
      女子遺失24克金項鏈,陌生人撿到后扔了,稱“看著不像金的”,失主報警

      女子遺失24克金項鏈,陌生人撿到后扔了,稱“看著不像金的”,失主報警

      上觀新聞
      2026-05-25 14:41:14
      博主“硬剛”稻城亞丁景區(qū)“截斷近40公里省道收費”,多方回應(yīng)

      博主“硬剛”稻城亞丁景區(qū)“截斷近40公里省道收費”,多方回應(yīng)

      上游新聞
      2026-05-25 14:46:47
      福克斯:G3賽后波波維奇沖進更衣室,非常嚴(yán)厲地批評了球隊

      福克斯:G3賽后波波維奇沖進更衣室,非常嚴(yán)厲地批評了球隊

      懂球帝
      2026-05-25 15:22:13
      完了!全完了!幾十萬在美華人的綠卡夢,一夜之間碎了!

      完了!全完了!幾十萬在美華人的綠卡夢,一夜之間碎了!

      安安說
      2026-05-25 11:03:42
      我離職帶走3萬自裝電腦,老板報警,警察看記錄反問:你想賠多少錢

      我離職帶走3萬自裝電腦,老板報警,警察看記錄反問:你想賠多少錢

      麥子情感故事
      2026-05-25 16:01:04
      2026-05-25 19:03:00
      愛范兒 incentive-icons
      愛范兒
      消費科技第一媒體
      38893文章數(shù) 2601753關(guān)注度
      往期回顧 全部

      科技要聞

      華為:沒有先進光刻機也能造出高端芯片

      頭條要聞

      牛彈琴:伊朗現(xiàn)在哭笑不得 美官員讓伊別理特朗普推文

      頭條要聞

      牛彈琴:伊朗現(xiàn)在哭笑不得 美官員讓伊別理特朗普推文

      體育要聞

      如果不好好守門,他可能早就繼承家業(yè)了

      娛樂要聞

      李晨鄭愷跑男停宣:12年元老被邊緣化

      財經(jīng)要聞

      紙包火的秘密:前發(fā)審委員的冒險游戲

      汽車要聞

      啟境GT7定檔5月29日預(yù)售 提供三電機版本

      態(tài)度原創(chuàng)

      教育
      時尚
      房產(chǎn)
      本地
      軍事航空

      教育要聞

      一個傳送帶上的滑塊,在中學(xué)的摩擦力模型中,從上面滑下來的時間與傳送帶運行速度是否相關(guān)?

      薄底鞋失寵!“這雙鞋”突然爆火,夏天穿時髦又好看

      房產(chǎn)要聞

      工抵房騙局!134套房款入私賬!海南這個盤,坑慘買房人!

      本地新聞

      用云錦的方式,打開江蘇南京

      軍事要聞

      俄軍出動“榛樹”導(dǎo)彈襲擊烏克蘭

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 特黄特色大片免费播放| 精品久久久无码中文字幕| www免费视频com| 久久亚洲精品中文字幕一区| 另类专区欧美在线亚洲免费| 欧美肥老太牲交| 91探花在线播放| 亚洲成a人片在线播放观看国产| 国产一卡2卡三卡4卡免费网站| 精品国产自在现线看久久| 亚洲美女久久| 亚洲va久久久噜噜噜久久| 97久久精品国产熟妇高清网| 欧美精品一区二区蜜臀亚洲| 天堂?最新在线8| 久久狠狠色噜噜狠狠狠狠97视色| 国产乱国产乱老熟300部视频| 人妻系列无码专区无码中出| www夜插内射视频网站| 伊人久久福利中文字幕| 苍井空一区二区三区在线观看| 精品视频在线观看免费无码| 国产精品无码久久久久久| 91视频在线观看免费| 大陆一区视频观看| 在线点播亚洲日韩国产欧美| 日本最大成人网站| 国产精品 中文字幕 亚洲 欧美| 99久久精品费精品国产一区二| 国产精品激情欧美可乐视频| www.911国产| 久久婷婷热| 亚洲AⅤ无码日韩AV无码网站| 中文字幕一区日韩在线视频| 久久精品国产再热青青青| 国产成人午夜福利在线播放| 麻豆乱码国产一区二区三区| a国产一区二区免费入口| 99re在线视频观看| 久久中文字幕人妻丝袜系列 | 香港三日本8a三级少妇三级99 |