“芯片圈地震了!”當(dāng)寒序科技(ICY Tech)官宣與三星生態(tài)設(shè)計(jì)伙伴SEMIFIVE完成亞洲首個(gè)8nm嵌入式MRAM(eMRAM)AI芯片流片時(shí),整個(gè)科技圈直接炸鍋——這不僅是國產(chǎn)芯片在先進(jìn)存儲(chǔ)領(lǐng)域的一次“史詩級(jí)”逆襲,更意味著中國AI算力終于撕開了“內(nèi)存墻”這道困住行業(yè)多年的枷鎖!
![]()
要知道,過去十年,全球AI芯片賽道幾乎被英偉達(dá)、AMD等巨頭壟斷,國產(chǎn)芯片雖在制程工藝上拼命追趕,卻總被“內(nèi)存墻”卡脖子:傳統(tǒng)AI芯片依賴SRAM(靜態(tài)隨機(jī)存取存儲(chǔ)器)作為緩存,但SRAM隨著制程微縮,面積效率暴跌、功耗飆升,導(dǎo)致大模型推理時(shí)數(shù)據(jù)搬運(yùn)成本高到離譜,甚至出現(xiàn)“算力還沒耗盡,內(nèi)存先撐不住”的尷尬場面。
而寒序科技這次直接甩出“MRAM+SRAM”混合存儲(chǔ)架構(gòu),用eMRAM替代大部分片上SRAM,相當(dāng)于給AI芯片裝了個(gè)“渦輪增壓發(fā)動(dòng)機(jī)”——存儲(chǔ)密度提升3倍,能效比直接碾壓國際頂尖推理芯片,還能讓20億參數(shù)的大模型在端側(cè)跑起來!這波操作,簡直是“降維打擊”!
一、寒序科技是誰?憑什么能撬動(dòng)三星的8nm工藝?
先說說這次的主角——寒序科技。這家成立僅5年的國產(chǎn)AI芯片企業(yè),堪稱“技術(shù)狂魔”:核心團(tuán)隊(duì)來自北京大學(xué)物理學(xué)院應(yīng)用磁學(xué)中心,專攻自旋電子學(xué)與存算一體技術(shù),手握幾十項(xiàng)MRAM(磁性隨機(jī)存儲(chǔ)器)核心專利,堪稱“國產(chǎn)MRAM的黃埔軍校”。
![]()
而他們的對(duì)手,是三星這種掌握全球最先進(jìn)制程工藝的半導(dǎo)體巨頭——8nm eMRAM工藝,可是三星的“鎮(zhèn)店之寶”,連自家旗艦芯片都未必能用上,寒序科技憑什么能拿到?
答案藏在合作模式里。這次寒序科技與SEMIFIVE的合作,堪稱“技術(shù)+生態(tài)”的完美結(jié)合:寒序科技全程主導(dǎo)底層架構(gòu)設(shè)計(jì),從MRAM比特單元、外圍電路到高帶寬讀出電路,甚至大模型推理算子加速方案,全部自研;而SEMIFIVE則負(fù)責(zé)后端硅實(shí)現(xiàn)與MPW流片支持(MPW即多項(xiàng)目晶圓,能大幅降低流片成本)。
這種“底層架構(gòu)自研+國際生態(tài)落地”的模式,徹底擺脫了傳統(tǒng)ASIC項(xiàng)目依賴標(biāo)準(zhǔn)IP調(diào)用的局限——簡單說,就是寒序科技自己畫圖紙,三星負(fù)責(zé)把圖紙變成實(shí)物,相當(dāng)于“定制款”芯片!
更關(guān)鍵的是,寒序科技在MRAM領(lǐng)域的積累太硬核了。MRAM作為一種新型非易失存儲(chǔ)器,兼具DRAM的高速讀寫、NAND Flash的非易失性(斷電不丟數(shù)據(jù)),且單元尺寸比SRAM小40%以上,功耗低到離譜。但過去受限于材料與工藝,MRAM一直難以商業(yè)化,尤其是8nm這種先進(jìn)制程,全球能玩的企業(yè)屈指可數(shù)。
寒序科技卻憑借自旋電子學(xué)技術(shù),硬生生把eMRAM的讀寫速度、可靠性拉到了可用級(jí)別,甚至能替代片上SRAM——這波操作,直接讓三星都愿意為其開放工藝窗口!
二、技術(shù)亮點(diǎn):混合存儲(chǔ)架構(gòu)+PNM計(jì)算,擊穿“內(nèi)存墻”!
這次寒序科技的芯片,最炸裂的技術(shù)點(diǎn)有兩個(gè):“MRAM+SRAM”混合存儲(chǔ)架構(gòu)和近內(nèi)存處理(PNM)架構(gòu)。咱們一個(gè)一個(gè)說。
1. 混合存儲(chǔ)架構(gòu):用eMRAM替代SRAM,存儲(chǔ)密度暴漲3倍!
傳統(tǒng)AI芯片的“內(nèi)存墻”問題,本質(zhì)是SRAM的“先天缺陷”:隨著制程微縮(比如從14nm到8nm),SRAM的單元面積縮小速度遠(yuǎn)低于晶體管,導(dǎo)致片上緩存占用的面積比例飆升,甚至能占到芯片總面積的50%以上!更糟的是,SRAM的漏電流問題嚴(yán)重,功耗高到離譜——跑個(gè)大模型推理,光是數(shù)據(jù)搬運(yùn)就能耗掉70%的電量,這誰頂?shù)米。?/strong>
寒序科技的解決方案很粗暴:直接用eMRAM替代大部分片上SRAM!eMRAM作為非易失存儲(chǔ)器,斷電也能保存數(shù)據(jù),且單元尺寸比SRAM小40%以上,這意味著同樣面積下,eMRAM能塞進(jìn)3倍的存儲(chǔ)容量!更關(guān)鍵的是,eMRAM的讀寫功耗極低,數(shù)據(jù)搬運(yùn)成本大幅降低,直接解決了“內(nèi)存墻”的核心痛點(diǎn)。
當(dāng)然,寒序科技也沒完全拋棄SRAM——畢竟SRAM的讀寫速度更快,適合高頻訪問的臨時(shí)數(shù)據(jù)。所以他們采用了“MRAM+SRAM”混合架構(gòu):用eMRAM存儲(chǔ)大模型參數(shù)(長期保存),用少量SRAM作為高速緩存(臨時(shí)存儲(chǔ)),既保證了存儲(chǔ)密度,又兼顧了性能。這波操作,堪稱“既要馬兒跑,又要馬兒不吃草”!
![]()
2. PNM計(jì)算架構(gòu):把計(jì)算單元“塞進(jìn)”存儲(chǔ)里,推理速度起飛!
存儲(chǔ)問題解決了,計(jì)算效率也得跟上。寒序科技這次祭出了近內(nèi)存處理(PNM,Processing Near Memory)架構(gòu),簡單說就是把計(jì)算單元直接集成到存儲(chǔ)模塊里,讓數(shù)據(jù)“原地計(jì)算”,避免反復(fù)搬運(yùn)。這招有多狠?舉個(gè)例子:傳統(tǒng)AI芯片跑Transformer推理時(shí),數(shù)據(jù)需要在存儲(chǔ)和計(jì)算單元之間來回搬運(yùn),耗時(shí)占整個(gè)推理過程的60%以上;而PNM架構(gòu)下,數(shù)據(jù)直接在存儲(chǔ)模塊里完成計(jì)算,搬運(yùn)時(shí)間幾乎為零,推理速度直接翻倍!
更絕的是,寒序科技還針對(duì)Transformer的關(guān)鍵算子(比如GEMV,通用矩陣向量乘法)做了硬件加速優(yōu)化。這意味著,同樣跑20億參數(shù)的大模型,寒序的芯片能比傳統(tǒng)芯片快30%,功耗卻低40%!這性能,已經(jīng)對(duì)標(biāo)國際頂尖推理芯片(比如英偉達(dá)的Orin、高通的Cloud AI 100),甚至在存儲(chǔ)密度和能效比上實(shí)現(xiàn)了超越——國產(chǎn)芯片,終于能挺直腰板和國際巨頭掰手腕了!
三、應(yīng)用場景:從人形機(jī)器人到私有AI Agent,端側(cè)AI的“核彈級(jí)”算力!
技術(shù)再牛,最終得落地才有價(jià)值。寒序科技這次流片的芯片,主要聚焦三大場景:私有AI Agent、人形機(jī)器人、具身智能與云端推理中心。這些場景有個(gè)共同點(diǎn):對(duì)功耗、空間、實(shí)時(shí)性要求極高,傳統(tǒng)芯片根本玩不轉(zhuǎn)!
1. 私有AI Agent:你的“數(shù)字分身”,終于能離線跑了!
現(xiàn)在大火的AI Agent(智能體),比如ChatGPT的“私人定制版”,需要實(shí)時(shí)處理用戶請(qǐng)求、調(diào)用大模型推理。但問題來了:如果依賴云端推理,不僅延遲高(網(wǎng)絡(luò)傳輸要時(shí)間),還涉及隱私泄露風(fēng)險(xiǎn)(數(shù)據(jù)得傳到服務(wù)器);如果用端側(cè)推理,傳統(tǒng)芯片又跑不動(dòng)大模型(存儲(chǔ)和算力不夠)。寒序科技的芯片,直接解決了這個(gè)矛盾!
20億參數(shù)的大模型,在端側(cè)就能跑,且功耗低到能用電池供電——這意味著,你的AI Agent可以完全離線運(yùn)行,數(shù)據(jù)不出設(shè)備,隱私有保障;還能實(shí)時(shí)響應(yīng),延遲低于10毫秒,體驗(yàn)絲滑如本地應(yīng)用。未來,你的手機(jī)、智能音箱、甚至智能眼鏡,都能裝個(gè)“數(shù)字分身”,隨時(shí)幫你處理任務(wù),這畫面,想想就酷!
![]()
2. 人形機(jī)器人:告別“智障”,終于能“獨(dú)立思考”了!
人形機(jī)器人為啥一直“智障”?核心瓶頸是算力不夠:傳統(tǒng)機(jī)器人芯片,要么用低功耗CPU(算力弱,只能做簡單動(dòng)作),要么用高功耗GPU(體積大,散熱難,成本高)。而寒序科技的芯片,用eMRAM的高密度存儲(chǔ),塞進(jìn)了20億參數(shù)的大模型,還能實(shí)時(shí)處理視覺、語音、運(yùn)動(dòng)控制等多模態(tài)數(shù)據(jù)——這意味著,機(jī)器人終于能“獨(dú)立思考”了!
比如,未來的人形機(jī)器人可以邊走邊識(shí)別環(huán)境,邊和你對(duì)話邊規(guī)劃路徑,甚至能根據(jù)你的情緒調(diào)整互動(dòng)方式——這哪是機(jī)器人?分明是“鋼鐵俠”里的賈維斯!更關(guān)鍵的是,寒序芯片的功耗極低,機(jī)器人用電池就能跑一整天,徹底擺脫“充電兩小時(shí),工作五分鐘”的尷尬。
3. 具身智能與云端推理中心:GPU之外的“高能效備胎”!**
除了端側(cè),寒序芯片還能適配具身智能(Embodied AI,即能感知環(huán)境的智能體)和云端推理中心。在云端場景,它雖然比不上英偉達(dá)GPU的“暴力算力”,但勝在能效比高、成本低——同樣性能下,寒序芯片的功耗只有GPU的1/3,成本只有1/2。這對(duì)于需要大規(guī)模部署推理服務(wù)的場景(比如智能客服、數(shù)據(jù)標(biāo)注、內(nèi)容生成),簡直是“降本神器”!
四、行業(yè)影響:國產(chǎn)芯片的“里程碑”,AI算力的“新范式”!
寒序科技這次流片成功,影響遠(yuǎn)不止技術(shù)層面——它標(biāo)志著國產(chǎn)芯片在先進(jìn)存儲(chǔ)與存算架構(gòu)領(lǐng)域,終于實(shí)現(xiàn)了從“跟跑”到“并跑”甚至“領(lǐng)跑”的跨越!
1. 技術(shù)層面:MRAM商業(yè)化邁出關(guān)鍵一步!
MRAM作為下一代存儲(chǔ)技術(shù),一直被寄予厚望,但商業(yè)化進(jìn)程緩慢。寒序科技這次用8nm eMRAM跑通了AI芯片,證明MRAM在高性能計(jì)算領(lǐng)域的可行性——未來,MRAM很可能替代SRAM,成為AI芯片的主流存儲(chǔ)方案!這不僅會(huì)重塑芯片設(shè)計(jì)邏輯,還可能帶動(dòng)整個(gè)半導(dǎo)體產(chǎn)業(yè)鏈的變革(比如材料、設(shè)備、封裝等環(huán)節(jié))。
2. 產(chǎn)業(yè)層面:國產(chǎn)AI芯片擺脫“卡脖子”!
過去,國產(chǎn)AI芯片總被詬病“制程落后”“架構(gòu)落后”,但寒序科技這次用“混合存儲(chǔ)+PNM計(jì)算”的創(chuàng)新架構(gòu),繞開了制程限制,直接在能效比和存儲(chǔ)密度上實(shí)現(xiàn)了超越。這意味著,即使未來被限制使用先進(jìn)制程,國產(chǎn)芯片也能通過架構(gòu)創(chuàng)新保持競爭力——這才是真正的“技術(shù)自主”!
3. 生態(tài)層面:國際合作“新模板”!
寒序科技與SEMIFIVE的合作,為國產(chǎn)芯片企業(yè)提供了新思路:與其閉門造車,不如借助國際生態(tài)的力量,快速實(shí)現(xiàn)技術(shù)落地。這種“底層自研+生態(tài)合作”的模式,既能保證核心技術(shù)自主可控,又能利用全球資源加速商業(yè)化,未來可能成為國產(chǎn)芯片“出海”的主流路徑。
![]()
五、總結(jié):寒序科技的“一小步”,國產(chǎn)芯片的“一大步”!
寒序科技這次流片成功,看似只是“一顆芯片”的突破,實(shí)則是國產(chǎn)芯片在先進(jìn)存儲(chǔ)、存算架構(gòu)、國際合作等多個(gè)維度的全面進(jìn)階。它用實(shí)力證明:國產(chǎn)芯片不僅能追趕,還能超越;不僅能做“備胎”,還能當(dāng)“主角”!
未來,隨著MRAM技術(shù)的成熟和PNM架構(gòu)的普及,AI芯片的競爭將不再局限于制程工藝,而是轉(zhuǎn)向架構(gòu)創(chuàng)新與能效比——而這,正是國產(chǎn)芯片最擅長的領(lǐng)域!所以,別再說“國產(chǎn)芯片不行”了——寒序科技們,正在用技術(shù)重新定義規(guī)則!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.