<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      小模型,也是嵌入式的未來

      0
      分享至

      這兩天,英偉達一個最新研究結論讓業界備受關注——小型語言模型(SLM)才是智能體的未來。緊接著,英偉達又拋出了自己的全新小型語言模型:Nemotron-Nano-9B-V2,該模型在部分基準測試中達到了同類產品中的最高性能。

      事實上,小型語言模型(SLM)的風,也刮到了MCU和MPU領域。

      小模型,就是“壓小”的大模型

      小型語言模型(SLM)也許我們早有所接觸。SLM 的參數范圍從幾百萬到幾十億不等,而 LLM 則具有數千億甚至數萬億參數。

      SLM是由LLM壓縮而來,壓縮模型需要在縮小模型的同時,盡可能保留模型的準確性。常見方法如下:

      • 知識蒸餾:利用從大型“教師”模型轉移的知識來訓練一個較小的“學生”模型;

      • 剪枝:移除神經網絡架構中冗余或不那么重要的參數;

      • 量化:降低計算中使用的數值精度(例如,將浮點數轉換為整數)。

      小型語言模型比大型模型更緊湊、更高效。因此,SLM需要較少的內存和計算能力,非常適合資源受限的邊緣或者嵌入式設備。

      許多小而強大的語言模型已經出現,證明大小并非一切。常見的10億到40億的SLM包括Llama3.2-1B(Meta開發的10億參數變體)、Qwen2.5-1.5B(阿里巴巴的15億參數模型)、DeepSeeek-R1-1.5B(DeepSeek的15億參數模型)、SmolLM2-1.7B(HuggingFaceTB,的17億參數模型)、Phi-3.5-Mini-3.8B(微軟的38億參數模型)、Gemma3-4B(Google DeepMind的40億參數模型)。

      跑SLM,靠得不光是算力

      對MPU來說,跑SLM,似乎不是什么難題。但對開發人員來說,如何知道MCU支持是否支持運行生成式AI?

      這個問題沒有單一、直接的答案——不過有一個硬性要求,即MCU的神經處理單元(NPU)必須能夠加速Transformer運行。

      除此之外,跑生成式AI,對于MCU的帶寬系統總線以及以及大容量、高速、緊密耦合的內存配置有要求。

      其實,現在很多人都去只用GOPS(十億次運算每秒)或TOPS(萬億次運算每秒)來比較微控制器的原始吞吐量,目前性能最佳的MCU能提供高達250GOPS的算力,而用于生成式AI的MCU將至少提供兩倍于此的性能。但原始吞吐量并非衡量實際系統性能的理想指標。

      因為成功的生成式AI應用程序需要支持Transformer運算,會在系統內部、內存、神經處理單元、中央處理器以及圖像信號處理器等外圍功能之間傳輸大量數據。因此,一個具有高原始吞吐量的系統理論上或許能快速處理大量數據,但如果系統無法將數據快速傳輸給神經處理單元,實際性能就會十分緩慢,令人失望。

      當然,對MPU來說,大帶寬、內存、總線之間的緊密耦合也至關重要。

      Aizip與Renesas合作的SLM項目

      早在去年8月,Aizip就與Renesas攜手合作,在MPU上展示了用于邊緣系統應用的超高效SLM和緊湊型AI Agents,這些小巧而高效的模型已經集成到基于 Arm Cortex-A55的Renesas RZ/G2L和RZ/G3S主板中。

      Aizip創建了一系列超高效的小型語言模型(SLM)和人工智能代理(AI Agents),名為 Gizmo,規模從3億到20億個參數不等。這些型號支持多種平臺,包括適用于廣泛應用的 MPU和應用處理器。

      SLM使設備邊緣應用程序上的AI代理能夠提供與大型語言模型(LLM)相同的功能,但在邊緣占用空間上。設備上模型具有增強的隱私保護、彈性作和節省成本等優勢。雖然一些公司已經成功地減小了手機語言模型的大小,但確保在低成本邊緣設備上為自動化應用提供準確的工具調用仍然是這些 SLM 面臨的重大挑戰。

      據介紹,在運行頻率為1.2 GHz的單個A55內核的RZ/G2L上,這些SLM可以實現不到3秒的響應時間。

      MCU,也在加大對SLM投入

      Alif Semiconductor最近發布了最新系列的MCU和融合處理器——Ensemble E4、E6和E8,便主要針對支持SLM在內的生成式AI模型的運行。與此同時,Alif是首家使用 Arm Ethos-U85 NPU(神經處理單元)的芯片供應商,該芯片支持基于Transformer的機器學習網絡。

      根據基準測試結果顯示,該系列在不到2毫秒的時間內進行高能效物體檢測、圖像分類時間不到8毫秒、在E4設備上執行的SLM在生成文本以根據用戶提供的提示構建故事時僅消耗36mW的功率。

      Ensemble E4(MCU)采用雙Arm Cortex-M55內核,Ensemble E6和E8融合處理器分別基于Arm Cortex-A32內核和雙Cortex-M55內核,值得注意的是E4/E6/E8均搭載雙Ethos-U55+Ethos-U85,算力非常強大。


      Alif認為,相比其他制造商,他們布局更早,因為第一代Ensemble MCU系列早在2021年就發布了,從那時起我們就一直在批量出貨E1、E3、E5 和 E7設備。而在其他MCU廠商還停留在第一代AI MCU時,Alif就發布了第二代產品,同時是業界首款支持基于Transformer的網絡的MCU,是LLM和其他生成式AI模型的基礎。

      SLM會是嵌入式的未來

      SLM在大幅壓縮模型體積的同時,盡可能保留了模型的準確性。這種高效、緊湊的特性,使其完美契合了資源受限的邊緣和嵌入式設備,為這些設備帶來了前所未有的智能能力。

      事實上,邊緣AI的未來圖景正在徐徐展開,SLM也會是MCU和MPU廠商會布局的關鍵領域之一。

      比如,意法半導體的STM32N6、英飛凌PSoC Edge最新一代MCU、TI的AM62A和TMS320F28P55x、恩智浦的i.MX RT700和i.MX 95、ADI的MAX7800X都開始重視NPU。

      嵌入式AI最初主要是在Linux系統上運行的相對昂貴的基于微處理器的產品的一項功能。但很快,市場意識到邊緣和端點設備中也有AI的空間——其中許多設備都是基于MCU。所以,在2025年下半年,先進的MCU廠商都將提供AI功能的產品納入其產品組合中。這些廠商的NPU分為Arm Ethos IP一派和自研一派。目前來看,最新的Ethos-U85開始支持Transformer,并且在半年前展示了搭載SLM的效果,其他廠商也在不斷跟進。在未來,相信SLM也會徹底改變MCU和MPU的格局。

      參考文獻

      [1]IBM:https://www.ibm.com/cn-zh/think/topics/small-language-models

      [2]Hugging-Face:https://hugging-face.cn/blog/jjokah/small-language-model

      [3]Alif:https://alifsemi.com/comparing-mcus-for-generative-ai-its-not-just-about-the-gops/

      [4]Alif:https://alifsemi.com/who-wins-in-the-race-to-make-ai-mcus/

      [5]Arm:https://newsroom.arm.com/blog/small-language-model-generative-ai-edge

      歡迎將我們設為“星標”,這樣才能第一時間收到推送消息。

      關注EEWorld旗下訂閱號:“機器人開發圈”

      回復“DS”領取《DeepSeek:從入門到精通》完整版

      掃碼添加小助手回復“機器人”

      進群和電子工程師們面對面交流經驗


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      性,已成為職場流通的硬資源!

      性,已成為職場流通的硬資源!

      燈錦年
      2026-05-14 00:10:06
      臺灣網友曾發出質疑:我們日子過得明明挺好,為什么還要回歸?

      臺灣網友曾發出質疑:我們日子過得明明挺好,為什么還要回歸?

      南風不及你溫柔
      2026-05-14 09:03:21
      馬斯克幼子的虎頭包走紅,品牌方:少數民族繡娘手工縫制,優惠后每個338元,正緊急追加生產

      馬斯克幼子的虎頭包走紅,品牌方:少數民族繡娘手工縫制,優惠后每個338元,正緊急追加生產

      揚子晚報
      2026-05-14 22:32:00
      今夜,芯片股集體爆發!中國資產,直線暴漲:阿里、京東、百度大漲超6%

      今夜,芯片股集體爆發!中國資產,直線暴漲:阿里、京東、百度大漲超6%

      中國基金報
      2026-05-14 00:21:19
      普京急眼了

      普京急眼了

      求實處
      2026-05-14 21:52:11
      停更3年,千萬粉絲網紅改名宣布回歸,4小時漲粉240萬

      停更3年,千萬粉絲網紅改名宣布回歸,4小時漲粉240萬

      天津生活通
      2026-05-14 10:34:09
      花旗將獲中國第七張外商獨資券商牌照

      花旗將獲中國第七張外商獨資券商牌照

      風向觀察
      2026-05-14 08:46:29
      國宴上一幕!馬斯克喘著粗氣,面前擺滿空酒杯,網友:喝大了?

      國宴上一幕!馬斯克喘著粗氣,面前擺滿空酒杯,網友:喝大了?

      消失的電波
      2026-05-14 22:21:16
      形勢有多嚴峻?坐標上海:80末90初程序員都開始失業,評論區炸了

      形勢有多嚴峻?坐標上海:80末90初程序員都開始失業,評論區炸了

      慧翔百科
      2026-05-14 09:00:11
      正式取消!知名985高校:公眾進校不用預約了

      正式取消!知名985高校:公眾進校不用預約了

      南方都市報
      2026-05-14 13:02:01
      肖磊:特朗普訪華團隊里有個人非常特殊

      肖磊:特朗普訪華團隊里有個人非常特殊

      肖磊看世界
      2026-05-14 14:06:24
      路透:聯想、富士康獲準為英偉達H200在中國分銷商 聯想確認

      路透:聯想、富士康獲準為英偉達H200在中國分銷商 聯想確認

      格隆匯
      2026-05-14 14:58:08
      中美關系,有了新定位

      中美關系,有了新定位

      中國新聞周刊
      2026-05-14 16:01:38
      5月14日俄烏最新:意想不到的轉折

      5月14日俄烏最新:意想不到的轉折

      西樓飲月
      2026-05-14 18:53:06
      人大代表:建議將機關企事業單位工齡滿30年的帶薪年假延長到20天

      人大代表:建議將機關企事業單位工齡滿30年的帶薪年假延長到20天

      細說職場
      2026-05-14 15:42:32
      女子稱關閉支付功能后,180多萬元凌晨莫名通過支付寶捐給慈善機構;支付寶:賬密是用戶透露出去的

      女子稱關閉支付功能后,180多萬元凌晨莫名通過支付寶捐給慈善機構;支付寶:賬密是用戶透露出去的

      大風新聞
      2026-05-14 18:15:39
      中方為特朗普舉行歡迎宴會 現場全是中國元素

      中方為特朗普舉行歡迎宴會 現場全是中國元素

      看看新聞Knews
      2026-05-14 20:04:03
      特朗普來華,外交學院專家臉被打腫了

      特朗普來華,外交學院專家臉被打腫了

      吃瓜體
      2026-05-14 13:37:12
      “那家伙在空軍1號前居然一動不動”!美媒注意到一名中國儀仗兵

      “那家伙在空軍1號前居然一動不動”!美媒注意到一名中國儀仗兵

      阿龍聊軍事
      2026-05-14 11:02:15
      特朗普帶美國經濟半壁江山訪華,中美博弈,換賽道了

      特朗普帶美國經濟半壁江山訪華,中美博弈,換賽道了

      光遠看經濟
      2026-05-14 16:43:40
      2026-05-15 01:08:49
      EEWorld電子工程世界 incentive-icons
      EEWorld電子工程世界
      即時參與討論電子工程世界最火話題,搶先知曉電子工程業界資訊。
      290文章數 27關注度
      往期回顧 全部

      科技要聞

      馬斯克說會談很順利 黃仁勛點贊 庫克比耶

      頭條要聞

      外媒詢問中方對魯比奧的制裁是否已經解除 外交部回應

      頭條要聞

      外媒詢問中方對魯比奧的制裁是否已經解除 外交部回應

      體育要聞

      爭議抽象天王山,和季后賽最穩定中鋒

      娛樂要聞

      何九華官宣當爸!全程不提孩子媽

      財經要聞

      李強會見美國工商界代表

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      時尚
      教育
      旅游
      藝術
      軍事航空

      白色上衣+彩色下裝:今年夏天最火搭配,時髦又減齡!

      教育要聞

      老師的績效也隨工資發了,領導好像不太能拿捏老師們了!

      旅游要聞

      日照五蓮:云海日出映青山

      藝術要聞

      帕特里克鏡頭下的戴安娜:光影與情感的極致呈現

      軍事要聞

      美以伊戰爭期間以總理密訪阿聯酋

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 图片区小说区av区| 无码高潮爽到爆的喷水视频app| 亚洲精品区二区三区蜜桃| 日韩乱码人妻无码中文字幕视频 | 亚洲青涩在线| 国产在线拍揄自揄视频导航| 亚洲人妻一区二区av| 国产成人精品午夜2022| 亚洲国产成人无码网站大全 | 无码熟妇人妻AV在线影片免费| 亚洲片一区二区三区| 亚洲天堂网2014| 天堂网www天堂在线资源下载| 久久久久成人精品无码中文字幕| 在线 国产 欧美 专区| 国产制服丝袜在线视频| 中文字幕熟妇无码专区 | 精品露脸国产偷人在视频| 精品人妻无码| 国产无码精品在线播放| 国产三级精品三级在线专区1| 久久久久夜夜夜综合国产| 又粗又黄又硬又爽的免费视频| 日韩激情一区二区无码AV| 亚洲综合色婷婷中文字幕| 亚洲天堂二区| 日韩精品 中文字幕 视频在线 | 国产精品国产三级国产AV主播 | 久久一日本道色综合久久| 欧美19综合中文字幕| 国产精品无码一二区免费| 无码人妻精品一区二区三区下载| 性感美女久久久| 成人看的污污超级黄网站免费 | 青青AV| 精品视频国产香蕉尹人视频| 别揉我奶头~嗯~啊~的视频| 男人的天堂久久精品激情| 精品精品国产高清a毛片牛牛 | 特黄大片又粗又大又暴| 久久久久成人精品一区二区|