<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      挑戰(zhàn)英偉達算力霸權(quán)?多倫多一家創(chuàng)企將大模型“刻進”芯片

      0
      分享至



      翼言商業(yè)觀察

      是破局突圍,還是刻舟求劍?

      在硅谷當下的宏大敘事中,算力即權(quán)力。

      英偉達的 GPU 似乎成了通往AGI唯一且昂貴的門票。當整個行業(yè)都在狂熱地堆疊“更大、更貴、更耗電”的 GPU 集群時,一種極具顛覆性的底層技術叛逆卻在暗處悄然發(fā)生。


      近日,一家成立不到三年、位于多倫多的初創(chuàng)公司 Taalas 拋出了一個讓半導體與 AI 業(yè)界側(cè)目的方案:他們將 Meta 的 Llama 大模型直接“硬連線”(Hardwired)進了 ASIC(專用集成電路)芯片。 這并非一次常規(guī)的硬件制程升級,而是一場物理層面的暴力重構(gòu)。

      由Tenstorrent前聯(lián)合創(chuàng)始人Ljubisa Bajic帶隊的這群工程師,不再依賴昂貴的HBM顯存,拋棄了液冷:模型不再是以軟件代碼的形式運行在通用硬件上,也不再需要頻繁地從高帶寬顯存(HBM)中吞吐成百上千 GB 的權(quán)重數(shù)據(jù)。Llama 龐大的神經(jīng)網(wǎng)絡結(jié)構(gòu)和數(shù)十億參數(shù),被直接固化進物理電路,成為了芯片本身——芯片即模型,模型即芯片。

      在這塊采用臺積電6納米工藝、面積達815平方毫米的芯片上,單用戶運行Llama 3.1 8B的推理吞吐達到了令人瞠目的17,000 tokens/秒。作為對比,這個速度是英偉達最頂尖GPU的數(shù)十倍,是人類閱讀或思考速度的成百上千倍。生成一部詳盡的二戰(zhàn)逐月編年史,僅需0.138秒。

      這一反常識的技術路線,究竟是打破算力瓶頸的終極突破,還是無視模型迭代規(guī)律的“刻舟求劍”?

      一、歷史的鐘擺

      天下苦“內(nèi)存墻”久矣

      Taalas 之所以做如此激進的嘗試,是因為當前 AI 產(chǎn)業(yè)有一個隱疾:內(nèi)存墻(Memory Wall)。

      自計算機誕生以來,統(tǒng)治整個行業(yè)的基石是“馮·諾依曼架構(gòu)”,其設計中就存在計算與存儲分離的特點:需要計算時,就從后臺把數(shù)據(jù)搬運到舞臺上,算完再搬回去。


      在模型只有幾兆、幾十兆的時代,這個架構(gòu)運轉(zhuǎn)良好。但是,當大語言模型膨脹到幾百億、上千億參數(shù)時,這一經(jīng)典架構(gòu)正在成為最大的絆腳石。GPU 運行大模型進行推理時,它并沒有把大部分精力花在計算上,而是被迫變成了一個疲于奔命的“搬運工”——海量的模型權(quán)重數(shù)據(jù)需要在顯存和計算單元之間來回穿梭,高達 80% 的功耗和延遲都浪費在了這種數(shù)據(jù)的物理搬運上。這不僅造就了英偉達龐大的護城河,也直接捧紅了價格極其昂貴的 HBM 存儲芯片。AI行業(yè)苦“內(nèi)存墻”久矣,它讓 AI 推理的成本居高不下,讓數(shù)據(jù)中心變成了吞噬電力的巨獸。

      Taalas 的 ASIC 路線,本質(zhì)上是對這筆“算力稅”的徹底逃避。當模型權(quán)重不再是以數(shù)據(jù)的形式存在于內(nèi)存中,而是變成了固化的晶體管開閉狀態(tài),數(shù)據(jù)搬運的動作就在物理層面上被抹除了。

      二、絕對速度與“電子牛馬”

      商業(yè)落地的場景價值

      Taalas打破內(nèi)存墻帶來的最直接后果,是成本和能效比的恐怖斷層。


      傳統(tǒng)的GPU數(shù)據(jù)中心是名副其實的“電老虎”,動輒需要液冷伺候。而Taalas的HC1芯片,單顆功耗僅約250W。即使部署10顆芯片,總功耗不過2.5千瓦,僅靠常規(guī)的空氣冷卻就能穩(wěn)定運行。根據(jù)Taalas官方及業(yè)界測算,其百萬Token的推理成本僅為0.0075美元左右,是傳統(tǒng)GPU方案的二十分之一甚至更低。在“唯快不破”和“降本增效”成為行業(yè)鐵律的今天,這組數(shù)據(jù)的沖擊力毋庸多言。

      從工程學的角度來看,這顯然是一次驚人的效率躍升;而在模型快速迭代的今天,一個不能更新、不能運行其他模型的芯片,聽起來顯然又像個笑話。但是,如果我們跳出“打造全知全能AGI”的宏大敘事,將目光投向海量的商業(yè)垂直場景,也許會發(fā)現(xiàn),這種“固化”非但不是缺陷,反而可能是某些場景下的最優(yōu)解。

      在真實的商業(yè)世界里,并非所有場景都需要一個通曉量子力學、能寫莎士比亞十四行詩的GPT5甚至更新的模型。大部分場景需要的,是一個極其穩(wěn)定、便宜、速度極快且不需要休息的“電子牛馬”。


      想象一下工業(yè)流水線上的毫秒級殘次品視覺識別、智能汽車里需要絕對零延遲響應的端側(cè)語音中樞、數(shù)以億計的家用陪伴機器人或兒童玩偶……在這些場景中,企業(yè)根本不在乎你能否兼容最新的大模型框架,他們在乎的是:能不能用幾美分的成本,把手頭這件特定的任務做到光速?

      Taalas的HC1,正好可以解決這種“規(guī)模化單一任務”。當17,000 tokens/秒的速度應用在語音助手上,AI的回答將比人類的神經(jīng)反射還要快,“等待LLM思考”的轉(zhuǎn)圈動畫將徹底成為歷史。一個原本需要幾百瓦功率、必須插在液冷服務器上的大模型,未來也許只需幾瓦的電量,就能被輕易塞進一臺掃地機器人、一部智能手機,甚至是一副輕薄的AI眼鏡中。真正的“萬物皆 AI”,也只有在算力和功耗被極度壓縮后才可能實現(xiàn)。

      三、刻舟求劍的隱憂

      被“凍結(jié)”在芯片里的智慧

      盡管如此,鑒于當前 AI 算法一日千里的演進速度,Taalas 的路線極具風險的另一面也是不容忽視的。將流動的軟件代碼固化為冰冷的物理電路,意味著犧牲了靈活性。這里有兩個極其尖銳的現(xiàn)實錯位。

      首先是迭代周期的錯位。如今,開源大模型的進化是以“月”甚至“周”為單位的。但一顆先進制程的芯片,從架構(gòu)設計、流片到最終量產(chǎn),通常需要 18 到 24 個月。而當它走下產(chǎn)線時,它所“凍結(jié)”的 Llama 模型,在日新月異的算法世界里,是否已經(jīng)淪為一個落后的“古董”?

      再者是容錯率的錯位。大模型如果出現(xiàn)嚴重的幻覺或安全漏洞,可以通過微調(diào)或推送 OTA 補丁來迅速修復。但是,一塊已經(jīng)刻好物理電路的芯片該怎么打補丁呢?一旦芯片內(nèi)固化的模型存在致命缺陷,整批昂貴的芯片大概率只能淪為硅垃圾。

      對于這些致命的商業(yè)風險,Taalas也給出了他們的防守策略。首先是微調(diào)的保留, HC1雖然鎖死了基礎權(quán)重,但依然保留了對低秩自適應(LoRA)微調(diào)的支持。這意味著企業(yè)可以在物理大模型的外部,外掛小型的“知識補丁”來調(diào)整特定任務的表現(xiàn)。其次是極速的物理迭代,Taalas CEO 透露,改變模型并不需要重新設計整個底層硅片,而只需更改芯片最上層的兩層金屬層。這種制造工藝的創(chuàng)新,將新模型的硬件化周期壓縮到了驚人的兩個月,從而幫助模型實現(xiàn)小幅迭代。

      縱然如此,這依然是一場與時間賽跑的豪賭。在這場博弈中,Taalas試圖用硬件的極致靜態(tài),去捕捉 AI 算法的極致動態(tài),不可避免地帶有一些“刻舟求劍”的悲壯色彩。

      四、蝴蝶效應

      誰在戰(zhàn)栗,誰在狂歡?

      盡管局限性很明顯,但Taalas這種“模型即芯片”的路線的面世,依然撕開了英偉達絕對壟斷帝國的一道裂痕。

      英偉達的地位,很大程度上歸功于其CUDA軟件生態(tài)。全世界的開發(fā)者都在用CUDA寫程序,這使得硬件的壁壘變成了堅不可摧的軟件生態(tài)壁壘。但是,如果AI的盡頭不再需要軟件呢?


      Taalas的路線意味著,在推理這個占據(jù)未來AI算力90%以上份額的市場中,CUDA的護城河被徹底繞過了。模型訓練依然離不開英偉達的GPU,但在最終落地應用的端側(cè)和專業(yè)推理數(shù)據(jù)中心,ASIC專有芯片正在掀起一場“去英偉達化”的起義。

      另外,隨著生成式AI加速進入商業(yè)落地,Taalas之外,Groq、Cerebras、Etched等公司也分別在極速響應、海量吞吐、特定算法加速方面進行著不同的探索,都有可能一點點蠶食推理市場,撼動曾經(jīng)固若金湯的英偉達帝國。

      同時,存儲巨頭的狂歡也極可能降溫。目前,HBM芯片是存儲行業(yè)的超級印鈔機。但如果模型權(quán)重被內(nèi)化于電路,對龐大顯存的依賴將大幅降低。無存算分離架構(gòu)一旦普及,存儲廠商在 AI 時代的暴利預期將被大幅擠壓。

      正因如此,Taalas將大模型刻進硅片,絕不是AI算力的終點,在不遠的未來,我們也許會看到算力市場的明顯分化:

      云端與訓練場依然是英偉達GPU和通用加速器的天下,用于探索AGI的智力邊界,處理那些最復雜、最多變的未知任務。

      端側(cè)與流水線則是Taalas這類“物理硬化”芯片的汪洋大海,它們?nèi)缟匙影惚阋耍绻馑侔忝艚荩瑵B透進每一個路燈、每一臺家電、每一個工業(yè)機器人中。

      甚至,當我們把目光放得更長遠一些,當量子計算真正走向?qū)嵱茫蛘哳惸X計算實現(xiàn)突破時,今天我們?yōu)榱送黄岂T·諾依曼架構(gòu)所做的所有努力,可能都會成為技術史上一次次充滿勇氣而又略顯笨拙的嘗試。

      結(jié)語

      從“全能大腦”到“硬件本能”

      計算架構(gòu)的演進從來不是單向的直線,而是螺旋上升的復調(diào)。從早期的專用打孔機,到通用CPU,到專為圖形處理誕生的GPU,再到如今的AI ASIC,計算的歷史,就是在“通用靈活性”與“專用極致效率”之間不斷搖擺的過程。

      Taalas的探索,或許在今天看來略顯激進,甚至面臨“出廠即落后”的窘境,但它向我們拋出了一個極具哲學意味的產(chǎn)業(yè)命題:

      AI的終極演化形態(tài)究竟是什么?

      它是否必須永遠保持像水一樣可以隨意重塑的“通用軟件大腦”?

      還是說,就像生物歷經(jīng)億萬年進化一樣,AI 也會將其最基礎、最成熟的智能(比如基礎的視覺識別、語言邏輯解析),內(nèi)化為無需思考、極低功耗運行的“硅基硬件本能”?


      回望科技史,任何偉大的范式轉(zhuǎn)換,往往都在非議與豪賭中誕生。

      也許,未來的 AI 計算基座并不是非此即彼。云端依然是算力磅礴的通用 GPU 集群,而在萬物互聯(lián)的終端,則是無數(shù)顆被固化了“本能”的低功耗 AI 芯片。

      當大模型不再是云端的高嶺之花,而是變成像電阻、電容一樣廉價且隨處可見的電子元器件時,AI 真正的大爆發(fā),才算真的拉開大幕。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      不能失憶!人民日報平安校園:海參崴的街頭,中國孩子在為誰歡呼

      不能失憶!人民日報平安校園:海參崴的街頭,中國孩子在為誰歡呼

      瑜說還休
      2026-05-07 17:45:15
      告別NBA生涯!41歲塔克正式宣布退役:曾隨雄鹿奪得總冠軍

      告別NBA生涯!41歲塔克正式宣布退役:曾隨雄鹿奪得總冠軍

      羅說NBA
      2026-05-08 09:12:04
      歷史第一!詹姆斯迎季后賽300場里程碑 前十榜唯一現(xiàn)役球員

      歷史第一!詹姆斯迎季后賽300場里程碑 前十榜唯一現(xiàn)役球員

      醉臥浮生
      2026-05-08 09:18:21
      國務院一紙令下!六月起強制執(zhí)行,騎電動車再也不用見警就躲了

      國務院一紙令下!六月起強制執(zhí)行,騎電動車再也不用見警就躲了

      今朝牛馬
      2026-05-07 20:58:21
      爭議!鄭欽文委屈落淚:向裁判抗議安保人員亂走動 反遭對方回懟

      爭議!鄭欽文委屈落淚:向裁判抗議安保人員亂走動 反遭對方回懟

      風過鄉(xiāng)
      2026-05-07 19:49:48
      13投10鐵+3助4誤!哈登僅10分 正負值全場最低 季后賽失誤歷史第5

      13投10鐵+3助4誤!哈登僅10分 正負值全場最低 季后賽失誤歷史第5

      狍子歪解體壇
      2026-05-08 09:43:37
      一場4-0!讓英超保級又生變數(shù):熱刺有2對手要爭六,全輸或降級

      一場4-0!讓英超保級又生變數(shù):熱刺有2對手要爭六,全輸或降級

      體育知多少
      2026-05-08 09:00:37
      黑龍江兩名11歲女孩已遇害:網(wǎng)傳被先奸后殺,兇手身份被曝光

      黑龍江兩名11歲女孩已遇害:網(wǎng)傳被先奸后殺,兇手身份被曝光

      魔都姐姐雜談
      2026-05-07 15:17:15
      深圳女環(huán)衛(wèi)工遭拖拽毆打!堅決拒和解,男子身份曝光,原因太荒唐

      深圳女環(huán)衛(wèi)工遭拖拽毆打!堅決拒和解,男子身份曝光,原因太荒唐

      做一個合格的吃瓜群眾
      2026-05-08 07:03:36
      14歲神童手搓發(fā)動機被曝造假!漏洞百出吹上天,普通人拿什么比?

      14歲神童手搓發(fā)動機被曝造假!漏洞百出吹上天,普通人拿什么比?

      社會日日鮮
      2026-05-08 04:18:01
      國際足聯(lián)急了!三次降價求央視轉(zhuǎn)播世界杯,6200 萬多一分免談

      國際足聯(lián)急了!三次降價求央視轉(zhuǎn)播世界杯,6200 萬多一分免談

      貍花小咪
      2026-05-08 01:33:06
      國際足聯(lián)也急了!原來除了中國,還有這么多國家不給世界杯買單了

      國際足聯(lián)也急了!原來除了中國,還有這么多國家不給世界杯買單了

      可樂愛微笑
      2026-05-08 05:22:07
      美媒稱美軍襲擊伊朗南部多地

      美媒稱美軍襲擊伊朗南部多地

      財聯(lián)社
      2026-05-08 04:58:07
      太原一出租車司機“狂噴”乘客?官方:頂格行政處罰

      太原一出租車司機“狂噴”乘客?官方:頂格行政處罰

      界面新聞
      2026-05-08 10:22:07
      美媒:美政府正尋求重啟“自由計劃”行動

      美媒:美政府正尋求重啟“自由計劃”行動

      環(huán)球網(wǎng)資訊
      2026-05-08 07:59:46
      稀土戰(zhàn)爭其實早就打完了——一份從 1985 到 2026 的完整賬本,告訴你 AI 時代真正的勝負手是什么

      稀土戰(zhàn)爭其實早就打完了——一份從 1985 到 2026 的完整賬本,告訴你 AI 時代真正的勝負手是什么

      六子吃涼粉
      2026-05-06 18:14:18
      鐵路車站客運員出售演藝人員行程信息,已被判刑

      鐵路車站客運員出售演藝人員行程信息,已被判刑

      新京報
      2026-05-08 10:57:20
      伊朗南部多次傳出爆炸聲,伊朗軍方稱美軍空襲沿海地區(qū)

      伊朗南部多次傳出爆炸聲,伊朗軍方稱美軍空襲沿海地區(qū)

      新京報
      2026-05-08 09:27:42
      再見了CBA?徐昕已被美國球隊高薪挖墻腳:年薪有望超過2000萬?

      再見了CBA?徐昕已被美國球隊高薪挖墻腳:年薪有望超過2000萬?

      籃球快餐車
      2026-05-08 00:46:53
      突發(fā)!王暖暖深夜被送往醫(yī)院搶救,護士反復喊其名字,疑原因曝光

      突發(fā)!王暖暖深夜被送往醫(yī)院搶救,護士反復喊其名字,疑原因曝光

      裕豐娛間說
      2026-05-08 07:14:12
      2026-05-08 11:16:49
      翼言商業(yè)觀察 incentive-icons
      翼言商業(yè)觀察
      新科技,新產(chǎn)業(yè),新消費。
      119文章數(shù) 3關注度
      往期回顧 全部

      科技要聞

      追趕星艦:中國商業(yè)火箭離SpaceX有多遠?

      頭條要聞

      媒體:特朗普黨內(nèi)同盟訪華 當著王毅的面感謝中國

      頭條要聞

      媒體:特朗普黨內(nèi)同盟訪華 當著王毅的面感謝中國

      體育要聞

      巴黎再進歐冠決賽,最尷尬的情況還是發(fā)生了

      娛樂要聞

      黃子佼獲緩刑4年,無需入獄服刑

      財經(jīng)要聞

      一覺醒來,美伊又打起來了

      汽車要聞

      雷克薩斯全新純電三排SUV 全新TZ全球首發(fā)

      態(tài)度原創(chuàng)

      手機
      時尚
      游戲
      藝術
      本地

      手機要聞

      谷歌Pixel 12系列手機自研芯片Tensor G7曝光:代號Lajolla

      今年母親節(jié),和媽媽一起變漂亮

      PS Store“特惠”標簽突然消失又回歸?玩家虛驚一場

      藝術要聞

      21 歲徐悲鴻畫的 “天價仙女”,被網(wǎng)友罵 “生無可戀”

      本地新聞

      用蘇繡的方式,打開江西婺源

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产综合有码无码中文字幕| 华人91视频| 精品人妻潮喷久久久又裸又黄| 国产成人AV一区二区三区在线| 一本一本久久久久a久久综合激情| 精品一区二区三区在线视频| 免费看无码网站成人A片| 伊人97| 色综合久久综合欧美综合网| 久久久不卡国产精品一区二区| 337p日本欧洲亚洲大胆色噜噜| 中字幕视频在线永久在线观看免费 | 国产无遮挡乱子伦免费精品| 久久精品欧美日韩精品| 精品中文人妻在线不卡| av解说在线观看| 久久久久久久久18禁秘| 国产成人av无码永久免费一线天| 人妻少妇不满足中文字幕| 亚洲另类无码专区首页| 久久久久人妻精品一区三寸蜜桃| 久久婷婷五月综合尤物色国产 | 日韩一区国产二区欧美三区| 欧美日韩精品一区二区在线视频| 国产女人水多毛片18| 九九99热久久精品在线6| 国产乱人伦AV在线麻豆A | 久久久久久免费视频| 在线视频 亚太 国产 欧美 一区二区| 中文字幕一二三区波多野结衣| 日韩毛片在线视频x| 伊人性网| 亚洲国产在一区二区三区| 色综合久久88色综合天天| 久久亚洲伊人| 国产精品2区| 欧美最猛性xxxxx免费| 人妻无码一区二区三区免费| 亚洲国产精品特色大片观看完整版 | 色猫咪av在线网址| 绍兴县|