<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      1000 倍效率神話,Taalas如何用 “模型即芯片” 暴打英偉達

      0
      分享至

      2026年2月,AI 算力行業的平靜被一家加拿大初創公司徹底打破。

      由前 AMD、英偉達架構師柳比薩?巴伊奇(Ljubisa Bajic)創立的 Taalas,帶著其 “Model Based” 芯片架構與累計超 2.19 億美元的融資浮出水面。這家公司喊出了 “將 AI 模型效率提升 1000 倍” 的激進口號,宣稱其首款產品 HC1 能以 17,000 Token / 秒的推理速度,將 Llama 3.1 8B 模型的推理成本降至 0.75 美分 / 百萬 token—— 這一數字是傳統 GPU 云服務的 1/266。



      在英偉達通過 200 億美元推理技術許可協議 “收編” Groq、全行業陷入通用算力內卷的當下,Taalas 的 “硬核模型” 路線不僅是對摩爾定律的重新詮釋,更預示著 AI 算力市場正從 “通用主導” 走向 “通用與專用并存” 的分裂格局。本文將深度解析 Taalas 的技術革命、商業化困境,以及這場架構之爭對全球 AI 產業的長遠影響。

      一場“反通用” 豪賭正秘密進行

      Taalas 的誕生,源于巴伊奇對 AI 算力現狀的深刻不滿。這位曾主導 Tenstorrent 可擴展 AI 加速器研發的芯片老兵,在 2023 年 3 月離開 Tenstorrent 后,與工程師 Drago Ignjatovic、Lejla Bajic 共同創立了 Taalas,核心使命是 “將人工智能商品化”。



      “人工智能就像電力一樣 —— 這是一種不可或缺的必需品,必須向所有人提供。” 巴伊奇在公司亮相時表示,“將人工智能商品化需要對計算能力和效率進行 1000 倍的提升,而這一目標通過當前漸進式的手段是無法實現的。”

      這種 “非漸進式” 的思路,讓 Taalas 從一開始就走上了與英偉達對立的道路。公司在 2023 年 8 月至 2024 年 3 月間完成兩輪融資,首輪 5000 萬美元由皮埃爾?拉蒙德和 Quiet Capital 牽頭,后續融資使其總估值達到 2.19 億美元。值得注意的是,投資人皮埃爾?拉蒙德對團隊的評價極為直接:“他們做芯片的經驗業內頂級,這個方向能實現 1000 倍的成本改善,推動 AI 成為基礎設施級能力。”

      Taalas 的研發效率同樣令人驚嘆。這款被命名為 HC1 的首款產品,由 24 人團隊僅用 3000 萬美元研發成本就完成設計,并與臺積電達成合作,實現了 “2 個月從模型權重到可部署硬件” 的極速生產周期。按照原計劃,HC1 應在 2025 年第一季度向客戶供貨,而最新消息顯示,這款芯片已進入技術驗證階段,其極端的性能表現正在重塑行業對推理算力的認知。

      Model Based 架構:把大模型 “寫死” 在硅片上

      Taalas 的 1000 倍效率神話,并非來自玄學突破,而是源于對傳統 AI 芯片架構的徹底重構。與通用 GPU“內存加載模型、軟件調度運行” 的模式不同,Taalas 采用了 “Model Based” 架構,將特定大模型的訓練結果直接固化在晶體管層面,實現物理意義上的 “硬核模型”。



      傳統 GPU 為了兼容多模型、多任務,預留了大量運算單元與調度邏輯,導致硬件冗余度極高。而 Taalas 的架構創新,本質上是一場 “效率與靈活性的極致取舍”:

      1、硬件固化權重

      采用 mask ROM recall fabric + SRAM 架構,將 Llama 3.1 8B 等模型的權重直接寫入硬件,徹底繞開了高帶寬內存(HBM)這一成本與功耗瓶頸。這種 “硬連線” 設計讓模型推理不再依賴外部內存讀寫,從根本上降低了延遲與能耗。

      2、單模型專用設計

      每塊 HC1 芯片僅支持單一模型,通過犧牲靈活性換取極致性能。在實測中,其推理速度達到 17,000 Token / 秒,是英偉達 H200 GPU(230 Token / 秒)的 50 倍,遠超 Cerebras WSE(2,000 Token / 秒)等專用加速器。

      3、成本與功耗優化

      得益于架構簡化,HC1 的硬件成本比傳統方案降低 20 倍,功耗減少 10 倍。對于數據中心而言,這意味著 “以 10% 功耗運行同等規模模型”,將徹底改寫 AI 投資回報曲線。

      中國科學院計算技術研究所副研究員趙永威對這一技術路線給予了高度評價:“雖然 Taalas 目前的狀況還沒有應用價值,但不妨礙它會成為一顆有歷史意義的芯片。這種硬連線模式是未來芯片發展的一大趨勢,目前的質疑由 Taalas 來扛,后來者在推廣相關概念時會更加輕松。”

      仍有缺陷:“秒出 2000 字” 背后的精度代價

      極致的速度背后,是初代產品難以回避的短板。在實際測試中,HC1 雖然能實現 “2000 字回復秒出” 的驚人表現,但回復質量卻存在明顯缺陷 —— 不僅簡單運算會出現錯誤,復雜問題下還會出現 “胡編亂造” 的情況。

      這一問題的核心原因,在于 HC1 初代產品采用的定點數格式無法滿足復雜推理的精度需求。為了對沖這一風險,Taalas 已明確規劃第二代產品 HC2,將改用標準 4-bit 浮點格式改善精度問題,同時將模型支持規模提升至 200 億參數,計劃在 2026 年底前覆蓋 GPT-5 級別系統。

      “感覺像作弊一樣快。”Basecamp 創始人 DHH 的試用評價,精準概括了 HC1 的用戶體驗。而 Cambrian-AI 首席分析師 Karl Freund 則用 “insane(瘋狂)” 來形容其性能表現。這種 “速度與精度的矛盾”,也成為 Taalas 商業化落地的核心挑戰。

      “一模型一芯片” 的生存邏輯

      在巴伊奇的設想中,Taalas 并非要取代英偉達 GPU,而是要填補 “通用算力與極致效率之間的市場空白”。目前,公司已探索出三條商業化路徑:自建 API、直接出售芯片、與模型開發者合作定制芯片,其核心邏輯是 “鎖定高粘性垂直場景”,推動 “一模型一芯片” 的定制化趨勢。

      核心落地場景:從智能客服到自動駕駛的邊緣革命

      Taalas 的產品定位,精準命中了三類對延遲敏感、模型版本穩定的應用場景:

      企業專用模型場景

      金融、醫療、法律等行業的企業,往往長期使用固定版本的私有化模型。對于這類客戶,HC1 的成本優勢極為明顯 —— 推理成本降至傳統方案的 1/266,足以讓許多此前不可行的 AI 應用變得具備商業價值。

      邊緣推理場景

      人形機器人、自動駕駛汽車、高端智能手機等設備,對實時性要求極高,且無需運行多模型。

      大規模客服場景

      電商、運營商的智能客服系統,常年運行標準化對話模型,對響應速度的要求遠高于復雜推理能力。HC1 的 “秒級響應” 能顯著提升用戶體驗,同時將運營成本削減 90% 以上。

      Taalas 產品副總裁 Paresh Kharya 明確表示:“為模型定制的最優硅片不會取代滿是 GPU 的大型數據中心,但它會適配特定的應用場景。” 這種 “互補而非替代” 的定位,為 Taalas 在英偉達的陰影下找到了生存空間。

      模型迭代與生態壁壘的雙重考驗

      盡管場景定位清晰,但 Taalas 的商業模式仍面臨兩大核心不確定性:

      首先是模型迭代風險。“一模型一芯片” 的模式,意味著客戶必須對特定模型做出長期承諾。在大模型架構快速演進的當下,一旦行業轉向全新架構(如超越 Transformer 的革命性設計),現有專用硬件將快速貶值。Taalas 的應對策略,是押注 Llama 等開源架構的長期主導地位,同時通過 LoRA 微調技術優化芯片固化模型的適應性。

      其次是生態系統短板。英偉達的真正護城河并非硬件,而是 CUDA 軟件生態和開發者的重度依賴。相比之下,Taalas 的專用芯片缺乏配套的開發工具鏈,開發者需要重新適配,這無疑提高了客戶的遷移成本。如何在短時間內構建起自己的生態,成為 Taalas 能否規模化落地的關鍵。

      Taalas 的崛起,并非孤立的行業現象。2025 年底,英偉達以 200 億美元的價格與 Groq 達成推理技術許可協議,這一交易被業內視為 “通用算力巨頭向專用推理賽道妥協” 的信號。

      作為谷歌 TPU 核心開發者 Jonathan Ross 創立的公司,Groq 的 LPU 推理芯片同樣采用專用架構,憑借確定性設計和片上 SRAM 內存實現了超低延遲。英偉達通過 “非獨占技術許可 + 核心人才吸納” 的方式,快速補全推理短板,同時降低收購風險。有消息稱,英偉達下一代 Feynman GPU 可能在 2028 年集成 Groq 的 LPU 單元,形成“通用 + 專用”的混合架構。

      這場路線之爭的本質,是 AI 產業從 “模型訓練階段” 向 “規模化推理落地階段” 轉型的必然結果。隨著大模型發布間隔時間延長,企業對成熟模型的依賴度不斷增加,專用推理芯片的市場空間正在快速擴大。

      未來的 AI 算力市場將呈現 “三分天下” 的格局:英偉達 GPU 主導訓練場景和通用推理場景,Taalas 等 “模型即芯片” 企業占據高粘性垂直場景,而谷歌 TPU、微軟 Azure Maia 等云廠商自研芯片則深耕云原生推理市場。這種分化,將徹底打破英偉達的壟斷地位,推動 AI 算力進入 “專業化分工” 時代。

      對于 Taalas 而言,2026 年將是決定其命運的關鍵一年。第二代產品 HC2 的推出,將驗證其技術路線的可擴展性;而商業化落地的成效,將決定資本對 “模型即芯片” 路線的信心。要真正實現巴伊奇 “將 AI 商品化” 的愿景,Taalas 還需要跨越三道門檻:

      第一,精度與速度的平衡。HC2 能否在采用 4-bit 浮點格式后,保持 HC1 的極致速度優勢,同時顯著提升推理正確率,將直接決定其能否進入金融、醫療等高精度要求場景。

      第二,成本與規模化的突破。目前 HC1 仍處于技術驗證階段,未公開定價。要實現 “推理成本降至 1/266” 的承諾,Taalas 需要通過大規模量產降低制造成本,同時優化供應鏈管理。

      第三,生態與合作伙伴的積累。與模型廠商、云服務商、垂直行業客戶建立深度合作,構建起 “模型定制 - 芯片設計 - 場景落地” 的完整閉環,才能擺脫 “小眾技術” 的標簽,成為行業標準的制定者。

      從更長遠的視角看,Taalas 的探索不僅關乎一家初創公司的生死,更關乎 AI 產業的未來走向。如果“模型即芯片”路線被證明可行,將推動 AI 算力從 “追求通用” 轉向 “追求極致效率”,讓 AI 技術真正滲透到千行百業,實現巴伊奇 “讓 AI 像電力一樣無處不在” 的愿景。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      4種染發劑被曝含致癌物,看看你正在用嗎?轉告父母:謹慎購買

      4種染發劑被曝含致癌物,看看你正在用嗎?轉告父母:謹慎購買

      荊醫生科普
      2026-05-07 20:55:07
      我67歲,看到3位同事不到70歲離世后,我開始認可這五種做法

      我67歲,看到3位同事不到70歲離世后,我開始認可這五種做法

      荷蘭豆愛健康
      2026-05-08 03:39:47
      高市輸得精光!特朗普不顧攔阻要訪華,中方宣告192國世道真變了

      高市輸得精光!特朗普不顧攔阻要訪華,中方宣告192國世道真變了

      樂天閑聊
      2026-05-08 06:06:30
      別再吹捧神仙友情!郭富城張學友為草蜢站臺,實則是樂壇頂尖藝人的生存認證

      別再吹捧神仙友情!郭富城張學友為草蜢站臺,實則是樂壇頂尖藝人的生存認證

      草莓解說體育
      2026-05-07 08:18:34
      歐盟中國商會與畢馬威發布報告:這一提案若執行,歐盟國家損失將超3600億歐元

      歐盟中國商會與畢馬威發布報告:這一提案若執行,歐盟國家損失將超3600億歐元

      澎湃新聞
      2026-05-06 19:04:28
      “他又不是三歲!”家長給高中兒子準備生日禮,卻因太幼稚被群嘲

      “他又不是三歲!”家長給高中兒子準備生日禮,卻因太幼稚被群嘲

      妍妍教育日記
      2026-05-07 11:40:07
      中國“撿錢”時代可能要來了:若手中只有10萬,試試死啃這兩條線

      中國“撿錢”時代可能要來了:若手中只有10萬,試試死啃這兩條線

      世界圈
      2026-04-20 13:02:44
      王曼昱回應11-1 孫穎莎爆發大心臟 王藝迪:有莎莎和曼昱,更有底氣 劍指世乒賽冠軍

      王曼昱回應11-1 孫穎莎爆發大心臟 王藝迪:有莎莎和曼昱,更有底氣 劍指世乒賽冠軍

      好乒乓
      2026-05-08 00:01:47
      王心凌演出被鐳射激光燙到腿,現場痛到尖叫,主辦方致歉!醫生:突發燙傷建議第一時間進行冷敷或冷水沖洗

      王心凌演出被鐳射激光燙到腿,現場痛到尖叫,主辦方致歉!醫生:突發燙傷建議第一時間進行冷敷或冷水沖洗

      魯中晨報
      2026-05-06 15:38:22
      52 歲方瓊回農村喝喜酒,狀態嫩得像 30 歲,獨自坐板凳上玩手機

      52 歲方瓊回農村喝喜酒,狀態嫩得像 30 歲,獨自坐板凳上玩手機

      南萬說娛26
      2026-04-22 12:10:10
      修了十幾年!圍擋拆除!沈陽這條大型商業街快開了!

      修了十幾年!圍擋拆除!沈陽這條大型商業街快開了!

      沈陽生活圈i
      2026-05-07 17:34:39
      昔日法網黑馬復出難求一勝,神奇之路恐難再續

      昔日法網黑馬復出難求一勝,神奇之路恐難再續

      網球之家
      2026-05-07 23:05:21
      江蘇釣友釣獲米級鳡魚,摘鉤時鳡魚一個猛子,把千元魚竿拽走了

      江蘇釣友釣獲米級鳡魚,摘鉤時鳡魚一個猛子,把千元魚竿拽走了

      魚窩魚窩
      2026-05-07 11:24:33
      藤蔓,絕不讀 téng màn,但是99%的人可能一直都讀錯了!

      藤蔓,絕不讀 téng màn,但是99%的人可能一直都讀錯了!

      未央看點
      2026-05-07 23:52:23
      五一票房腰斬,陳思誠:1500萬是存亡線,電影院連房租都賺不回!

      五一票房腰斬,陳思誠:1500萬是存亡線,電影院連房租都賺不回!

      喜歡歷史的阿繁
      2026-05-07 01:45:47
      跟低學歷妹子談戀愛是啥體驗?網友:低社會化人群被女版黃毛拿下

      跟低學歷妹子談戀愛是啥體驗?網友:低社會化人群被女版黃毛拿下

      帶你感受人間冷暖
      2026-03-28 16:48:21
      被曝散盡家財2天,吳宜澤迎天價獎金,丁俊暉父親的愿望也終實現

      被曝散盡家財2天,吳宜澤迎天價獎金,丁俊暉父親的愿望也終實現

      TVB的四小花
      2026-05-08 03:53:30
      114國拒絕簽字!魯比奧警告中國,在聯合國提新草案逼中俄通過

      114國拒絕簽字!魯比奧警告中國,在聯合國提新草案逼中俄通過

      面包夾知識
      2026-05-07 20:22:12
      佩雷拉:剛戰藍軍又戰維拉太難,為湊齊名單我甚至放3名傷員

      佩雷拉:剛戰藍軍又戰維拉太難,為湊齊名單我甚至放3名傷員

      懂球帝
      2026-05-08 05:58:09
      3000億估值,國資和投資人都在等梁文鋒點頭

      3000億估值,國資和投資人都在等梁文鋒點頭

      融資中國
      2026-05-07 16:34:06
      2026-05-08 07:08:49
      山自 incentive-icons
      山自
      寫點有趣的。關注自動駕駛和AI商業變革。
      126文章數 0關注度
      往期回顧 全部

      科技要聞

      月之暗面完成20億美元融資,估值突破200億

      頭條要聞

      伊朗武裝部隊:美軍違反停火協議空襲伊朗 已反擊

      頭條要聞

      伊朗武裝部隊:美軍違反停火協議空襲伊朗 已反擊

      體育要聞

      巴黎再進歐冠決賽,最尷尬的情況還是發生了

      娛樂要聞

      Lisa主持!寧藝卓觀看脫衣秀風波升級

      財經要聞

      人均年薪406萬,這家ST公司驚呆市場!

      汽車要聞

      雷克薩斯全新純電三排SUV 全新TZ全球首發

      態度原創

      游戲
      手機
      親子
      家居
      教育

      《遠星物語》團隊新作《皓白初曉》登Steam EA

      手機要聞

      0.5mm邊框+2億像素+8000mAh,小米這臺AI概念機,每一項都離譜

      親子要聞

      只祝她“母親節快樂”是不夠的

      家居要聞

      破繭成蝶 土味精裝房爆改

      教育要聞

      高考地理中的潮光互補

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲国产理论片在线播放| 免费大片黄国产在线观看| 日韩精品一区二区三区不卡| 无码人妻精品一区二区蜜桃色| 在线播放无码后入内射少妇| 97久久精品人人做人人爽| 无码免费中文字幕视频| 亚洲香蕉网久久综合影视| 亚洲不卡| 亚洲?成人?综合?另类| 亚洲AV永久天堂在线观看| 放荡的美妇在线播放| 18禁无遮挡羞羞啪啪免费网站 | 蜜臀AV在线播放一区二区三区| 国产丝袜精品不卡| 欧美混交群体交| 欧美牲交a欧美牲交aⅴ一| 国产成人av无码永久免费一线天| 在线观看午夜福利| 国自产偷精品不卡在线| 久久天天躁狠狠躁夜夜躁| 亚洲国产精品美日韩久久| 亚洲日韩第2页| www欧美在线观看| 亚洲区小说区图片区qvod| a一级毛片免费播放| 鞍山市| 免费A级毛片无码免费视频| 岛国一区二区三区高清视频| 国模久久| av无码小缝喷白浆在线观看| 亚洲嫩模高清在线视频| 五月婷婷六月丁香| 日韩第一页| 亚洲偷精品国产五月丁香麻豆| 成人av午夜在线观看| 亚洲日本在线一区| 欧美精品99久久久| 国产成人精品亚洲精品色欲| 国产亚洲AV天天夜夜无码| 久久香蕉久久香蕉久久|