<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      這一次,梁文鋒和楊植麟隔空握手

      0
      分享至



      真是熱鬧的一周。

      周一,Kimi剛發完Kimi K2.6;周五,萬眾矚目的DeepSeek V4就來了。

      這種感覺很熟悉。

      過去一年,這兩家公司不是前后腳發模型,就是前后腳發技術論文,不是你把市場熱度點著了,就是我把技術討論接過去了。

      更早之前,說起中國開源模型,幾乎條件反射地想到DeepSeek。

      尤其是DeepSeek發布R1之后,這家公司不僅憑一己之力改寫了全球市場對中國AI的印象,而且喚醒了其他中國的AI創業團隊的“信心”。

      于是,我們看到,更多的中國AI創業團隊開始做出非常競爭力的模型,帶來非常有影響力的技術研究成果。

      2025年7月,被《自然》雜志稱為“又一個DeepSeek時刻”的Kimi K2模型,在底層架構上首次大規模驗證了二階優化器 Muon,同時采用了 DeepSeek驗證過的 MLA注意力機制。

      到了2026年4月,DeepSeek V4在架構上也跟進 Kimi K2采用 Muon優化器,取代過去已經使用了10年的Adam優化器。

      這可能是開源最大的價值:讓中國公司共享技術,加速追趕美國的閉源巨頭。

      它們是中國目前唯二,總參數超過萬億、已權重公開的中國模型。也是最有國際影響力的中國AI模型代表。全球市值最高的英偉達公司在展示下一代芯片性能時,用的模型正是來自 DeepSeek 和Kimi。



      不僅如此,他們也都在挑戰深度學習網絡的底層架構,DeepSeek有mHC殘差連接,Kimi有引發硅谷核心技術圈討論的“注意力殘差”。

      A

      雖然說DeepSeek V4和Kimi K2.6在同一周發布,但其實兩個模型各有技術側重點。

      V4的核心突破在于百萬上下文的成本重構,它通過全新的混合注意力機制,將單token推理的計算量壓縮到V3.2的27%,KV Cache降至10%。

      這套方案結合了壓縮稀疏注意力和重度壓縮注意力,讓百萬級上下文從技術演示變成了可以普及的基礎設施。

      V4同時針對agent場景做了專項優化,后訓練階段把agent作為獨立方向單獨訓練,工具調用格式從JSON換成帶特殊token的XML結構,跨輪次推理痕跡在工具調用場景下完整保留。

      DeepSeek還自建了名為DSec的沙箱平臺,單集群可并發管理數十萬個沙箱實例,用來支撐agent強化學習訓練和評測。

      K2.6的方向則更偏向長程編碼和agent集群。它在Kimi Code Bench內部評測中得分68.2,比K2.5的57.4提升約20%。

      最高可支持300個子agent并行完成4000個協作步驟。



      B

      2025年2月,Kimi 發布 Moonlight系列模型,首次將二階優化器Muon應用于480億參數的大模型,驗證了新一代優化器的效果。

      2025年4月,Kimi-VL模型發布,在Moonlight模型的技術上,引入MoonViT視覺編碼器,為之后的多模態理解模型打下基礎。

      2025年7月,Kimi首次將Muon優化器擴展到萬億參數的規模,推出 K2 開源模型。

      2025年10月,Kimi發布Kimi Linear,這是Kimi提出的一種線性注意力架構,核心目標是在保住長上下文能力的同時,把大模型處理超長文本的計算和顯存成本降下來。

      這說明楊植麟已經不滿足于只做模型了,他想對模型的底層架構動手。

      隨后,Kimi發布并開源支持圖片和視頻理解的萬億參數模型Kimi K2.5。

      2026年3月,Kimi發布注意力殘差的論文,繼續對Transformer的底層結構下手。

      這篇論文在X上收獲了馬斯克本人的稱贊。

      在然后就到了前幾天的K2.6,這是一個圍繞長周期編碼、agent執行、工程任務能力的模型。

      從產品定位的演變可以看出,Kimi正在從消費級對話產品往生產力工具轉型。

      2026年3月,楊植麟在英偉達GTC大會上發表演講,系統介紹Kimi技術路線,他用三個關鍵詞概括Kimi的Scaling策略:Token效率、長上下文、agent集群。

      他表示,要推動大模型智能上限的持續突破,必須對優化器、注意力機制及殘差連接等底層基石進行重構。

      當前的Scaling已經不再是單純的資源堆砌,而是要在計算效率、長程記憶和自動化協作上同時尋找規模效應。

      一家公司最怕的是,只有媒體在討論你,開發者卻不用你。

      但Kimi不一樣,無論是在OpenRouter上還是絕大多數agent工具的默認接口里, K2.5和K2.6都是主流選項。

      截止發稿,Kimi和DeepSeek都出現在OpenRouter的TOP3模型里,在AA的榜單上,K2.6甚至暫時占得先機。



      而在K2.6這里,模型繼續強化agent、長任務、編碼能力,也是同一個信號。楊植麟真正押注的,就是生產力場景。

      這也是Kimi這一年最關鍵的變化。

      它不再只是告訴用戶“我能幫你讀更長的文件”,而是在回答更底層的問題,模型怎樣才能在更長時間、更復雜任務、更高工具調用密度下保持穩定?

      長上下文解決的是記憶和信息承載;線性注意力解決的是成本和擴展性;agent集群解決的是復雜任務拆解;編程能力解決的是模型的理解和執行。

      它們看起來是幾條不同產品線,其實背后指向同一個方向,Kimi想把Kimi從一個好用的聊天窗口,變成可以承接真實工作的基礎模型。

      4月,楊植麟受邀參加總理主持的經濟形勢專家和企業家座談會,作為唯一的大模型創業者代表發言。這個1993年出生的年輕人,成為座談會上最年輕的參會者。

      一個月前,他剛在2026中關村論壇年會全體會議上發表演講,系統闡述了中國AI團隊如何通過底層架構的“推倒重建”,打破沿用十年的行業技術標準。

      顯然,Kimi已經從一家創業公司,變成了代表中國AI技術路線的符號之一。

      Kimi這一年的成長路徑,和DeepSeek的路徑有明顯差異。兩家公司的技術選擇不同,但也正因如此,才讓中國開源模型有了更多可能性。

      C

      過去我們寫這兩家公司,容易寫成“誰的模型好”、“誰才是下一個OpenAI”。

      但這其實是個誤區。

      DeepSeek和Kimi,不該被簡單理解成“誰贏誰輸”。它們更像中國開源模型對外競爭的兩條腿。不存在誰取代誰,而是應該互相刺激互相促進。

      DeepSeek和Kimi相繼證明了一件事,做前沿模型不一定需要無限的資源,關鍵在于算法創新和工程優化。它們在模型算法、工程效率、開源路線和降低推理成本上的貢獻,仍然是中國AI過去一年最重要的技術事件之一。

      它們彼此競爭,但也彼此抬高了中國開源模型的上限。

      真正重要的不是它們誰先到終點,而是它們把中國模型的競爭維度拆開了。

      過去我們評價一家模型公司,很容易只看榜單、參數、價格、發布會聲量。

      但模型公司真正的護城河,已經不再是“模型聰不聰明”、“模型性能如何”這些事了。現在圍繞模型的敘事,是它能不能形成一整套技術路線。

      DeepSeek把第一件事做得很徹底。它讓外界看到,中國公司可以用更高的工程效率,把模型訓練和推理成本打下來,可以把技術報告寫到足夠透明,可以把權重開放到足夠激進。

      它建立的是一種開源信任。開發者愿意研究它、復現它、部署它,是因為它不只是給了一個API,而是把模型背后的方法論也拿了出來。

      Kimi補上的是另一塊。

      Kimi最早被用戶記住,是因為長文本和聊天產品,但K2.6之后,它講的已經不是一個更會聊天的助手,而是模型如何進入真實工作流。

      長程編碼、Agent集群、工具調用、長周期任務,這些能力沒有“霸榜”那么直觀,但它們決定模型能不能從“被試用”走向“被依賴”。

      如果說DeepSeek解決的是模型夠不夠強、夠不夠便宜、夠不夠開放的問題,Kimi更關心的是模型能不能真的替人完成復雜任務。

      所以這兩家公司放在一起看,意義反而更大。

      作為觀察者和用戶,我們肯定希望都存在,這樣產業才能發展。

      中國AI真正值得興奮的,不是終于出了一個DeepSeek。

      而是在DeepSeek的帶動下,Kimi們依然能靠自己成長為一座座大山。

      這說明中國AI公司已經開始在不同維度上找到自己的位置,不再是簡單模仿,是真正的在探索自己獨有的那條技術路線。

      DeepSeek和Kimi的技術互相賦能,也說明了一件事,開源生態的價值在于協作。

      現在的問題不是DeepSeek和Kimi誰更強,而是它們能不能繼續保持這種競爭關系,繼續在技術上互相刺激。

      中國開源模型要真正在全球站穩腳跟,需要的不是一家獨大,而是多家公司在不同方向上都做到世界級水平。DeepSeek和Kimi的存在,讓這個可能性變得更大。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      馬靖昊:五糧液犯下這樣的“會計差錯”,情何以堪!這種把操縱財報當本事的做法,是對投資者信任的踐踏!

      馬靖昊:五糧液犯下這樣的“會計差錯”,情何以堪!這種把操縱財報當本事的做法,是對投資者信任的踐踏!

      新浪財經
      2026-05-01 11:38:53
      詹姆斯:我認為大概再沒人能連續八年進總決賽!

      詹姆斯:我認為大概再沒人能連續八年進總決賽!

      歷史第一人梅西
      2026-05-01 15:01:34
      【特稿】美國“選區版圖戰”硝煙再起 將如何影響中期選舉?

      【特稿】美國“選區版圖戰”硝煙再起 將如何影響中期選舉?

      新華社
      2026-04-30 19:07:02
      全紅嬋事件又上演!世界杯總決賽,陳芋汐又有壞消息,全網炸鍋

      全紅嬋事件又上演!世界杯總決賽,陳芋汐又有壞消息,全網炸鍋

      攬星河的筆記
      2026-05-01 18:15:37
      中國軍號“點名”李幼斌,釋放三個強烈信號,5年前的話他沒說錯

      中國軍號“點名”李幼斌,釋放三個強烈信號,5年前的話他沒說錯

      君笙的拂兮
      2026-05-01 01:15:53
      馬斯克,撕破臉了

      馬斯克,撕破臉了

      藍鉆故事
      2026-04-30 22:41:52
      誰去誰后悔!五一最堵五大景點,第1名擠到崩潰,第5名直接勸退

      誰去誰后悔!五一最堵五大景點,第1名擠到崩潰,第5名直接勸退

      小冠說娛
      2026-05-01 19:18:07
      電商亂象:AB貨已經猖獗到恐怖如斯!

      電商亂象:AB貨已經猖獗到恐怖如斯!

      黯泉
      2026-05-01 10:34:48
      26歲女子實名舉報63歲人大教授,出軌多人含清華美女教授

      26歲女子實名舉報63歲人大教授,出軌多人含清華美女教授

      老貓觀點
      2026-05-01 07:20:16
      比爾蓋茨:若美認為將與中國開戰,勿提前告知

      比爾蓋茨:若美認為將與中國開戰,勿提前告知

      孤酒老巷QA
      2026-04-30 22:42:36
      張慶鵬將離任,北控換帥三大熱門出爐,誰能拯救球隊?

      張慶鵬將離任,北控換帥三大熱門出爐,誰能拯救球隊?

      男足的小球童
      2026-05-01 16:54:27
      古天樂被曝疑似隱婚生子,女方疑似女演員林淑茵

      古天樂被曝疑似隱婚生子,女方疑似女演員林淑茵

      韓小娛
      2026-04-30 15:29:59
      連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

      連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

      街上的行人很刺眼
      2026-04-25 10:55:49
      新華時評丨勞動光榮的價值底色永遠閃亮

      新華時評丨勞動光榮的價值底色永遠閃亮

      新華社
      2026-04-30 20:54:03
      被罵瘋子的米萊終結阿根廷幾十年赤字

      被罵瘋子的米萊終結阿根廷幾十年赤字

      桂系007
      2026-04-28 15:20:23
      她拒唱國歌否認是中國籍,還將倆兒子戶口落到國外,她現狀如何?

      她拒唱國歌否認是中國籍,還將倆兒子戶口落到國外,她現狀如何?

      混沌錄
      2026-04-28 22:29:08
      單依純鄭州公開挑釁李榮浩,穿的像馬桶刷,現場氛圍詭異,太瘋狂

      單依純鄭州公開挑釁李榮浩,穿的像馬桶刷,現場氛圍詭異,太瘋狂

      嫹筆牂牂
      2026-04-30 07:30:10
      間隔一天吃他汀,降脂效果更好?醫生建議:服用他汀,謹記這7點

      間隔一天吃他汀,降脂效果更好?醫生建議:服用他汀,謹記這7點

      健身狂人
      2026-05-01 19:26:00
      2-4止步首輪!約基奇把話挑明,他能簽3年2.01億美金超級頂薪

      2-4止步首輪!約基奇把話挑明,他能簽3年2.01億美金超級頂薪

      世界體育圈
      2026-05-01 19:26:43
      日本準備戰爭,要打誰?48小時內,中國兩大軍媒下場“算總賬”

      日本準備戰爭,要打誰?48小時內,中國兩大軍媒下場“算總賬”

      夢史
      2026-05-01 16:47:14
      2026-05-01 21:36:49
      字母榜 incentive-icons
      字母榜
      讓未來不止于大。
      2430文章數 8062關注度
      往期回顧 全部

      財經要聞

      GPU神話松動,AI真正的戰場變了

      頭條要聞

      70歲法國老人騎浙江品牌摩托車 穿越多國抵達杭州

      頭條要聞

      70歲法國老人騎浙江品牌摩托車 穿越多國抵達杭州

      體育要聞

      無奈!約基奇:這要在塞爾維亞 全隊早被炒了

      娛樂要聞

      馬筱梅產后身材恢復超好 現身戶外直播

      科技要聞

      蘋果上季在華收入繼續大增 iPhone收入新高

      汽車要聞

      限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

      態度原創

      房產
      健康
      親子
      教育
      軍事航空

      房產要聞

      所有戶型全賣爆!海口TOP級豪宅,景觀樣板間五一全線開放!

      干細胞治燒燙傷面臨這些“瓶頸”

      親子要聞

      寶藍和爸爸比賽吹氣球,吹成各種各樣的形狀,快來看看誰贏了~

      教育要聞

      告別“紙上談兵”!這個地方打破勞動教育圍墻,給孩子留下值得回憶的汗水!

      軍事要聞

      伊朗:持續推進海上封鎖的行為不可容忍

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 麻豆人人妻人人妻人人片AV| 日韩av中文| 亚洲欧美在线综合一区二区三区| 色伦综合网| 91精品免费久久久久久久久| 亚洲爆乳中文字幕无码专区网站| 亚洲欧美国产毛片在线| 亚洲一区二区激情| 久久丫精品久久丫| 91在线国内在线播放老师| 人妻中文久热无码丝袜| 亚洲精品国产成人无码区a片| 亚洲色欲色欱WWW在线| 偷拍自中文字av在线| 精品国产乱子伦一区二区三区,精品一| 中文字幕无码专区一VA亚洲V专| 色天使色偷偷色噜噜| 欧美日韩无线码在线观看| 国产高清在线观看91精品| 欧美成人看片黄a免费看| 欧美顶级metart裸体自慰| 无码人妻精品一区二区在线视频| 国产91九色在线播放| 无码精品国产dvd在线观看9久 | 天天做天天爱天天爽综合区| 天干天干夜啦天干天干国产| 精品人妻中文av一区二区三区| 欧美 国产 综合 欧美 视频| 在线播放ww| 屁屁影院ccyy备用地址| 一区二区av在线| 无码中文字幕AV免费放软件| 亚洲国产初高中生女av| 国产乱码卡二卡三卡4| 无码人妻丰满熟妇精品区| 一二三区中文字幕| 18禁免费无码无遮挡不卡网站 | 欧洲国产伦久久久久久久| 日韩美女av电影| 免费无码又爽又刺激高潮软件| 性天堂网|