<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      1/10成本、Opus 4.7級表現,Cursor甩出了性價比之王Composer 2.5

      0
      分享至



      機器之心編輯部

      「以 1/10 的成本,性能幾乎追平 Claude Opus 4.7 這個級別的模型。」

      它就是 Cursor 今天凌晨亮出的迄今為止最強大的模型 ——Composer 2.5

      官方表示,Composer 2.5更加智能,更擅長處理耗時較長的持續任務,并且在遵循復雜指令方面也更為可靠

      未來一周內,Cursor 將會把該模型原本附贈 / 包含的使用額度翻倍。



      相比 Composer 2,Composer 2.5 在智能水平和行為表現上都有顯著提升。



      通過擴大訓練規模、構建更復雜的強化學習環境,并引入新的學習方法,Cursor 全面改進了 Composer。

      除了在更困難的任務上訓練 Composer 2.5 外,Cursor 還優化了模型的溝通風格、努力程度校準等行為層面的表現。這些維度現有基準測試無法很好地衡量,但它們對實際使用體驗至關重要。

      可以看到,Composer 2.5 在同等能力的模型中,它的成本效率最高可高出 10 倍



      值得關注的是,Composer 2.5 基于與 Composer 2 相同的開源檢查點構建,即月之暗面的 Kimi K2.5



      Cursor 還宣布了與 SpaceXAI 的合作:雙方將從零開始訓練一個規模大得多的模型,總算力投入是此前的 10 倍。借助 Colossus 2 的百萬塊 H100 等效算力,以及雙方積累的數據和訓練技術,預計這將是模型能力的一次重大飛躍。

      馬斯克發推呼吁大家伙使用 Composer 2.5,并表示該模型的訓練有一部分是在 Colossus 2 上進行的。



      Cursor 創始人稱,「我們在強化學習方面已經做得極其出色了。Composer 2.5 完成了越級挑戰,其表現遠遠超出了它這個參數規模應有的水平。對于下一個版本,我們無比興奮。我們將與 SpaceXAI 一起,大幅擴展模型規模和算力投入。」



      Composer 2.5 訓練體系

      Composer 2.5 的訓練體系引入了多項新改進,這些改進同時針對模型智能和可用性。

      一是,基于文本反饋的精準強化學習

      隨著單次推理過程可能長達數十萬 token,強化學習中的功勞分配正成為一個日益嚴峻的挑戰。當獎勵是基于整個推理過程計算時,模型很難分辨到底是哪一個具體決策幫助或損害了最終結果。當我們想要抑制某個局部行為,比如一次錯誤的工具調用、一處令人困惑的解釋,或是一種風格違規,這種局限性尤其明顯。最終獎勵能告訴我們出了某種問題,但對于問題出在哪里,它只是一個充滿噪聲的信號。

      為解決這一問題,Cursor 用精準文本反饋來訓練 Composer 2.5。思路是:在模型推理軌跡中本可以表現更好的那個具體節點,直接給出反饋。針對目標模型消息,Cursor 構造一個簡短的提示,描述期望的改進方向,將其插入局部上下文,并將得到的模型概率分布作為「教師」。同時,以原始上下文中的策略作為「學生」,加入一個同策略蒸餾 KL 損失,將學生的 token 概率向教師的概率拉近。這樣一來,既能獲得對目標行為的局部化訓練信號,又保留了基于完整軌跡的整體強化學習目標。

      以文本反饋過程為例:設想一個漫長的推理過程,其中包含一次工具調用錯誤:模型試圖調用一個并不存在的工具。過程中,模型會收到「未找到工具」的錯誤提示,并繼續做出其他有效的工具調用。在數百次工具調用中出現一次錯誤,對其最終獎勵的影響微乎其微。

      借助文本反饋,可以精準定位這一具體錯誤:在出錯的那一輪上下文中插入一條提示,如「提醒:可用工具有……」并附上可用工具列表。這條提示改變了教師模型的概率分布,降低了錯誤工具的調用概率,提高了有效替代方案的概率。然后,僅針對那一輪,將學生權重向新的概率分布更新。

      在 Composer 2.5 的訓練過程中,Cursor 將這一方法應用于多種模型行為,從代碼風格到模型溝通方式。



      二是,合成數據

      在強化學習訓練期間,Composer 的編程能力會顯著提升,直到能正確完成大部分訓練任務。為了持續提升智能水平,Cursor 在整個訓練過程中動態篩選并創建更困難的任務。Composer 2.5 使用的合成任務數量是 Composer 2 的 25 倍

      Cursor 采用了多種方法來創建基于真實代碼庫的合成任務。例如,其中一種方法是「功能刪除」:給智能體一個包含大量測試用例的代碼庫,要求它以某種方式刪除代碼和文件,使得代碼庫在移除某些可測試功能后仍能保持運行。合成任務就是重新實現被刪除的功能,而測試用例則用作可驗證的獎勵。

      大規模創建合成任務帶來的一個附帶后果是,它可能引發意想不到的獎勵破解行為。

      隨著模型能力越來越強,Composer 2.5 找到越來越精巧的變通方法來完成任務。有一個例子是,模型找到了一個遺留的 Python 類型檢查緩存,并逆向工程其格式,從而找到了一個被刪除的函數簽名。另一個例子中,它找到并反編譯了 Java 字節碼,重建了一個第三方 API。Cursor 通過智能體監控工具發現并診斷了這些問題,但它們也說明,大規模強化學習需要越來越謹慎。



      三是,分片 Muon 與雙網格 HSDP

      在持續預訓練中,Cursor 采用分布式正交化的 Muon 優化器。生成動量更新后,以模型的自然粒度運行 Newton-Schulz 迭代:對注意力投影按每個注意力頭處理,對堆疊的 MoE 權重按每個專家處理。

      主要開銷來自專家權重的正交化。對于分片參數,將同形狀的張量分批處理,通過全量交換(all-to-all)將分片匯聚為完整矩陣,運行 Newton-Schulz,再通過全量交換將結果傳回原始分片布局。這些傳輸是異步的:當一個任務在等待通信時,優化器運行時會推進其他 Muon 任務,使網絡傳輸與計算重疊。這等效于全矩陣 Muon,但能保持分片組持續忙碌;在 1T 參數模型上,優化器單步耗時僅 0.2 秒。

      這與 Cursor 為 MoE 模型使用 HSDP 的方式密切相關。HSDP 構成多個 FSDP 副本,并在對應的分片之間進行梯度的全歸約操作。Cursor 對非專家權重和專家權重使用各自獨立的 HSDP 布局:非專家權重相對較小,其 FSDP 組可以保持較窄的范圍,通常在一個節點或機架內;而專家權重承載了絕大部分參數和大部分 Muon 計算量,因此使用更寬的專家分片網格。

      保持這些布局獨立還能讓獨立的并行維度得以重疊:例如 CP=2 和 EP=8 可以在 8 塊 GPU 上運行,而不需要在單一共享網格中占用 16 塊。這樣既避免了小型非專家狀態的大范圍通信,又將專家優化器的計算工作分攤到更多 GPU 上。

      Composer 2.5 定價

      Composer 2.5 定價為每百萬輸入 token 0.50 美元每百萬輸出 token 2.50 美元

      另有一個速度更快、智能水平相同的變體,定價為每百萬輸入 token 3.00 美元,每百萬輸出 token 15.00 美元,比其他前沿模型的快速版更便宜。

      博客地址:https://cursor.com/blog/composer-2-5

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      名場面+1,因卡皮耶短褲被圖安澤貝鞋釘帶下臀部展露無遺

      名場面+1,因卡皮耶短褲被圖安澤貝鞋釘帶下臀部展露無遺

      懂球帝
      2026-05-19 11:27:15
      潔麗雅發布嚴正聲明:已向公安機關報案

      潔麗雅發布嚴正聲明:已向公安機關報案

      每日經濟新聞
      2026-05-19 00:43:13
      評電影《監獄來的媽媽》——輿論陣地已全面失守

      評電影《監獄來的媽媽》——輿論陣地已全面失守

      閑閑碎
      2026-05-18 21:49:55
      陳夢樊振東被拒之門外,王勵勤這“一刀”,砍掉了國乒30年老規矩

      陳夢樊振東被拒之門外,王勵勤這“一刀”,砍掉了國乒30年老規矩

      劉哥談體育
      2026-05-19 16:14:52
      中俄元首戰略引領,兩國合作不斷拓展,普京今日開啟第25次訪華

      中俄元首戰略引領,兩國合作不斷拓展,普京今日開啟第25次訪華

      環球網資訊
      2026-05-19 07:01:06
      “脖子被死死壓住,根本無法開口呼救,硬生生扯出來的……”男子在健身房臥推145kg杠鈴突發意外

      “脖子被死死壓住,根本無法開口呼救,硬生生扯出來的……”男子在健身房臥推145kg杠鈴突發意外

      揚子晚報
      2026-05-18 12:39:36
      太解氣了!老師硬剛家長對話流出:你能投訴六次,我就能依法維權

      太解氣了!老師硬剛家長對話流出:你能投訴六次,我就能依法維權

      火山詩話
      2026-05-18 07:34:35
      4人赴泰考察失聯13天:出國不可怕,可怕的是熟人設下的溫柔圈套

      4人赴泰考察失聯13天:出國不可怕,可怕的是熟人設下的溫柔圈套

      米果說識
      2026-05-19 16:57:18
      77歲曹查理獨居東莞租房:拍三級片賺了幾千萬,如今一套房都沒留

      77歲曹查理獨居東莞租房:拍三級片賺了幾千萬,如今一套房都沒留

      飄飄然的娛樂匯
      2026-05-14 21:50:07
      張藝謀也沒想到,央劇《主角》劉浩存還沒出場,竟先背上了個罵名

      張藝謀也沒想到,央劇《主角》劉浩存還沒出場,竟先背上了個罵名

      喜歡歷史的阿繁
      2026-05-19 16:35:16
      兆易創新成交額達200億元

      兆易創新成交額達200億元

      每日經濟新聞
      2026-05-19 14:37:53
      3300億光纖巨頭,迎來潑天富貴!

      3300億光纖巨頭,迎來潑天富貴!

      投研邦V
      2026-05-18 19:56:33
      在日打拼國人感慨:別聽媒體吹牛,日本如今相當于我國二線城市

      在日打拼國人感慨:別聽媒體吹牛,日本如今相當于我國二線城市

      鯨探所長
      2026-05-18 19:32:54
      以色列證實指揮官遇襲,哈達德與妻女全部喪生,曾六次躲過暗殺

      以色列證實指揮官遇襲,哈達德與妻女全部喪生,曾六次躲過暗殺

      老牧說說
      2026-05-19 04:40:56
      日本紙板無人機曝光,最便宜的武器開始消耗最貴防空

      日本紙板無人機曝光,最便宜的武器開始消耗最貴防空

      桂系007
      2026-05-19 13:24:30
      黃仁勛被全網確診灰指甲?高清鏡頭曝光,網友:千萬別和他握手!

      黃仁勛被全網確診灰指甲?高清鏡頭曝光,網友:千萬別和他握手!

      派大星紀錄片
      2026-05-19 11:27:49
      來自杭州的A股最貴*ST股摘帽了,今日停牌一天

      來自杭州的A股最貴*ST股摘帽了,今日停牌一天

      都市快報橙柿互動
      2026-05-19 00:29:29
      冠軍來了!阿森納有望“躺冠”,曼城必須全勝,同分必奪冠

      冠軍來了!阿森納有望“躺冠”,曼城必須全勝,同分必奪冠

      嗨皮看球
      2026-05-19 11:05:00
      特朗普:應卡塔爾、沙特阿拉伯、阿聯酋領導人請求,19日對伊朗的軍事打擊推遲“兩到三天”;內塔尼亞胡連續兩晚開會,為重啟戰事做準備

      特朗普:應卡塔爾、沙特阿拉伯、阿聯酋領導人請求,19日對伊朗的軍事打擊推遲“兩到三天”;內塔尼亞胡連續兩晚開會,為重啟戰事做準備

      都市快報橙柿互動
      2026-05-19 08:21:31
      不能二次加熱的6種食物!醫生提醒:吃不完或倒掉,別亂節儉

      不能二次加熱的6種食物!醫生提醒:吃不完或倒掉,別亂節儉

      冷眼看世界728
      2026-05-12 20:46:26
      2026-05-19 17:56:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      13034文章數 142651關注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      武大全面開放校園后一棵梧桐樹被刻字 校方回應

      頭條要聞

      武大全面開放校園后一棵梧桐樹被刻字 校方回應

      體育要聞

      文班亞馬1比0雷霆:凌駕MVP的史詩價值

      娛樂要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財經要聞

      從賣流量到賣Token,運營商算力生意破局

      汽車要聞

      配置全家桶 全新海獅05這次升級全在點上

      態度原創

      本地
      游戲
      房產
      藝術
      公開課

      本地新聞

      別搜晉江小說了,去看真的晉江

      血賺還是血虧?玩家只花100刀拿下索尼PS5精英手柄

      房產要聞

      7516元/㎡,161套一次全甩!海口住宅最低價出現了!

      藝術要聞

      三影堂攝影藝術中心舉辦藝術家孫瑞祥個展

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲和欧洲一码二码三码| 成人久久久久久久久久久| 国产超碰人人一区二区三区| 无码av免费精品一区二区三区| 国产综合精品日本亚洲777| 欧洲精品欧美精品| 年轻女教师hd中字3| 欧美性猛交久久久乱大交小说| 国产精品久久二区二区| 亚洲色欲色欲WWW在线丝| 久久摸摸碰碰97网站| 岛国AV在线| 欧美日激情日韩精品嗯| 国产真实自在自线免费精品| 长宁县| 国产成人精品18| 色偷偷av一区二区三区| 亚洲色图自拍| 亚洲人妻精品视频| 日批视频免费在线观看| 1000部拍拍拍18勿入免费视频 | 视频二区三区国产情侣在线| 亚洲丁香婷婷久久一区二区| 久久婷婷五月综合色一区二区| 成人区人妻精品一区二区| 国产制服丝袜在线视频观看| 亚洲人成网站日本片| 在线观看黄片在线播放视频| 亚洲日本va午夜中文字幕| 99国产成人综合久久精品| 97中文字幕在线| 欧美疯狂做受xxxx高潮| 日韩电影在线观看视频| 国产大片黄在线观看私人影院 | 国产九九精品视频| 蜜臀精品视频一区二区三区| 日本久久中文字幕| 精品无码老熟妇magnet| 极品少妇被弄得高潮不断| 成人性爱视频在线观看| 乱子伦av无码中文字|