<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      520,遇見國產「新模王」Qwen3.7-Max!

      0
      分享至



      編輯|+0、杜偉

      僅僅一個月后,阿里又帶著最強旗艦模型殺回來了!

      昨天一早,阿里給了全球開發者一個大大的驚喜,悄悄上線了 Qwen3.7 Preview,包括 Qwen3.7 Max Preview 與 Qwen3.7 Plus Preview 兩個版本。



      第三方權威評測機構 Arena 放出了這兩個模型的榜單成績,其中 Qwen3.7 Max Preview 與 Qwen3.7 Plus Preview 分別拿下了文本領域、視覺領域的國產模型第一。



      左為 Qwen3.7 Max Preview,右為 Qwen3.7 Plus Preview

      Qwen3.7 預覽版的性能已經如此不俗,讓大家對正式版的表現充滿了期待。

      今天上午,在 2026 阿里云峰會上,阿里全新一代千問旗艦模型 Qwen3.7-Max 登場了!



      阿里巴巴集團通義大模型事業部負責人「周靖人」

      果然沒有令人失望,Qwen3.7-Max 一出手就是王炸。

      在 Arena 公布的最新一期全球大模型盲測總榜中,Qwen3.7-Max 總成績位列國產模型第一:傲視一眾國產大模型,包括 Kimi-K2.6、DeepSeek-v4 Pro、GLM-5.1,性能直逼 GPT、Claude、Gemini 等全球最強模型



      除了亮眼的總榜成績,Qwen3.7-Max 特別針對當下被眾多廠商押注并布局的 Agent 進行了系統性優化,憑借 Agentic、推理、通用等能力的持續突破,進一步拉高了其作為下一代通用智能體底座的性能上限。



      編程智能體方面,Qwen3.7-Max 在 SWE-Pro、SWE-Multilingual 等多個權威測評中均取得 SOTA 表現,其中在 Terminal Bench 2.0-Terminus 上取得最高 69.7 分,超過了 DeepSeek-v4-pro-Max、Claude-Opus 4.6 等一眾模型。

      通用智能體方面,Qwen3.7-Max 提升明顯,在 MCP-Atlas、MCP-Mark、Skillbench 等現實能力評測中表現優異,超越了 GLM-5.1、Kimi-K2.6 等,創下國產新高,并在 Kernel Bench L3 上展示了強大的 GPU 內核優化能力。

      而在推理方面, Qwen3.7-Max 表現同樣出色,在 GPQA Diamond、HLE、HMMT 2026 Feb、IMOAnswerBench 等核心推理測評中均超越了 Claude-Opus 4.6 及所有國產模型。

      通用能力與多語言方面,Qwen3.7-Max 在指令遵循評測 IFBench 中得分突破新高達到 79.1 分,在多語言理解和翻譯的 WMT24++、MAXIFE 評測中保持領先。

      智能體基座能力的全方位躍升,讓 Qwen3.7-Max 有了挑戰真實運行環境中超長程編程任務的底氣。在發布會上,阿里展示了一個 AI 自主迭代的工程創舉:

      Qwen3.7-Max 被放在了一個全新硬件平臺(平頭哥訓推一體 AI 芯片真武 M890)上,工作空間里只有任務描述、SGLang Triton 參考實現和評測腳本,沒有任何其他提示或干預。結果,模型連續編程 35 個小時,自主完成了一個生產級注意力內核算子的優化。并且,經過模型優化的推理內核比 SGLang Triton 官方參考實現取得了 10 倍的加速。效率如此之高的 AI 平替誰不喜歡呢。

      模型「化身」一位資深工程師,進行了 432 次內核評估、1158 次工具調用,從編寫、編譯、性能分析到迭代改進,全程都由自己完成。



      在接下來的實測環節,Qwen3.7-Max 在處理復雜智能體任務中的速度和準確度都讓人眼前一亮。

      一手實測

      從零代碼開發到復雜工具調度

      如果你沒有任何編程基礎,想要自己做一個電腦上的小工具(比如一個極簡的桌面番茄鐘),在以前,你需要從零開始學寫代碼、學配環境、學怎么修 Bug,最后還要學怎么把代碼打包成雙擊就能運行的 .exe 軟件。

      但現在,在 Qwen3.7-Max 模型強大的原生 Agent 推理能力驅動下,搭配上 Claude Code 這樣的執行工具,你只需要下達簡短指令「幫我做一個桌面番茄鐘應用」,它就能在背后為你擺平一切。

      面對模糊的需求,Qwen3.7-Max 展現了極強的產品架構能力。它沒有直接開始堆砌代碼,而是謀定而后動。在確認了技術棧(Python + PyQt)和功能范圍后,模型迅速輸出了一份結構化的 Markdown 架構計劃,并指揮工具開始執行。



      缺少工具?沒關系,大模型會調度系統自動安裝,全程不需要你操心。在運行中,由于電腦路徑不匹配引發了連續的紅字報錯,當 Claude Code 將報錯信息抓取回來后,Qwen3.7-Max 瞬間鎖定了錯誤根源,并展現出驚艷的自我糾錯能力。它迅速推理出了好幾種替代命令方案進行動態試錯。短短幾秒內,它就排除了系統環境的干擾,把精美的番茄鐘穩穩地彈到了你的桌面上。



      有不滿意的地方,比如想換個莫蘭迪色系,只要一句話,模型就能精準理解審美需求并修改代碼,分分鐘解決。



      如果你想把這個好用的番茄鐘發給朋友,只需要下達終極交付指令:「幫我打包成 exe」。Qwen3.7-Max 再次發揮 Agent 本能,識別出環境缺失后,生成對應指令讓工具自動安裝了打包依賴。經過它在后臺的一頓絲滑調度,原本復雜晦澀的代碼,變成了一個干干凈凈的 .exe 文件,安靜地躺在你的文件夾里,雙擊就能用。



      如果你覺得讓 AI 寫個桌面軟件只是大模型在代碼「舒適區」里的基操,那不妨看看它在真實的互聯網環境、CLI 以及 Skill 調用中,是如何展現真正的 Agent 實力的。

      我們先調用近期很火的 CLI 工具,首先讓 Agent 幫我下載了 opencli,讓它具備了直接觸達并檢索全網信息的能力。



      下達指令「使用 opencli 工具,幫我查查小紅書上北京必吃的粵菜,附圖片」后,Qwen3.7-Max 迅速從零開始「閱讀」工具文檔,自主摸索出了正確的調用語法。在抓取過程中,程序遭遇了網絡超時崩潰,它也自主推理出了修改底層配置的繞路方案來延長等待時間。





      你不需要看懂它在后臺排除了多少次 Bug,只需幾分鐘,它就已經把滿屏的美食圖片穩穩地下載到了你的本地文件夾里。收集完素材后,當然還可以讓 Agent 順手把調研結果快速轉為 PPT 和在線文檔,完成工作流閉環。







      Agent 的另一項核心能力,在于能針對特定場景靈活調用 Skill。

      面對一段充滿「首先其次最后」、「跨越時空的贊歌」等套路化詞匯的游記,只需簡短地輸入「去 AI 味」,Qwen3.7-Max 準確識別了文字修改的核心訴求,并主動調度了系統內的 Skill。



      在完成重寫后,模型輸出了一份結構化的 Markdown 復盤表格。它條理清晰地列出了自己去除了哪些「填充短語」和「宣傳性語言」,并從「直接性」、「真實性」等維度對修改結果進行了量化打分。



      從零基礎的桌面軟件開發,到陌生終端工具的自主摸索,再到高階文本的技能調度與反思,Qwen3.7-Max 在這三個場景中,展現的不只是單純的文本生成能力,還有高度成熟的 Agent 獨立執行力。

      三個月三連更

      阿里按下 AI「加速度」

      這一連串令人矚目的榜單成績與實戰效果,是千問大模型近期狂飆的一個縮影。

      千問旗艦模型的迭代周期已經卷到「月更」:3 月 20 日,Qwen3.5-Max-Preview 發布;4 月 20 日, Qwen3.6-Max-Preview 發布。到今天,Qwen3.7-Max 又來了。對于用戶來說,正在經歷「幸福的煩惱」。



      圖源:@LotusDecoder

      能保證一個月推出一代旗艦模型,靠的絕非只是模型團隊的「肝」。阿里自今年 3 月成立 ATH(Alibaba Token Hub)組織以來,逐漸形成的芯片、云、模型、應用全棧能力,才最大程度上促成了如今的局面。

      其中,平頭哥的定制芯片提供了極致的訓練與推理效率,阿里云的彈性算力讓大規模預訓練和部署無縫銜接,模型層的快速迭代又能直接反哺上層應用。這樣的垂直整合壓縮了溝通成本和工程損耗,讓千問的研發節奏可以像互聯網產品一樣快速滾動。

      可以說,千問旗艦模型的加速度,源自阿里全棧 AI 體系的爆發。這種體系化的壁壘優勢,要比單個模型的一次刷榜高分更難復制。

      千問在走高頻迭代路線的同時,也沒有放棄對開源社區的深耕。不夸張地說,千問已經成為國產乃至全球開源模型的標桿,幾乎每次新發布都會引起極大的關注。

      上個月開源的 Qwen3.6-27B 和 Qwen3.6-35B-A3B 更是成為「以小勝大」的代表作,登頂了 HuggingFace 全球開源榜單,在主要編程基準上全面超越了上代更大體量的 Qwen3.5-397B-A17B,也大幅領先同等規模的稠密模型。



      這些中小規模的千問模型,憑借極低的部署成本,提供了超越同尺寸甚至跨級挑戰的性能,更好地滿足了本地部署和定制化的剛需,讓全球開發者不自覺地將它們作為默認底座。正如一位用戶所說,「阿里正帶著千問飛速前進。開源這條賽道卷瘋了,但最終是所有人的勝利。」



      開源社區的口碑形成了強大的引力場,讓開發者「用腳投票」,在 API 調用上愿意為千問模型付費。

      上個月,Qwen3.6-Plus 奪得了全球知名大模型 API 調用平臺 OpenRouter 日榜和周榜的雙料冠軍,并首創了單日單模型調用量突破 1.4 萬億 Token 的全球紀錄。千問模型在全球開發者心目中的地位可見一斑。



      在收獲全球開發者心智的同時,千問也悄悄占據了全球 Token 經濟的流量入口。如今,Token 正在迅速成為了解決問題的通用輸入,而阿里通過千問牢牢抓住了這個發展節點。

      智能體軟件的地基

      正在被鋪設

      月更旗艦,看似「秀肌肉」,實際上是在為 Agent 時代搶占先機。

      不難發現,千問近半年來的模型均指向了同一個主題 —— Agent,其中 Qwen3.5 打造原生多模態智能體,Qwen3.6-Plus 走向現實世界智能體,Qwen3.7-Max 開辟智能體新前沿。每一次新發布都伴隨著模型自主規劃、工具調用與長程任務執行能力的提升。

      此次 Qwen3.7-Max 被寄予厚望。阿里想將它打造成為下一代全能智能體底座,因而不滿于其僅僅充當被調用的大腦,也希望通過下沉到硬件層,進行系統級編程與優化。Qwen3.7-Max 在平頭哥新 AI 芯片上成功運行 35 個小時超長程智能體任務,是這一轉變的有力例證。

      不僅如此,Qwen3.7-Max 還涌現出了跨智能體框架的泛化能力。無需專門訓練,就能絲滑支持 Claude Code、OpenClaw、Hermes Agent 等框架。這像極了當年操作系統的崛起邏輯,包括 PC 時代的 Windows、移動時代的 Android,通過統一的標準與接口,讓開發者在其上繁衍豐富的生態。

      千問正在努力搭建 Agent 時代的「標準接口」,讓自身成為不同智能體框架的首選底座。這種面向未來的布局,更具有戰略眼光。



      另外,Agent 時代拼的終歸還是模型能力能否站得住腳。阿里深知并一直踐行著這一點,并通過開源提升在全球開發者社區中的影響力。當越來越多開發者習慣于使用千問搭建智能體并運行任務時,阿里在下一代 Agentic 軟件生態的建設中就能掌握更多話語權。

      當下,Anthropic 與 OpenAI 通過「產品驅動」(Claude Code、Codex)路線贏得用戶和企業,并在商業市場謀求萬億美元上市。而作為國產大模型代表大廠之一的阿里,選擇了一條更難、更宏大的路徑,從技術到生態再到話語權,「全都要」。

      在這場關鍵的卡位戰中,阿里千問的野心遠比我們想象中的更大,它志在成為開發者構建智能體系統時最不可或缺的底層基礎設施。

      文中視頻鏈接:https://mp.weixin.qq.com/s/EvDiB0vpYh5-Ztx6OAfngg

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      世界唯一明代狀元卷,無一處涂改,文字像機器印刷,看完汗顏無地

      世界唯一明代狀元卷,無一處涂改,文字像機器印刷,看完汗顏無地

      收藏大視界
      2026-05-19 18:49:50
      伊朗總統:政府全力支持伊武裝力量

      伊朗總統:政府全力支持伊武裝力量

      澎湃新聞
      2026-05-21 23:24:03
      畢竟只是一個邊緣人物,馬刺替補控衛的個人能力還是差了一些的?

      畢竟只是一個邊緣人物,馬刺替補控衛的個人能力還是差了一些的?

      稻谷與小麥
      2026-05-21 23:31:07
      馬刺晉級概率跌至40%:??怂箽w期未定 哈珀大腿拉傷或休1周以上

      馬刺晉級概率跌至40%:??怂箽w期未定 哈珀大腿拉傷或休1周以上

      顏小白的籃球夢
      2026-05-21 12:14:23
      山西一位14歲女孩被活生生配冥婚,警察找到時發現,已與死者合葬

      山西一位14歲女孩被活生生配冥婚,警察找到時發現,已與死者合葬

      莫地方
      2026-05-20 01:40:03
      53票比39票!韓國瑜不在,藍白依然為高金素梅出頭,綠營集體破防

      53票比39票!韓國瑜不在,藍白依然為高金素梅出頭,綠營集體破防

      易昂楊
      2026-05-20 18:54:50
      河南貨車司機剛運出34噸面粉,遇大雨淋濕大半,面粉廠老板免賠還換了一車新貨,司機感動發聲:她說我也不容易,就不扣錢了,下次一定注意

      河南貨車司機剛運出34噸面粉,遇大雨淋濕大半,面粉廠老板免賠還換了一車新貨,司機感動發聲:她說我也不容易,就不扣錢了,下次一定注意

      洪觀新聞
      2026-05-21 12:02:45
      Netflix爆款動畫回歸,第二季前放大招

      Netflix爆款動畫回歸,第二季前放大招

      自愈小日子
      2026-05-20 02:03:55
      被丈夫鎖在門外那晚,我終于看懂婚姻里的控制

      被丈夫鎖在門外那晚,我終于看懂婚姻里的控制

      半勺甜心事
      2026-05-20 02:20:25
      全球股市集體跳水,原油跳漲!伊朗最高領袖下令:嚴禁高濃縮鈾外運

      全球股市集體跳水,原油跳漲!伊朗最高領袖下令:嚴禁高濃縮鈾外運

      中國基金報
      2026-05-21 21:41:49
      2026酒店入住新規:實名登記下,非夫妻成年男女合法同?。?>
    </a>
        <h3>
      <a href=今朝牛馬
      2026-05-21 21:42:41
      2026年度長三角地區主要領導座談會在上海舉行

      2026年度長三角地區主要領導座談會在上海舉行

      澎湃新聞
      2026-05-21 19:38:28
      深圳一渣土車撞倒電動車致1死1傷,當地教育局:受傷孩童系小學一年級學生,經搶救無效去世

      深圳一渣土車撞倒電動車致1死1傷,當地教育局:受傷孩童系小學一年級學生,經搶救無效去世

      大象新聞
      2026-05-20 20:52:30
      翁虹女兒顏值炸裂!憑成人禮火上熱搜,力壓小酒窩被封最美星二代

      翁虹女兒顏值炸裂!憑成人禮火上熱搜,力壓小酒窩被封最美星二代

      八卦王者
      2026-05-19 15:10:05
      馬斯克前腳剛走,78歲母親隨口一句話,讓中國網友集體破防

      馬斯克前腳剛走,78歲母親隨口一句話,讓中國網友集體破防

      史行途
      2026-05-20 00:13:07
      徹底出圈!《主角》劉浩存“翻跟斗”驚艷封神,張嘉譯果然沒說謊

      徹底出圈!《主角》劉浩存“翻跟斗”驚艷封神,張嘉譯果然沒說謊

      阿郎娛樂
      2026-05-20 21:44:18
      周薪35萬鎊!34歲曼聯巨星確定與邁阿密簽約3年,興奮將輔佐梅西

      周薪35萬鎊!34歲曼聯巨星確定與邁阿密簽約3年,興奮將輔佐梅西

      我愛英超
      2026-05-21 07:05:36
      紅船觀察丨副國級接見,黃仁勛老對手“蘇媽”訪華

      紅船觀察丨副國級接見,黃仁勛老對手“蘇媽”訪華

      紅船融媒
      2026-05-20 11:52:27
      突然找到了顏值飆升的秘訣了,網友:答案讓人意料不到??!

      另子維愛讀史
      2026-05-21 20:19:07

      陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

      陪玩陪睡根本不夠!認干爹、舔手指,背地里的陰暗面完全藏不住了

      杰絲聊古今
      2026-05-03 13:35:27
      2026-05-22 00:15:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      13055文章數 142651關注度
      往期回顧 全部

      科技要聞

      小米YU7 GT正式發布:售價38.99萬元

      頭條要聞

      叔侄倆將溺亡男子送回家離開 3天后男子被發現已腐爛

      頭條要聞

      叔侄倆將溺亡男子送回家離開 3天后男子被發現已腐爛

      體育要聞

      常住人口7000的小鎮,擁有了一支德甲球隊

      娛樂要聞

      反轉!金秀賢與金賽綸未成年時交往不實

      財經要聞

      潮水退去,裸泳的一定不止五糧液

      汽車要聞

      后驅+閃充+激光雷達 第三代元PLUS上市售11.99萬元起

      態度原創

      旅游
      健康
      房產
      教育
      公開課

      旅游要聞

      無主墓碑怎可當登山臺階 對逝者的敬畏,禁不起這么踩 | 封面評論

      外泌體與干細胞竟是“快遞”與“工廠”的關系?

      房產要聞

      順德澐璟樓王『澐冠』啟幕|一場高階共鳴的靜奢美學之約

      教育要聞

      一個方法讓孩子擁有解決問題能力

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成人h动漫无码网站久久| 午夜成人无码福利免费视频| 久久免费观看国产精品| 一级天堂| 亚洲色图欧美激情| 国产精品久久久久婷婷五月| 色综合久久久久8天国| 国产精品乱伦| 国产人妻精品午夜福利免费| 国产一级一片免费播放| 波多野av一区二区无码| 成年轻人电影www无码| 四虎精品一区二区三区| 午夜成人福利| 7777精品伊久久久大香线蕉| 国产精品永久久久久久久久久| 91人人妻| 亚洲多人视频在线观看| 国产av激情无码久久天堂| 性欧美vr高清极品| 日本一区二区中文字幕| 国产精品一区成人亚洲| 兴宁市| 国产成人亚洲综合网站| 欧妇女乱妇女乱视频| 亚洲国产中文字幕在线视频综合| 国产美女在线精品观看| 国产精品中文字幕观看| 亚洲精品国产AV| 亚洲国产99在线精品一区二区| 一本大道无码日韩精品影视| 亚洲日韩一区二区一无码| 在线v片免费观看视频| 国产乱码精品一区二区三区中文| 免费无码又爽又刺激高潮 | 久久AV青久久久AV三区三区| 护士脱了内裤让我爽了一夜视频 | 97色精品视频在线观看| 亚洲中文字幕系列第1页| 内射中出无码护士在线| 91午夜福利一区二区三区|