大家好,我是冷逸。
最近阿里千問的節(jié)奏,已經(jīng)不能用“高強(qiáng)度更新”來形容了,更像是“腹瀉式發(fā)布”。
想問下阿里的小伙伴,你們是不是把整個(gè)Qwen團(tuán)隊(duì)都蒸餾成了同事.skill啊,不然怎么做到一天發(fā)一個(gè)模型的?
你看這節(jié)奏:
3月30日,發(fā)布全模態(tài)模型Qwen3.5-Omni,直接拿下215項(xiàng)SOTA;
4月1日,發(fā)布圖像模型Wan2.7-Image,據(jù)我身邊不少朋友實(shí)測(cè),超長文字渲染能力離譜地強(qiáng);
4月2日,發(fā)布基座大模型Qwen3.6-Plus,比3.5又拉開了一截;
4月3日,又掏出Wan2.7-Video,一句話就能P視頻。
![]()
真的,如果我有5個(gè)冷逸.skill,我一定把這些模型全都測(cè)一遍。
可惜,目前我還沒完成自我煉化,只有一個(gè)真人冷逸。所以今天,我們重點(diǎn)測(cè)一下Qwen3.6-Plus。
先快速認(rèn)識(shí)一下這個(gè)模型:
100M上下文窗口
重點(diǎn)強(qiáng)化Agentic Coding
原生多模態(tài)(支持文本/圖片/視頻輸入)
原生聯(lián)網(wǎng)+Function Calling,可調(diào)用外部工具,適配龍蝦
API價(jià)格:輸入¥2/百萬tokens,輸出¥12/百萬tokens,不到Claude的1/18
兼容OpenAI和Anthropic協(xié)議,Claude Code、Codex和OpenClaw都能用
![]()
順帶一提,這張信息圖,也是Qwen3.6-Plus直接生成的。
![]()
一手實(shí)測(cè)
這次,我主要測(cè)了3大場(chǎng)景6個(gè)Case,交叉使用Claude Code、OpenClaw、cherry studio、chat.qwen.ai來綜合評(píng)估這個(gè)模型。
1)視覺編程
先來個(gè)簡單的。
我給了Qwen3.6-Plus一張學(xué)生書包圖片,讓它生成商品網(wǎng)頁。
Prompt:請(qǐng)為這款學(xué)生書包設(shè)計(jì)一個(gè)精致的圖文發(fā)布網(wǎng)頁,目標(biāo)人群是6-15歲的中小學(xué)生。
![]()
出來的頁面還挺像那么回事。
![]()
整體主色調(diào)是奶油白 + 暖灰,和書包本身的米白色呼應(yīng)。視覺風(fēng)格是典型的日系極簡風(fēng)(Minimalist & Clean)。
既保留了學(xué)生用品的親和力,又不會(huì)顯得廉價(jià)。
能看出,這個(gè)模型對(duì)視覺內(nèi)容的理解還是比較在線的。
于是我決定給它加點(diǎn)難度。我喂了一整個(gè)文件夾模特照片,讓它生成一個(gè)攝影師作品網(wǎng)站。
Prompt:我是拍模特廣告的攝影師,我的工作室叫「小逸攝影」,文件夾 D:\Vibe Coding\Qwen3.6-plus\模特圖片 放了一些模特圖片,給我生成一個(gè)高級(jí)審美、大師水準(zhǔn)的攝影師作品網(wǎng)站,用上文件夾里的圖片并配上精美的講解。
成品出來的時(shí)候,我第一反應(yīng)是:有點(diǎn)驚艷。
整體是深色主題+金色點(diǎn)綴+優(yōu)雅字體,整個(gè)氣質(zhì)看起來像那種電影節(jié)攝影展網(wǎng)站。
而且細(xì)節(jié)也沒偷懶:
點(diǎn)擊圖片燈箱放大
頁面滾動(dòng)漸顯動(dòng)畫
響應(yīng)式設(shè)計(jì)(手機(jī)/平板自適應(yīng))
但真正讓我意外的,是它的文案能力,我挑幾張給大家看下。
![]()
![]()
![]()
真的,這種一看就很高級(jí),很舒服。
很多模型做網(wǎng)頁有個(gè)通病:「UI很好看,但文案像實(shí)習(xí)生寫的。」
但Qwen3.6-Plus這次,從Logo到Slogan,以及小字解釋,它寫的文案,我?guī)缀跆舨怀鍪裁疵 ?/p>
Vibe Coding真正進(jìn)入生產(chǎn)場(chǎng)景,多模態(tài)能力是剛需。目前全球既擅長Coding又具備視覺理解能力的模型,其實(shí)沒幾家。
從我的實(shí)測(cè)來看,Qwen3.6-Plus在視覺編程這一塊,是合格的。
2)視覺理解&推理
接著,我測(cè)了一個(gè)稍微變態(tài)一點(diǎn)的題。
一張成都地鐵線路圖。
![]()
問題是:我在二仙橋,如果7號(hào)線癱瘓,我去火車南站一共有多少條路線?最少的換乘路線是哪條?
這題其實(shí)挺難的,模型思考了128秒才回答我。
![]()
我原本以為它會(huì)翻車,結(jié)果卻答對(duì)了。
![]()
接著我又測(cè)了一道題,把Qwen3.6-Plus的視覺benchmark表現(xiàn)發(fā)過去,問它Qwen3.6究竟強(qiáng)在哪里。
![]()
答案:
![]()
現(xiàn)在,再回過頭來看這張benchmark,一下子就懂了。
這說明什么?
說明這個(gè)模型已經(jīng)不只是看圖識(shí)物、OCR文字識(shí)別,而是能結(jié)合視覺理解、路徑推理、信息定位,來完成復(fù)雜任務(wù)。
當(dāng)模型不再停留在“看懂圖片”,而是開始圖表解析、UI理解、文檔理解、細(xì)粒度定位……那它就已經(jīng)不是一個(gè)“視覺模型”,而是開始向多模態(tài)智能體進(jìn)化。
而Qwen3.6-Plus,正是阿里發(fā)布的第二款原生多模態(tài)基座模型。
3)Agentic任務(wù)
最后,我重點(diǎn)測(cè)了一件事情:Agentic能力+長程任務(wù)。
第一個(gè)case,是我前幾天給大家介紹過的自動(dòng)寫公眾號(hào)神器。
我的需求是:
給我做一個(gè)“沃垠AI寫作神器”的全功能網(wǎng)站,直接打開html主頁就能運(yùn)行。功能要求:
1、有三個(gè)核心功能:正文生成、標(biāo)題摘要生成(先生成正文后,再根據(jù)正文來生成標(biāo)題和摘要)、封面生成。正文、標(biāo)題摘要接同一個(gè)模型,圖片接另外一個(gè)模型。
2、主界面有一個(gè)輸入會(huì)話框,給到示例模板“幫我寫一篇公眾號(hào)文章,主題是xx,字?jǐn)?shù)xx,內(nèi)容要點(diǎn)有:1.xx,2.xx……”,用戶輸入內(nèi)容主題和寫作要求后,開始調(diào)用大模型進(jìn)行寫作。
3、輸入會(huì)話框設(shè)計(jì)有“聯(lián)網(wǎng)”功能,支持用戶手動(dòng)打開和關(guān)閉聯(lián)網(wǎng)功能。
4、輸入會(huì)話框還設(shè)計(jì)有風(fēng)格1、風(fēng)格2等可選的寫作風(fēng)格模板。目前只有一個(gè)“風(fēng)格1:科技媒體評(píng)論”,風(fēng)格控制Prompt見本地文件“風(fēng)格1:科技媒體評(píng)論.txt”。
5、寫作和生圖均支持用戶自行調(diào)用大模型。調(diào)用接口設(shè)計(jì)成可視化窗口,用戶只需要輸入模型url、模型key和模型名字,就可以使用。
5、先寫正文,寫完正文后,再批量出一批標(biāo)題和摘要,供用戶選擇。
6、最后,再根據(jù)本文的核心內(nèi)容提煉2-3個(gè)關(guān)鍵內(nèi)容點(diǎn),并生成封面圖片的文生圖prompt,統(tǒng)一尺寸比例2.35:1,用戶選定某個(gè)prompt后,調(diào)用生圖模型一鍵生成封面圖片。
7、正文和標(biāo)題摘要,都設(shè)計(jì)有復(fù)制按鈕,支持用戶一鍵復(fù)制文本。封面圖片,設(shè)計(jì)有下載按鈕,支持用戶下載到本地。
新版「沃垠AI寫作神器」,不需要做本地配置,直接打開HTML,然后接入API就能用。
它可以自由加載你訓(xùn)練的寫作風(fēng)格(結(jié)構(gòu)化的提示詞),只需要點(diǎn)“寫作風(fēng)格”旁的+號(hào),它會(huì)自動(dòng)解析文件內(nèi)容(文件名統(tǒng)一為“風(fēng)格xxx.txt”),并添加到下拉列表。后面,我們只需要點(diǎn)一下就能使用。
![]()
需要新版本的朋友,直接后臺(tái)回復(fù)【寫作】,就能領(lǐng)走這個(gè)HTML。
這次開發(fā),我只迭代了5個(gè)版本,整個(gè)過程半小時(shí)搞定,直接交付2000+行可運(yùn)行代碼。
比我上次的開發(fā)效率,至少提升了兩倍。
接著,我又用搜索+office+skills任務(wù)測(cè)了一輪Qwen3.6-Plus。
需求是,聯(lián)網(wǎng)調(diào)研張雪機(jī)車的發(fā)展軌跡,生成5000字Word報(bào)告,然后調(diào)用skills把報(bào)告做成知識(shí)網(wǎng)站。
Prompt:聯(lián)網(wǎng)搜索、調(diào)研張雪機(jī)車的發(fā)展軌跡,盡量從權(quán)威信源獲取信息。首先,給我創(chuàng)建一份5000字的word調(diào)研報(bào)告。然后,調(diào)用Knowledge Site Creator Skills給這份報(bào)告創(chuàng)建一個(gè)知識(shí)學(xué)習(xí)網(wǎng)站,頁面高級(jí)審美。
期間,模型調(diào)用了web search、python-docx、Claude skills等工具。我數(shù)了一下,工具調(diào)用超過50次。
先看word報(bào)告。
![]()
信息完整度還是不錯(cuò)的。老實(shí)說,我一直想系統(tǒng)了解張雪機(jī)車,這份報(bào)告對(duì)我來說挺有價(jià)值。
然后再看它生成的知識(shí)網(wǎng)站。
我第一眼看到的時(shí)候,直接一句「臥槽」。
這UI和內(nèi)容質(zhì)量,都比我預(yù)期高很多。
整體跑下來,我的結(jié)論很簡單:Qwen3.6-Plus的Agentic能力,明顯被低估了。
當(dāng)一個(gè)模型同時(shí)擁有:
100M上下文
原生多模態(tài)
強(qiáng)工具調(diào)用能力
那它在Agentic Coding和Agentic Work領(lǐng)域,都是非常有想象空間的。
![]()
整體體驗(yàn)下來,我覺得Qwen3.6-Plus在文本推理、視覺理解、代碼能力、長程任務(wù)和Agentic能力上都還挺強(qiáng)的。
難怪它能夠在多個(gè)benchmark上拉開Qwen3.5一大截。
![]()
而這個(gè)價(jià)格卻不到Claude的1/18。
這就有點(diǎn)像什么?
就好像一個(gè)演員,明明是小李子的演技,卻拿著李洪綢的片酬,然后天天坐在片場(chǎng)看隔壁李現(xiàn)的表演。
更離譜的是,這個(gè)李洪綢,還時(shí)不時(shí)把自己的作品免費(fèi)上傳B站。
這對(duì)嗎?
說實(shí)話,我不知道。
但我在他們官方文章里看到一句話:在未來不久,我們還將開源更小規(guī)模的模型版本,以此重申我們對(duì)技術(shù)普惠與社區(qū)驅(qū)動(dòng)創(chuàng)新的堅(jiān)定承諾。
看完后,我就覺得:源神牛逼。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.