<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      橫評DeepSeek、Claude、GPT、Kimi,結果大跌眼鏡…

      0
      分享至

      大家好,我是冷逸。

      最近,模型圈又卷起來了,A廠、O廠和鯨魚都陸續發布了新模型。特別是DeepSeek V4,一發布就沖上了各種熱搜。

      好多人都在問DeepSeek V4到底在開源模型中是什么地位,又和閉源模型差多少呢?

      于是,我花了400元,實測對比了幾款熱門大模型,分別是:公認的頂級閉源模型 Claude Opus 4.6、GPT-5.4和頂級開源模型Kimi K2.6、DeepSeek V4 Pro。


      下面,我們基于實測結果,全面評估一下Kimi K2.6、DeepSeek-V4-Pro、Claude Opus 4.6以及GPT-5.4,看看如今的AI頂流之戰,誰才是真正的版本答案。


      一手實測

      1)前端:信息圖

      先測一個我們最常用到的信息圖,主要看模型的信息提煉能力、視覺排版能力和內容完整度。

      提示詞:提煉下面文字內容的核心關鍵點,創建一個HTML網頁。
      文字內容:
      {
      這里是一段文字內容
      }
      網頁的設計要求如下:
      1.視覺設計:采用{Magazine Layout}風格布局,{深色}主題色,營造現代高端氛圍。
      2.字體與排版:
      ·使用超大字體或數字突出核心要點,中文采用大號粗體,強調視覺沖擊力。
      ·英文使用小號字體作為點綴,與中文形成比例反差,提升設計層次感。
      3視覺元素:
      ·融入超大視覺元素(如標題、背景圖或裝飾)以突出重點,與小型元素形成強烈對比。
      ·使用簡潔的勾線風格圖形作為數據可視化或配圖元素,保持現代感和清晰度。
      4.色彩與效果:運用高亮色(單色透明度漸變)營造科技感,每種高亮色獨立使用,避免不同高亮色之間的漸變混雜。
      5.技術要求:引入專業圖標庫(如Font Awesome或Material Icons,通過CDN加載),避免使用emoji作為主要圖標。
      6.內容要求:提煉內容關鍵要點,不忽略重要細節。

      Claude Opus 4.6:


      GPT-5.4:


      DeepSeek-V4-Pro:


      Kimi K2.6:


      整體來看,Kimi K2.6和DeepSeek-V4-Pro在這個case中表現最好,內容提煉得到位,視覺效果也更具沖擊力,布局、配色和字體搭配有層次感。

      Claude Opus 4.6內容總結得不錯,關鍵信息都沒有遺漏,但是視覺效果一般。GPT-5.4 也是同樣的問題。

      2)前端:旅游網站

      接下來,我們試試讓大模型看圖做設計,測測模型的圖片理解和審美遷移能力。

      提示詞:你是一個有頂級審美的網頁設計專家,請根據"xxxx.jpg"這張圖的元素和風格,設計一個旅游網站。

      Claude Opus 4.6:


      GPT-5.4:


      DeepSeek-V4-Pro:


      Kimi K2.6:


      這個項目完成最好的是Claude Opus 4.6和Kimi K2.6,對于我給出的圖片風格都有自己的理解,并且按照這個理解來設計視覺效果。

      而DeepSeek-V4-Pro和GPT-5.4做的網頁,圖片都沒加載出來,前者是因為不支持多模態,但是后者應該不至于。

      3)3D任務

      3D任務主要看模型的前端能力,考驗模型對三維空間理解、Three.js組織能力和生成結果的穩定性。

      提示詞:制作一個3D的雪山場景html,雪山中間有一個中式的寺廟,整體風格參考塞爾達曠野之息。

      Claude Opus 4.6:


      GPT-5.4:


      DeepSeek-V4-Pro:


      Kimi K2.6:

      在這個任務中,GPT-5.4的表現不及格,一直卡在雪山頁面根本動不了;DeepSeek-V4-Pro倒是完成了任務,但是建模肉眼可見的粗糙。

      Claude Opus 4.6和Kimi K2.6的建模就很不錯,3D場景創建的挺好,旋轉、縮放展示也都非常流暢,做到了提示詞要求的“雪山+日式寺廟+塞爾達風格”。

      特別是Kimi K2.6,雪山、建筑、雪花粒子這些細節上的表現,真的太強了。

      4)網站開發

      需求是,讓模型基于我給到的模特照片,做一個攝影師作品集網站。

      提示詞:我是拍模特廣告的攝影師,我的工作室叫「小逸攝影」,文件夾 xxx 放了一些模特圖片,給我生成一個高級審美、大師級別水準的攝影師作品集網站,用文件夾里的圖配上精美的講解。

      Claude Opus 4.6:

      GPT-5.4:


      DeepSeek-V4-Pro:


      Kimi K2.6:

      Kimi K2.6生成的網頁實在是太棒了,在logo、文字配色、交互動畫這些UI細節上的表現非常強,說明是真的讀懂了圖像,完全是基于圖片內容和風格來生成的。

      Claude Opus 4.6生成的頁面風格也非常有特點,但圖片的展示比較簡單。

      至于DeepSeek-V4-Pro和GPT-5.4我只想說,為啥別人都有圖,你倆卻加載不出來。很明顯是遇到bug了,需要人工來修。

      5)Skills任務

      前兩天,我用跑了一個PPT,效果非常滿意。這次也讓所有模型都來對比一下。

      提示詞:根據"xxxx.txt"的內容,用guizang-ppt-skill做一份10頁的PPT。

      Claude Opus 4.6:


      GPT-5.4:


      DeepSeek-V4-Pro:


      Kimi K2.6:


      這個調用skill的任務,四個模型都調用成功了。做出來的效果也大差不差,沒啥大的區別,可能skill已經把路徑限制的很死,沒留太多模型自我發揮的余地。

      6)Agent長程任務

      任務,還是我們的老case,讓Claude Code做一個聯網搜索+word生成+skill調用+網站開發的復雜長程任務。

      提示詞:聯網搜索、調研張雪機車的發展軌跡,盡量從權威信源獲取信息。首先,給我創建一份5000字的word調研報告。然后,調用qiaomu-knowledge-site-creator skill給這份報告創建一個知識學習網頁,頁面高級審美。

      Claude Opus 4.6:



      GPT-5.4:



      DeepSeek-V4-Pro:



      Kimi K2.6:



      因為是長程任務,需要模型先后調用WebSearch、python生成word、skills和網站開發等工具能力,還包括網站上線前測試的chrome-devtools-mcp,所以這個長程任務,大家都消耗了很長的時間。

      所幸結果,大家都完成了。

      從生成的調研報告來看,Kimi K2.6是最好的(他們家的WebSearch能力一直就很強),其次是Claude Opus 4.6和DeepSeek-V4-Pro,最差的是 GPT-5.4,你好歹給我排版一下啊。

      從生成的網站來看,GPT-5.4嘴上說調用skill成功,但是最后生成的東西完全跟 skill不符,其他三個都生成的中規中矩,Kimi K2.6在頁面美化上稍強一點。

      7)費用情況

      最后,我們來算一下Coding成本。

      本期測評花費如下:

      • Claude Opus 4.6,16.4美刀;

      • GPT-5.4,22.8美刀;

      • Kimi K2.6,我用的是Coding Plan套餐,大概消耗里月額度的1/10,換算下來是4塊錢;

      • DeepSeek-V4-Pro,接的昨天降價后的API,約2.4元。


      第三方平臺對Claude和GPT的費用統計

      說實話,對于這個成本來說,Claude和GPT是非常不劃算的,Claude生成的效果與Kimi差不多,但價格竟然差了近30倍!GPT更是效果也不好,但卻是花得最多的,十分不推薦。

      降價后的DeepSeek,算是物美價廉。


      綜合測評下來,如果要論成本,API降價后的DeepSeek V4無疑是最劃算的。但是它沒有多模態,很多coding場景受限。

      如果要論性價比,Kimi K2.6則是最合適的,能力比肩甚至超越全球頂尖模型,而成本卻不到他們的幾十分之一。

      另外,kimi也有多模態,Agent能力在線,綜合能力確實不錯。

      而Claude和GPT,至少在本次任務測試中并未表現出有代差的能力,大家旗鼓相當。甚至部分場景,GPT還比較拉胯。

      我是冷逸,你們的AI測評手替。如果你有想測的場景,歡迎在評論區甩出來,咱們互相抄作業。

      如果覺得本期內容有用的話,歡迎點贊+在看+轉發,讓更多人看見,感恩。

      咱們下期見。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      哈蘭德經紀人親口爆料續約內幕:面對曼城,我們毫無談判籌碼

      哈蘭德經紀人親口爆料續約內幕:面對曼城,我們毫無談判籌碼

      夜白侃球
      2026-05-07 10:07:16
      廳級干部已經成為了高危職業

      廳級干部已經成為了高危職業

      風向觀察
      2026-05-04 14:17:07
      美媒稱中國正開展全國動員,殲36、殲50生產數量超美國兩倍

      美媒稱中國正開展全國動員,殲36、殲50生產數量超美國兩倍

      咸魚金腦袋
      2026-05-07 13:01:23
      與柯文哲黃國昌有不正當男女關系?臺灣民眾黨美女候選人發文回擊

      與柯文哲黃國昌有不正當男女關系?臺灣民眾黨美女候選人發文回擊

      海峽導報社
      2026-05-07 12:12:04
      我跟村花打賭:你這么漂亮肯定能嫁個大老板,她說:嫁給你吧

      我跟村花打賭:你這么漂亮肯定能嫁個大老板,她說:嫁給你吧

      千秋文化
      2026-05-05 20:26:39
      巴黎6-5淘汰拜仁!第3次進歐冠決賽 跟阿森納爭冠 登貝萊閃擊破門

      巴黎6-5淘汰拜仁!第3次進歐冠決賽 跟阿森納爭冠 登貝萊閃擊破門

      侃球熊弟
      2026-05-07 04:17:48
      東體:內地媒體遲遲無法辦理世界杯簽證,體育版權定價應回歸理性

      東體:內地媒體遲遲無法辦理世界杯簽證,體育版權定價應回歸理性

      懂球帝
      2026-05-07 11:16:09
      俄羅斯尷尬了!5月9日勝利日核心嘉賓拒絕參加!

      俄羅斯尷尬了!5月9日勝利日核心嘉賓拒絕參加!

      回京歷史夢
      2026-05-07 12:36:26
      軍售放行后,日烏開始共制武器

      軍售放行后,日烏開始共制武器

      鳳凰WEEKLY
      2026-05-06 19:44:21
      “全部約滿”!不少深圳人搶到了!網友:早上定5、6個鬧鐘就為了搶號

      “全部約滿”!不少深圳人搶到了!網友:早上定5、6個鬧鐘就為了搶號

      小影的娛樂
      2026-05-07 11:05:08
      美日菲“肩并肩2026”聯合演習中,一張熟悉的面孔再次出現

      美日菲“肩并肩2026”聯合演習中,一張熟悉的面孔再次出現

      三叔的裝備空間
      2026-05-06 23:40:02
      五一被罵最慘六大景區:泰山榜上有名,洛陽令人失望,第一太過分

      五一被罵最慘六大景區:泰山榜上有名,洛陽令人失望,第一太過分

      有范又有料
      2026-05-06 11:12:28
      鄧文迪三母女閃耀紐約紅毯,高定禮服很東方美,倆女兒又瘦又優秀

      鄧文迪三母女閃耀紐約紅毯,高定禮服很東方美,倆女兒又瘦又優秀

      攬星河的筆記
      2026-05-05 16:55:54
      研究表明:性生活次數不達標,不管男女容易早衰且癌癥風險增高!

      研究表明:性生活次數不達標,不管男女容易早衰且癌癥風險增高!

      黯泉
      2026-05-03 20:25:37
      倆11、12歲女孩五一失聯,慘遭熟人親屬殺害,手段殘忍令人發指

      倆11、12歲女孩五一失聯,慘遭熟人親屬殺害,手段殘忍令人發指

      老貓觀點
      2026-05-06 18:57:19
      被活埋夫妻遺體找到!家境慘到讓人落淚,當地人曝料:出事有預兆

      被活埋夫妻遺體找到!家境慘到讓人落淚,當地人曝料:出事有預兆

      一盅情懷
      2026-05-06 11:48:41
      小S阿雅重返大S母校,翻看大S畢業照時,小S哽咽哭泣

      小S阿雅重返大S母校,翻看大S畢業照時,小S哽咽哭泣

      素素娛樂
      2026-05-07 08:45:10
      英媒:吳宜澤吞云吐霧照片讓老球迷更喜歡,他風格很像颶風希金斯

      英媒:吳宜澤吞云吐霧照片讓老球迷更喜歡,他風格很像颶風希金斯

      楊華評論
      2026-05-06 15:14:00
      特朗普白宮追問39次:馬霍姆斯能趕上揭幕戰嗎?

      特朗普白宮追問39次:馬霍姆斯能趕上揭幕戰嗎?

      娛圈觀察員
      2026-05-06 13:40:45
      魔怔了?被罰5萬還不服,再次怒噴亞歷山大,年薪5300萬不怕罰款

      魔怔了?被罰5萬還不服,再次怒噴亞歷山大,年薪5300萬不怕罰款

      你的籃球頻道
      2026-05-07 10:51:57
      2026-05-07 15:00:49
      沃垠AI incentive-icons
      沃垠AI
      努力分享一些有用、有趣的AI干貨
      89文章數 34關注度
      往期回顧 全部

      科技要聞

      凌晨突發!馬斯克租22萬塊GPU給“死敵”

      頭條要聞

      美國博主自發抵制:不想收錢抹黑中國

      頭條要聞

      美國博主自發抵制:不想收錢抹黑中國

      體育要聞

      阿森納巴黎會師歐冠決賽!5月31日開戰

      娛樂要聞

      小S阿雅重返大S母校,翻看大S畢業照

      財經要聞

      特朗普:美伊“很有可能”達成協議

      汽車要聞

      理想為什么不做轎車,有了解釋……

      態度原創

      本地
      親子
      時尚
      公開課
      軍事航空

      本地新聞

      用青花瓷的方式,打開西溪濕地

      親子要聞

      2026年上海幼兒入園報名驗證、小學報名今起開始

      “白色闊腿褲”今年夏天又火了!這樣穿時髦又高級

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普:美伊"很可能"達成協議

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 最新无码人妻在线不卡| 无遮挡又色又刺激的女人视频| 亚洲中文字幕无码久久精品1| 狠狠狠色丁香婷婷综合久久俺| 97人妻无码专区| 欧美综合区| 亚洲国产三级在线观看| 午夜成年影院| 亚洲日韩成人av无码网站| 中文字幕精品一区二区三区精品 | 3Pav图| 毛片免费观看天天干天天爽| 亚洲成人观看| 日韩激情无码av一区二区| 伊人久久精品在热线热| 在线观看亚洲精品国产| 99久热在线精品视频观看| 日韩一区二区三区av| 国产精品无码翘臀在线观看 | 久操线在视频在线观看| 国产成人精品亚洲精品日日| 3p视频在线观看免费| 国产乱码精品一区二区三| 99福利一区二区视频| 豆国产97在线 | 亚洲| 制服丝袜影音先锋| 国产一级精品在线免费看| 草草浮力地址线路①屁屁影院| 无码精品人妻一区二区三区老牛 | 91亚洲国产成人aⅴ毛片大全| 国产69精品久久久久久久久久久久| 日本少妇被黑人xxxxx| 日韩精品人妻系列无码专区免费| 99国产精品农村一级毛片| 国产在线观看免费人成视频| 中文字幕亚洲制服在线看| 手机在线看永久av片免费| 福利姬Jk丝袜-91Porn| 国产精品美女久久久| 中文人妻无码一区二区三区| 亚洲成年片在线观看|