<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

      DeepSeek V4 發(fā)布后遇冷,開發(fā)者只聊Codex:便宜不是萬能藥

      0
      分享至

      去年 DeepSeek V3 發(fā)布時(shí),整個(gè) AI 圈的氣氛,和今年完全不一樣。

      那時(shí)候的討論非常熱烈,甚至有點(diǎn)像 ChatGPT 剛火爆全球,社交媒體上到處都是實(shí)測、跑分、成本分析,很多海外開發(fā)者第一次認(rèn)真討論一家中國大模型公司。國內(nèi)和硅谷公司都意識(shí)到,原來除了 OpenAI、Anthropic、Google 之外,還有團(tuán)隊(duì)能把模型做到這個(gè)水平。

      更關(guān)鍵的是,它還便宜。DeepSeek 帶來的沖擊不只是技術(shù)層面,更低的訓(xùn)練成本、更激進(jìn)的工程優(yōu)化、更高的推理性價(jià)比,都讓整個(gè)行業(yè)重新思考大模型的競爭邏輯,很多人都將其視為真正的「Open AI」。

      兩周前,DeepSeek V4 發(fā)布,行業(yè)當(dāng)然非常關(guān)注,很多開發(fā)者第一時(shí)間跑測試、做對比,但整個(gè)市場的情緒明顯冷靜了很多。過去兩周,對普通用戶來說,該用豆包、ChatGPT 的繼續(xù)用,而對開發(fā)者群體來說,很多使用 Codex、Claude Code 的人,也并沒有因?yàn)?DeepSeek V4 更便宜就替換掉 GPT-5.5 或者 Claude 4.6/4.7。



      圖片來源:YouTube

      甚至很多開發(fā)者現(xiàn)在討論 AI 時(shí),已經(jīng)不太提 GPT-5.5、Claude 4.6 或 DeepSeek V4 這些模型名字了,更多人張口閉口聊的是 Codex、Claude Code、OpenClaw、OpenCode、Hermes 等 Agent 框架。

      事實(shí)上在過去一年,AI 行業(yè)的競爭重點(diǎn),已經(jīng)從模型本身的能力逐漸轉(zhuǎn)向 AI 實(shí)際的產(chǎn)出價(jià)值。在這件事上,DeepSeek V4 還缺少一個(gè)屬于自己的 Codex。

      DeepSeek V4 很好,但大家都不太看模型了

      「我在 opencode 上試了同樣的操作,deepseek v4 pro high 模式下速度慢得驚人,同樣的任務(wù)在 codex 5.5 med 模式下只需 20 分鐘,而在 v4 pro 上卻要花 2 小時(shí)。」X 用戶 Ayush Jaipuriar 最近談到。



      圖片來源:X

      需要先說明,DeepSeek V4 當(dāng)然是一個(gè)強(qiáng)模型。包括代碼能力、推理能力、長上下文、多輪理解,V4 相比去年 V3 都有明顯提升,尤其是在中文場景、復(fù)雜邏輯推理以及長上下文等方面。與此同時(shí),在國內(nèi)外一眾大模型的漲價(jià)潮中,V4 也是少數(shù)降價(jià)的大模型。

      但問題在于,2026 年的大模型行業(yè),各種基準(zhǔn)測試的成績越來越不能說明實(shí)際工作中 AI 的表現(xiàn)。去年每次新模型發(fā)布,社交媒體第一時(shí)間討論的還是在 MMLU 上超過誰、在 SWE-Bench 上刷新紀(jì)錄、在人類評(píng)測里又提升了多少等等。

      不是說基準(zhǔn)測試完全沒價(jià)值,但開發(fā)者顯然沒那么在意了。原因并不復(fù)雜,大家已經(jīng)見過太多「測試很強(qiáng),但實(shí)際不好用」的模型,很多 benchmark 更像考試,而真實(shí)工作環(huán)境遠(yuǎn)比考試復(fù)雜,實(shí)際的干活表現(xiàn)很多時(shí)候也比價(jià)格優(yōu)勢更重要。

      半導(dǎo)體和 AI 分析機(jī)構(gòu) SemiAnalysis 最近還做了一次橫向測試,覆蓋 GPT-5.5、Opus 4.7 和 DeepSeek V4,指出 DeepSeek V4 是目前成本最低的頂尖閉源模型替代方案,但其能力尚未達(dá)到領(lǐng)先水平。

      更何況,Token 成本的計(jì)算方式也不合理,更合理的其實(shí)是做好一個(gè)任務(wù)的成本。開發(fā)者、前媒體人王博源在 X 上就提到,用次頂級(jí)國產(chǎn)模型搞了半天都沒搞定的一個(gè)問題,用 Codex 一次就解決了。開發(fā)者、墨問西東創(chuàng)始人池建強(qiáng)也遇到 Claude Code 兩次解決不了,Codex 卻能一次搞定。



      圖片來源:X

      顯而易見的是,實(shí)際的模型成本就不能簡單對比「官方 Token 定價(jià)」,先不說結(jié)果,實(shí)際使用的 Token 量就不一致。而且 GPT-5.5 這次很重要的一點(diǎn)升級(jí)就是「效率」,能用更少的 Token 完成同樣的任務(wù)。

      所以即便有一些方法可以在 Claude Code、Codex 上使用如 DeepSeek V4 等第三方模型,考慮到穩(wěn)定性、效果、時(shí)間等因素,絕大部分人都還是采用官方的默認(rèn)模型,Claude Code 是 Claude 4.x,Codex 是 GPT-5.x。

      尤其是在 Coding 場景,開發(fā)者真正每天面對的問題,是 AI 到底能不能參與完整的軟件工程流程。比如能不能理解整個(gè)項(xiàng)目結(jié)構(gòu),能不能持續(xù)修改十幾個(gè)文件,能不能自己調(diào)用 terminal,能不能自動(dòng)修 bug,能不能在報(bào)錯(cuò)后繼續(xù)嘗試,能不能長時(shí)間保持上下文穩(wěn)定。

      這些東西,考驗(yàn)的不只是「模型能力」,更需要一套完整的 AI 工作系統(tǒng)。開發(fā)者 Vladimir 在使用了 1443 萬 Token 的 DeepSeek V4 后表示,V4 的智能程度接近于 GPT-5.2/GPT-5.3,但最大的問題是經(jīng)常忽略 agents 文件,實(shí)際使用中必須強(qiáng)制執(zhí)行工具和 Harness 框架。



      圖片來源:X

      Claude Code、Codex 是真正完整的產(chǎn)品,但 DeepSeek V4 只是模型。SemiAnalysis 在測試報(bào)告中還強(qiáng)調(diào):「真正完整的產(chǎn)品是運(yùn)行框架 + 模型。缺了其中任一個(gè),你就有所欠缺?!?/strong>

      過去一年,OpenClaw(龍蝦)、Claude Code 和 Codex 這類 Agent 框架的存在感越來越強(qiáng)。很多開發(fā)者現(xiàn)在已經(jīng)不會(huì)說「我在用 Claude 4.6」,而是直接說「我在用 Claude Code」。同樣,很多人在討論 Codex 而非 GPT-5.5。

      DeepSeek 還差一個(gè)自己的 Codex

      很多人現(xiàn)在回頭看 ChatGPT 剛火的時(shí)候,會(huì)發(fā)現(xiàn)當(dāng)時(shí)整個(gè)行業(yè)其實(shí)都在圍繞「對話」做產(chǎn)品。無論是 OpenAI、Anthropic 還是國內(nèi)廠商,本質(zhì)上都是讓模型更像人類聊天,重點(diǎn)是模型更聰明、更自然、更像真人。

      但現(xiàn)在 AI 的重點(diǎn),正在從「聊天」變成「工作」。這個(gè)變化看起來好像只是用途的變化,但背后連帶整個(gè)行業(yè)競爭邏輯也變了。以前模型公司最重要的任務(wù),是把模型訓(xùn)練得更聰明;現(xiàn)在越來越重要的問題,則是怎么讓 AI 真正完成任務(wù)。

      這也是為什么最近一年,行業(yè)里開始大量出現(xiàn) Agent、Workflow、Context Engineering、Harness Engineering 這些詞。本質(zhì)上,它們都在解決同一個(gè)問題:怎么讓 AI 真正進(jìn)入生產(chǎn)流程。

      所以現(xiàn)在很多開發(fā)者評(píng)價(jià) AI Coding 或者 Agent 產(chǎn)品時(shí),模型作為系統(tǒng)「引擎」當(dāng)然重要,但直接決定 AI 實(shí)際價(jià)值的關(guān)鍵,更在于一套系統(tǒng)工程。比如上下文管理,比如工具調(diào)用,比如長期記憶,比如任務(wù)拆解,比如錯(cuò)誤恢復(fù),比如多 Agent 協(xié)同。實(shí)際工作中,這些能力很多時(shí)候甚至比模型本身的優(yōu)勢更重要。



      圖片來源:X

      這也是為什么越來越多人開始說,AI Coding 的競爭已經(jīng)不只是 LLM 競爭,而是 AgentOS 競爭。

      反過來看,也能在一定程度上理解 Claude Code、Codex 的成功。一方面是自家模型在能力上的領(lǐng)先,另一方面則是從底層模型到 Agent 框架的垂直整合,在真實(shí)工作環(huán)境中可以帶來更穩(wěn)定、高效的表現(xiàn)。尤其是長任務(wù)場景下,Claude Code 更像一個(gè)能持續(xù)自主代理工作的 AI 助手。

      而 GPT-5.5 真正重要的地方,也不只是模型更強(qiáng),還有背后 Codex 工作流越來越成熟。包括文件管理、工具調(diào)用、Agent 協(xié)同、任務(wù)拆解、上下文管理,這些能力的疊加,也讓實(shí)際 AI 表現(xiàn)出的能力和價(jià)值有了質(zhì)的變化。

      OpenAI 前幾天也官宣表示,GPT-5.5 發(fā)布一周的 API 收入增長速度超過以往任何版本的兩倍多,而 Codex 在不到七天內(nèi)收入翻倍。而且現(xiàn)在來看,這種優(yōu)勢已經(jīng)從 AI Coding 溢出到了更多的 Agent 場景上。

      關(guān)注 Anthropic、OpenAI 的朋友應(yīng)該都能發(fā)現(xiàn),這段時(shí)間兩家公司都在將 Claude Code、Codex 擴(kuò)展到更多場景下,包括連接更多第三方應(yīng)用和平臺(tái)。



      圖片來源:X

      不僅如此,Claude Code 更多承接了 Claude Cowork 的辦公定位,最新推出了專為銀行和其他金融服務(wù)企業(yè)量身定制的 AI Agent,Codex 也在強(qiáng)調(diào)更多研究、文書、會(huì)計(jì)等工作,而不僅限于 Coding。

      回頭再看 DeepSeek V4,雖然已經(jīng)在模型層面追上了行業(yè)的前沿變化和領(lǐng)先陣營,但還差一個(gè)自己的 Codex。事實(shí)上,這種呼聲已經(jīng)不小了,還有人在 Github 上開源了基于 DeepSeek V4 開發(fā)的終端 Coding Agent——DeepSeek TUI,支持 Skill 以及大量 Agent 框架上的常見功能。

      但這畢竟還是第三方開發(fā)者的作品,對于 DeepSeek V4 的理解很難比擬官方團(tuán)隊(duì),不太可能充分發(fā)揮 V4 的垂直整合優(yōu)勢。最好的期待是,借由 DeepSeek TUI 的反饋和呼聲,DeepSeek 官方能夠下場打造自己的開源 Agent 框架,自己的 Codex。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      墨菲警告英政府:中國人15年里給斯諾克砸了太多錢 趕緊抄作業(yè)吧

      墨菲警告英政府:中國人15年里給斯諾克砸了太多錢 趕緊抄作業(yè)吧

      風(fēng)過鄉(xiāng)
      2026-05-06 07:19:53
      護(hù)膚極簡主義:皮膚科醫(yī)生的底線清單

      護(hù)膚極簡主義:皮膚科醫(yī)生的底線清單

      心事寄山海
      2026-05-06 00:19:58
      浙江36歲寶媽突發(fā)腦梗!從沒“三高”的她,自行用家中筋膜槍按摩放松頸部,致左側(cè)椎動(dòng)脈夾層

      浙江36歲寶媽突發(fā)腦梗!從沒“三高”的她,自行用家中筋膜槍按摩放松頸部,致左側(cè)椎動(dòng)脈夾層

      臺(tái)州交通廣播
      2026-05-07 00:45:40
      放假通知!中小學(xué)生2026暑假時(shí)間確定了,家長卻表示難以接受!

      放假通知!中小學(xué)生2026暑假時(shí)間確定了,家長卻表示難以接受!

      凱旋學(xué)長
      2026-05-06 17:52:12
      大批“宇航員”排隊(duì)打卡內(nèi)蒙烏蘭哈達(dá)火山,景區(qū):內(nèi)部環(huán)境似火星地表,牧民提供“宇航服”出租服務(wù),休眠火山很安全

      大批“宇航員”排隊(duì)打卡內(nèi)蒙烏蘭哈達(dá)火山,景區(qū):內(nèi)部環(huán)境似火星地表,牧民提供“宇航服”出租服務(wù),休眠火山很安全

      極目新聞
      2026-05-04 16:07:52
      拜仁慘遭巴黎淘汰,他才是當(dāng)世第一人?

      拜仁慘遭巴黎淘汰,他才是當(dāng)世第一人?

      西哇體育
      2026-05-07 10:57:17
      王心凌演唱會(huì)意外!遭強(qiáng)力雷射「直射大腿」痛叫出聲…主辦被罵爆

      王心凌演唱會(huì)意外!遭強(qiáng)力雷射「直射大腿」痛叫出聲…主辦被罵爆

      ETtoday星光云
      2026-05-06 13:02:26
      謝娜演唱會(huì)林志穎助陣,可惜他又矮又胖,皮膚黑肚子大,有點(diǎn)滑稽

      謝娜演唱會(huì)林志穎助陣,可惜他又矮又胖,皮膚黑肚子大,有點(diǎn)滑稽

      小娛樂悠悠
      2026-05-06 07:20:02
      1200噸戰(zhàn)略物資被賤賣,中國出現(xiàn)大內(nèi)鬼,難怪美國一點(diǎn)都不怕

      1200噸戰(zhàn)略物資被賤賣,中國出現(xiàn)大內(nèi)鬼,難怪美國一點(diǎn)都不怕

      羽逸地之光
      2026-05-07 01:45:06
      命運(yùn)玩笑!姆巴佩離開2年 巴黎2次歐冠決賽 他淪為皇馬公敵

      命運(yùn)玩笑!姆巴佩離開2年 巴黎2次歐冠決賽 他淪為皇馬公敵

      葉青足球世界
      2026-05-07 08:08:53
      3比1擊敗武漢三鎮(zhèn),海牛取得三連勝,里斯蒂奇羞辱鄭智和李霄鵬

      3比1擊敗武漢三鎮(zhèn),海牛取得三連勝,里斯蒂奇羞辱鄭智和李霄鵬

      姜大叔侃球
      2026-05-06 22:13:31
      蔣介石孫子召開發(fā)布會(huì),提出“兩蔣”移靈大陸,2句話讓世人唏噓

      蔣介石孫子召開發(fā)布會(huì),提出“兩蔣”移靈大陸,2句話讓世人唏噓

      老謝談史
      2026-03-18 18:33:35
      大風(fēng)呼呼吹!北京今天陣風(fēng)可達(dá)6至7級(jí) 明起風(fēng)力減弱氣溫回升

      大風(fēng)呼呼吹!北京今天陣風(fēng)可達(dá)6至7級(jí) 明起風(fēng)力減弱氣溫回升

      北青網(wǎng)-北京青年報(bào)
      2026-05-07 08:19:03
      細(xì)思極恐!深圳車主,快藏好你的挪車電話!

      細(xì)思極恐!深圳車主,快藏好你的挪車電話!

      深圳晚報(bào)
      2026-05-06 20:43:40
      重慶百貨:證券簡稱將于5月12日起變更為“重百集團(tuán)”

      重慶百貨:證券簡稱將于5月12日起變更為“重百集團(tuán)”

      界面新聞
      2026-05-06 17:37:43
      美股收盤:納指、標(biāo)普500指數(shù)續(xù)創(chuàng)新高 英偉達(dá)總市值重回5萬億美元上方

      美股收盤:納指、標(biāo)普500指數(shù)續(xù)創(chuàng)新高 英偉達(dá)總市值重回5萬億美元上方

      財(cái)聯(lián)社
      2026-05-07 04:02:25
      隨著澳大利亞4-0,韓國1-1,U17亞洲杯首輪最新排名:國足列第三

      隨著澳大利亞4-0,韓國1-1,U17亞洲杯首輪最新排名:國足列第三

      侃球熊弟
      2026-05-07 06:06:27
      趙露思整容失敗!臉假到不行,臉部饅化嚴(yán)重,被嘲是網(wǎng)紅小三的面相

      趙露思整容失敗!臉假到不行,臉部饅化嚴(yán)重,被嘲是網(wǎng)紅小三的面相

      八卦王者
      2026-05-07 10:29:11
      特朗普:美伊“很有可能”達(dá)成協(xié)議,有可能下周結(jié)束戰(zhàn)事,伊已同意不擁有核武器,高豐度濃縮鈾會(huì)被運(yùn)往美國!伊朗方面對此暫無回應(yīng)

      特朗普:美伊“很有可能”達(dá)成協(xié)議,有可能下周結(jié)束戰(zhàn)事,伊已同意不擁有核武器,高豐度濃縮鈾會(huì)被運(yùn)往美國!伊朗方面對此暫無回應(yīng)

      每日經(jīng)濟(jì)新聞
      2026-05-07 09:39:19
      中方呼吁防止AI成為少數(shù)富國的游戲

      中方呼吁防止AI成為少數(shù)富國的游戲

      界面新聞
      2026-05-06 13:59:39
      2026-05-07 11:19:00
      雷科技 incentive-icons
      雷科技
      專注AI硬科技
      36934文章數(shù) 812075關(guān)注度
      往期回顧 全部

      科技要聞

      凌晨突發(fā)!馬斯克租22萬塊GPU給“死敵”

      頭條要聞

      牛彈琴:一位特殊的客人來到北京 提到一句話很關(guān)鍵

      頭條要聞

      牛彈琴:一位特殊的客人來到北京 提到一句話很關(guān)鍵

      體育要聞

      阿森納巴黎會(huì)師歐冠決賽!5月31日開戰(zhàn)

      娛樂要聞

      小S阿雅重返大S母校,翻看大S畢業(yè)照

      財(cái)經(jīng)要聞

      特朗普:美伊“很有可能”達(dá)成協(xié)議

      汽車要聞

      從沒人做到搶著做,71臺(tái)概念車揭開中國汽車下一個(gè)時(shí)代

      態(tài)度原創(chuàng)

      教育
      家居
      房產(chǎn)
      手機(jī)
      公開課

      教育要聞

      13年跨越59萬里,用腳步丈量世界,解鎖國際教育本真

      家居要聞

      破繭成蝶 土味精裝房爆改

      房產(chǎn)要聞

      遙遙領(lǐng)先!這個(gè)澄邁頂流紅盤,憑什么持續(xù)霸榜

      手機(jī)要聞

      谷歌否認(rèn)液態(tài)玻璃 Android 17延續(xù)自有體系

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 啊av在线| 人妻有码一区二区三区| 亚洲av无码精品蜜桃| 国产在线极品美女酒店| 午夜成人岛国无码| 十八禁视频网站| 风韵多水的老熟妇| 99久久精品国产一区二区暴力 | 国产成人盗摄精品| 少妇扒开双腿让我看个够| 青草亚洲地区在线视频| 国产精品一码在线播放| 亚洲视频欧美| 亚洲妇熟xxxx妇色黄| 白浆出来无码视频在线| 国产高跟黑色丝袜在线| 中文字幕av免费看| 国产乱子伦精品免费视频| 青青青国产视频手机| 九九精品热| 手机av中文字幕| 国产精品自在线拍国产手机版| 免费精品一区二区中文字幕| 成人xx免费无码| 中国久久中文| 亚洲の无码国产の无码步美 | 亚洲精品网站在线观看不卡无广告| 日本一区中文字幕| 国精品无码一区二区三区在线| 中文字幕日韩一区二区不卡| 亚洲AV无码精品呻吟| 熟女中文字幕| 亚洲国产精品无码久久久秋霞1| 人人婷婷人人澡人人爽| 欧美激情视频一区| 香蕉大美女天天爱天天做| 中文人妻无码一区二区三区信息| 免青青草免费观看视频在线| 成人无码区免费视频网站| 国产裸体无遮挡免费精品| 国产中文|