<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      世界還在為“龍蝦”狂歡,“AI操作系統”戰爭已悄然打響

      0
      分享至

      本文系基于公開資料撰寫,僅作為信息交流之用,不構成任何投資建議


      OpenAI明里暗里預熱了很久的GPT-5.4,終于在上周五正式亮相了。它的能力提升自不必說,但有意思的是,這次發布的新版本,和當下爆火的應用“龍蝦”(OpenClaw),有著剪不斷的關聯。而這一切的核心,就藏在OpenAI官方介紹中反復強調的一個關鍵能力上:“Computer-Use”(計算機使用)

      在展開之前,我們先亮出核心觀點,也是本文想要傳達的主旨:透過GPT-5.4,我們可以看到,OpenAI正在打造的,早已不是一個更聰明的聊天模型,而是一個全新的“AI操作系統”(AI OS)。

      從長上下文、工具調用到原生操控電腦,這一切都是在為這個“操作系統”鋪路。當世界還在為OpenClaw的爆火而歡呼,為Agent的概念而興奮時,OpenAI已經將Agent的核心能力(Computer-Use)內建于模型底層。

      世界或許還渾然不知,但我們正站在一個新時代的起點:AI即將從“產品應用”蛻變為“操作平臺”。

      01

      操作系統”的內核:推理+編碼+工作流

      相比Google的Gemini 精通于世界知識,OpenAI 的ChatGPT系列經常會被定義為“理科生”。

      雖然自升級到 GPT-5 以后,它給人提供情緒價值的能力略有減弱,但編程和數學能力仍然極為出色。

      這一次,為了讓能力溢出的 AI 能夠在 Agent 時代順利落地到具體應用上,GPT-5.4 實現了一項核心技術突破:

      將推理、編碼、智能體工作流三方面能力整合至單一模型架構之中 。

      簡單來說,GPT-5.4 更全能了,而且在特定領域的能力也更強了,它不再是一個單一功能的工具,而是一個具備通用能力的“操作系統內核”。

      在推理層面,為了更好地落實到應用層面、讓模型具備執行復雜任務的能力,OpenAI 特意強化了 GPT-5.4 的上下文理解能力。

      面對 100萬 token 量級的復雜任務(相當于可以一次性處理整套項目文檔或長時財務記錄),模型能夠整合海量的數據并正確進行信息去重 。對于單條事實聲稱的錯誤率相比 GPT-5.2 降低了 33%,在高專業度場景下的輸出更加可信。

      除此之外,GPT-5.4 已經可以在 CodeX 中設置支持 1M 的上下文窗口,不過需要用戶在 config.toml 中手動設置,否則默認仍為 256k。


      具體到知識工作,在面向 44 種職業的 GDPval 基準測試中,GPT-5.4 能夠在 83% 以上的場景中達到甚至超越行業專家水平 。

      相比于 GPT-5.2 的 70.9% 水平,這一提升幅度已經十分顯著。不過令人有些疑惑的是,GPT-5.4 的 Pro 版本模型反而表現略遜于 GPT-5.4。(官方解釋為 Pro 版本更側重于極端復雜任務的穩定性,而非通用場景的平均分)

      為了更好地讓 GPT-5.4 融入人們的實際工作場景,OpenAI 在官方介紹中直觀展現了新版本模型在電子表格、文檔和幻燈片三個場景的專業級表現:




      除此之外,GPT-5.4 取得的顯著進步,在金融和法律等高專業度領域也發揮了至關重要的作用。

      多家國際機構的反饋顯示,新模型在財務建模、合同分析、長周期任務執行中準確率提升的同時,用戶與 AI 的交互頻次也減少了很多,顯著縮短了任務完成時間


      針對最受開發者關注的編碼場景,GPT-5.4 保持了與 GPT-5.3-Codex 生成同等質量代碼的能力,沒有顯著的提升。不過,新增加的“/fast”模式能夠實現約 1.5倍 的token 生成速度

      智能體方面,工具調用能力是智能體完成任務的核心,新引入的“工具搜索 (Tool Search)”機制讓模型能夠在數萬個工具的大型生態中按需調用能力,在準確率保持不變的情況下token消耗量驚人地下降了47%

      這正是“操作系統”調度底層資源的方式,高效且精準。

      02

      原生計算機操作:從理解到執行,這就是“操作系統”的界面

      AI 的形態已經從大語言模型演進到了智能體,想要實現產品的商業化就必須讓 AI 能真正幫人們做事。

      于是,全球的AI企業不約而同地將目光放到了用戶PC的控制權上。

      但是,各種桌面端代理發布一段時間后,下載率和留存率其實都不理想。哪怕是對于 ChatGPT 的 9.56 億月活用戶而言,也有很多人不愿意單獨下載一個桌面端代理軟件 。

      大家早已習慣和 AI(大語言模型)聊天,卻還沒適應讓 AI(智能體代理)接管電腦。

      于是,OpenAI想出了一個天才般的點子:讓用戶每天都在用的大模型操控電腦,不用專門下載安裝。

      于是,GPT-5.4 順理成章地成為了第一個具備原生計算機操作能力的通用模型 。

      原理其實并不復雜,它能夠根據屏幕截圖發出鼠標鍵盤指令,也可以通過 Playwright 等庫編寫代碼來直接操作軟件系統 。

      相比于需要專門訓練才能使用的 PC 端代理助手不同,GPT-5.4 選擇將操控電腦的能力直接內建于通用架構之中,開發者在同一模型中即可無縫切換推理、編碼或執行任務。正如“操作系統”天然擁有底層硬件(鍵鼠、屏幕)的驅動一樣。

      一提到操控電腦,那安全問題就不可回避。

      GPT-5.4 的行為可通過開發者的輸入進行精細化調節,以此適應不同應用場景的需求 。

      為了確保安全,開發者可以配置自定義的安全確認策略,根據任務風險等級設置不同的操作確認機制

      數據查詢、代碼編寫等低風險任務設置成自動執行,資金操作、文件刪改則必須人工確認,既能保證系統安全,又能提升工作流的執行效率。


      在 OSWorld-Verified 基準測試中,GPT-5.4 實現了 75% 的成功率,超越人類基準(72.4%) 的同時,大幅領先于前代 GPT-5.2 的 47.3% 水平,足以證明新模型在 PC 端任務場景中的實用和可靠 。

      而在瀏覽器自動化方面,GPT-5.4 在 WebArena-Verified 和 Online-Mind2Web 測試中,依靠截圖為主的方法分別得到 67.3% 和 92.8% 的成功率。

      這就意味著,模型即便不訪問網頁底層架構,僅憑視覺信息即可完成復雜的網頁交互任務,這主要歸功于底層視覺感知能力的系統性提升。

      傳統多模態領域的提升相對較小,MMMU-Pro 視覺理解與推理測試中,模型的準確率從 79.5% 提升至 81.2%;但對于結構化信息的識別能力則顯著提升,模型在 OmniDocBench 文檔解析基準測試中的平均錯誤率從 0.140 降至 0.109 。

      也就是說,模型更善于處理復雜的 PDF、掃描文檔等工作環境中常見的文件類型,不會像以前一樣一遇到表格和插圖就束手無策。

      針對高密度的界面和精細操作的需求,GPT-5.4 新增的“original”圖像輸入級別支持最高 1024 萬像素的全保真感知。

      根據用戶反饋,模型在處理企業級 ERP 系統、財務報表或工程設計軟件等復雜界面時,高分辨率模式下的界面元素定位準確率和點擊操作成功率都有顯著提升。

      03

      實際測試:操作系統之戰,從一張昂貴入場券開始

      在這份官方介紹中,OpenAI 試圖用大量基準測試的跑分結果和知名機構的專業評價來證明模型能力之強大。

      盡管人們普遍不太信任基準測試的分數,但幾項實際測試的結果卻證明了 OpenAI 所言非虛。

      首先是 Artificial Analysis 的評測榜單,如預想一般,智能程度、編碼能力、代理能力同時登頂:




      如果這還不足夠具有說服力,那還可以看看 X 平臺上的一項綜合性測試:



      原視頻鏈接:
      https://x.com/angaisb_/status/2029635731585372598?s=46&t=E5aK_KpbsE6EAIfDJWZvzQ

      這是 X 平臺上用戶 @Angaisb_ 用 GPT-5.4 編寫的 Minecraft 游戲,無論是主視角的行動邏輯(奔跑、跳躍、搭建),還是游戲中方塊的材質和美觀程度,幾乎都無可挑剔。

      一個 demo 中展示出的內容,已經與 Minecraft 初期版本的質量相差無幾。

      由此可見,GPT-5.4 的功能是實打實的強大,也確實具備相當高的實際價值。

      但俗話說得好,一分錢一分貨,如此強大的功能自然意味著極其高昂的費用。


      相比 GPT-5.2,價格漲幅相當驚人,甚至有用戶在模型剛發布后的幾個小時內表示,僅僅是打了個招呼問了個問題,幾百美元就不翼而飛了 。

      如此強大的能力和高昂的定價,似乎與 OpenAI 官方定義的“能力溢出”有些自相矛盾。

      如今,OpenClaw 帶動了 token 成本極其低廉的國產大模型爆火,GPT 系列產品已經跌出使用量排行榜的前十,為何 OpenAI 還敢給 GPT-5.4 定下如此高的價格?

      算力資源的緊張自然不必多說,但更深層的答案或許藏在 OpenAI 近期商業化策略的微妙轉向之中。

      據悉,OpenAI 正在縮減 ChatGPT 應用內的直接購買方案,不再將聊天界面作為閉環交易的核心場景,而是優先支持外部應用處理購買行為 。

      這表明,OpenAI 正在從“直接面向消費者變現”轉向“通過生態環境間接獲利”。

      OpenAI 將 GPT-5.4 定位為專業的基礎設施,通過能力溢價篩選出高價值的客戶;而普通用戶的變現需求,則交給 Notion、Cursor 等集成 ChatGPT 能力的第三方生態來承接,無需直接承擔高昂的 API 成本即可通過合作伙伴的產品間接體驗模型能力 。

      而熟悉桌面智能代理的朋友可能會注意到,GPT-5.4 的原生計算機操作能力其實與 OpenClaw 的思路高度相似:AI 需要看懂界面、操作軟件、完成任務。

      不過,GPT-5.4 更進一步,讓用戶跳過下載安裝和配置底層大模型等無法省略的步驟,直接體驗“開箱即用”,試圖取代當下這款最潮流的智能代理產品 。

      但這并非易事。若要取代 OpenClaw,OpenAI 要么解決 Agent 代理快速消耗 token 的問題,要么降低 token 成本。而目前看來,前者的希望會更大一些。

      總體來看,OpenAI 的選擇已經十分清晰:用高定價篩選高價值客戶,用生態合作和無門檻產品覆蓋大眾市場,用效率優化證明“貴有貴的道理”。

      但對于普通用戶來說,最好的策略仍然是:保持關注、理性評估、按需選擇。不必急于直接購買高價 API,極致的性價比才是 Agent 時代的方向。

      然而,我們最不能忽視那個正在發生的、靜悄悄的革命:OpenAI正在打造的,是一個以“Computer-Use”為核心,整合了長上下文、工具調用、推理與編碼能力的“AI操作系統”。

      當這個“操作系統”逐漸成熟,今天關于價格和OpenClaw的討論,都將只是歷史的注腳。世界還在為某一款應用的爆火而狂歡,但真正的操作系統之戰,已經打響了。

      轉載開白 | 商務合作 | 內容交流
      請添加微信:jinduan008
      添加微信請備注姓名公司與來意


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      女人等你泡她,會露出六個行為,尤其有老公的女人,越明顯越真實

      女人等你泡她,會露出六個行為,尤其有老公的女人,越明顯越真實

      周哥一影視
      2026-05-20 20:59:13
      中國人最尊敬的清華校長攜巨款逃去美國,如今驚人秘密浮出水面

      中國人最尊敬的清華校長攜巨款逃去美國,如今驚人秘密浮出水面

      華人星光
      2026-05-19 11:05:48
      69年周總理前來勸說,主席打斷道:放兩顆原子彈,但不要對外公布

      69年周總理前來勸說,主席打斷道:放兩顆原子彈,但不要對外公布

      歷史龍元閣
      2026-05-16 13:45:19
      楊梅協會會長含淚懇求:別一棍子打死,給果農一條生路!

      楊梅協會會長含淚懇求:別一棍子打死,給果農一條生路!

      大稻網絡科技
      2026-05-20 18:03:55
      中國男足2-0澳洲!賽后澳洲主帥盛贊中國隊一人,他是國足的未來

      中國男足2-0澳洲!賽后澳洲主帥盛贊中國隊一人,他是國足的未來

      小青年淥淥
      2026-05-20 18:34:02
      材料與結構力學領域專家、中國科學院院士方岱寧逝世

      材料與結構力學領域專家、中國科學院院士方岱寧逝世

      澎湃新聞
      2026-05-19 09:58:28
      最低0.6%!佛山公辦中簽率出爐,熱門學校難度升級

      最低0.6%!佛山公辦中簽率出爐,熱門學校難度升級

      佛山樓市發布
      2026-05-20 20:56:59
      全網禁售“藥水楊梅”,華東最大水果市場只對云南楊梅開綠燈

      全網禁售“藥水楊梅”,華東最大水果市場只對云南楊梅開綠燈

      三人成虎V5
      2026-05-19 21:22:16
      郭涵煜再發威救盤點首進法網資格賽決勝輪,張帥被喊老帥又贏了

      郭涵煜再發威救盤點首進法網資格賽決勝輪,張帥被喊老帥又贏了

      網球之家
      2026-05-20 22:50:56
      新加坡急了,外長幾乎是拍著桌子,讓中國“尊重”馬六甲的地位。

      新加坡急了,外長幾乎是拍著桌子,讓中國“尊重”馬六甲的地位。

      南權先生
      2026-01-26 15:41:26
      身體開始糖化,皮膚會有這3個表現!若出現了,說明你該抗糖化了

      身體開始糖化,皮膚會有這3個表現!若出現了,說明你該抗糖化了

      荊醫生科普
      2026-05-18 21:40:10
      剛結束訪華,馬斯克徹底拋棄印度!

      剛結束訪華,馬斯克徹底拋棄印度!

      華人星光
      2026-05-20 11:31:51
      扎波羅熱州的俄羅斯士兵因中毒酒精集體死亡

      扎波羅熱州的俄羅斯士兵因中毒酒精集體死亡

      桂系007
      2026-05-21 00:00:11
      廣州一顧客在酒樓牛仔骨蒸籠里吃出拇指大蟑螂,涉事酒樓:或是蟑螂不小心掉入,正常蒸籠用開水燙過才蒸,新員工不知操作流程,當時已更換

      廣州一顧客在酒樓牛仔骨蒸籠里吃出拇指大蟑螂,涉事酒樓:或是蟑螂不小心掉入,正常蒸籠用開水燙過才蒸,新員工不知操作流程,當時已更換

      三湘都市報
      2026-05-20 12:29:20
      馬斯克轉發重慶東站,一字未言,美國人反問:為什么我們做不到?

      馬斯克轉發重慶東站,一字未言,美國人反問:為什么我們做不到?

      周哥一影視
      2026-05-20 08:54:16
      孫正義腸子悔青了

      孫正義腸子悔青了

      藍鉆故事
      2026-05-20 09:08:48
      北京輸球三大混子:48分鐘僅13分,正負值慘淡至-40

      北京輸球三大混子:48分鐘僅13分,正負值慘淡至-40

      大漢體育解說
      2026-05-21 02:14:55
      21歲女大學生堅持全素食3年,突然各種精神錯亂,最終離世... 驗尸官:她B12耗盡了...

      21歲女大學生堅持全素食3年,突然各種精神錯亂,最終離世... 驗尸官:她B12耗盡了...

      英國那些事兒
      2026-05-20 22:31:51
      黃金大局已定?不出意外,2026年下半年金價或迎來4大轉變

      黃金大局已定?不出意外,2026年下半年金價或迎來4大轉變

      蜉蝣說
      2026-05-20 18:57:59
      曝萬科宣傳能抗8級地震,柳州地震外墻脫裂,業主紛紛網上索賠

      曝萬科宣傳能抗8級地震,柳州地震外墻脫裂,業主紛紛網上索賠

      譚談社會
      2026-05-20 18:57:34
      2026-05-21 06:15:00
      錦緞研究院 incentive-icons
      錦緞研究院
      專注上市公司價值發現與傳播
      2520文章數 10830關注度
      往期回顧 全部

      科技要聞

      一文看懂谷歌I/O2026:谷歌打響智能體大戰

      頭條要聞

      被普京抱過的中國男孩火了 本人最新發聲

      頭條要聞

      被普京抱過的中國男孩火了 本人最新發聲

      體育要聞

      尼克斯贏下最窒息的一場翻盤,場場都是逆天局

      娛樂要聞

      王菲“沒事兒”,成年人學不來的松弛

      財經要聞

      白酒榜|汾酒營收凈利雙增 口子窖"造富"

      汽車要聞

      26.98萬起步 看小鵬GX如何詮釋一車多能以及滿配的科技與豪華

      態度原創

      本地
      時尚
      教育
      藝術
      公開課

      本地新聞

      用云錦的方式,打開江蘇南京

      被這個顏色刷屏了!今年夏天想減齡好看就穿它吧

      教育要聞

      收藏:2026山東美術生多少分能讀本科!

      藝術要聞

      初夏最不能辜負的7個絕美古鎮

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲日韩精品欧美中文字幕| 国产白丝网站精品污在线入口| 精品99在线黑丝袜| 风流老熟女一区二区三区| 亚洲不卡中文字幕无码| 国产性感美女啪啪| 无码人妻aⅴ一区二区三区用会员| 一区二区无码免费视频网站 | 久久97人人超人人超碰超国产| 亚洲a影院| 樱花草在线社区www中国| 人妻精品无码不卡中文字幕| 女自慰喷水免费观看WWW久久| 亚洲VA欧美VA国产VA综合| 中文字幕精品久久久久人妻红杏1| 国产尻逼视频| 免费精品国偷自产在线在线| 夜夜嗨av一区二区三区四区| 人妻少妇精品| 欧美精品1卡二卡三卡四卡| 亚洲精品国产中文字幕| 国精产品一区一区三区有限公司杨| 亚洲色欲久久久综合网东京热| 麻豆果冻传媒精品一区| 国产精品亚洲综合第一页| 欧美综合激情网| 亚洲AV区| 99久久久无码国产精品9| 丰满饥渴老女人hd| 国产精品又黄又爽又色无遮挡| 欧美日韩国产网站| 国内精品久久久久久久久电影网 | 又粗又大又硬又长又爽| 性欧美videofree中文字幕| 午夜夜福利一区二区三区| 色婷婷成人| 国产精品原创不卡在线| 中文字幕在线一区二区在线| 久久综合丝袜日本网| 亚洲人成综合网站7777香蕉| 男女激情一区二区三区|