OpenAI 又一次悄悄地給 Codex「補課」了。
北美世界 5 月 7 日,OpenAI 官宣 Codex for Chrome 擴展功能上線,讓 Codex 可以直接調用用戶電腦上的 Chrome 瀏覽器,進入已經登錄的網站和工具里完成任務。
按照官方的說辭,接入這個擴展功能之后,Codex 可以讀取網頁內容、操作內部系統、查看后臺、填寫表單等,用戶還可以控制它訪問哪些網站。以雷科技的理解就是,現在的 Codex,可以接管你的 Chrome 瀏覽器了。
![]()
(圖源:OpenAI)
不過,只看官方介紹,這的確是一個美好的新功能,可體驗過當年 OpenAI 推出的 ChatGPT Altas 的朋友應該都明白,理想和現實還是有一點點差距的。既然如此,我們雷科技AGI(ID:leikejiagi)決定還是親自去體驗看看。
接入 codex,瀏覽器自己「動」起來了
Codex for Chrome 擴展功能的上手難度并不高,一共就分為兩步。第一步是去 Chrome 瀏覽器里找到擴展功能,進入 Chrome 應用商店,搜索「Codex」安裝即可。完成安裝后,它會出現在瀏覽器的右上角,但此時的狀態是未連接。
接著打開 Codex,找到設置里的「電腦操控」,把「Google Chrome」這個插件安裝上,完成后點擊激活即可連接成功。
![]()
第一輪測試我們來點簡單的,讓 Codex for Chrome 整理我們的標簽頁。發出指令之后,Codex 開始思考,這一個過程我們不需要去關注 Chrome 正在干什么,它能夠在后臺自動運行。
雖然是簡單的操作,反倒讓 Codex 犯了難。Codex 最開始并不能完全識別到所有的標簽頁,且沒有一個專門的控件能夠執行這個操作,但它想到了可以先關閉所有標簽頁,再按分類順序打開。可惜,第一步 Codex 就誤操作把所有頁面關閉了,但沒有記錄下具體的網址,因此無法打開。
![]()
接下來就是測試Codex for Chrome 在整理數據上的一個能力,我們直接在 Codex 上讓它喚醒 Chrome,收集蘋果、華為、小米最新款旗艦手機信息,輸出資料卡,同時給我們 5 個選題建議。這一次就非常順利了,我們能清晰看到它調用了 Chrome 的網頁,在進行信息搜索和整理,整個過程大概耗時三分多鐘。
![]()
給出的 5 個選題,我認為也是超出預期的,針對影像、屏幕、AI 大模型這幾個大家比較在意的部分均有涉及,Codex 還是挺懂讀者想要看哪些內容。
![]()
既然這個不算難,那干脆上一個長任務好了。我讓 Codex 在 Chrome 瀏覽器里找到 Deepseek,并寫一篇符合雷科技風格的文章,主題就用之前分析三款旗艦給的建議選題題目,全程讓它自主操作。
![]()
這次Codex for Chrome 的響應速度很快,基本上 30 秒就把指令完整貼到了 Deepseek 上,開始寫文章,直至完成文章也只花了 1 分鐘左右。
![]()
接著我們又嘗試了更復雜的操作,讓Codex for Chrome 做一份 AI 新聞日報的表格。由于我一開始就已經給 Codex 安排上了做 AI 日報總結的 Skill,因此這部分進展還是相對順利的,大概 1 分鐘就完成了信息的收集。然后就到了開啟騰訊文檔,新建表格,將內容粘貼進去,整個過程進展還算順利,中間偶爾會出現識別不準確的問題,但也能及時糾正。
![]()
目前來看,Codex for Chrome 的實用性還是挺高的,一方面,Codex 的能力在當前來說的確是第一梯隊的,以它為軸心去執行的操作,基本上不會出現很大的岔子,至少我們嘗試了這幾種方案,都沒有說完全做不到的情況;另一方面,打通 Chrome 和 Codex,最大的優勢其實還是不需要專門更換其他 AI 瀏覽器也能做到相同的效果,降低了換新的門檻。
輔助瀏覽器而不是替代,OpenAI 這次學聰明了
在看到 OpenAI 官宣做了這么個擴展應用時,我們下意識會想起被冷落了很久的 ChatGPT Atlas,作為 OpenAI 推出的首款 AI 瀏覽器,它其實承載了很大的希望。不過,大家也都知道,ChatGPT Atlas 并沒有掀起多大的波瀾。
包括 Firefox、Atlas、美團光年之外團隊打造的 Tabbit 瀏覽器在內的這些 AI 瀏覽器,一直都在教育用戶,現在的瀏覽器不應該只是一個看網頁的工具,它應該能理解你正在看的內容,知道你接下來可能要干什么,甚至在某些時候直接幫你把操作做完。
比如Atlas,它能在你打開網頁、查資料、做研究、整理信息,AI 都在旁邊跟著看,必要的時候還能進入 agent mode,幫你自動化處理任務。但問題是,大家還是按照習慣,每天的工作基本都在 Chrome 上處理,為啥呢?我認為這很簡單,瀏覽器畢竟不是一個普通的 App,它承載了書簽、密碼、歷史記錄、插件、登錄狀態,還有使用習慣,很多人就是喜歡某些按鈕在某個位置。更別提,Chrome 依然是目前擴展功能最豐富的瀏覽器。
![]()
所以回過頭來看 Codex for Chrome,我反而覺得這一招有點雞賊,或許是 ChatGPT Atlas 沒能成功引起了 OpenAI 的另一個思考,那就是,既然改變不了用戶的習慣,我們在用戶習慣的范疇里給更強的能力。
都是 AI 為主,這里面還是有區別的。Atlas、Tabbit 更像是瀏覽器+AI,瀏覽器本身就是產品主角,AI 是它的核心體驗,它在搜索、信息總結這些基于網頁的能力上,表現非常亮眼。而Codex for Chrome 本質上是借 Codex 的能力落地,Codex 本身就是 OpenAI 打造的專門做任務的 Agent,優勢自然就是「干實事」。
![]()
從我們前面的實測看,也確實如此,比如讓它整理旗艦手機資料、生成選題建議、調用 DeepSeek 寫稿、去騰訊文檔新建表格,這些事情 Codex for Chrome 都能做,而且整體不算慢。尤其是調用 DeepSeek 寫稿那次,體驗其實比我預想中順,它能喚起 Chrome,進入對應頁面,找到輸入區域,把內容寫進去。整個過程都不需要我去監看 Chrome 正在發生什么事,也沒有要接管的情況。
我認為Codex for Chrome 最有價值的地方還是做一些日常比較瑣碎的工作,就像我把 AI 日報做成表格,實際上作為科技數碼行業從業者來說,這可能是每天都需要完成的一項任務,而交給Codex for Chrome ,可以節省不少時間和精力。
![]()
和所有 AI 瀏覽器一樣,Codex for Chrome 目前也還是存在一些問題。我們自己操作瀏覽器的時候,哪些網頁沒加載出來、哪些按鈕不要隨便按,登錄、廣告位置在哪里,我們都能判斷,但是 AI 還是需要花很長的時間識別。比如小雷最擔心的是,萬一它直接點了發布,把沒寫完的文章發布出去,那就釀成大禍了。
所以我現在更愿意把 Codex for Chrome 看成一個已經能干活的半自動助手,在不涉及安全、金融、隱私等方面的工作時,會放心交給它,但還是需要有人在旁邊盯著,以防出現問題。
當然,瀏覽器 Agent 對普通用戶來說,形態倒是沒有那么重要,反而是查資料、寫稿、填表、整理網頁的時候,它能不能給到幫助。
從這次體驗看,Codex for Chrome 已經能做到一部分。它可以幫你跑一些中間步驟,也能把幾個原本需要來回切換的網頁任務串起來。只不過,它現在還沒有到“你說一句話就徹底不用管”的程度。
至于涉及關閉標簽頁、提交表單、修改后臺數據這些動作,現階段還是要謹慎一點。不是說它完全不能做,而是用戶最好知道它做到了哪一步,也最好在關鍵節點看一眼。說白了,你還是得盯著,不要完全讓它全權接管瀏覽器。
這可能也是 Codex for Chrome 眼下最現實的價值:它沒有把瀏覽器 Agent 一步帶到終點,但至少讓人第一次感覺到,這件事不是只能停留在演示里。等它再穩一點、再少翻車一點,用戶自然會給它更多活干。到那時候,瀏覽器會不會被 AI 改掉,反而不用急著下結論。先看它能不能把眼前這些小事做好,就夠了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.