Google I/O 2026上,Gemini 3.5 Flash正式發布。100萬token上下文窗口——這個數字出現在每篇報道里,然后大家繼續劃向下一條新聞。
它聽起來像參數表上的馬力數字:700匹,很厲害。但你到底開在哪條路上?
![]()
我想讓它具體一點。3.5 Flash是3.5系列首個正式版模型,發布即GA,沒有preview標簽,穩定可用。官方基準測試顯示,它在幾乎所有測試中都超過Gemini 3.1 Pro,速度是后者的4倍。這是Flash系列的一貫策略:犧牲部分極端復雜任務的上限,換取日常場景的速度和成本優勢。
我實際測了一下:3.1 Pro需要8-10秒的請求,3.5 Flash 2-3秒返回。規模化之后,這就是"交互工具"和"批處理作業"的區別。
上手只需要三分鐘。pip install google-genai,從AI Studio領一個免費API key,不需要綁卡就能測試。
100萬token到底能裝什么?大約75萬單詞。相當于:一個中等規模Web應用的完整源碼;一個活躍工程頻道六個月的Slack導出記錄;一份300頁的法律協議及其全部引用附件;一整年的客服工單。
以前,要對完整代碼庫做推理,你得切塊、嵌入、檢索相關片段,然后祈禱檢索沒漏掉關鍵信息。現在,直接發過去。一次調用,模型同時看到全部內容。
一個可能得罪人的觀點:大多數RAG管道的復雜設計,都是對上下文窗口不足的妥協。100萬token不會徹底消滅RAG,但能消除開發者實際構建的應用中,很大一部分檢索問題。
我跑了一個真實實驗:把整個項目喂給3.5 Flash,讓它做結構化安全審查。遍歷目錄、讀取指定后綴的文件、拼接成完整文本,一次請求發過去。模型檢查SQL注入、未驗證用戶輸入、硬編碼密鑰——這些原本需要多輪檢索才能覆蓋的跨文件依賴問題,現在單輪可見。
這不是未來場景。API已經開放,免費額度足夠跑通原型。剩下的問題是:你的代碼庫,準備好被一次性看光了嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.