今天,火山引擎2025冬季FORCE大會正在上海舉辦。
而地點,正是上海世博中心。旁邊500米的地方,有一個標志性的斗拱建筑,叫「中國館」。
![]()
它以“斗冠”為形,配以“中國紅”,形成了獨特的東方之冠。
我用剛剛發(fā)布的豆包1.8模型復刻了一下,長這樣。
![]()
提示詞:參照 中國館.jpg 的外觀造型,用Three.js構(gòu)建一個可交互的【上海世博園·中國館】的3D頁面。(工具來自TRAE)
![]()
幾乎是完全還原,模擬了中國館的倒梯形結(jié)構(gòu)。
我還用它做了一個關于“華”字的3D游戲,很燃、很炸……快把我鍵盤都擼冒煙了。
提示詞:參考 中國館.jpeg 的結(jié)構(gòu)和顏色,創(chuàng)建一個形似“華”字的3D游戲頁面。“華”字被拆解成霓虹構(gòu)件。屏幕中央是一個巨大的、旋轉(zhuǎn)的 3D 線框“華”字。含有“華”字的成語(如:風華正茂、才華橫溢、樸實無華、春華秋實)像彈幕一樣襲來,玩家需要輸入漢字來“充能”,讓中間的“華”字越來越亮,最終爆發(fā)成粒子煙花。
豆包1.8,有點東西。
![]()
模型介紹
簡單介紹一下,剛剛發(fā)布的豆包大模型1.8。
![]()
1)更強的Agent能力
新一代模型,大幅增強了工具調(diào)用(Tool use)能力,比如Search、Computer use、Browser use等,擅長執(zhí)行復雜的任務規(guī)劃和流程理解。
同時,它的Coding能力也有所提升,相信你已在開篇的2個前端case中看到。
而且,它的長文和多輪指令遵循也有所提升。在benchmark中,相比上一代模型有大幅提升。
![]()
所以,這是一個非常適合復雜場景的企業(yè)級Agent部署的模型。
2)更精準的多模態(tài)理解
同Gemini 3 Pro、GLM-4.6V一樣,豆包1.8的多模態(tài)理解能力這次也得了顯著增強。
![]()
尤其是視覺理解方面,不僅視覺理解的Tokens消耗更少,同步還理解精度更高,單次視頻理解幀數(shù)從640幀提升至1280幀。
同時,思考長度也支持自調(diào)節(jié),各模式下思考更精簡,Tokens更節(jié)省。
3)更靈活的上下文管理
上下文窗口支持256k,尤其擅長超長文本處理、復雜/多步流程任務。
據(jù)官方介紹,豆包1.8是國內(nèi)首個支持原生API進行上下文管理的模型,僅需API傳參就可以靈活清理上下文,減少輸入tokens,大幅降低成本。
中譯中就是,豆包1.8把上下文管理從開發(fā)者的負擔,直接變成了模型API自帶的能力,既省tokens,又省開發(fā)工程。
![]()
一句話總結(jié):豆包1.8在模型層面做了很多“工程友好性”的事情,同時也大幅優(yōu)化了自身在多模態(tài)、Agentic方面的能力,非常適合企業(yè)級Agent的部署。
![]()
豆包1.8實測
下面,我們來看一些實測案例。
首先第一個,是我自己參加豆包1.8內(nèi)測時做的。
需求,是這樣的。
假設我是一名總經(jīng)理助理,現(xiàn)在收到5份AI項目的立項報告,我需要幫老板從中找出最合適的項目,并給出充分的理由。
這5份報告,各不相同,有pdf,有word,還有ppt。
![]()
真的,光看見這不同的格式,我頭都大了……還要自己進行項目分析、總結(jié),這不得又要熬幾個晚上才能把方案肝出來吧。
于是,我把5份報告直接丟給豆包1.8。
![]()
輸入提示詞:
簡短、明確、有說服力。最終,豆包1.8給出的推薦項目是BT Code。
![]()
給出的理由是:BT Code項目瞄準了零編程人員的藍海市場,能夠快速釋放中小企業(yè)和非技術人群的軟件開發(fā)需求。其清晰的免費+增值商業(yè)模式確保了商業(yè)化可行性,在2000萬預算下可實現(xiàn)快速落地和規(guī)模化。
全部分析結(jié)果,寫成了一個HTML網(wǎng)頁。
![]()
全過程不到2分鐘,直出結(jié)果,這下不用熬夜了。
整個過程,我也錄了個視頻,大家可以看下。
而且,這版豆包的coding能力很強,比如我做的這個3D城市,效果就很驚艷。
優(yōu)化措施:對所有重復出現(xiàn)的元素(如汽車、燈光)采用“實例化網(wǎng)格”技術進行優(yōu)化處理。![]()
![]()
這次,豆包大模型直接從1.6跳到了1.8。
這背后,不難看出字節(jié)對這一模型的重視。
多模態(tài)+Agent有沒有得搞?肯定有得搞,企業(yè)要把AI從Demo搬進產(chǎn)線,這是繞不過的基座選擇。
而字節(jié),一直擅長在性能、價格和速度之間交付最均衡的模型,豆包1.8就是如此。
![]()
假裝在活動現(xiàn)場,圖片來自@蒼何
更關鍵的是他們的戰(zhàn)略姿態(tài):喊All in AI,就真的All in,不扭扭捏捏,不左右互搏。
在新舊交替的窗口期,方向比速度更重要。
唯有篤定了方向,才能從從容容、游刃有余。
否則,就只能是匆匆忙忙、連滾帶爬。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.