全場景共生,改變AI硬件的商業化邏輯
2026年,正處于產業躍升關鍵期的AI硬件,告別了零散的概念堆砌階段。
工業和信息化部、商務部、市場監管總局聯合發布的《人工智能終端智能化分級》系列國家標準,為這個躁動的賽道劃定出了一個明確的刻度,將終端智能劃分為L1到L4四個等級,從響應級逐步上升到協同級。
這套標準體系明確了感知、認知、執行、記憶、學習五個能力要素,覆蓋了手機、電腦、電視、眼鏡、汽車座艙、音箱、耳機七個品類,基本框定了第一批有望規模普及的AI硬件形態,并給出了具體的測試方法。
對消費者來說,從此一臺設備到底有多聰明,不用再費力參透技術邏輯,也不用再聽廠商自說自話。
與標準發布幾乎同一時期,阿里云在5月20日舉辦的阿里云峰會上展示了多款AI硬件的落地成果,同時宣布與天貓共同發布“千問智能硬件X天貓合作計劃”,計劃包括千問模型專享權益、天貓億級流量扶持、以及全域品牌曝光資源等,雙方將共同投入1億+資源,從技術、品牌、銷售渠道三個維度幫助硬件廠商完成價值躍遷,加速AI硬件新物種爆發。
天貓618大促即將開啟,搭載千問能力的多款AI硬件將在天貓亮相,雙方平臺聯合提供流量與品牌曝光資源,推動AI硬件加速商業化落地。國家為AI硬件劃出了金字塔,云廠商則提供了登上金字塔所需要的能力底座。
這些迅速發生的改變,指向了同一個趨勢:
AI硬件正在從端側的概念驗證,走向端云協同的規模普及,而AI云服務的能力釋放則恰好踩在了這個轉折點上。
01. 誰停在了L1,誰沖向了L4?
從L1到L4,每一級躍升都對應著能力門檻的抬高。
L1設備只能執行預設指令,本質上是傳統電器的智能化翻版;L2則開始具備工具屬性,用戶可以主動調用某些功能。
中國電子技術標準化研究院副院長于秀明在解讀標準時指出,經過調研與測試分析,目前用戶持有率較高的產品普遍處于L1和L2級,部分新品可達到L3級水平。
整體來看,AI終端正在沿著傳統終端升級、新興終端擴量、未來終端探索三條路徑并行演進。
真正的分水嶺在L3輔助級。L3的核心是終端能夠全面理解用戶的指令和意圖,并且具備主動識別和主動提供服務的能力。
以智能空調為例,L3級別的設備可以自動識別用戶額頭上是否冒汗,然后主動調低溫度,用戶按下離家模式后,攝像頭會先判斷家里是否還有人,等人穿好鞋離開后再關燈。這些動作需要綜合音頻、視頻、傳感器多種輸入,做出復雜的意圖識別和判斷。標準要求設備具備復雜意圖理解、鏈式推理及長期記憶能力,意味著設備不能只回答是什么,還要理解為什么,甚至預判接下來該做什么。
有些硬件廠商過去幾年在L1級別原地踏步,呈現出了幾種典型特征。
一種是產品定義過于封閉,只解決單一功能,沒有為后續升級預留傳感器或者算力冗余;另一種是過度依賴端側的輕量模型,導致在復雜場景下能力斷裂。
還有一種更加隱蔽:把L1的功能包裝成L2、L3的噱頭,這類產品會在標準測試面前迅速現形,消費者也會用腳投票。
![]()
對此,阿里云智能集團公共云事業部解決方案架構部副總經理陳立偉的判斷是,整個硬件行業正處于從L2向L3邁進的階段,誰能率先構建起L3的基礎架構,實現L3級別的產品體驗,誰就能拿下更大的市場空間。
停在L1、甚至L2,都不再是安全區。而想要平穩進入L3階段,需要的是多模態感知與泛化推理的配合。
本次阿里云峰會還重磅發布千問旗艦模型Qwen3.7-Max。在三方機構Arena全球大模型盲測總榜中,Qwen3.7-Max位列國產模型第一,對標全球最強模型。
Qwen3.7-Max的設計初衷,其實就是讓模型成為Agent的內核,具備自主規劃、持續迭代、跨端協同的能力,技術升級恰好對應了L3級別對感知和認知要素的要求。目前,阿里云面向智能硬件行業提供的多模態交互開發套件已全面支持接入Qwen3.7-Max。
![]()
云端泛化能力越強,硬件的L3適配成本就越低。陳立偉也指出:“今天沒有任何一款硬件產品可以通過單一的模型達成端到端的閉環用戶體驗,解法一定是多模型組合的方式。”
02. 端云協同,成為必選項
在L3輔助級之后,L4協同級會是一次更大的躍遷。
從現有定義來看,L4的核心特征關注的不是單個設備是否更聰明,而是多個設備組成一個智能系統。用戶走進家門,眼鏡、音箱、機器人、座艙之間就會自動共享記憶,進而在物理世界中服務用戶。
因此,未來想要讓技術和產品平穩落地在L4,硬件廠商面臨的最大挑戰,就是系統集成與設備協同。
標準分類表中,從移動終端到眼鏡、耳機,大部分產品標注的是端云協同,背后的邏輯很直接:實時響應依賴端側,復雜推理依賴云端,是當下的智能化最優解。
科沃斯管家機器人“八界”就是一個典型例子。基于對開源及模型持續迭代能力的考慮,科沃斯很早就選擇接入了千問大模型。
管家機器人的核心挑戰,來自于家庭環境的非標性,其安全等級要求高、信息密度大、需求非常長尾。科沃斯“八界”的解決方案之一是,將機器人的原子能力(抓拿、取放、感知、規劃)封裝成容易被模型理解的API接口,云端基于Qwen3.6-Plus處理環境感知和動作拆解等復雜任務。
當用戶說出整理客廳這樣的模糊指令,可以先結合云端理解客廳包含哪些物體、整理的標準是什么,然后拆解為一系列動作指令下發給機械臂。這一系列理解的背后可以不用預編程,“八界”上的智能體主動串聯出了任務。
目前,科沃斯還將“八界”的系統、原子能力和仿真平臺開放了出來,讓更多生態伙伴通過“八界”很方便地參與到家用機器人的算法開發和應用落地中。
杭州研極微旗下的神眸系列產品同樣印證了端云協同的必要性。作為一家專注低功耗智能影像的公司,研極微的產品核心是把攝像頭的供電和網絡通訊難題做優化,做到無網無電。低功耗帶來的挑戰是,端側芯片的算力有限,無法承載大規模模型的推理負載。
他們的解決方案是,端側做實時打標和初步處理,通過端側的AI芯片識別畫面中有人、有車、有非機動車,然后將文本圖片信息通過低功耗的4G信標上傳到云端;云端再基于千問大模型做深度理解和結構化記憶,讓用戶可以像搜索相冊一樣提問相機,比如“昨天下午門口出現過什么顏色的貓”。而這種體驗在純端側方案下幾乎不可能實現。
基于這套架構,這家公司的付費轉化率提升了25%,平均客單價提升30%,付費用戶持續留存率達到75%以上。AI能力直接轉化為了商業競爭力。
端云協同的分工模式,正在成為行業共識,云廠商的角色也隨之發生了巨大變化。
過去,云廠商只提供算力、存儲等云資源,現在則變成了提供端云協同、圍繞Agent的基礎設施底座,將視覺理解、任務規劃、甚至前端代碼生成能力打包成可調用的服務,從提供平臺、提供模型到提供Agentic Coding,從開發層降低硬件廠商將AI能力嵌入到現有系統中的門檻。
陳立偉也總結了阿里云當下的四個核心挑戰:模型的組合、工程的復雜性、持續運營的能力、數據的閉環。
談及模型組合與工程化,值得提及的是此前發布的新一代全模態大模型Qwen3.5-Omni。
Qwen3.5-Omni在音視頻理解、識別、交互等215項任務中取得了SOTA,大幅增強了實時交互體驗,擁有了“高情商”。更令人驚喜的是,Qwen3.5-Omni展現出了音視頻Vibe Coding的能力,用戶對著鏡頭闡述需求,模型就能自主生成APP、網頁、游戲等復雜產品代碼。實時全模態能力,為AI硬件從L1、L2走向L3、L4提供了關鍵的技術基礎。
全模態模型不斷成熟的同時,硬件廠商們也在探索差異化的落地路徑。
比如,樂森機器人作為專注toC人形機器人的公司,正在布局一個有趣的端云協同嘗試。用戶可以通過家庭局域網,用自己的電腦或本地智能體完全接管機器人的AI系統,從而讓機器人擁有智能家居控制、方言對話、個性化話題等定制化能力。
剛剛發售全球首款具備視覺感知能力AI耳機的光帆科技,觀察到過去一年AI硬件行業最大的變化就是“快”,軟硬件迭代速度驚人,AI從單純的聊天進化出智能體和自學習能力,能做的事情每天都在大幅增加。而光帆的實踐路徑是構建一套比OpenClaw范圍更廣的AI原生操作系統,涵蓋多模態交互、硬件調度、軟件調度和算力調度。
“一線玩家”們的探索,證明了端云協同是一個“難而正確”的長期主題。云端智能正在快速進化,而端側的執行能力和硬件調度能力,仍然是決定AI硬件智能化階段的關鍵變量。
03. 協同邊界在哪,市場就在哪
除了技術指引之外,分級標準的意義還有商業化層面的信號釋放。
消費者可以依據L1到L4來評判產品,以此為動力,硬件廠商也會隨之出現明確的升級路線圖。
尤其是對于創業公司來說,自研多模態模型和推理框架是不現實的,更多廠商需要的是標準化的AI底座和明確的商業回報路徑。
AI硬件服務的商業想象力,從嚕咔博士AI拍學機的高用戶黏性中有跡可循。嚕咔博士公開數據顯示,早期用戶的日均使用時長只有30多分鐘;接入Qwen3.6-Plus之后,日均時長提升了50%,每個月約有5000萬張用戶拍攝的照片與AI互動。更精準的萬物識別和OCR能力帶來了更高頻的圖片識別,泛化推理的增強帶來了問答輪次的提升,可量化的AI底座進步,直接反饋為用戶黏性的質變。
用戶每天在硬件設備上產生上百次交互、積累了大量個人興趣數據之后,一個自然的需求也浮現出來:這些記憶和偏好,如何才能聯動到其他設備上?比如在學校的設備上繼續基于數據制定學習任務。
單個設備的智能化水平達到一定高度后,市場真正的想象力就會來到全場景共生下的系統智能。
標準里提到的L4協同級,核心特征就是跨設備協同與用戶偏好記憶。一臺手機、一副眼鏡、一個座艙、一個音箱,圍繞用戶形成一張智能網絡。
你戴著眼鏡走進車里,座艙自動切換你的駕駛偏好;你對著音箱說一句話,機器人開始整理客廳。一致的體驗需要所有設備共享同一個云端智能底座,也需要云廠商提供統一的身份、記憶與執行調度體系。
全場景共生,會直接改變AI硬件的商業化邏輯。
過去做硬件,大多靠供應鏈賺錢,每賣出去一臺就完成了一次交易。如今AI的疊加打開了全新的想象力,未來也可以通過訂閱的方式持續產生溢價服務。
在協同場景下,用戶更愿意為跨設備的連續體驗付費,比如訂閱個人助理服務、購買場景化技能包。由此,整個賽道的價值分配也會重新洗牌。
舉個已經存在的例子,Rokid眼鏡在端側接入阿里版OpenClaw產品JVS Claw后,職場人士能高效地完成創建日歷、回復微信、支付等操作,這些高頻行為如果能進一步被整合和沉淀為提升工作效率的場景,就可以延伸出生活助理的訂閱服務。
618大促期間,天貓也上線了數十個搭載了JVS Claw的主機品牌,全面接入智能助手,迎來Agent PC時代。
硬件變成了服務的入口,而不是終點。
市場重構的浪潮,會涌向那些能夠融入這張智能網絡的產品,逐漸拋棄孤島般的L1級別設備。
分級標準給出了產業終局的指引,端云協同提供了確定性的路徑,而云廠商的標準化能力也正在讓這條路變得更寬、更平。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.