![]()
AI硬件的終極目標是“消失”,通過集成音頻、視覺和傳感器,硬件將成為AI實時感知世界的“感官”。
文|范凌
ID | BMR2004
AI原生硬件,并不是“在傳統硬件上增加AI功能”,而是以AI為操作系統來設計硬件。
過去幾十年的計算設備,本質上都是工具。用戶通過界面操作設備,比如按鈕、菜單、屏幕層級,交互的基本單位是“指令(command)”,用戶需要明確告訴系統做什么。
但在AI原生時代,這個邏輯會發生變化。交互的單位會從“指令”轉向“意圖(intent)”。用戶不再需要告訴系統具體的操作路徑,而是表達自己想要的結果。AI再通過推理、工具調用和系統編排去完成任務,從設計哲學上看,AI原生硬件意味著一種轉變,即從功能驅動的系統設計,轉向意圖驅動的系統設計。
01
從人理解機器轉向機器理解人
當AI硬件去屏幕,或者減少屏幕時,交互方式會越來越接近人類的自然行為。
AI原生硬件的交互方式,與非AI原生硬件的交互方式,其本質區別總結為一句話就是:過去是人理解機器,現在是機器理解人。在傳統計算機和手機時代,用戶必須理解系統結構,比如應用、菜單和功能模塊,然后通過操作完成任務,而在AI原生系統中,用戶更多是在表達目標,例如“幫我記錄這個會議”“幫我整理這些資料”。AI需要做的,是理解用戶的意圖,然后拆解任務并調用不同能力去執行。
交互結構因此發生變化:過去是人→UI→功能→執行;未來更像人→意圖→ AI推理→Agent執行。在這個結構中,硬件更多是連接現實世界的入口,而AI負責理解和行動。
在如今的硬件發展中,去屏幕化已經成為一種趨勢,當用戶無法通過菜單表達意圖時,會出現哪些全新的交互模式呢?當AI硬件去掉屏幕,或者減少屏幕時,交互方式會越來越接近人類的自然行為。這些交互方式有以下幾種:
第一類是語音。語言本身就是人表達意圖最自然的方式。
第二類是微動作,比如手勢、頭部方向或者細微動作。這些動作可以成為隱性的輸入信號。
第三類是視線。當用戶看向某個物體時,本身就表達了一種注意力。
第四類是環境上下文,例如時間、地點和用戶當前的活動狀態。
這些信號組合在一起,AI就有可能理解用戶的需求。因此很多交互不再是用戶主動操作設備,而是系統在理解場景之后做出合理推斷。
目前AI眼鏡在取代手機上的呼聲越來越高,但短期來看,它很難完全替代手機,因為手機不僅是交互設備,也是內容消費設備、社交設備和工作設備。很多復雜任務仍然需要屏幕。但AI眼鏡可能會承擔另一種角色,它更像是一個實時的AI助手,用于理解環境、提供信息提示、記錄內容、輔助決策。
未來是否會出現新的設備形態,取決于一個關鍵問題:AI是否能夠足夠準確地理解人的意圖。如果AI能夠做到,且用戶幾乎不需要操作設備,那么硬件形態確實可能會發生變化。
02
人們對AI的期待是能夠識別“意圖”
理解復雜意圖的關鍵并不只是感知技術,而是對用戶行為的整體理解。
人們對AI的期待是能夠識別“意圖”,但用戶意圖往往是模糊的。很多時候,人類自己也沒有完全想清楚。
AI在理解意圖時通常會結合三類信息:語言、上下文和歷史行為。語言是用戶直接表達的信息;上下文包括時間、地點和當前場景;歷史行為則反映用戶的習慣。在這個過程中,AI并不是尋找唯一正確答案,而是在形成一種合理的猜想。
科學研究其實也是類似的過程。科學進步并不是簡單的“觀察—歸納—得到真理”,而是“問題—猜想—批判—更好的猜想”。AI在理解用戶意圖時,本質上也是在不斷形成和修正這些猜想。
理解復雜意圖的關鍵并不只是感知技術,而是對用戶行為的整體理解。AI需要把不同信號組合起來,例如語音、動作、環境信息等,然后在一個更大的上下文中理解它們的意義。這里的核心其實是上下文(Context)。當所有人都可以使用類似的大模型時,真正的差異往往來自上下文。模型產生智能,但上下文決定價值。意圖識別的難點,很多時候也來自于上下文不完整。當系統對用戶理解越充分,判斷就越準確。
03
建立AI自主決策的可信度
一個理想的技術形態,是讓用戶忘記技術本身的存在。
用戶希望擁有一個無感的交互方式,授權AI自主決策,但同時也會擔心AI決策的結果偏離真實的意圖,因而需要在“自主決策”和“請求確認”之間找到平衡。
一個常見的方法是基于置信度。如果系統對某個判斷非常確定,就可以自動執行;如果確定程度一般,可以給出建議;如果置信度很低,則應該請求用戶確認。這種方式可以在效率和安全之間取得平衡。AI系統需要在兩個目標之間找到合適的位置:既要提高效率,也要避免錯誤帶來的風險。
另一個問題是,當AI原生硬件拋棄屏幕后,用戶如果想知道AI工作的狀態時,系統需要全新的反饋方式,例如光效、振動或者定向聲音,這些都可以成為一種環境反饋。比如呼吸燈表示AI正在處理任務,輕微震動可以表示操作完成,這些設計幫助用戶理解系統狀態,從而減少“黑箱感”。
總之,一個理想的技術形態,是讓用戶忘記技術本身的存在。
在PC時代,人們記得鍵盤和鼠標;在移動互聯網時代,人們記得屏幕和應用。在AI原生時代,交互可能會重新回到人類最自然的行為,比如說話、觀察、移動。當系統能夠理解這些行為時,用戶就不再需要“操作設備”。那時,硬件就會逐漸消失在體驗之中。
04
美國頭部投資機構對AI原生硬件的觀點
硬件不再是廉價勞動力密集型產品,而是高毛利的“軟件溢價”載體。
進入2026年,美國頭部投資機構,如紅杉、a16z、Founders Fund等,對AI原生硬件的觀點已經從最初的狂熱轉向了更加垂直、注重物理驗證和社交契約的務實階段。
長期以來,硬件只是軟件的載體,但在a16z (Andreessen Horowitz) 看來,硬件存在的目的是給AI提供更多上下文,AI獲得的數據維度越高(音頻、視覺、傳感器),它就越有用。a16z強調,AI硬件的終極目標是“消失”,通過集成音頻、視覺和傳感器,硬件將成為AI實時感知世界的“感官”。這意味著,未來的交互將從“主動輸入”轉變為“被動感知”。而隨著智能手機供應鏈的極度成熟,傳感器和算力組件變得廉價且模塊化,這種“溢出效應”將催生出一批具備AI原生靈魂的小眾、垂直硬件形態。
紅杉資本 (Sequoia Capital) 的觀點認為,AI對硬件的真正變革,在于縮短了從原子到產品的“驗證周期”。紅杉認為,與純軟件不同,物理產品一旦出錯后果嚴重。因此,他們強調AI在硬件開發中扮演的“驗證層”角色,正在將傳統的“設計—打樣—測試”循環縮短數倍,并因此投資了Ricursive(加速芯片設計)和Nominal(硬件測試驗證)等公司。紅杉也警示,當前AI基礎建設投入巨大,硬件端需要產生足夠的應用收入來匹配基礎設施的資本開支。
以彼得·蒂爾(Peter Thiel)為核心的Founders Fund則從社會工程學角度切入。他們認為,第一代AI硬件(如全時錄音筆或攝像頭)的失敗,本質上是觸犯了“社交契約”。成功的AI硬件必須在“全知全能”與“隱私尊重”之間找到精細的平衡。他們更青睞那些“只有在被需要時才介入”的硬件,而非全天候監控的監控器。
在更宏觀的層面,Founders Fund認為,通過AI驅動的自動化機器人和無人機系統,硬件不再是廉價勞動力密集型產品,而是高毛利的“軟件溢價”載體。但他們強調,AI硬件不應是“全天候監控”,而應遵循“社交契約”,只在用戶主動觸發時捕捉信息,解決可穿戴設備的社交尷尬感。
綜合上述頭部機構的觀點,未來AI原生硬件將會呈現以下三大趨勢:
去屏幕化(Screen-less):語音和視覺將取代觸控成為第一交互,屏幕不再是必需品。
垂直化(Verticality):“通用硬件”正在被淘汰,能夠解決特定場景(如翻譯、戶外運動、工業檢測)的專用設備更受資本青睞。
反饋閉環(Data Flywheel):硬件存在的理由,是獲取軟件無法在云端獲取的“第一手物理數據”,從而喂養更強大的私有模型。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.