網易首頁 > 網易號 > 正文申請入駐

AI原生硬件，走向“無感”時代

2026-04-08 12:41:11　來源: 商學院雜志

北京舉報

分享至

AI硬件的終極目標是“消失”，通過集成音頻、視覺和傳感器，硬件將成為AI實時感知世界的“感官”。

文｜范凌

ID | BMR2004

AI原生硬件，并不是“在傳統硬件上增加AI功能”，而是以AI為操作系統來設計硬件。

過去幾十年的計算設備，本質上都是工具。用戶通過界面操作設備，比如按鈕、菜單、屏幕層級，交互的基本單位是“指令（command）”，用戶需要明確告訴系統做什么。

但在AI原生時代，這個邏輯會發生變化。交互的單位會從“指令”轉向“意圖（intent）”。用戶不再需要告訴系統具體的操作路徑，而是表達自己想要的結果。AI再通過推理、工具調用和系統編排去完成任務，從設計哲學上看，AI原生硬件意味著一種轉變，即從功能驅動的系統設計，轉向意圖驅動的系統設計。

從人理解機器轉向機器理解人

當AI硬件去屏幕，或者減少屏幕時，交互方式會越來越接近人類的自然行為。

AI原生硬件的交互方式，與非AI原生硬件的交互方式，其本質區別總結為一句話就是：過去是人理解機器，現在是機器理解人。在傳統計算機和手機時代，用戶必須理解系統結構，比如應用、菜單和功能模塊，然后通過操作完成任務，而在AI原生系統中，用戶更多是在表達目標，例如“幫我記錄這個會議”“幫我整理這些資料”。AI需要做的，是理解用戶的意圖，然后拆解任務并調用不同能力去執行。

交互結構因此發生變化：過去是人→UI→功能→執行；未來更像人→意圖→ AI推理→Agent執行。在這個結構中，硬件更多是連接現實世界的入口，而AI負責理解和行動。

在如今的硬件發展中，去屏幕化已經成為一種趨勢，當用戶無法通過菜單表達意圖時，會出現哪些全新的交互模式呢？當AI硬件去掉屏幕，或者減少屏幕時，交互方式會越來越接近人類的自然行為。這些交互方式有以下幾種：

第一類是語音。語言本身就是人表達意圖最自然的方式。

第二類是微動作，比如手勢、頭部方向或者細微動作。這些動作可以成為隱性的輸入信號。

第三類是視線。當用戶看向某個物體時，本身就表達了一種注意力。

第四類是環境上下文，例如時間、地點和用戶當前的活動狀態。

這些信號組合在一起，AI就有可能理解用戶的需求。因此很多交互不再是用戶主動操作設備，而是系統在理解場景之后做出合理推斷。

目前AI眼鏡在取代手機上的呼聲越來越高，但短期來看，它很難完全替代手機，因為手機不僅是交互設備，也是內容消費設備、社交設備和工作設備。很多復雜任務仍然需要屏幕。但AI眼鏡可能會承擔另一種角色，它更像是一個實時的AI助手，用于理解環境、提供信息提示、記錄內容、輔助決策。

未來是否會出現新的設備形態，取決于一個關鍵問題：AI是否能夠足夠準確地理解人的意圖。如果AI能夠做到，且用戶幾乎不需要操作設備，那么硬件形態確實可能會發生變化。

人們對AI的期待是能夠識別“意圖”

理解復雜意圖的關鍵并不只是感知技術，而是對用戶行為的整體理解。

人們對AI的期待是能夠識別“意圖”，但用戶意圖往往是模糊的。很多時候，人類自己也沒有完全想清楚。

AI在理解意圖時通常會結合三類信息：語言、上下文和歷史行為。語言是用戶直接表達的信息；上下文包括時間、地點和當前場景；歷史行為則反映用戶的習慣。在這個過程中，AI并不是尋找唯一正確答案，而是在形成一種合理的猜想。

科學研究其實也是類似的過程。科學進步并不是簡單的“觀察—歸納—得到真理”，而是“問題—猜想—批判—更好的猜想”。AI在理解用戶意圖時，本質上也是在不斷形成和修正這些猜想。

理解復雜意圖的關鍵并不只是感知技術，而是對用戶行為的整體理解。AI需要把不同信號組合起來，例如語音、動作、環境信息等，然后在一個更大的上下文中理解它們的意義。這里的核心其實是上下文（Context）。當所有人都可以使用類似的大模型時，真正的差異往往來自上下文。模型產生智能，但上下文決定價值。意圖識別的難點，很多時候也來自于上下文不完整。當系統對用戶理解越充分，判斷就越準確。

建立AI自主決策的可信度

一個理想的技術形態，是讓用戶忘記技術本身的存在。

用戶希望擁有一個無感的交互方式，授權AI自主決策，但同時也會擔心AI決策的結果偏離真實的意圖，因而需要在“自主決策”和“請求確認”之間找到平衡。

一個常見的方法是基于置信度。如果系統對某個判斷非常確定，就可以自動執行；如果確定程度一般，可以給出建議；如果置信度很低，則應該請求用戶確認。這種方式可以在效率和安全之間取得平衡。AI系統需要在兩個目標之間找到合適的位置：既要提高效率，也要避免錯誤帶來的風險。

另一個問題是，當AI原生硬件拋棄屏幕后，用戶如果想知道AI工作的狀態時，系統需要全新的反饋方式，例如光效、振動或者定向聲音，這些都可以成為一種環境反饋。比如呼吸燈表示AI正在處理任務，輕微震動可以表示操作完成，這些設計幫助用戶理解系統狀態，從而減少“黑箱感”。

總之，一個理想的技術形態，是讓用戶忘記技術本身的存在。

在PC時代，人們記得鍵盤和鼠標；在移動互聯網時代，人們記得屏幕和應用。在AI原生時代，交互可能會重新回到人類最自然的行為，比如說話、觀察、移動。當系統能夠理解這些行為時，用戶就不再需要“操作設備”。那時，硬件就會逐漸消失在體驗之中。

美國頭部投資機構對AI原生硬件的觀點

硬件不再是廉價勞動力密集型產品，而是高毛利的“軟件溢價”載體。

進入2026年，美國頭部投資機構，如紅杉、a16z、Founders Fund等，對AI原生硬件的觀點已經從最初的狂熱轉向了更加垂直、注重物理驗證和社交契約的務實階段。

長期以來，硬件只是軟件的載體，但在a16z (Andreessen Horowitz) 看來，硬件存在的目的是給AI提供更多上下文，AI獲得的數據維度越高（音頻、視覺、傳感器），它就越有用。a16z強調，AI硬件的終極目標是“消失”，通過集成音頻、視覺和傳感器，硬件將成為AI實時感知世界的“感官”。這意味著，未來的交互將從“主動輸入”轉變為“被動感知”。而隨著智能手機供應鏈的極度成熟，傳感器和算力組件變得廉價且模塊化，這種“溢出效應”將催生出一批具備AI原生靈魂的小眾、垂直硬件形態。

紅杉資本 (Sequoia Capital) 的觀點認為，AI對硬件的真正變革，在于縮短了從原子到產品的“驗證周期”。紅杉認為，與純軟件不同，物理產品一旦出錯后果嚴重。因此，他們強調AI在硬件開發中扮演的“驗證層”角色，正在將傳統的“設計—打樣—測試”循環縮短數倍，并因此投資了Ricursive（加速芯片設計）和Nominal（硬件測試驗證）等公司。紅杉也警示，當前AI基礎建設投入巨大，硬件端需要產生足夠的應用收入來匹配基礎設施的資本開支。

以彼得·蒂爾（Peter Thiel）為核心的Founders Fund則從社會工程學角度切入。他們認為，第一代AI硬件（如全時錄音筆或攝像頭）的失敗，本質上是觸犯了“社交契約”。成功的AI硬件必須在“全知全能”與“隱私尊重”之間找到精細的平衡。他們更青睞那些“只有在被需要時才介入”的硬件，而非全天候監控的監控器。

在更宏觀的層面，Founders Fund認為，通過AI驅動的自動化機器人和無人機系統，硬件不再是廉價勞動力密集型產品，而是高毛利的“軟件溢價”載體。但他們強調，AI硬件不應是“全天候監控”，而應遵循“社交契約”，只在用戶主動觸發時捕捉信息，解決可穿戴設備的社交尷尬感。

綜合上述頭部機構的觀點，未來AI原生硬件將會呈現以下三大趨勢：

去屏幕化（Screen-less）：語音和視覺將取代觸控成為第一交互，屏幕不再是必需品。

垂直化（Verticality）：“通用硬件”正在被淘汰，能夠解決特定場景（如翻譯、戶外運動、工業檢測）的專用設備更受資本青睞。

反饋閉環（Data Flywheel）：硬件存在的理由，是獲取軟件無法在云端獲取的“第一手物理數據”，從而喂養更強大的私有模型。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.