![]()
此前我們曾報道過,在3月12日,烏克蘭國防部宣布,將向合作伙伴開放用于人工智能(AI)模型訓練的真實戰場數據。
那么,真實戰場數據的價值將如何助力AI模型的訓練?近日,人工智能(AI)應用方向的資深專家石永亮接受了《中國航空報》記者的采訪。他表示,軍用AI一般采用三層訓練體系:大量的模擬數據+合成數據增強+真實戰場數據校準。盡管真實戰場數據看似在第三層訓練中才出現,但這部分工作會決定模型最終性能。
石永亮指出,真實戰場數據的價值可以歸納為這三點:減少仿真與現實差距、提供罕見戰術與環境數據、提升模型的環境適應(即“泛化”)與決策能力。
![]()
石永亮表示,如果沒有戰場真實數據,AI模型仍能通過模擬環境、合成數據、演習數據、以往軍事行動的數據等進行模擬場景的設計、參數調試、數據增強來完成訓練。但存在幾個不可避免的問題,包括訓練周期更長,成本和風險顯著增加,可靠性更低等。
他解釋道,這種可靠性是指實戰背景下,尤其是遭遇極端環境、新型戰術和干擾因素疊加等情況時,容易出現可靠性降低情況,進而導致軍用AI在實戰應用中暴露出風險增加、誤識別率增加、誤傷概率上升等缺陷。從技術角度講,基于實驗室數據訓練出的AI模型,在真實場景中驗證時通常會不可避免地出現“域偏移”情況,這就是因為訓練數據與真實數據之間在數據特征分布上存在著差異。
![]()
真刀真槍的數據訓練讓模型更強、更經濟
根據對軍用AI的研究,石永亮指出,真實的戰場數據對AI模型訓練效率的提升十分直接,能讓模型跳過“實驗室仿真-真實場景驗證-回爐調優”這樣不斷試錯的環節,直接基于實戰驗證的特征來訓練,讓AI模型從一開始就貼合戰場環境,后面的試錯和調優的環節將被大幅壓縮。
同時,因為有了真實的戰場數據,也省去了需要投入海量資源來構建“仿真戰場”的高成本。一般來說,為了模擬戰場的復雜性,需要聯合軍事專家、AI工程師、數據標注人員等多方人員,耗時數月甚至數年來構建仿真環境、生成合成數據,各方面的成本都極高。
![]()
總結來說,真實的戰場數據能夠大幅降低AI的訓練成本、縮短訓練周期。同時,這些戰場數據還可以用來微調現有數據圖像,通過視頻生成模型等來可控地生成,大量的更多國別地區、更多場景、更多環境條件(比如,基于采集了晴天烏克蘭戰場數據來生成雨天的)高保真“類戰場”仿真數據,以輔助模型的訓練,從而讓AI模型對目標的識別能力、決策能力進一步提升,可靠性更高,更具魯棒性,堪稱軍用AI部署應用的“加速器”。
![]()
訓練出更小的AI模型,利于無人裝備上部署
石永亮形象地介紹道,對AI模型的訓練來說,數據就像人類去圖書館里看書學習,“AI模型看的書就是這些數據集”。如果沒有真實戰場數據,僅僅依托于仿真數據來訓練軍用AI模型,就需要AI模型刻意學習各種可能的干擾、極端或罕見情況,這就像是學生“上考場”前要背完所有題型、看完所有書、做完所有模擬練習題——因此,AI模型必須做得很大,用強算力和多參數來保證精度。
![]()
他比喻道:“有了真實戰場數據,就好比是我們在考前獲得了考試重點。對于模型的開發和優化工作來說,真實戰場數據就像考前老師給學生們劃出的‘考點’。這些信息過濾掉了‘垃圾信息’和‘無效特征’,并針對‘考點’進行了強化,從而讓AI模型的訓練更加有的放矢。”
也就是說,真實戰場數據能夠讓AI模型在同樣精度下,將模型體積縮小50%~90%,甚至是超輕量模型,但同時依舊能擁有極強的真實環境適應能力。而這樣的小算力AI模型,極有可能會很快部署在低成本自殺式無人機,以及用第一人稱視角(FPV)技術進行操控的無人機上。
![]()
俄烏沖突戰場上使用最為廣泛的自殺式無人機、FPV無人機,被視為AI模型部署的熱門候選平臺。
能夠很大程度上推動無人系統的智能化
石永亮表示,AI模型想要在FPV這類小型、微型的平臺上部署,要解決的是算力有限、空間緊張、功耗敏感這三大核心難題。如果依托真實戰場數據訓練出了功能更聚焦、輕量化的小模型,就可以兼顧低功耗、低成本,從而就有了邊端(邊緣與端側的統稱)部署的可能性。
搭載這樣的AI模型,無人系統不僅能夠完成目標識別、自動尋獲敵方目標、對敵高效一擊等任務,還有望獲得在GPS拒止環境下的視覺導航能力。
關于軍用AI模型在裝備上的部署,石永亮從技術角度給出他的理解是:依舊可按照行業慣例大致分為云端和邊端部署,即分成云端智能和邊端智能。
![]()
他表示,自殺式無人機和FPV無人機,都是對算力、功耗、負載都比較敏感的無人設備,是代表性的邊端設備。其所能夠部署的AI模型是輕量的目標檢測、識別模型。代表性的AI模型有卷積神經網絡(CNN)、循環神經網絡(RNN)、長短期記憶網絡(LSTM)、門控循環單元(GRU)等,可輔助無人系統進行實時目標追蹤與威脅評估,顯著提升無人系統的自主攻擊能力。
為這些無人機系統搭載AI模型,可以理解為在這類邊端裝備上部署了“本地小腦”;而與此對應的,則是云端的“超級大腦”。以大語言模型(LLM)、多模態大語言模型(MLLM)為代表,云端模型可承載大規模、多源數據融合的預測模型,具備情報分析、作戰推演與戰損評估能力。
石永亮強調,不論是云端智能還是邊端智能,真實的戰場數據能帶來的影響都是全方位的,能夠令其相互促進。
![]()
新一代AI有望成為“可信賴的戰場大腦”
石永亮還指出,真實戰場數據還有一項重要價值:可為當前處于在研階段的下一代AI模型即可控世界模型劃定出重點的學習方向。
可控世界模型,理論上來說能夠預測世界的下一個狀態,但其前提是學習物理、時空、因果、物體、環境演化等現實世界規律。有了真實的戰場數據,就可讓這下一代AI模型更好地學習和理解真實戰場世界里的種種規律,從而讓它更為嚴格地按照現實世界、物理規律和“戰場規律”,最終實時生成高度逼真的戰場數字孿生,來進行長時序的分析、評估、預測、規劃和推演等。
![]()
他舉例道,可控世界模型能夠分析和綜合評估不同類型彈藥對不同目標的毀傷效果、不同機型在任務中的優劣與打擊效能,疊加物理規律(如彈道、天氣、地形交互、電磁干擾)、多方實體行為(敵我友部隊、平民)和不確定性因素等來制定更為合理可行的行動方案,并同步“想象”多種行動后果與應對處置方案等。
石永亮認為,AI技術的飛速發展正推動戰爭形態轉向“算法戰爭”,可控世界模型有望把AI從“工具”升級為“可信賴的戰場大腦”的戰略地位,很可能會成為未來大國軍事競爭中的關鍵不對稱優勢。
![]()
“生成更多真刀真槍”,實現算法戰爭的數據閉環
石永亮還與記者分享了其最新的觀察。他表示,新一代的AI模型在預測生成能力方面已有了顯著的提升。如近期英偉達(NVIDIA)發布的Cosmos系列可控世界模型、WorldLab的空間智能等(國產的類似模型也取得了大幅進展),在場景生成方面展現出前所未有的時空一致性與物理合理性,真實戰場數據正成為這些模型的“物理錨點”,為這些生成模型注入真實物理約束與戰術邏輯。
他“大膽”預測,新一代的AI模型,或許能夠模擬俄烏沖突的戰場,生成下一個潛在戰場的場景數字資產,作為軍用仿真,提前進行大規模的軍事推演。而這一推演過程,無疑又將產生新的真刀真槍的實戰數據,又可反哺多模態大語言模型的微調,促進多模態大語言模型在戰場認知推理方面的垂直應用和提升,從而形成“數據采集—數據生成—仿真推演—模型優化—實戰驗證”的閉環迭代。
![]()
石永亮認為,這樣的“數據閉環”將能夠為云端模型的情報分析、戰場走勢推演等注入“強心劑”。而對于邊端智能而言,模擬真實戰場數據進行多樣化的數據增強,提升端側模型的魯棒性與泛化能力,使其在復雜電磁干擾、惡劣氣象及偽裝欺騙等實戰條件下仍保持高精度識別。
在采訪的結尾,他感慨道:“如果時間倒回10年前,彼時俄烏戰場真實數據的價值并不會令我們感覺到‘恐怖’,因為10年前的技術條件下,戰場數據對全方位戰場智能化的提升作用是有限的。但放在AI技術日新月異的今天,這些數據稱得上是稀缺和寶貴的,其所帶來的影響也無疑將是‘巨大’的。”
注:本文提到世界模型特指用于2D、3D生成的世界模型,例如,NVIDIA的Cosmos、阿里巴巴的Wan、WorldLab空間智能等,不涉及Dreamer、JEPA等世界模型。(鄭宇航)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.