網易首頁 > 網易號 > 正文申請入駐

生成式 AI 驅動的貝葉斯校準全局敏感性分析

2026-05-12 20:01:27　來源: CreateAMind

上海舉報

分享至

生成式 AI 驅動的貝葉斯校準全局敏感性分析

Bayesian-calibrated global sensitivity analysis for mathematical models using generative AI

https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1013312

研究背景與核心問題

傳統GSA的獨立性假設困境：經典的全局敏感性分析（GSA，如Sobol方差分解法）普遍假設模型輸入參數相互獨立。但在實際科學建模（尤其是健康與生物領域）中，經貝葉斯校準的模型參數往往存在強相關性與高維依賴結構。
違背假設的后果：當參數相關時，傳統蒙特卡洛估計量會產生偏差，導致敏感性排序失真，進而誤導模型簡化、參數篩選或干預策略設計。

?? 現有解決方案的局限

理論可行但計算困難：Rosenblatt變換與Shapley效應在理論上可處理相關性，但均依賴從高維復雜聯合分布中進行精確的條件采樣，實現門檻極高。
代理方法的假設束縛：Copula等現成方法雖便于條件采樣，但強加了對稱性、線性依賴等限制，且在高維場景下易受“維度災難”影響，難以刻畫真實數據的復雜依賴模式。

本文提出的創新框架

本文提出一種基于生成式AI的貝葉斯校準全局敏感性分析新范式，核心思想是將GSA重構為直接在貝葉斯后驗分布上執行的“校準后任務”：

數據驅動的依賴學習：利用生成模型直接從貝葉斯后驗樣本中學習參數的聯合分布與條件分布，徹底摒棄對參數獨立性或預設依賴結構的限制。
雙路徑技術實現
- 采用**自回歸架構（Autoregressive Models）**實現Rosenblatt變換，將相關分布映射為獨立均勻分布，兼容傳統Sobol指數計算。
- 采用**擴散模型（Diffusion Models）**高效估計Shapley效應，通過條件生成自然處理任意參數子集的邊際貢獻。
計算解耦潛力：將模型輸出作為目標聯合分布的附加特征同步建模，有望將敏感性分析與昂貴的前向模型仿真解耦，顯著降低計算開銷。

? 方法核心優勢

真實性與可解釋性：所得敏感性指數反映的是“經貝葉斯校準、與觀測數據一致”的參數影響力，而非抽象未校準模型的純數學結構敏感性。
高維非線性適應性：無需預設分布族（如高斯假設），可自適應捕捉復雜、非高斯、強耦合的參數依賴關系。
靈活可擴展：框架兼容各類貝葉斯校準的確定性模型，計算復雜度隨數據規模與模型維度平滑增長，具備工程落地潛力。
嚴格理論銜接：經驗估計量兼具“后驗權重導數”的精確操作定義與“總體敏感性一致無偏估計”的統計性質。

驗證與應用場景

在兩個典型健康科學模型上完成實證驗證：
- 新冠疫情傳播模型
- 癌癥免疫治療動力學模型
實驗表明：該方法在參數強相關設定下仍能精準識別關鍵驅動參數，且在計算效率、方法靈活性與結果穩健性上顯著優于傳統Copula或近似采樣方案。

研究意義與未來展望

打通了貝葉斯不確定性量化、生成式建模與系統敏感性分析的理論鏈路，為數據驅動型復雜系統建模提供了可解釋性新工具。
生成式范式具備天然擴展性，未來可向隨機微分方程模型、基于智能體（Agent-based）模型的分布級敏感性分析延伸，助力現代生物醫學、氣候建模與工程系統的高保真決策支持。

如需進一步提煉為PPT匯報要點、繪制技術路線圖，或補充具體數學公式/算法流程的對應關系，可隨時告知。

摘要

我們提出了一種生成式建模框架，用于在具有強相關性且可能高維的參數復雜系統中進行全局敏感性分析（GSA）。傳統的基于方差的 GSA 方法依賴于輸入參數獨立的假設，而這在貝葉斯校準的模型中很少成立。盡管近期基于 Rosenblatt 變換和 Shapley 效應的擴展方法在理論上解決了這一局限，但其實現需要從相關聯合分布中進行精確的條件采樣，這一任務仍具挑戰性。現有解決方案對輸入依賴性施加了限制性假設，從而限制了其在復雜數據驅動問題中的適用性。我們的方法通過將敏感性分析重構為貝葉斯后驗分布上的校準后任務來應對這些挑戰：參數相關性通過生成式模型從數據中學習，從而消除了對依賴關系的限制性假設，并確保敏感性估計與數據相關。我們采用自回歸架構來實現 Rosenblatt 變換，并利用擴散模型來估計 Shapley 效應。這些方法無需預設分布假設，且能隨數據量和模型復雜度高效擴展。我們在兩個代表性應用中驗證了該方法的有效性：新冠病毒傳播模型和癌癥免疫治療模型。結果表明，我們的方法能在參數存在相關性的情況下有效捕捉參數敏感性，并在可擴展性和靈活性方面較現有方法取得顯著提升。

作者總結

在本研究中，我們引入了一種使用生成式 AI 對生物模型進行全局敏感性分析的新方法。我們的方法與貝葉斯推斷完全兼容，而貝葉斯推斷被廣泛用于生物系統的參數校準。與傳統敏感性分析假設參數獨立或施加簡化依賴結構不同，我們的方法直接在貝葉斯校準的后驗分布上進行敏感性分析，其中參數相關性是從觀測數據中學習得到的。因此，所得的敏感性分析反映的是真實的、與數據相關的參數敏感性，而非抽象模型的純結構敏感性。所提出的框架具有靈活性、可擴展性，并廣泛適用于各類通過貝葉斯方法校準的確定性模型。此外，該方法的生成式特性為未來擴展至隨機模型或基于代理模型的分布敏感性分析鋪平了道路，增強了其在現代生物應用中的潛力。

引言

數學建模、貝葉斯推斷和敏感性分析是跨不同科學領域開展復雜數據驅動型研究項目的重要工具。健康科學等學科中的現實問題經常使用數學模型進行分析，因為它們能夠抽象復雜的系統行為，并通過參數化方程對其進行描述。這些模型使研究人員能夠模擬和預測系統如何響應變化的條件，從而為其底層動力學提供有價值的見解。這些預測可靠性的核心在于模型參數的準確估計，這一任務可通過貝葉斯推斷有效解決 [1]。這種統計方法利用觀測數據更新關于參數值的先驗信念，生成一個同時捕捉參數不確定性和相互依賴性的后驗分布。基于參數估計，我們隨后可以進行敏感性分析，以識別哪些參數對模型結果的影響最大。

在敏感性分析的廣泛范疇內存在多種方法。例如，局部敏感性分析側重于評估施加于單個模型參數的小擾動所產生的影響，而全局敏感性分析（GSA）則考察在指定范圍內同時改變多個參數所產生的影響。本文聚焦于一種 GSA 方法，即基于方差的 Sobol 方法 [2]。該方法通過估計可歸因于每個單獨輸入參數變化及其相互作用的輸出方差比例，來量化參數敏感性。由此產生的一階（個體）和高階（交互）指數提供了對參數影響力的全面度量。由于其穩健性和可解釋性，Sobol 方法已在各個領域得到廣泛應用，如下列研究所示 [3–5]。

盡管用途廣泛，但在現實世界的數學模型上估計 Sobol 敏感性指數面臨著重大挑戰，這主要是由于在給定觀測數據條件下，模型參數的貝葉斯后驗分布中嵌入了錯綜復雜的相關性。傳統的 Sobol 方法通常假設輸入參數是獨立的，而現實世界系統往往表現出源于模型結構與數據交互的復雜高維依賴性。這些依賴性限制了該方法的適用性，因為當獨立性假設被違背時，相應的蒙特卡洛估計量會產生偏差，可能導致關于參數敏感性的誤導性結論。為解決這一問題，已提出多種方法。例如，Rosenblatt 變換可用于將任何復雜的聯合分布映射為單位超立方體上的獨立均勻變量，從而能夠使用傳統的 Sobol 方法 [6]。盡管該方法在理論上對任意復雜的分布都成立，但其實際實現需要近似一系列條件密度函數，這絕非易事。另一種替代方法采用合作博弈論中的 Shapley 效應來量化相關性下的輸入敏感性 [7]。Shapley 效應通過平均每個輸入在所有可能參數子集上的邊際貢獻，自然地容納了依賴性。然而，估計 Shapley 效應同樣依賴于從聯合分布的任意子集中進行條件采樣，面臨著類似的計算挑戰。從這些例子可以清楚地看出，從模型輸入的條件分布中進行準確采樣是執行 GSA 的核心。現有的基于 Copula 的方法因其實際應用的簡便性而受到關注 [8]。通過將邊緣分布與依賴結構分離，只要 Copula 函數能準確表示相關結構，Copula 就允許進行非常高效的條件采樣。在實踐中，高斯 Copula 被廣泛使用，但施加了限制性假設（如對稱和線性依賴），這可能無法對輸入之間的復雜依賴關系進行建模。此外，由于維數災難，它們在高維設置中可能會失去準確性 [9]。

生成式人工智能的最新進展為在全局敏感性分析中從復雜的條件參數分布中進行準確采樣提供了一個有前景的解決方案。諸如自回歸模型（順序建模變量依賴性）和基于擴散的方法（學習聯合分布并生成靈活的條件樣本）等方法，在捕捉高維、非高斯分布方面展現出了卓越的能力 [10]。受生成式模型靈活性和可擴展性的啟發，我們提出將 GSA 重新構建為一項直接在貝葉斯后驗分布上執行的校準后任務，其中參數相關性自然產生于模型結構與觀測數據之間的交互。通過使用生成式模型從后驗樣本中學習聯合和條件參數分布，所提出的框架消除了限制性的獨立性或依賴性假設。此外，通過將模型輸出與輸入一起作為目標聯合分布的附加特征納入，該方法有可能將敏感性分析與重復的正向模型評估解耦，從而在模型評估成本高昂時減輕計算負擔。因此，所得的敏感性指數反映的是真實的、經貝葉斯校準的參數敏感性，而非抽象的、未經校準模型的純結構敏感性。

在本文中，我們探討如何利用生成式模型對經貝葉斯校準的數學模型進行 GSA。“材料”部分提供了數學建模框架、貝葉斯數據校準和 Sobol 敏感性分析的背景。“方法”部分介紹了所提出的用于 GSA 的生成式建模方法。“案例研究結果”部分通過數值實驗驗證了該方法，包括合成基準測試和健康科學中的現實世界應用。

。。。。。。。。。。

原文鏈接：https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1013312

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.