監(jiān)測預警基礎28-Joinpoint軟件實操指南：手把手教你完成趨勢拐點分析

2026-05-04 16:27:41　來源: CDC疾控人

陜西舉報

分享至

在上一篇中，我們深入探討了Joinpoint回歸的原理。工欲善其事，必先利其器。

本文將聚焦于NCI官方開發(fā)的Joinpoint Regression Program，通過詳細的步驟演示和結果解讀，讓你從“知道”到“做到”，真正將這一強大工具應用于日常監(jiān)測預警工作。

1.軟件獲取

Joinpoint軟件完全免費，但需要官方授權。請訪問美國國家癌癥研究所監(jiān)測流行病學與最終結果（SEER）項目官網(wǎng)（https://surveillance.cancer.gov/joinpoint/ ）進行下載。通常需要注冊并填寫簡單的申請信息，通過后即可獲取最新版本的軟件（目前最新版為Joinpoint 5.0.2）。

2. 數(shù)據(jù)準備：這是成功分析的第一步，至關重要

軟件支持兩種主要的文件格式：純文本文件（.txt）和逗號分隔值文件（.csv）。你的數(shù)據(jù)源可以是SAS、Stata、SPSS、R或Excel等，只需將數(shù)據(jù)整理后另存為上述格式即可。

更關鍵的是，軟件支持兩種數(shù)據(jù)讀入模式，適應不同基礎的數(shù)據(jù)：

模式一：提供原始數(shù)據(jù)（病例數(shù)+人口數(shù)）

這是最推薦的方式，尤其當你有分年齡組的數(shù)據(jù)時。軟件會自動計算發(fā)病/死亡率及相關標準誤。數(shù)據(jù)文件需要包含以下變量：

年份（自變量）

發(fā)病/死亡病例數(shù)

對應的人口數(shù)

（可選）標準人口，用于計算年齡標化率。

模式二：提供已計算好的率

如果你已經(jīng)計算好了粗率或年齡標化率，也可以直接提供。數(shù)據(jù)文件需要包含：

年份

率（如1/10萬）

（強烈建議提供）率的標準誤，這能讓模型估計更準確。

打開軟件并載入數(shù)據(jù)文件后，會進入?yún)?shù)設置界面。理解每個選項的含義，是做出正確分析的關鍵。

首先是導入數(shù)據(jù)，選擇NEWS，然后打開數(shù)據(jù)即可。

導入之后進入設置頁面。

設置頁比較簡單，一般以下3個內(nèi)容。

1. 因變量和自變量的確定

根據(jù)你準備的數(shù)據(jù)，在“Response Data”部分進行選擇，簡單來說，就是讓軟件幫你計算率還是已經(jīng)算好的率直接讓他用。

如果選擇模式一（原始數(shù)據(jù)）：應選擇Calculated from Data File。隨后需要分別指定“Count Variable”（病例數(shù)變量）、“Population Variable”（人口數(shù)變量），如果計算標化率，還需指定“Standard Population Variable”（標準人口變量）。

如果選擇模式二（已計算的率）：應選擇Rates，并指定率的變量，哪個變量代表的是率。

這樣上面的完成后因變量的設置就結束了，接下來是自變量的設置。

2. 模型與誤差設置（核心參數(shù)）

模型轉(zhuǎn)換（Model Transformation）：對于我們傳染病來說，一般的發(fā)病/死亡率，幾乎總是選擇Logarithmic（對數(shù)線性模型），這樣才能輸出APC。

誤差選項（Heteroscedastic Errors Option）：這是最重要的設置之一。

Constant Variance (Homoscedastic) - 恒方差：假設率的方差在整個時間序列上是恒定的。如果率的波動不大，可選擇此項，計算更簡單快速。

Standard Error - 標準誤：如果已提供或由軟件計算得出率的標準誤，建議選擇此項。它考慮了率的變異，結果更穩(wěn)健，是最常用且推薦的選擇。

Poisson Variance - 泊松方差：適用于數(shù)據(jù)是原始病例數(shù)的情況，假設病例數(shù)服從泊松分布。

3. 連接點設置

最大連接點數(shù)量（Maximum Number of Joinpoints）：軟件允許你設置模型最多尋找?guī)讉€連接點。它會基于置換檢驗自動從0到這個最大數(shù)之間選擇最優(yōu)模型。對于10-20年的數(shù)據(jù)，設置最大為3-5通常是合理的，一般來說我們可以簡單理解為5年一個點，而且軟件會根據(jù)數(shù)據(jù)點數(shù)量給出推薦值。

所有設置完成之后選擇運行即可。

點擊“Run”后，軟件就會運行了，我們重點關注的主要有以下幾部分：

1. 模型選擇結果

在結果界面的左側(cè)，軟件會列出從0到最大連接點的所有模型，并用星號（）標記出根據(jù)置換檢驗選出的最優(yōu)模型。

2. 趨勢圖

這是最直觀的結果，也是主要結果，圖表上會顯示：

原始數(shù)據(jù)點（散點）。
擬合的Joinpoint折線。
連接點的位置（垂直虛線或標記）。
每個趨勢段的APC值和顯著性。
一張圖就能讓你對整個趨勢演變一目了然。

3. 趨勢表（Trend Table）——核心解讀內(nèi)容

這是形成結論的關鍵，比如下表，

時間段

APC (%)

95% CI

P值

趨勢判斷

1993 - 1995

(-5.91, 0.94)

不顯著

1995 - 1998

1.92

(-1.52, 5.48)

不顯著

1998 - 2008

(-2.67, -2.07)

<0.001

顯著下降

2008 - 2013

(-2.71, -1.56)

<0.001

顯著下降

整體 (AAPC)

(-4.64, -3.10)

<0.001

顯著下降

解讀要點：

顯著性判斷：查看每個APC的95%置信區(qū)間（95% CI）。如果區(qū)間不包含0，則該時間段的趨勢具有統(tǒng)計學意義（P值通常也<0.05）。如上表，1998年后兩個階段均為顯著下降。

APC值：表示年均變化幅度。例如，1998-2008年APC為-2.37%，意味著在此期間，發(fā)病率平均每年顯著下降2.37%。

AAPC值：代表整個研究期間（1993-2013）的加權平均變化速度，也為顯著下降，年均下降3.87%。

4. 模型估計表（Model Estimates）

此表提供了擬合方程的詳細參數(shù)（如β, δ等），可用于書寫論文或報告中的方程。

1.遇到某年的率為0，軟件報錯怎么辦？

軟件無法處理率為0的情況。解決方法是將該年的率替換為一個極小的正數(shù)（如0.000001），這對整體趨勢分析影響微乎其微。

2.“恒方差”和“標準誤”選項，結果差異大嗎？

當率的波動較小時，兩種方法結果相似。但當數(shù)據(jù)存在“驟升驟降”時，“標準誤”選項更可靠。

3.如何分析不同亞組（如不同性別、地區(qū)）的趨勢？

可以在數(shù)據(jù)中設置“分組變量”（By Variable），如性別。軟件會自動為每個亞組運行分析，并生成各自的結果和圖表，便于比較。

編輯：普通疾控人 | 審核：詩酒趁年華

文章來源 | 原創(chuàng)

說明 | 轉(zhuǎn)載只為分享，如有侵權聯(lián)系刪除

轉(zhuǎn)載請注明

再次轉(zhuǎn)載請注明出處

科普健康 | 宣傳疾控

本號為多位疾控機構從業(yè)者運營

重點關注國內(nèi)外健康事件

致力于疾控科普

在做好科普服務大眾的同時

做好疾控機構的宣傳

讓更多的人了解疾控，擁抱健康

歡迎加「小編」微信(cdcjkr126com)

本文具體說明

本文為原創(chuàng)內(nèi)容，文章為個人理解所學，不涉及疫情信息及內(nèi)部保密數(shù)據(jù)，發(fā)表的目的為自我總結及給有需求的人士學習使用。如有不妥之處，歡迎聯(lián)系小編修改、刪除。

更多精彩視頻，盡在“CDC疾控人”視頻號

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.