![]()
在上一篇中,我們深入探討了Joinpoint回歸的原理。工欲善其事,必先利其器。
本文將聚焦于NCI官方開發(fā)的Joinpoint Regression Program,通過詳細的步驟演示和結果解讀,讓你從“知道”到“做到”,真正將這一強大工具應用于日常監(jiān)測預警工作。
![]()
1.軟件獲取
Joinpoint軟件完全免費,但需要官方授權。請訪問美國國家癌癥研究所監(jiān)測流行病學與最終結果(SEER)項目官網(wǎng)(https://surveillance.cancer.gov/joinpoint/ )進行下載。通常需要注冊并填寫簡單的申請信息,通過后即可獲取最新版本的軟件(目前最新版為Joinpoint 5.0.2)。
2. 數(shù)據(jù)準備:這是成功分析的第一步,至關重要
軟件支持兩種主要的文件格式:純文本文件(.txt)和逗號分隔值文件(.csv)。你的數(shù)據(jù)源可以是SAS、Stata、SPSS、R或Excel等,只需將數(shù)據(jù)整理后另存為上述格式即可。
更關鍵的是,軟件支持兩種數(shù)據(jù)讀入模式,適應不同基礎的數(shù)據(jù):
模式一:提供原始數(shù)據(jù)(病例數(shù)+人口數(shù))
這是最推薦的方式,尤其當你有分年齡組的數(shù)據(jù)時。軟件會自動計算發(fā)病/死亡率及相關標準誤。數(shù)據(jù)文件需要包含以下變量:
年份(自變量)
發(fā)病/死亡病例數(shù)
對應的人口數(shù)
(可選)
標準人口,用于計算年齡標化率。
模式二:提供已計算好的率
如果你已經(jīng)計算好了粗率或年齡標化率,也可以直接提供。數(shù)據(jù)文件需要包含:
年份
率(如1/10萬)
(強烈建議提供)
率的標準誤,這能讓模型估計更準確。
![]()
打開軟件并載入數(shù)據(jù)文件后,會進入?yún)?shù)設置界面。理解每個選項的含義,是做出正確分析的關鍵。
首先是導入數(shù)據(jù),選擇NEWS,然后打開數(shù)據(jù)即可。
![]()
導入之后進入設置頁面。
設置頁比較簡單,一般以下3個內(nèi)容。
1. 因變量和自變量的確定
根據(jù)你準備的數(shù)據(jù),在“Response Data”部分進行選擇,簡單來說,就是讓軟件幫你計算率還是已經(jīng)算好的率直接讓他用。
如果選擇模式一(原始數(shù)據(jù)):應選擇Calculated from Data File。隨后需要分別指定“Count Variable”(病例數(shù)變量)、“Population Variable”(人口數(shù)變量),如果計算標化率,還需指定“Standard Population Variable”(標準人口變量)。
![]()
如果選擇模式二(已計算的率):應選擇Rates,并指定率的變量,哪個變量代表的是率。
這樣上面的完成后因變量的設置就結束了,接下來是自變量的設置。
![]()
2. 模型與誤差設置(核心參數(shù))
模型轉(zhuǎn)換(Model Transformation):對于我們傳染病來說,一般的發(fā)病/死亡率,幾乎總是選擇Logarithmic(對數(shù)線性模型),這樣才能輸出APC。
誤差選項(Heteroscedastic Errors Option):這是最重要的設置之一。
Constant Variance (Homoscedastic) - 恒方差:假設率的方差在整個時間序列上是恒定的。如果率的波動不大,可選擇此項,計算更簡單快速。
Standard Error - 標準誤:如果已提供或由軟件計算得出率的標準誤,建議選擇此項。它考慮了率的變異,結果更穩(wěn)健,是最常用且推薦的選擇。
Poisson Variance - 泊松方差:適用于數(shù)據(jù)是原始病例數(shù)的情況,假設病例數(shù)服從泊松分布。
![]()
3. 連接點設置
最大連接點數(shù)量(Maximum Number of Joinpoints):軟件允許你設置模型最多尋找?guī)讉€連接點。它會基于置換檢驗自動從0到這個最大數(shù)之間選擇最優(yōu)模型。對于10-20年的數(shù)據(jù),設置最大為3-5通常是合理的,一般來說我們可以簡單理解為5年一個點,而且軟件會根據(jù)數(shù)據(jù)點數(shù)量給出推薦值。
![]()
所有設置完成之后選擇運行即可。
![]()
![]()
點擊“Run”后,軟件就會運行了,我們重點關注的主要有以下幾部分:
1. 模型選擇結果
在結果界面的左側(cè),軟件會列出從0到最大連接點的所有模型,并用星號()標記出根據(jù)置換檢驗選出的最優(yōu)模型。
2. 趨勢圖
這是最直觀的結果,也是主要結果,圖表上會顯示:
原始數(shù)據(jù)點(散點)。
擬合的Joinpoint折線。
連接點的位置(垂直虛線或標記)。
每個趨勢段的APC值和顯著性。
一張圖就能讓你對整個趨勢演變一目了然。
3. 趨勢表(Trend Table)——核心解讀內(nèi)容
這是形成結論的關鍵,比如下表,
時間段
APC (%)
95% CI
P值
趨勢判斷
1993 - 1995
(-5.91, 0.94)
不顯著
1995 - 1998
1.92
(-1.52, 5.48)
不顯著
1998 - 2008
(-2.67, -2.07)
<0.001
顯著下降
2008 - 2013
(-2.71, -1.56)
<0.001
顯著下降
整體 (AAPC)
(-4.64, -3.10)
<0.001
顯著下降
解讀要點:
顯著性判斷:查看每個APC的95%置信區(qū)間(95% CI)。如果區(qū)間不包含0,則該時間段的趨勢具有統(tǒng)計學意義(P值通常也<0.05)。如上表,1998年后兩個階段均為顯著下降。
APC值:表示年均變化幅度。例如,1998-2008年APC為-2.37%,意味著在此期間,發(fā)病率平均每年顯著下降2.37%。
AAPC值:代表整個研究期間(1993-2013)的加權平均變化速度,也為顯著下降,年均下降3.87%。
4. 模型估計表(Model Estimates)
此表提供了擬合方程的詳細參數(shù)(如β, δ等),可用于書寫論文或報告中的方程。
![]()
1.遇到某年的率為0,軟件報錯怎么辦?
軟件無法處理率為0的情況。解決方法是將該年的率替換為一個極小的正數(shù)(如0.000001),這對整體趨勢分析影響微乎其微。
2.“恒方差”和“標準誤”選項,結果差異大嗎?
當率的波動較小時,兩種方法結果相似。但當數(shù)據(jù)存在“驟升驟降”時,“標準誤”選項更可靠。
3.如何分析不同亞組(如不同性別、地區(qū))的趨勢?
可以在數(shù)據(jù)中設置“分組變量”(By Variable),如性別。軟件會自動為每個亞組運行分析,并生成各自的結果和圖表,便于比較。
![]()
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創(chuàng)
說明 | 轉(zhuǎn)載只為分享,如有侵權聯(lián)系刪除
?版權聲明 | 部分信息和圖片來自公開網(wǎng)絡
轉(zhuǎn)載請注明
再次轉(zhuǎn)載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構從業(yè)者運營
重點關注國內(nèi)外健康事件
致力于疾控科普
在做好科普服務大眾的同時
做好疾控機構的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創(chuàng)內(nèi)容,文章為個人理解所學,不涉及疫情信息及內(nèi)部保密數(shù)據(jù),發(fā)表的目的為自我總結及給有需求的人士學習使用。如有不妥之處,歡迎聯(lián)系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.