![]()
系列簡介
這是我們一系列原創(chuàng)技術(shù)貼,從易到難,每天學習一點。所有內(nèi)容均為疾控數(shù)據(jù)分析、科研論文相關(guān),或者說很多和現(xiàn)在的熱門監(jiān)測預警相關(guān),所以我們這個系列就叫“監(jiān)測預警基礎(chǔ)”。
今天是第25節(jié),再詳細講一下MEM的核心計算過程。
首先需要說明的是,一般情況下MEM的操作我們都是采用R或者類似軟件工具實現(xiàn)的,但是對于傳染病監(jiān)測人員來說,直接使用R或在線工具雖然方便,但容易變成"黑箱操作",就是不理解過程和原理,結(jié)果就出來了。
我們首先教大家用Excel手動計算,有三大好處:
深入理解原理:每個計算步驟都親手完成,真正掌握MAP函數(shù)的內(nèi)涵
數(shù)據(jù)質(zhì)量把控:在計算過程中能及時發(fā)現(xiàn)數(shù)據(jù)問題,確保結(jié)果可靠性
理解參數(shù)調(diào)整:便于理解δ參數(shù)等關(guān)鍵設(shè)置對結(jié)果的影響
今天,我們就以某區(qū)縣流感每周病例數(shù)為例,完整重現(xiàn)MAP函數(shù)的計算流程。
![]()
MAP函數(shù)的全稱是"最大累積和百分比",它的作用是自動找出一個流行季中,病例數(shù)最集中的連續(xù)周次,從而確定流行期的長度和位置。
計算公式如下:
p_j^r = t_j^r ÷ t_j^S
其中:p_j^r就是MAP函數(shù)值;分子t_j^r是連續(xù)r周的最大發(fā)病數(shù)累積和;分母t_j^S是整個流行季發(fā)病數(shù)總累積和。
這個公式的意義在于通過計算不同r值對應的累積和占比,找到病例數(shù)增長最集中的時段。
![]()
一、第一步:準備基礎(chǔ)數(shù)據(jù)
比如有一個52周每一周的流感病例數(shù)這樣的數(shù)據(jù)
![]()
二、第二步:計算不同r值的累積和(分子t_j^r)
這是最關(guān)鍵的一步,我們需要計算連續(xù)1周、2周、3周...直到52周的最大發(fā)病數(shù)累積和。記住,是最大發(fā)病數(shù)累計和,不是第1周、第2周的累計和,而是連續(xù)r周,r是連續(xù)的周次,以1周、2周作為連續(xù)幾周算最大發(fā)病數(shù)累計和。
r=1,就是52周中某連續(xù)1周最大的發(fā)病數(shù)的累計和,其實就是最大發(fā)病數(shù)那一周,
r=2,就是52周中某連續(xù)2周最大的發(fā)病數(shù)的累計和,其實就是最大發(fā)病數(shù)那一周和它上下某一周的累計和,上下周中哪一周大就加那一周。
理解還是比較好理解的,但是操作起來很難,有什么便捷的操作技巧嗎?
當然有!使用下面這個公式即可
=MAX(SUBTOTAL(9, OFFSET($B$2, ROW($1:$52) - 1, 0, D2, 1)))
我們對公式說明解釋一下:
OFFSET($B$2, ROW($1:$52)-1, 0, D2, 1):生成從每個起始周開始的連續(xù) r周的數(shù)據(jù)范圍。
SUBTOTAL(9, ...):計算每個范圍的求和(9表示求和功能)。
MAX(...):取所有窗口累積和的最大值。
重要提示:此公式為數(shù)組公式,輸入后需按Ctrl+Shift+Enter確認(Excel會添加{}括號)。如果使用Excel 365或2021版,直接按Enter即可。
![]()
三、第三步:計算總累積和(分母t_j^S)
這是MAP函數(shù)的分母,總累計和其實就是1-52周病例數(shù)的和。
![]()
四、第四步:計算MAP函數(shù)值(p_j^r)
現(xiàn)在我們可以計算每個r值對應的MAP函數(shù)值了,其實就是分子除以分母。
![]()
五、第五步:計算P值斜率(Δp_j^r)
斜率計算是確定流行期長度的關(guān)鍵。
1.操作:
在H列計算斜率
在H2單元格輸入公式:
=(H3-H2)*100(轉(zhuǎn)換為百分比)拖動填充柄完成計算
注意最后一個r值(52)沒有斜率值
2.斜率的流行病學意義:
斜率代表病例數(shù)累積速度的變化
隨著r增大,斜率會逐漸減小
當斜率首次低于某個閾值(δ)時,就找到了最優(yōu)流行期長度
δ參數(shù)是MEM模型的"調(diào)節(jié)器",通常取值在2.0%-4.0%之間。初次計算可使用推薦值2.8%,如需優(yōu)化,可在2.0%-4.0%間以0.1%為間隔測試,選擇靈敏度與特異度最均衡的值(約登指數(shù)最大)。
目前舉的例子中其實就是在H列(斜率列)中查找,找到第一個小于δ值的斜率對應的r值,本例中,當δ=2.8%時,r=14的斜率2.46%首次小于2.8%,因此確定流行期長度為14周。
![]()
七、第七步:確定流行開始和結(jié)束時間
找到流行期長度后,最后一步是確定具體的流行時間范圍,回到原始數(shù)據(jù)中第14周累積和的計算結(jié)果,找到累積和最大的連續(xù)14周時段究竟是哪個時段,這個時段就是流行期。
本例中,第19-32周的累積和3721為最大值,因此流行開始周為第19周,流行結(jié)束周為第32周;流行前期為第1-18周,流行后期為第33-52周。
![]()
好的,MEM的核心MAP函數(shù)我們就已經(jīng)學會了,下一節(jié)我們講一講目標數(shù)據(jù)流行期閾值的設(shè)置。
![]()
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創(chuàng)
說明 | 轉(zhuǎn)載只為分享,如有侵權(quán)聯(lián)系刪除
?版權(quán)聲明 | 部分信息和圖片來自公開網(wǎng)絡
轉(zhuǎn)載請注明
再次轉(zhuǎn)載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構(gòu)從業(yè)者運營
重點關(guān)注國內(nèi)外健康事件
致力于疾控科普
在做好科普服務大眾的同時
做好疾控機構(gòu)的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創(chuàng)內(nèi)容,文章為個人理解所學,不涉及疫情信息及內(nèi)部保密數(shù)據(jù),發(fā)表的目的為自我總結(jié)及給有需求的人士學習使用。如有不妥之處,歡迎聯(lián)系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.