這是本將疾病進展的系統(tǒng)動力學模型與流行病學率的統(tǒng)計學模型相結(jié)合的、全面考慮所有疾病可用數(shù)據(jù)的優(yōu)選疾病負擔(GBD)的研究書籍,闡釋了GBD研究的核心方法。GBD研究結(jié)果可作為衛(wèi)生健康各級政府和非政府機構(gòu)的政策制定、資金優(yōu)先的決策參考!睹枋隽餍胁WMETA回歸框架》還詳細闡述了描述性流行病學模型的未來發(fā)展方向。
描述流行病學Meta回歸框架是針對描述流行病學指標的一整套全新Meta分析方法。從基本原理出發(fā),本書介紹了一體化系統(tǒng)模型,構(gòu)建了疾病負擔研究(如全球疾病、傷害和危險因素負擔2010(GBD 2010)研究)的發(fā)病率估計理論基礎(chǔ),估計方法依賴于不同國家、性別、年份的一系列非致死疾病、傷害和危險因素的年齡別患病率。
GBD 2010是測量所有主要疾病、傷害和危險因素水平及其趨勢的團隊合作研究,首個標志性成果是2012年12月發(fā)表的一系列論文,這些文章給出了291個疾病和傷害、67個危險因素、全球21個區(qū)域、20個年齡組和187個國家的疾病負擔和危險因素歸因估計值。作者有488人,來自50個國家的303個研究單位。
作為GBD 2010研究的一部分,為了整合非致死健康結(jié)局的流行病學資料,我們特別開發(fā)了貝葉斯Meta回歸工具。利用這一工具,對所有流行病學資料構(gòu)建了各種固定或隨機效應(yīng)的廣義負二項回歸模型,包括年齡固定效應(yīng)、預(yù)測不同國家變異的協(xié)變量固定效應(yīng)、預(yù)測不同研究變異(不同研究方案,超大區(qū)域、區(qū)域和國家的變動)的固定效應(yīng)。該工具應(yīng)用貝葉斯推斷估計參數(shù),使用聯(lián)合后驗分布模型整合所有相關(guān)流行病學資料。盡管是新的方法,但其研究基礎(chǔ)是已在全球健康流行病學中應(yīng)用將近20年的通用疾病建模方法。然而,直到現(xiàn)在,模型和方法的描述只能從雜志論文、疾病負擔報告、操作手冊中零散查閱到。
通過描述流行病學方法進行測量以及使用系統(tǒng)綜述,可以得到傷殘損失壽命年(years lived with disability,YLD),把反映疾病進展的系統(tǒng)動態(tài)模型與流行病學率的統(tǒng)計學模型聯(lián)系起來,大大擴展了以前的疾病負擔估計模型。這種系統(tǒng)動態(tài)建模和統(tǒng)計學建模相結(jié)合來整合所有可獲得資料的方法,稱為一體化系統(tǒng)建模(integrative systems modeling,ISM)。這種將統(tǒng)計學基礎(chǔ)知識融人到廣泛貝葉斯框架之中的方法介紹見第1章。擬合復(fù)雜模型需要高級數(shù)字算法,第8章提供了馬爾科夫鏈蒙特卡洛(Markov chain Monte Carlo,MCMC)和其他相關(guān)計算方法的背景知識。
系統(tǒng)綜述的經(jīng)驗表明,所有可獲得的相關(guān)數(shù)據(jù)通常都是稀疏的、帶噪聲的。在GBD估計中,數(shù)據(jù)稀疏通常意味著全球所有地區(qū)沒有任何數(shù)據(jù)可得到,需要利用危險因素和其他Meta回歸解釋變量來預(yù)測患病率,否則會默認為該區(qū)域、超大區(qū)域或全球的平均值。處理噪聲數(shù)據(jù)則是另一個挑戰(zhàn),不同區(qū)域或國家的許多指標通常呈高度異質(zhì),甚至異質(zhì)度遠遠超過抽樣誤差大小,具有相當大的非抽樣變異。非抽樣變異的來源有:抽樣設(shè)計,樣本缺乏代表性,以及資料收集、病例定義和診斷技術(shù)等執(zhí)行問題。同時,存在真正的地理差異,使事情變得更為復(fù)雜。
在估計非致死疾病結(jié)局的患病率時,其他常見的挑戰(zhàn)還有:
·基于生物和臨床知識,關(guān)于疾病或情況的發(fā)病率或患病率年齡模式會有一些先驗看法。例如,由于致癌物的累積暴露,人們可能會認為:隨著年齡的增加,至少針對成年人而言,許多癌癥的發(fā)病率也會增加;又如,幼小兒童的躁狂癥患病率為0。
·已出版研究通常采用諸如18~ 35歲、15歲及以上等不同年齡組。對于GBD 2010研究,需要采用來自不同標準年齡組來產(chǎn)生20個年齡組的一致性估計。大多數(shù)并發(fā)癥與年齡之間存在強相關(guān),使得該問題更為嚴重。
·在許多情況下,可獲得的研究采用了不同的病例定義,比如在糖尿病患病率研究中,發(fā)現(xiàn)有18個不同定義在使用。如果所有其他定義對應(yīng)的數(shù)據(jù)被排除,那么預(yù)測只能基于僅有的少數(shù)幾個研究。一個替代的辦法就是利用所有可獲得研究的重疊情況,在不同的定義間進行適當調(diào)整。
·在區(qū)域或國家內(nèi)部,并發(fā)癥(sequela)實際患病率可能變化巨大,埃及丙肝感染率高就是中東和非洲地區(qū)的一個典型例子。這種真實率的地區(qū)內(nèi)部異質(zhì)性必須納入到Meta回歸框架之中。
·收集不同結(jié)局、不同疾病、同一疾病不同地區(qū)的發(fā)病率、患病率、緩解率、超額死亡率或死因別死亡率等各種資料,所有這些資源提供了患病率估計的相關(guān)信息。
宇傳華,武漢大學衛(wèi)生統(tǒng)計學教授,博導(dǎo)。中國衛(wèi)生信息與健康醫(yī)療大數(shù)據(jù)學會醫(yī)院統(tǒng)計專業(yè)委員會副主任委員,湖北省衛(wèi)生統(tǒng)計與信息學會副會長!吨袊l(wèi)生統(tǒng)計》《中國醫(yī)院統(tǒng)計》《公共衛(wèi)生與預(yù)防醫(yī)學》等雜志編委。主編(著或譯)有《Excel與數(shù)據(jù)分析(-3版)》《SPSS與統(tǒng)計分析(-2版)》、《診斷醫(yī)學統(tǒng)計學》等著作。發(fā)表科研論文260余篇。
第一部分 理論方法
第1章 貝葉斯方法簡介
1.1 Meta分析實例:吸煙率
1.2 另一個Meta分析實例:吸煙率的隨機效應(yīng)模型
1.3 總結(jié)
第2章 率、比與病程的統(tǒng)計學模型
2.1 一個啟發(fā)性例子:精神分裂癥患病率
2.2 二項式模型
2.3 貝塔二項式模型
2.4 泊松模型
2.5 負二項模型
2.6 經(jīng)轉(zhuǎn)換的正態(tài)模型
2.7 下限數(shù)據(jù)模型
2.8 不確定性的量化
2.9 模型比較
2.10 總結(jié)及展望
第3章 年齡模式模型
3.1 樣條模型的定義
3.2 選擇節(jié)點
3.3 懲罰樣條模型
3.4 樣條模型的拓展
3.5 總結(jié)和展望
第4章 年齡模式的專家先驗
4.1 水平先驗
4.2 單調(diào)性先驗
4.3 先驗不僅僅用于樣條
4.4 年齡模式的層次相似性先驗
4.5 總結(jié)和展望
第5章 異質(zhì)年齡組的統(tǒng)計學模型
5.1 重疊年齡組數(shù)據(jù)
5.2 中值模型
5.3 解集模型
5.4 年齡組寬度作為協(xié)變量的中值模型
5.5 年齡標化和年齡積分模型
5.6 模型比較
5.7 總結(jié)和展望
第6章 協(xié)變量建模
6.1 解釋偏倚的交叉游走固定效應(yīng)
6.2 改善樣本外估計的預(yù)測固定效應(yīng)
6.3 解釋變異的固定效應(yīng)
6.4 空間變異的隨機效應(yīng)
6.5 協(xié)變量與一致性
6.6 總結(jié)和展望
第7章 其他類型資料的患病率估計
7.1 一個啟發(fā)性例子:人口動力學
7.2 人群疾病的系統(tǒng)動力學模型
7.3 地方性平衡點
7.4 正向模擬的例子
……
第二部分 實例應(yīng)用