本書介紹了生物與醫(yī)藥學(xué)統(tǒng)計中常用的數(shù)據(jù)分析與建模方法,內(nèi)容包括基礎(chǔ)數(shù)理統(tǒng)計、列聯(lián)表分析、回歸分析、多元統(tǒng)計分析、生存分析和馬爾柯夫鏈模型數(shù)據(jù)分析等統(tǒng)計分支學(xué)科的基礎(chǔ)內(nèi)容,每章結(jié)合生物與醫(yī)藥學(xué)的實際數(shù)據(jù)進行數(shù)據(jù)分析和建模方法的講解。此外,每章還配備了一定數(shù)量的習(xí)題與上機實驗題。
本書可作為普通高等院校農(nóng)學(xué)、生命科學(xué)和醫(yī)藥學(xué)專業(yè)研究生基礎(chǔ)課程教材,也可作為這些專業(yè)大四學(xué)生和其他非統(tǒng)計類學(xué)科研究生的教學(xué)參考書。
在農(nóng)業(yè)、林業(yè)以及醫(yī)藥、衛(wèi)生健康等生命科學(xué)領(lǐng)域的工作進程和科學(xué)實驗中所產(chǎn)生的大量數(shù)據(jù)已不再局限于定性的描述,而是需要從大量調(diào)查和測定的數(shù)據(jù)中,應(yīng)用統(tǒng)計學(xué)的原理和方法,分析和解釋其數(shù)量的變化及其變化之間的關(guān)聯(lián)性,以正確制訂試驗計劃,科學(xué)地對試驗結(jié)果進行分析,從而做出符合科學(xué)實際的推斷。
本書是為生命科學(xué)類領(lǐng)域的研究生開設(shè)的統(tǒng)計學(xué)應(yīng)用課程。概率論是數(shù)理統(tǒng)計的數(shù)學(xué)基礎(chǔ),本書第1章為未學(xué)習(xí)過概率論的讀者提供概率論基礎(chǔ)知識的總結(jié)性介紹。第2章至第4章介紹數(shù)據(jù)整理與展示的方法、參數(shù)估計與假設(shè)檢驗等基礎(chǔ)統(tǒng)計學(xué)知識,第5章的四格子表分析為分析試驗中兩個因子彼此之間的關(guān)聯(lián)關(guān)系提供了一套統(tǒng)計分析方法。大數(shù)據(jù)時代的數(shù)據(jù)集不僅變量繁多,而且變量性狀多樣化及變量間層次結(jié)構(gòu)復(fù)雜化。數(shù)據(jù)分析的實踐表明,擬合這類數(shù)據(jù)集中多變量復(fù)雜關(guān)系的模型往往首先考慮的是線性統(tǒng)計模型。第6章介紹了多自變量線性回歸分析和建模的基本思想和方法。第7章的方差分析和實驗設(shè)計旨在比較具有某種相同特質(zhì)的多個試驗對象有關(guān)指標平均值的比較,以及怎樣基于方差分析進行實驗設(shè)計。第8章至第10章屬于多元統(tǒng)計分析的內(nèi)容,重點介紹具有多元屬性的試驗對象的常用分析及分類方法。第11章介紹的分支分類方法是探索生物物種分支演化規(guī)律的基本方法。第12章介紹的生存分析原本屬于醫(yī)藥統(tǒng)計學(xué)范疇,目前已成為分析具有生命特征實驗對象存活時間的分析工具。最后一章介紹怎樣應(yīng)用馬爾科夫鏈模型分析生態(tài)系統(tǒng)演化以及物種世代雜交基因演化的數(shù)據(jù)變化規(guī)律。
生物與醫(yī)學(xué)統(tǒng)計的內(nèi)容十分豐富,本書的主要目的并不是把讀者培養(yǎng)成生物醫(yī)學(xué)統(tǒng)計分析方面的專家,而是培養(yǎng)學(xué)生掌握統(tǒng)計學(xué)的基本思想和方法,使讀者對生命科學(xué)中的數(shù)據(jù)如何進行數(shù)據(jù)分析和建模有一個比較全面的基本了解,為將來能夠就實踐中出現(xiàn)的數(shù)據(jù)問題用統(tǒng)計學(xué)的語言與生物醫(yī)學(xué)統(tǒng)計學(xué)的專家進行科研交流探索。正因為此,讀者只要掌握了大學(xué)階段的多元微積分、線性代數(shù)和概率論的基礎(chǔ)知識,就可以閱讀本書的全部內(nèi)容?紤]到目前統(tǒng)計軟件及介紹統(tǒng)計軟件的書籍和網(wǎng)上資料繁多,因此本書對統(tǒng)計軟件的具體操作不再做詳細介紹。本書的部分內(nèi)容也可作為數(shù)學(xué)專業(yè)大四學(xué)生和其他學(xué)科研究生統(tǒng)計課程的教學(xué)參考書以及相關(guān)業(yè)界數(shù)據(jù)分析師的參考用書。
在本書結(jié)稿之際,我要感謝所有關(guān)心和支持我寫作和出版此書的人們。自2006年以來,本書的大部分內(nèi)容在上海交通大學(xué)生命科學(xué)學(xué)院的研究生公共課《生物數(shù)學(xué)(Ⅰ)》和《生物統(tǒng)計》課程中講授過。參加過課程學(xué)習(xí)的同學(xué)對課程的成功和本書的成書做出了貢獻。本書的寫作和出版得到了上海交通大學(xué)2017年至2019年研究生學(xué)科人才培養(yǎng)建設(shè)與創(chuàng)新專業(yè)課建設(shè)經(jīng)費(經(jīng)費號: WF610107101)的重點資助,以及國家自然科學(xué)基金國際(地區(qū))合作與交流項目開放網(wǎng)絡(luò)下醫(yī)療資源配置和優(yōu)化的模型、算法及應(yīng)用研究(項目編號: 71520107003)的資助。
由于作者水平所限,書中存在缺點和錯誤,懇請同行和廣大讀者批評指正。
林建忠上海交通大學(xué)數(shù)學(xué)科學(xué)學(xué)院2019年6月
1概率論基礎(chǔ)知識001
1.1隨機事件及其概率001
1.2概率的定義003
1.3隨機變量及其分布函數(shù)009
1.4一元隨機變量的數(shù)字特征019
1.5多維隨機變量及其分布025
1.6大數(shù)定律與中心極限定理028
1.7習(xí)題1029
2樣本描述與抽樣分布031
2.1總體和樣本031
2.2數(shù)據(jù)類型033
2.3樣本分布035
2.4樣本統(tǒng)計量046
2.5一些常用的抽樣分布054
2.6習(xí)題2060
3參數(shù)估計062
3.1點估計方法062
3.2估計量的優(yōu)劣標準068
3.3區(qū)間估計069
3.4習(xí)題30844假設(shè)檢驗088
4.1基本原理與方法088
4.2均值的假設(shè)檢驗095
4.3總體方差的假設(shè)檢驗101
4.4單邊假設(shè)檢驗104
4.5置信區(qū)間與假設(shè)檢驗之間的關(guān)系108
4.6習(xí)題4110
52檢驗與四格表分析113
5.1分布假設(shè)檢驗擬合優(yōu)度檢驗113
5.2成組設(shè)計兩樣本率比較的四格子表2
檢驗115
5.3配對設(shè)計兩樣本率比較的配對四格表2
檢驗123
5.4獨立性的卡方檢驗125
5.5Fisher精準檢驗131
5.6習(xí)題5135
6線性回歸模型138
6.1一元線性回歸模型138
6.2可線性化的一元非線性回歸與Logistic
種群增長模型147
6.3多元線性回歸模型154
6.4回歸方程的檢驗159
6.5回歸診斷與治療163
6.6回歸方程的選擇173
6.7習(xí)題6177
7方差分析模型與正交試驗設(shè)計180
7.1單因素方差分析180
7.2兩因素方差分析188
7.3正交試驗設(shè)計與方差分析1977.4習(xí)題7202
8主成分分析204
8.1總體與樣本的主成分204
8.2主成分的計算與實際意義211
8.3習(xí)題8222
9判別分析224
9.1費希爾的判別分析法224
9.2多類群時的貝葉斯判別法231
9.3習(xí)題9233
10聚類分析235
10.1分類的基本概念和原始數(shù)據(jù)的獲得235
10.2數(shù)據(jù)變換和數(shù)據(jù)標準化237
10.3相似性概念的數(shù)量化239
10.4系統(tǒng)聚類法244
10.5k均值聚類251
10.6習(xí)題10254
11生物演化的分支分類255
11.1演化集合及其基本定理255
11.2分支性狀與編碼261
11.3演化的定量表示與儉約性公理267
11.4性狀演化的和諧性與和諧性分析方法272
11.5生物演化歷史的重構(gòu)281
11.6習(xí)題11287
12生存分析289
12.1基本數(shù)據(jù)與變量類型289
12.2生存分析的基本函數(shù)295
12.3生存數(shù)據(jù)建模常用的參數(shù)模型300
12.4刪失和截尾數(shù)據(jù)似然函數(shù)的構(gòu)造308
12.5估計基本特征函數(shù)的壽命表法311
12.6右刪失數(shù)據(jù)的生存函數(shù)和累積死亡力
函數(shù)的估計313
12.7雙刪失數(shù)據(jù)的生存函數(shù)估計318
12.8比較生存函數(shù)的非參數(shù)方法,兩個生存
函數(shù)的比較322
12.9分層情形下的MantelHaenszel檢驗327
12.10比例危險率模型329
12.11習(xí)題12333
13馬爾柯夫鏈數(shù)學(xué)模型337
13.1馬爾柯夫鏈的基本概念及其表示337
13.2正則馬爾柯夫鏈346
13.3吸收馬爾柯夫鏈351
13.4習(xí)題13360
參考文獻363