數(shù)據(jù)科學(xué)統(tǒng)計(jì)基礎(chǔ)(數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書)
定 價(jià):49 元
叢書名:數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)叢書
- 作者:呂曉玲 黃丹陽(yáng)
- 出版時(shí)間:2021/1/1
- ISBN:9787300286921
- 出 版 社:中國(guó)人民大學(xué)出版社
- 中圖法分類:C8
- 頁(yè)碼:324
- 紙張:
- 版次:1
- 開本:16
在數(shù)據(jù)科學(xué)的時(shí)代背景下,統(tǒng)計(jì)學(xué)作為一門學(xué)科基礎(chǔ)課和方法論課程,更強(qiáng)調(diào)的是統(tǒng)計(jì)思想在數(shù)據(jù)科學(xué)中的應(yīng)用。編寫教材、組織教學(xué)都是圍繞著這個(gè)核心內(nèi)容來(lái)安排的。我們不再將傳統(tǒng)的正態(tài)分布下的抽樣分布、參數(shù)估計(jì)、假設(shè)檢驗(yàn)的理論和方法作為重點(diǎn)講述內(nèi)容, 而是將其融入到具體例子中進(jìn)行講授,突出統(tǒng)計(jì)思維在其中的應(yīng)用.
本書首先介紹統(tǒng)計(jì)量的概念及其性質(zhì),在此基礎(chǔ)上介紹經(jīng)典統(tǒng)計(jì)的兩個(gè)重要內(nèi)容,參數(shù)估計(jì)和假設(shè)檢驗(yàn),將其作為統(tǒng)計(jì)研究問(wèn)題中的兩個(gè)例子, 介紹統(tǒng)計(jì)研究方法的重要思想。之后介紹統(tǒng)計(jì)決策與貝葉斯方法。最后介紹基于再抽樣和數(shù)據(jù)重利用的統(tǒng)計(jì)方法與理論。本書的每個(gè)小節(jié)后面都有批判性思考題目,目的是引起討論、啟發(fā)思考。每章的最后一節(jié)介紹了與本章知識(shí)點(diǎn)相關(guān)的R語(yǔ)言操作, 包括本書介紹的各種方法的計(jì)算機(jī)實(shí)現(xiàn), 以及使用統(tǒng)計(jì)模擬來(lái)輔助各種方法的更深入理解等.
呂曉玲 中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院教授,博士生導(dǎo)師;數(shù)據(jù)科學(xué)與大數(shù)據(jù)統(tǒng)計(jì)系系主任;中國(guó)人民大學(xué)數(shù)據(jù)挖掘中心主任。本科與碩士畢業(yè)于南開大學(xué)數(shù)學(xué)系概率統(tǒng)計(jì)專業(yè),博士畢業(yè)于香港城市大學(xué)管理科學(xué)系。曾經(jīng)是奧地利約翰開普勒大學(xué)應(yīng)用統(tǒng)計(jì)系以及美國(guó)加州大學(xué)伯克利分校統(tǒng)計(jì)系訪問(wèn)學(xué)者。一直從事統(tǒng)計(jì)機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)領(lǐng)域的研究。主持教育部人文社會(huì)科學(xué)研究項(xiàng)目以及中國(guó)國(guó)家自然科學(xué)基金項(xiàng)目。學(xué)術(shù)論文在Journal of American Statistical Association, Journal of Electronic Commerce Research等SSCI/SCI檢索的國(guó)際學(xué)術(shù)期刊發(fā)表。
第 1章 數(shù)據(jù)及其描述 :統(tǒng)計(jì)量
1.1數(shù)據(jù)和變量
1.1.1數(shù)據(jù)的例子
1.1.2變量的類型
批判性思考
習(xí)題1.1
1.2總體、樣本和統(tǒng)計(jì)量
1.2.1總體和分布
1.2.2樣本
1.2.3統(tǒng)計(jì)量
批判性思考
習(xí)題 1.2
1.3從樣本認(rèn)識(shí)總體的圖表方法
1.3.1頻數(shù)頻率表與直方圖
1.3.2餅圖與條形圖
1.3.3樣本的經(jīng)驗(yàn)分布函數(shù)
1.3.4高維數(shù)據(jù)的圖表展示方法
1.3.5數(shù)據(jù)變換
批判性思考
習(xí)題 1.3
1.4次序統(tǒng)計(jì)量
1.4.1次序統(tǒng)計(jì)量的概念
1.4.2樣本極差
1.4.3樣本中位數(shù)與樣本 p分位數(shù)
1.4.4箱線圖和 Q–Q圖
批判性思考
習(xí)題 1.4
1.5抽樣分布
1.5.1樣本均值的抽樣分布
1.5.2正態(tài)總體各統(tǒng)計(jì)量的分布
1.5.3次序統(tǒng)計(jì)量的分布
1.5.4用隨機(jī)模擬法尋找統(tǒng)計(jì)量的近似分布
批判性思考
習(xí)題 1.5
1.6充分統(tǒng)計(jì)量
1.6.1充分統(tǒng)計(jì)量的概念
1.6.2因子分解定理
批判性思考
習(xí)題 1.6
1.7常用的概率分布族
1.7.1常用概率分布族表
1.7.2伽瑪分布族
1.7.3貝塔分布族
1.7.4指數(shù)型分布族
批判性思考
習(xí)題 1.7
1.8與本章相關(guān)的 R語(yǔ)言操作
1.8.1基本統(tǒng)計(jì)量的計(jì)算
1.8.2圖表
1.8.3隨機(jī)模擬統(tǒng)計(jì)量的抽樣分布
附錄:定理證明
第 2章 參數(shù)估計(jì)
2.1點(diǎn)估計(jì)與無(wú)偏性
批判性思考
習(xí)題2.1
2.2矩估計(jì)與相合性
2.2.1矩估計(jì)
2.2.2相合性
批判性思考
習(xí)題2.2
2.3最大似然估計(jì)與漸近正態(tài)性
2.3.1最大似然估計(jì)
2.3.2最大似然估計(jì)的不變?cè)?
2.3.3最大似然估計(jì)的漸近正態(tài)性
2.3.4 EN算法
批判性思考
習(xí)題2.3
2.4最小方差無(wú)偏估計(jì)
2.4.1無(wú)偏估計(jì)的有效性
2.4.2有偏估計(jì)的均方誤差準(zhǔn)則
2.4.3一致最小方差無(wú)偏估計(jì)
2.4.4完備性及其應(yīng)用
批判性思考
習(xí)題2.4
2.5 C-R不等式
2.5.1 C-R不等式
2.5.2有效估計(jì)
批判性思考
習(xí)題2.5
2.6置信區(qū)間
2.6.1置信區(qū)間概念
2.6.2樞軸量法
2.6.3大樣本置信區(qū)間
批判性思考
習(xí)題2.6
2.7正態(tài)總體參數(shù)的置信區(qū)間
2.7.1正態(tài)總體參數(shù)的置信區(qū)間
2.7.2二維參數(shù) (μ, σ2)的置信域
2.7.3樣本量的確定
批判性思考
習(xí)題2.7
2.8與本章相關(guān)的R語(yǔ)言操作
2.8.1隨機(jī)變量序列分布的演示
2.8.2最大似然估計(jì)
2.8.3 EM算法模擬實(shí)例
2.8.4區(qū)間估計(jì)的模擬結(jié)果
2.8.5均值、方差的區(qū)間估計(jì)
第3章假設(shè)檢驗(yàn)
3.1假設(shè)檢驗(yàn)的概念與步驟
3.1.1假設(shè)檢驗(yàn)問(wèn)題
3.1.2假設(shè)檢驗(yàn)的步驟
批判性思考
習(xí)題3.1
3.2正態(tài)總體參數(shù)和比率的檢驗(yàn)
3.2.1正態(tài)均值μ的檢驗(yàn)
3.2.2其他正態(tài)總體參數(shù)的檢驗(yàn)
3.2.3成對(duì)數(shù)據(jù)的t檢驗(yàn)
3.2.4比率的推斷
3.2.5幾個(gè)說(shuō)明
批判性思考
習(xí)題3.2
3.3分布的檢驗(yàn)
3.3.1離散分布的X2擬合優(yōu)度檢驗(yàn)
3.3.2連續(xù)分布的檢驗(yàn)
批判性思考
習(xí)題3.3
3.4大規(guī)模假設(shè)檢驗(yàn)與FDR
3.4.1大規(guī)模假設(shè)檢驗(yàn)
3.4.2 FDR方法介紹
批判性思考
習(xí)題3.4
3.5與本章相關(guān)的R語(yǔ)言操作
3.5.1正態(tài)總體的參數(shù)檢驗(yàn)
3.5.2比率檢驗(yàn)
3.5.3假設(shè)檢驗(yàn)的一個(gè)人為例子
3.5.4 X2擬合優(yōu)度檢驗(yàn)
3.5.5夏皮洛—威爾克檢驗(yàn)
3.5.6柯莫哥洛夫—斯米爾諾夫檢驗(yàn)
3.5.7 FDR例子
第4章統(tǒng)計(jì)決策與貝葉斯方法
4.1統(tǒng)計(jì)決策的基本概念
4.1.1統(tǒng)計(jì)決策問(wèn)題的三要素
4.1.2統(tǒng)計(jì)決策函數(shù)與風(fēng)險(xiǎn)函數(shù)
批判性思考
習(xí)題 4.1
4.2貝葉斯點(diǎn)估計(jì)
4.2.1先驗(yàn)分布與貝葉斯公式
4.2.2先驗(yàn)分布
4.2.3貝葉斯風(fēng)險(xiǎn)與貝葉斯點(diǎn)估計(jì)
4.2.4兩個(gè)注釋
批判性思考
習(xí)題 4.2
4.3貝葉斯區(qū)間估計(jì)
4.3.1可信區(qū)間
4.3.2最大后驗(yàn)密度 (HPD)可信區(qū)間
批判性思考
習(xí)題 4.3
4.4貝葉斯假設(shè)檢驗(yàn)
批判性思考
習(xí)題 4.4
4.5與本章相關(guān)的 R語(yǔ)言操作
4.5.1不同先驗(yàn)的對(duì)比
4.5.2貝葉斯區(qū)間估計(jì)
第 5章再抽樣方法
5.1自助法參數(shù)估計(jì)
5.1.1標(biāo)準(zhǔn)誤差的自助法估計(jì)
5.1.2偏差的自助法估計(jì)
5.1.3自助法的區(qū)間估計(jì)
5.1.4討論
批判性思考
習(xí)題 5.1
5.2 Jackknife
5.2.1 Jackknife方法介紹
5.2.2 Jackknife和自助法的聯(lián)系
批判性思考
習(xí)題 5.2
5.3再抽樣假設(shè)檢驗(yàn)
5.3.1置換檢驗(yàn)
5.3.2自助法假設(shè)檢驗(yàn)
批判性思考
習(xí)題 5.3
5.4交叉驗(yàn)證
5.4.1交叉驗(yàn)證簡(jiǎn)介
5.4.2進(jìn)一步討論
批判性思考
習(xí)題 5.4
5.5數(shù)據(jù)科學(xué)中的 PCS準(zhǔn)則
5.5.1 DSLC中的 PCS準(zhǔn)則
5.5.2通過(guò)擾動(dòng)分析進(jìn)行 PCS推斷
批判性思考
習(xí)題 5.5
5.6與本章相關(guān)的 R語(yǔ)言操作
5.6.1自助法
5.6.2 Jackknife
5.6.3假設(shè)檢驗(yàn)
5.6.4交叉驗(yàn)證
5.6.5數(shù)據(jù)科學(xué)中的 PCS準(zhǔn)則
附錄 R語(yǔ)言簡(jiǎn)介
A.1 R軟件簡(jiǎn)介
A.1.1 R軟件的簡(jiǎn)單介紹
A.1.2 R軟件的安裝
A.2數(shù)據(jù)的類型結(jié)構(gòu)
A.2.1數(shù)據(jù)的類型
A.2.2數(shù)據(jù)的結(jié)構(gòu)
A.2.3缺失數(shù)據(jù)的處理
A.3 R的基本操作
A.3.1數(shù)據(jù)的輸入和輸出
A.3.2控制結(jié)構(gòu)
A.3.3自定義函數(shù)
A.3.4畫圖
A.4概率分布
參考文獻(xiàn)