大數(shù)據(jù)數(shù)學(xué)基礎(chǔ)(Python語(yǔ)言描述)
本書(shū)全面地講解了在科學(xué)領(lǐng)域廣泛運(yùn)用的微積分、概率論與數(shù)理統(tǒng)計(jì)、線性代數(shù)、數(shù)值計(jì)算、多元統(tǒng)計(jì)分析等數(shù)學(xué)基礎(chǔ)知識(shí)。全書(shū)共6章:第1章介紹了大數(shù)據(jù)與數(shù)學(xué)、數(shù)學(xué)與Python的關(guān)系;第2章介紹了微積分的基礎(chǔ)知識(shí),包括極限、導(dǎo)數(shù)、微分、不定積分與定積分等;第3章介紹了概率論與數(shù)理統(tǒng)計(jì)的基礎(chǔ)知識(shí),包括數(shù)據(jù)分布特征、概率與概率分布、參數(shù)估計(jì)、假設(shè)檢驗(yàn)等;第4章介紹了線性代數(shù)的基礎(chǔ)知識(shí),包括行列式、矩陣的運(yùn)算和特征分解、奇異值分解;第5章介紹了數(shù)值計(jì)算的基礎(chǔ)知識(shí),包括插值法、函數(shù)逼近與擬合、非線性方程(組)求根;第6章介紹了常用的多元統(tǒng)計(jì)分析方法,包括回歸分析、判別分析、聚類(lèi)分析、主成分分析、因子分析和典型相關(guān)分析。本書(shū)示例大都結(jié)合Python進(jìn)行求解分析,且每章都有課后習(xí)題,可以幫助讀者鞏固所學(xué)的內(nèi)容。
全書(shū)大部分章節(jié)緊扣實(shí)際需求展開(kāi),不堆積知識(shí)點(diǎn),著重于解決問(wèn)題時(shí)思路的啟發(fā)與方案的實(shí)施,幫助讀者真正理解與消化大數(shù)據(jù)數(shù)學(xué)基礎(chǔ)。
書(shū)中案例全部源于企業(yè)真實(shí)項(xiàng)目,可操作性強(qiáng),引導(dǎo)讀者融會(huì)貫通,并提供源代碼等相關(guān)學(xué)習(xí)資源,幫助讀者快速掌握大數(shù)據(jù)相關(guān)技能。
張良均,高級(jí)信息系統(tǒng)項(xiàng)目管理師,泰迪杯全國(guó)大學(xué)生數(shù)據(jù)挖掘競(jìng)賽(www.tipdm.org)發(fā)起人。華南師范大學(xué)、廣東工業(yè)大學(xué)兼職教授,廣東省工業(yè)與應(yīng)用數(shù)學(xué)學(xué)會(huì)理事。兼有大型高科技企業(yè)和高校的工作經(jīng)歷,主要從事大數(shù)據(jù)挖掘及其應(yīng)用的策劃、研發(fā)及咨詢(xún)培訓(xùn)。全國(guó)計(jì)算機(jī)技術(shù)與軟件專(zhuān)業(yè)技術(shù)資格(水平)考試?yán)^續(xù)教育和CDA數(shù)據(jù)分析師培訓(xùn)講師。發(fā)表數(shù)據(jù)挖掘相關(guān)論文數(shù)20余篇,已取得國(guó)家發(fā)明專(zhuān)利12項(xiàng),主編《Hadoop大數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》《R語(yǔ)言數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》等多本暢銷(xiāo)圖書(shū),主持并完成科技項(xiàng)目9項(xiàng)。獲得SAS、SPSS數(shù)據(jù)挖掘認(rèn)證及Hadoop開(kāi)發(fā)工程師證書(shū),具有電力、電信、銀行、制造企業(yè)、電子商務(wù)和電子政務(wù)的項(xiàng)目經(jīng)驗(yàn)和行業(yè)背景。
第 1章 緒論 1
1.1 大數(shù)據(jù)與數(shù)學(xué) 1
1.1.1 大數(shù)據(jù)的定義 1
1.1.2 數(shù)學(xué)在大數(shù)據(jù)領(lǐng)域的作用 2
1.2 數(shù)學(xué)與Python 4
1.2.1 NumPy 4
1.2.2 SciPy 5
1.2.3 SymPy 5
1.2.4 StatsModels 5
小結(jié) 6
課后習(xí)題 6
第 2章 微積分基礎(chǔ) 7
2.1 函數(shù)與極限 7
2.1.1 映射與函數(shù) 7
2.1.2 數(shù)列與函數(shù)的極限 13
2.1.3 極限運(yùn)算法則與存在法則 16
2.1.4 連續(xù)函數(shù)與初等函數(shù)的
連續(xù)性 17
2.2 導(dǎo)數(shù)與微分 18
2.2.1 導(dǎo)數(shù)的概念 18
2.2.2 函數(shù)的求導(dǎo)法則 22
2.2.3 微分的概念 26
2.3 微分中值定理與導(dǎo)數(shù)的應(yīng)用 30
2.3.1 微分中值定理 30
2.3.2 函數(shù)的單調(diào)性與曲線的
凹凸性 31
2.3.3 函數(shù)的極值與最值 32
2.4 不定積分與定積分 36
2.4.1 不定積分的概念與性質(zhì) 36
2.4.2 不定積分的換元積分法與
分部積分法 41
2.4.3 定積分的概念與性質(zhì) 43
2.4.4 定積分的換元積分法與
分部積分法 46
小結(jié) 47
課后習(xí)題 47
第3章 概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ) 49
3.1 數(shù)據(jù)分布特征的統(tǒng)計(jì)描述 49
3.1.1 集中趨勢(shì)度量 49
3.1.2 離散趨勢(shì)度量 57
3.1.3 偏度與峰度的度量 62
3.2 概率與概率分布 65
3.2.1 隨機(jī)事件及其概率 65
3.2.2 隨機(jī)變量與概率分布 69
3.2.3 隨機(jī)變量的數(shù)字特征 75
3.3 參數(shù)估計(jì)與假設(shè)檢驗(yàn) 83
3.3.1 參數(shù)估計(jì) 83
3.3.2 假設(shè)檢驗(yàn) 85
小結(jié) 88
課后習(xí)題 88
第4章 線性代數(shù)基礎(chǔ) 90
4.1 行列式 90
4.1.1 行列式與全排列 90
4.1.2 行列式的性質(zhì) 97
4.1.3 行列式按行(列)展開(kāi) 102
4.2 矩陣及其運(yùn)算 104
4.2.1 矩陣的定義 105
4.2.2 特殊矩陣 106
4.2.3 矩陣的運(yùn)算 110
4.2.4 矩陣的逆 114
4.2.5 向量組與矩陣的秩 115
4.2.6 協(xié)方差矩陣 119
4.2.7 相關(guān)矩陣 120
4.3 矩陣的特征分解與
奇異值分解 121
4.3.1 特征分解 121
4.3.2 奇異值分解 134
小結(jié) 137
課后習(xí)題 137
第5章 數(shù)值計(jì)算基礎(chǔ) 140
5.1 數(shù)值計(jì)算的基本概念 140
5.1.1 誤差的來(lái)源 140
5.1.2 誤差分類(lèi) 142
5.1.3 數(shù)值計(jì)算的衡量標(biāo)準(zhǔn) 143
5.2 插值法 143
5.2.1 Lagrange插值 143
5.2.2 Newton插值 146
5.2.3 樣條插值 152
5.3 函數(shù)逼近與擬合 153
5.3.1 數(shù)據(jù)的最小二乘線性擬合 153
5.3.2 函數(shù)的最佳平方逼近 157
5.3.3 數(shù)據(jù)的多變量擬合 160
5.3.4 數(shù)據(jù)的非線性曲線擬合 162
5.4 非線性方程(組)求根 164
5.4.1 二分法求解非線性方程 164
5.4.2 迭代法求解非線性方程 167
5.4.3 Newton法求解非線性方程 169
5.4.4 Newton法求解非線性
方程組 171
小結(jié) 173
課后習(xí)題 174
第6章 多元統(tǒng)計(jì)分析 176
6.1 回歸分析 176
6.1.1 一元線性回歸 176
6.1.2 多元線性回歸 184
6.1.3 Logistic回歸 189
6.2 判別分析 193
6.2.1 距離判別 194
6.2.2 貝葉斯判別 197
6.2.3 費(fèi)希爾判別 200
6.3 聚類(lèi)分析 202
6.3.1 距離和相似系數(shù) 202
6.3.2 系統(tǒng)聚類(lèi)法 205
6.3.3 動(dòng)態(tài)聚類(lèi)法 212
6.4 主成分分析 215
6.4.1 總體主成分 215
6.4.2 樣本主成分 221
6.5 因子分析 224
6.5.1 正交因子模型 225
6.5.2 參數(shù)估計(jì) 228
6.5.3 因子旋轉(zhuǎn) 235
6.5.4 因子得分 237
6.6 典型相關(guān)分析 238
6.6.1 總體典型相關(guān) 238
6.6.2 樣本典型相關(guān) 240
6.6.3 典型相關(guān)系數(shù)的顯著性檢驗(yàn) 241
小結(jié) 243
課后習(xí)題 243
附錄I t分布表 248
附錄II F分布表 250
參考文獻(xiàn) 262