MATLAB為機(jī)器學(xué)習(xí)領(lǐng)域提供了必要的工具。用戶(hù)可以借助MATLAB環(huán)境提供的強(qiáng)大交互式圖形界面,非常輕松地解決機(jī)器學(xué)習(xí)問(wèn)題。
本書(shū)在介紹每個(gè)主題前,會(huì)簡(jiǎn)要概述其理論基礎(chǔ),然后輔以實(shí)際案例進(jìn)行闡釋。通過(guò)閱讀本書(shū),讀者能夠應(yīng)用機(jī)器學(xué)習(xí)方法,并能充分利用MATLAB的功能解決實(shí)際問(wèn)題。
《MATLAB機(jī)器學(xué)習(xí)》前3章主要介紹MATLAB機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)、使用MATLAB導(dǎo)入數(shù)據(jù)和組織數(shù)據(jù)的方法以及從數(shù)據(jù)到知識(shí)發(fā)掘的方法,中間3章主要介紹回歸分析、分類(lèi)分析以及無(wú)監(jiān)督學(xué)習(xí),最后3章介紹人工神經(jīng)網(wǎng)絡(luò)、降維變換的方法以及機(jī)器學(xué)習(xí)實(shí)戰(zhàn)的相關(guān)知識(shí)。
本書(shū)可供數(shù)據(jù)分析員、數(shù)據(jù)科學(xué)家以及任何希望學(xué)習(xí)機(jī)器學(xué)習(xí)算法以及構(gòu)建數(shù)據(jù)處理、預(yù)測(cè)應(yīng)用的讀者閱讀。
1. 知名MATLAB專(zhuān)家用 MATLAB 進(jìn)行機(jī)器學(xué)習(xí)建模的入門(mén)書(shū)。
2. 真實(shí)案例+圖表展示多種回歸模型,真實(shí)再現(xiàn)用MATLAB實(shí)現(xiàn)數(shù)據(jù)應(yīng)用,且側(cè)重于實(shí)際應(yīng)用。
3. 中國(guó)量化投資學(xué)會(huì)MATLAB技術(shù)分會(huì)會(huì)長(zhǎng)、MATLAB技術(shù)論壇聯(lián)合創(chuàng)始人李洋領(lǐng)銜翻譯,在原書(shū)基礎(chǔ)上增加了專(zhuān)業(yè)、細(xì)致的修訂。
朱塞佩·恰布羅(Giuseppe Ciaburro),獲有意大利那不勒斯腓特烈二世大學(xué)(Università degli Studi di Napoli Federico Ⅱ)的化學(xué)工程碩士學(xué)位和那不勒斯第二大學(xué)(Seconda Università degli Studi di Napoli)的聲學(xué)和噪聲控制碩士學(xué)位。他目前在意大利坎帕尼亞的一所大學(xué)(Università degli Studi della Campania“Luigi Vanvitelli”)的建成環(huán)境控制實(shí)驗(yàn)室工作。他在燃燒領(lǐng)域以及聲學(xué)和噪聲控制領(lǐng)域方面有15年以上的編程工作經(jīng)驗(yàn)。他使用的核心編程語(yǔ)言是Python和R,并且在使用MATLAB上也有豐富的經(jīng)驗(yàn)。Giuseppe雖為聲學(xué)和噪聲控制領(lǐng)域的專(zhuān)家,但他在專(zhuān)業(yè)計(jì)算機(jī)課程的教學(xué)以及在線(xiàn)課程方面也有豐富的經(jīng)驗(yàn)。他出版過(guò)專(zhuān)著,也在科學(xué)期刊、主題會(huì)議上發(fā)表過(guò)文章。近期他的研究方向是將機(jī)器學(xué)習(xí)應(yīng)用到聲學(xué)和噪聲控制理論中。
第 1章 MATLAB機(jī)器學(xué)習(xí)初體驗(yàn) 1
1.1 機(jī)器學(xué)習(xí)基礎(chǔ) 1
1.2 機(jī)器學(xué)習(xí)算法的分類(lèi) 4
1.2.1 監(jiān)督學(xué)習(xí) 4
1.2.2 非監(jiān)督學(xué)習(xí) 5
1.2.3 強(qiáng)化學(xué)習(xí) 5
1.3 選擇正確的算法 6
1.4 構(gòu)建機(jī)器學(xué)習(xí)模型的流程 7
1.5 MATLAB中的機(jī)器學(xué)習(xí)支持簡(jiǎn)介 8
1.5.1 操作系統(tǒng)、硬件平臺(tái)要求 10
1.5.2 MATLAB安裝要求 11
1.6 統(tǒng)計(jì)機(jī)器學(xué)習(xí)工具箱 11
1.6.1 數(shù)據(jù)類(lèi)型 13
1.6.2 統(tǒng)計(jì)機(jī)器學(xué)習(xí)工具箱功能簡(jiǎn)介 13
1.7 神經(jīng)網(wǎng)絡(luò)工具箱 18
1.8 MATLAB中的統(tǒng)計(jì)學(xué)和線(xiàn)性代數(shù) 19
1.9 總結(jié) 21
第 2章 使用MATLAB導(dǎo)入數(shù)據(jù)和組織數(shù)據(jù) 22
2.1 熟悉MATLAB桌面 22
2.2 將數(shù)據(jù)導(dǎo)入MATLAB 27
2.2.1 導(dǎo)入向?qū)А?7
2.2.2 通過(guò)程序語(yǔ)句導(dǎo)入數(shù)據(jù) 29
2.3 從MATLAB導(dǎo)出數(shù)據(jù) 36
2.4 處理媒體文件 37
2.4.1 處理圖像數(shù)據(jù) 37
2.4.2 音頻的導(dǎo)入/導(dǎo)出 39
2.5 數(shù)據(jù)組織 39
2.5.1 元胞數(shù)組 40
2.5.2 結(jié)構(gòu)體數(shù)組 42
2.5.3 table類(lèi)型 44
2.5.4 分類(lèi)數(shù)組 46
2.6 總結(jié) 47
第3章 從數(shù)據(jù)到知識(shí)挖掘 49
3.1 區(qū)分變量類(lèi)別 50
3.1.1 定量變量 50
3.1.2 定性變量 50
3.2 數(shù)據(jù)準(zhǔn)備 51
3.2.1 初步查看數(shù)據(jù) 51
3.2.2 找到缺失值 53
3.2.3 改變數(shù)據(jù)類(lèi)型 54
3.2.4 替換缺失值 54
3.2.5 移除缺失值 55
3.2.6 為表格排序 56
3.2.7 找到數(shù)據(jù)中的異常值 56
3.2.8 將多個(gè)數(shù)據(jù)源合并成一個(gè)數(shù)據(jù)源 57
3.3 探索性統(tǒng)計(jì)指標(biāo)—數(shù)值測(cè)量 59
3.3.1 位置測(cè)量 59
3.3.2 分散度的測(cè)量 61
3.3.3 分布形狀的測(cè)量 64
3.4 探索性可視化 66
3.4.1 圖形數(shù)據(jù)統(tǒng)計(jì)分析對(duì)話(huà)框 67
3.4.2 柱狀圖 70
3.4.3 箱形圖 75
3.4.4 散點(diǎn)圖 77
3.5 總結(jié) 78
第4章 找到變量之間的關(guān)系—回歸方法 80
4.1 尋找線(xiàn)性關(guān)系 80
4.1.1 最小二乘回歸 81
4.1.2 基本擬合接口 86
4.2 如何創(chuàng)建一個(gè)線(xiàn)性回歸模型 88
4.2.1 通過(guò)穩(wěn)健回歸消除異常值的影響 93
4.2.2 多元線(xiàn)性回歸 96
4.3 多項(xiàng)式回歸 101
4.4 回歸學(xué)習(xí)器App 103
4.5 總結(jié) 107
第5章 模式識(shí)別之分類(lèi)算法 108
5.1 決策樹(shù)分類(lèi) 108
5.2 概率分類(lèi)模型—樸素貝葉斯分類(lèi) 115
5.2.1 概率論基礎(chǔ) 116
5.2.2 使用樸素貝葉斯進(jìn)行分類(lèi) 119
5.2.3 MATLAB中的貝葉斯方法 120
5.3 判別分析分類(lèi) 123
5.4 k鄰近算法 128
5.5 MATLAB分類(lèi)學(xué)習(xí)器App 132
5.6 總結(jié) 136
第6章 無(wú)監(jiān)督學(xué)習(xí) 137
6.1 聚類(lèi)分析簡(jiǎn)介 137
6.1.1 相似度與離散度指標(biāo) 138
6.1.2 聚類(lèi)方法類(lèi)型簡(jiǎn)介 139
6.2 層次聚類(lèi)算法 141
6.2.1 層次聚類(lèi)中的相似度指標(biāo) 141
6.2.2 定義層次聚類(lèi)中的簇 143
6.2.3 如何理解層次聚類(lèi)圖 145
6.2.4 驗(yàn)證聚類(lèi)結(jié)果 147
6.3 k均值聚類(lèi)—基于均值聚類(lèi) 148
6.3.1 k均值算法 148
6.3.2 函數(shù)kmeans() 149
6.3.3 silhouette圖—可視化聚類(lèi)結(jié)果 152
6.4 k中心點(diǎn)聚類(lèi)—基于樣本中心聚類(lèi) 153
6.4.1 什么是中心點(diǎn) 154
6.4.2 函數(shù)kmedoids() 154
6.4.3 評(píng)估聚類(lèi)結(jié)果 156
6.5 高斯混合模型聚類(lèi) 156
6.5.1 高斯分布 156
6.5.2 MATLAB中的GMM支持 157
6.5.3 使用后驗(yàn)概率分布進(jìn)行聚類(lèi) 159
6.6 總結(jié) 160
第7章 人工神經(jīng)網(wǎng)絡(luò)——模擬人腦的思考方式 162
7.1 神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介 162
7.2 神經(jīng)網(wǎng)絡(luò)基礎(chǔ)構(gòu)成 165
7.2.1 隱藏層數(shù)量 170
7.2.2 每層的節(jié)點(diǎn)數(shù)量 170
7.2.3 神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法 170
7.3 神經(jīng)網(wǎng)絡(luò)工具箱 171
7.4 工具箱的用戶(hù)界面 175
7.5 使用神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)擬合 176
7.5.1 如何使用擬合App(nftool) 178
7.5.2 腳本分析 186
7.6 總結(jié) 188
第8章 降維——改進(jìn)機(jī)器學(xué)習(xí)模型的性能 190
8.1 特征選擇 190
8.1.1 分步回歸 191
8.1.2 MATLAB中的分步回歸 192
8.2 特征提取 199
8.3 總結(jié) 210
第9章 機(jī)器學(xué)習(xí)實(shí)戰(zhàn) 211
9.1 用于預(yù)測(cè)混凝土質(zhì)量的數(shù)據(jù)擬合 211
9.2 使用神經(jīng)網(wǎng)絡(luò)診斷甲狀腺疾病 222
9.3 使用模糊聚類(lèi)對(duì)學(xué)生進(jìn)行分簇 226
9.4 總結(jié) 231