R語言基礎(chǔ)與數(shù)據(jù)科學應用
定 價:49.8 元
- 作者:沈剛
- 出版時間:2018/6/1
- ISBN:9787115483027
- 出 版 社:人民郵電出版社
- 中圖法分類:TP312
- 頁碼:0
- 紙張:
- 版次:01
- 開本:16開
本書是為初學者學習R語言基礎(chǔ)以及在數(shù)據(jù)科學中的應用而編寫的。全書內(nèi)容包括三個部分,分別介紹了R語言的編程基礎(chǔ)知識,數(shù)據(jù)處理、可視化和統(tǒng)計分析的實用技術(shù),以及在機器學習、神經(jīng)網(wǎng)絡(luò)和深度學習中的具體應用。讀者可以通過本書了解和體驗R語言的風格特點和強大功能。本書中所有程序均在R 3.4.3環(huán)境下調(diào)試通過。
1.本書為教育部高等學校計算機類專業(yè)教學指導委員會-華為ICT產(chǎn)學結(jié)合項目:數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)系列規(guī)劃教材
2.通過本書快速掌握各類型數(shù)據(jù)處理方法,洞察數(shù)據(jù)類型背后的分析思維
3.實踐R數(shù)據(jù)科學實戰(zhàn)案例
沈剛,博士,教授。1990年及1992年畢業(yè)于清華大學自動化系生產(chǎn)過程自動化專業(yè)和系統(tǒng)工程專業(yè),分別獲學士學位和碩士學位。后留校任教,曾參與多項CIMS課題研究。1995年到1999年在加拿大McGill大學Electrical and Compter Engineering系學習,獲博士學位。1999年9月到12月,在多倫多大學Electrical Engineering系作訪問研究。1999年起,在加拿大Kerr Vayne Systems及美國Motorola公司工作,從事自動化系統(tǒng)和移動通訊系統(tǒng)的研究及開發(fā)。2003年起,在華中科技大學軟件學院開設(shè)《計算機網(wǎng)絡(luò)》《嵌入式系統(tǒng)》《軟件能力成熟度模型》等雙語課程。在IEEE Transactions on Automatic Control等期刊和IEEE Conference on Decision and Control等會議上發(fā)表多篇論文,F(xiàn)主要研究興趣包括實時系統(tǒng),無線通訊系統(tǒng),數(shù)字通信網(wǎng)絡(luò)和軟件工程等方向。
第 1章 引言 1
1.1 R的起源與發(fā)展 2
1.1.1 R的產(chǎn)生與演化 2
1.1.2 R的特點 3
1.2 安裝與運行R系統(tǒng) 6
1.2.1 R的獲取與安裝 7
1.2.2 運行R 7
1.3 安裝與使用包 10
1.3.1 什么是包 10
1.3.2 安裝包 12
1.3.3 載入、使用、卸載包 12
1.3.4 包的命名空間 13
1.4 工作空間管理 14
1.5 R語言的集成開發(fā)環(huán)境
RStudio 16
1.5.1 什么是集成開發(fā)環(huán)境 16
1.5.2 RStudio的使用方法 16
1.6 使用幫助系統(tǒng) 18
1.7 R語言與數(shù)據(jù)科學 19
1.7.1 R與大數(shù)據(jù)平臺 19
1.7.2 R在數(shù)據(jù)科學中的應用 22
習題 23
第 2章 數(shù)據(jù)與運算 25
2.1 基礎(chǔ)知識 26
2.1.1 向量 26
2.1.2 對象 27
2.1.3 函數(shù) 29
2.1.4 標識符與保留字 30
2.2 數(shù)據(jù)類型與數(shù)據(jù)表示 31
2.2.1 基本數(shù)據(jù)類型 31
2.2.2 變量 34
2.2.3 常量 34
2.2.4 特殊值 35
2.3 基本運算 36
2.3.1 運算符 36
2.3.2 算術(shù)運算 37
2.3.3 關(guān)系運算 37
2.3.4 邏輯運算 38
2.3.5 賦值運算 39
2.4 數(shù)據(jù)類型轉(zhuǎn)換與R中常見的數(shù)據(jù)
結(jié)構(gòu) 40
2.4.1 數(shù)據(jù)類型轉(zhuǎn)換 41
2.4.2 常見的數(shù)據(jù)結(jié)構(gòu) 43
習題 45
第3章 程序設(shè)計基礎(chǔ) 47
3.1 控制流 48
3.1.1 順序結(jié)構(gòu) 48
3.1.2 分支結(jié)構(gòu) 49
3.1.3 循環(huán)結(jié)構(gòu) 51
3.1.4 選擇結(jié)構(gòu) 53
3.2 函數(shù)設(shè)計 54
3.2.1 聲明、定義與調(diào)用 54
3.2.2 返回值 56
3.2.3 函數(shù)中的輸入/輸出 57
3.2.4 環(huán)境與范圍 59
3.2.5 遞歸函數(shù) 62
3.3 編程規(guī)范與性能優(yōu)化 65
3.3.1 使用腳本文件 65
3.3.2 編程規(guī)范 66
3.3.3 性能優(yōu)化 67
習題 68
第4章 類與對象 70
4.1 面向?qū)ο蟪绦蛟O(shè)計方法 71
4.1.1 結(jié)構(gòu)化程序設(shè)計方法回顧 71
4.1.2 對象與類的概念 71
4.1.3 面向?qū)ο蟪绦蛟O(shè)計的特點 72
4.1.4 R中類的體系 73
4.2 S3類 74
4.2.1 S3類的定義 74
4.2.2 創(chuàng)建S3類對象 74
4.2.3 S3類的泛型函數(shù) 76
4.2.4 定義S3類的方法 77
4.2.5 編寫S3類的泛型函數(shù) 78
4.3 S4類 79
4.3.1 S4類的定義 79
4.3.2 創(chuàng)建S4類對象 81
4.3.3 訪問插槽 82
4.3.4 S4類的泛型函數(shù) 83
4.3.5 定義S4類的方法 84
4.4 引用類 84
4.4.1 定義引用類 84
4.4.2 創(chuàng)建引用類對象 85
4.4.3 訪問與修改引用類對象的域 86
4.4.4 引用類的方法 88
4.5 繼承 90
4.5.1 S3類中的繼承 90
4.5.2 S4類中的繼承 91
4.5.3 引用類中的繼承 92
4.5.4 多重繼承 93
習題 94
第5章 數(shù)據(jù)結(jié)構(gòu)與數(shù)據(jù)處理 96
5.1 向量 97
5.1.1 創(chuàng)建向量 97
5.1.2 使用索引訪問向量元素 98
5.1.3 循環(huán)補齊 99
5.1.4 向量的比較 100
5.1.5 按條件提取元素 101
5.2 矩陣與數(shù)組 101
5.2.1 創(chuàng)建矩陣 102
5.2.2 線性代數(shù)運算 103
5.2.3 使用矩陣索引 105
5.2.4 apply函數(shù)族 106
5.2.5 多維數(shù)組 107
5.3 數(shù)據(jù)框 108
5.3.1 創(chuàng)建數(shù)據(jù)框 108
5.3.2 訪問數(shù)據(jù)框中的元素 109
5.3.3 使用SQL語句查詢數(shù)據(jù)框 110
5.4 因子 111
5.5 列表 112
5.6 數(shù)據(jù)導入與導出 113
5.6.1 數(shù)據(jù)文件的讀寫 113
5.6.2 rio包 116
5.6.3 數(shù)據(jù)編輯器 118
5.7 數(shù)據(jù)清洗 118
5.7.1 數(shù)據(jù)排序 119
5.7.2 數(shù)據(jù)清洗的一般方法 120
5.7.3 mice包 122
習題 127
第6章 繪圖與數(shù)據(jù)可視化 128
6.1 基本圖形與繪圖函數(shù) 129
6.1.1 基礎(chǔ)圖形的創(chuàng)建 129
6.1.2 新增繪圖窗口 131
6.1.3 導出圖形 131
6.2 調(diào)整繪圖參數(shù) 133
6.2.1 自定義特征 133
6.2.2 調(diào)整符號與線條 134
6.2.3 調(diào)整顏色 135
6.2.4 調(diào)整標簽與標題文本 137
6.3 其他自定義元素 140
6.3.1 坐標軸 140
6.3.2 次要刻度線 140
6.3.3 網(wǎng)格線 141
6.3.4 疊加繪圖 143
6.3.5 圖例 144
6.3.6 標注 145
6.4 描述性統(tǒng)計圖 146
6.4.1 柱狀圖 146
6.4.2 餅圖 149
6.4.3 直方圖 150
6.4.4 箱形圖 151
6.4.5 三維繪圖 152
6.5 動態(tài)圖形 155
6.5.1 保存為GIF格式 155
6.5.2 gganimate包 157
習題 160
第7章 統(tǒng)計與回歸分析 162
7.1 定性數(shù)據(jù)與定量數(shù)據(jù) 163
7.1.1 定性數(shù)據(jù) 163
7.1.2 定量數(shù)據(jù) 166
7.2 數(shù)據(jù)的數(shù)值度量 173
7.2.1 均值 173
7.2.2 中位值 173
7.2.3 四分位數(shù) 173
7.2.4 百分位數(shù) 174
7.2.5 變化范圍 174
7.2.6 四分位距 174
7.2.7 方差與標準差 175
7.2.8 協(xié)方差 175
7.2.9 相關(guān)系數(shù) 176
7.3 概率分布與假設(shè)檢驗 176
7.3.1 二項式分布 177
7.3.2 泊松分布 178
7.3.3 連續(xù)均勻分布 178
7.3.4 指數(shù)分布 179
7.3.5 正態(tài)分布 180
7.3.6 ? 2分布 181
7.3.7 學生t分布 182
7.3.8 統(tǒng)計假設(shè)檢驗 182
7.4 回歸分析 187
7.4.1 簡單線性回歸 187
7.4.2 多元線性回歸 192
7.4.3 邏輯回歸 196
習題 199
第8章 統(tǒng)計機器學習 201
8.1 特征空間與距離 203
8.1.1 距離的定義 203
8.1.2 KNN分類 207
8.2 聚類算法 209
8.2.1 k均值聚類 209
8.2.2 層次聚類 211
8.2.3 密度聚類 216
8.3 分類算法 219
8.3.1 決策樹 219
8.3.2 樸素貝葉斯方法 225
8.3.3 支持向量機 229
8.4 集成學習 233
8.4.1 基本方法 233
8.4.2 隨機森林 234
8.4.3 堆疊式集成學習 238
習題 245
第9章 神經(jīng)網(wǎng)絡(luò)與深度學習 247
9.1 基本原理 249
9.1.1 神經(jīng)元 249
9.1.2 多層感知器模型 250
9.1.3 反向傳播算法 251
9.2 感知器模型 252
9.2.1 neuralnet包 252
9.2.2 非線性回歸 254
9.2.3 分類 256
9.3 深度神經(jīng)網(wǎng)絡(luò) 261
9.3.1 深度神經(jīng)網(wǎng)絡(luò)的形式 261
9.3.2 MXNetR包 264
9.3.3 keras包 272
習題 280
附錄1 常用函數(shù)速查表 281
附錄2 《R語言基礎(chǔ)與數(shù)據(jù)科學
應用》配套實驗課程方案簡介 285
參考文獻 286