交互的Python 數(shù)據(jù)分析入門(mén)
定 價(jià):79 元
- 作者:王詩(shī)翔
- 出版時(shí)間:2020/7/1
- ISBN:9787115535702
- 出 版 社:人民郵電出版社
- 中圖法分類(lèi):TP311.561
- 頁(yè)碼:323
- 紙張:
- 版次:01
- 開(kāi)本:16開(kāi)
Python具有強(qiáng)大的應(yīng)用能力,以及便捷高效的數(shù)據(jù)分析和可視化擴(kuò)展包系統(tǒng)。本書(shū)重點(diǎn)講解Python數(shù)據(jù)分析的基礎(chǔ)知識(shí),使讀者通過(guò)Python理解數(shù)據(jù)分析的邏輯,并掌握基本的Python編程知識(shí)和分析實(shí)現(xiàn)方法。本書(shū)系統(tǒng)全面、循序漸進(jìn)地介紹了Python編程基礎(chǔ)、數(shù)據(jù)導(dǎo)入、數(shù)據(jù)分析和可視化內(nèi)容,包括條件判斷與循環(huán)控制、從Excel中導(dǎo)入數(shù)據(jù)、使用Pandas庫(kù)進(jìn)行數(shù)據(jù)的轉(zhuǎn)換和計(jì)算,以及使用Plotnine庫(kù)繪制ggplot風(fēng)格的圖形等。此外,本書(shū)還涉及Markdown、基本的統(tǒng)計(jì)理論和IPython魔術(shù)命令等內(nèi)容。
為新手準(zhǔn)備的Python數(shù)據(jù)分析入門(mén)教程!
(1)從簡(jiǎn)單的數(shù)據(jù)出發(fā),聚焦于思考、理解和掌握數(shù)據(jù)分析邏輯。
(2)采用IPython Shell展示代碼,簡(jiǎn)潔優(yōu)美,清晰易懂。
(3)涵蓋Python基礎(chǔ)知識(shí)、數(shù)據(jù)導(dǎo)入、數(shù)據(jù)分析和可視化基礎(chǔ)知識(shí)。
(4)隨學(xué)隨用,實(shí)例方案可以作為模板初步應(yīng)用到實(shí)際工作場(chǎng)景中。
(5)輔以Markdown的使用介紹,便于讀者記錄和分享知識(shí)。
王詩(shī)翔,本科畢業(yè)于電子科技大學(xué),獲工學(xué)學(xué)士學(xué)位,優(yōu)秀畢業(yè)論文獲得者。目前在上?萍即髮W(xué)深造,攻讀博士學(xué)位。主要工作是利用公開(kāi)發(fā)表的數(shù)據(jù)集和數(shù)據(jù)庫(kù)研究和分析癌癥基因組學(xué)數(shù)據(jù),挖掘有臨床應(yīng)用價(jià)值的生物標(biāo)志物。
第 1章 Python介紹及學(xué)習(xí)前的準(zhǔn)備 1
1.1 Python是什么 1
1.2 為什么要使用Python進(jìn)行數(shù)據(jù)分析 2
1.3 科學(xué)計(jì)算核心庫(kù)簡(jiǎn)介 2
1.4 搭建環(huán)境 3
1.4.1 線(xiàn)上平臺(tái) 3
1.4.2 本地機(jī)器環(huán)境下相關(guān)軟件的安裝 4
1.5 章末小結(jié) 12
第 2章 Python入門(mén)示例及基礎(chǔ)知識(shí) 13
2.1 Python解釋器與IPython 13
2.1.1 標(biāo)準(zhǔn)Python解釋器 13
2.1.2 IPython 14
2.2 Python入門(mén)示例 15
2.3 nteract軟件使用簡(jiǎn)介 16
2.4 算術(shù)運(yùn)算 17
2.4.1 簡(jiǎn)單數(shù)學(xué)運(yùn)算 17
2.4.2 代碼約定 18
2.4.3 計(jì)算身體質(zhì)量指數(shù) 19
2.5 變量簡(jiǎn)介 20
2.5.1 什么是變量 20
2.5.2 變量的命名 21
2.6 基本數(shù)據(jù)類(lèi)型 22
2.6.1 數(shù)字 22
2.6.2 字符串 23
2.6.3 布爾值 24
2.6.4 查看數(shù)據(jù)類(lèi)型 24
2.7 數(shù)據(jù)運(yùn)算 25
2.7.1 加號(hào)與黑箱子 25
2.7.2 類(lèi)型轉(zhuǎn)換 26
2.7.3 運(yùn)算符匯總 26
2.8 章末小結(jié) 27
第3章 基本數(shù)據(jù)結(jié)構(gòu) 28
3.1 列表 28
3.1.1 列表的創(chuàng)建 28
3.1.2 修改列表元素 30
3.1.3 遍歷列表 30
3.1.4 列表操作符 31
3.1.5 列表切片 32
3.1.6 列表方法、函數(shù)與操作 33
3.1.7 列表與字符串 37
3.1.8 列表對(duì)象與值 38
3.2 元組 39
3.2.1 元組的創(chuàng)建 40
3.2.2 元組操作 40
3.2.3 元組與列表的區(qū)別 42
3.3 字典 42
3.3.1 字典的創(chuàng)建與使用 42
3.3.2 字典操作 43
3.4 集合 45
3.4.1 集合的創(chuàng)建 45
3.4.2 集合操作 45
3.4.3 冰凍集 46
3.5 章末小結(jié) 47
第4章 控制流與文件操作 48
4.1 條件結(jié)構(gòu)if-else 48
4.1.1 簡(jiǎn)單if-else結(jié)構(gòu) 49
4.1.2 嵌套條件結(jié)構(gòu) 50
4.1.3 單行if-else 51
4.1.4 使用邏輯操作符 51
4.2 for語(yǔ)句 52
4.2.1 for語(yǔ)句塊 53
4.2.2 else語(yǔ)句塊 53
4.2.3 索引迭代 54
4.2.4 多列表迭代 55
4.2.5 列表推導(dǎo)式 55
4.2.6 條件列表推導(dǎo)式 57
4.2.7 字典迭代 58
4.3 while語(yǔ)句 59
4.4 continue、break與pass 61
4.4.1 continue 61
4.4.2 break 62
4.4.3 pass 64
4.5 文件操作 64
4.5.1 文件類(lèi)型 65
4.5.2 使用open()函數(shù)讀取文件 65
4.5.3 使用open()寫(xiě)文件 68
4.6 章末小結(jié) 68
第5章 函數(shù)與模塊 69
5.1 函數(shù) 69
5.1.1 為什么使用函數(shù) 69
5.1.2 函數(shù)的調(diào)用 70
5.1.3 函數(shù)的創(chuàng)建 71
5.1.4 函數(shù)作用域 72
5.1.5 遞歸函數(shù) 73
5.2 函數(shù)的參數(shù) 76
5.2.1 位置參數(shù) 76
5.2.2 關(guān)鍵字參數(shù) 77
5.2.3 可變參數(shù) 79
5.3 模塊 80
5.3.1 模塊與包結(jié)構(gòu) 80
5.3.2 模塊的創(chuàng)建 81
5.3.3 模塊的作用域 83
5.3.4 三方模塊的安裝 83
5.3.5 模塊的使用 85
5.4 章末小結(jié) 87
第6章 NumPy 88
6.1 NumPy簡(jiǎn)介與ndarray 88
6.1.1 NumPy簡(jiǎn)介 88
6.1.2 創(chuàng)建ndarray 89
6.2 數(shù)組操作 92
6.2.1 數(shù)組運(yùn)算 92
6.2.2 索引與切片 95
6.2.3 布爾型索引 99
6.2.4 數(shù)組轉(zhuǎn)置與軸轉(zhuǎn)換 101
6.3 數(shù)組函數(shù)與方法 103
6.3.1 通用函數(shù) 103
6.3.2 基本統(tǒng)計(jì) 105
6.3.3 排序與集合操作 107
6.3.4 線(xiàn)性代數(shù)操作 108
6.3.5 偽隨機(jī)數(shù)的生成 109
6.3.6 數(shù)組文件的輸入與導(dǎo)出 111
6.4 章末小結(jié) 112
第7章 Matplotlib 113
7.1 Matplotlib入門(mén) 113
7.1.1 Matplotlib庫(kù)簡(jiǎn)介 113
7.1.2 命名約定 114
7.1.3 如何展示圖形 114
7.1.4 保存圖形 116
7.1.5 兩種繪圖接口 117
7.2 基本圖形繪制 119
7.2.1 線(xiàn)圖 119
7.2.2 散點(diǎn)圖 132
7.2.3 條形圖 137
7.2.4 直方圖 142
7.2.5 餅圖 146
7.2.6 箱線(xiàn)圖 148
7.3 多圖與自定義 150
7.3.1 多圖 150
7.3.2 設(shè)置風(fēng)格 154
7.3.3 兩種接口映射 156
7.4 章末小結(jié) 157
第8章 Pandas入門(mén) 158
8.1 Pandas簡(jiǎn)介 158
8.2 Pandas的數(shù)據(jù)結(jié)構(gòu) 159
8.2.1 Series 159
8.2.2 DataFrame 161
8.3 Pandas對(duì)象基本操作 163
8.3.1 查看數(shù)據(jù) 164
8.3.2 轉(zhuǎn)置 165
8.3.3 重索引 165
8.3.4 刪除數(shù)據(jù) 168
8.3.5 重賦值 169
8.3.6 索引與過(guò)濾 169
8.3.7 算術(shù)運(yùn)算 174
8.3.8 函數(shù)應(yīng)用 176
8.3.9 排序 177
8.4 基本統(tǒng)計(jì)分析 179
8.5 章末小結(jié) 180
第9章 Markdown基礎(chǔ) 181
9.1 Markdown簡(jiǎn)介 181
9.2 Markdown語(yǔ)法 182
9.2.1 塊元素 182
9.2.2 內(nèi)聯(lián)元素 188
9.3 聯(lián)合Python與Markdown 191
9.3.1 代碼塊與文本塊 191
9.3.2 文檔范例 192
9.4 章末小結(jié) 195
第 10章 數(shù)據(jù)導(dǎo)入 196
10.1 CSV文件 196
10.1.1 使用字符串方法 197
10.1.2 使用csv標(biāo)準(zhǔn)模塊 197
10.1.3 使用Pandas庫(kù) 198
10.2 CSV變體 198
10.2.1 創(chuàng)建CSV導(dǎo)入函數(shù) 199
10.2.2 使用Pandas導(dǎo)入 200
10.2.3 導(dǎo)出CSV 202
10.3 Excel文件 203
10.3.1 檢查數(shù)據(jù) 203
10.3.2 準(zhǔn)備工作 204
10.3.3 使用Pandas讀寫(xiě)Excel 205
10.4 pickle文件 207
10.5 SAS與Stata文件 208
10.6 HDF5文件 209
10.7 MATLAB文件 210
10.8 json文件 211
10.9 YAML文件 213
10.10 網(wǎng)頁(yè)數(shù)據(jù) 215
10.11 數(shù)據(jù)庫(kù)數(shù)據(jù) 218
10.12 章末小結(jié) 220
第 11章 數(shù)據(jù)分析工具箱 221
11.1 輔助函數(shù)與工具 221
11.1.1 序列解包 221
11.1.2 斷言 222
11.1.3 常用的字符串方法 223
11.2 作用域與求值計(jì)算 223
11.2.1 作用域 223
11.2.2 使用exec()和eval()執(zhí)行計(jì)算 224
11.3 異常的捕獲和處理 225
11.3.1 捕獲異!225
11.3.2 產(chǎn)生異!227
11.4 函數(shù)式編程 227
11.4.1 高階函數(shù) 227
11.4.2 常用的高階函數(shù) 228
11.4.3 itertools模塊 229
11.5 生成器與裝飾器 230
11.5.1 生成器 230
11.5.2 利用生成器讀入大型數(shù)據(jù)集 232
11.5.3 裝飾器 232
11.6 正則表達(dá)式 233
11.7 章末小結(jié) 236
第 12章 Pandas進(jìn)階 237
12.1 深入Pandas數(shù)據(jù)結(jié)構(gòu) 237
12.1.1 回顧 237
12.1.2 分類(lèi)變量 239
12.1.3 時(shí)間序列 243
12.2 迭代與函數(shù)應(yīng)用 247
12.2.1 迭代 247
12.2.2 函數(shù)應(yīng)用 250
12.2.3 字符串函數(shù) 253
12.2.4 分組計(jì)算 256
12.3 數(shù)據(jù)清洗 256
12.3.1 缺失值處理 257
12.3.2 連接 259
12.3.3 級(jí)聯(lián) 262
12.4 Pandas可視化 265
12.4.1 條形圖 266
12.4.2 直方圖 268
12.4.3 箱線(xiàn)圖 269
12.4.4 面積圖 270
12.4.5 散點(diǎn)圖 271
12.4.6 餅圖 271
12.5 章末小結(jié) 272
第 13章 數(shù)據(jù)可視化進(jìn)階 273
13.1 Seaborn 273
13.1.1 成對(duì)圖 274
13.1.2 子集圖 279
13.1.3 回歸圖 280
13.1.4 核密度圖 281
13.1.5 條形圖 282
13.1.6 計(jì)數(shù)圖 284
13.1.7 點(diǎn)圖 284
13.1.8 箱線(xiàn)圖 285
13.1.9 小提琴圖 286
13.1.10 雙變量分布圖 286
13.2 Plotnine 288
13.2.1 ggplot 術(shù)語(yǔ) 290
13.2.2 ggplot 初探 290
13.2.3 常見(jiàn)的幾何函數(shù)和選項(xiàng) 298
13.3 Bokeh 299
13.3.1 Bokeh 基礎(chǔ) 299
13.3.2 圖形排列 303
13.4 章末小結(jié) 305
第 14章 統(tǒng)計(jì)分析 306
14.1 概括性度量 306
14.1.1 集中趨勢(shì)的度量 307
14.1.2 離散程度的度量 308
14.1.3 偏態(tài)與峰態(tài)的度量 309
14.2 統(tǒng)計(jì)分布 311
14.2.1 正態(tài)分布 311
14.2.2 二項(xiàng)分布 312
14.2.3 伯努利分布 314
14.2.4 指數(shù)分布 314
14.2.5 泊松分布 315
14.3 假設(shè)檢驗(yàn) 316
14.3.1 u 與 t 統(tǒng)計(jì)量 316
14.3.2 一個(gè) t 檢驗(yàn)實(shí)例 317
14.3.3 兩樣本 t 檢驗(yàn) 317
14.4 章末小結(jié) 318
第 15章 未言及的內(nèi)容 319
15.1 魔術(shù)命令 319
15.2 面向?qū)ο缶幊獭?21
15.3 章末小結(jié) 323
結(jié)語(yǔ):接下來(lái)學(xué)什么 324