誰說菜鳥不會數(shù)據(jù)分析(Python篇)
定 價:69 元
- 作者:方小敏
- 出版時間:2019/6/1
- ISBN:9787121364587
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP391.13;TP311.561
- 頁碼:232
- 紙張:
- 版次:01
- 開本:16開
本書從解決工作實際問題出發(fā),提煉總結(jié)工作中Python 常用的數(shù)據(jù)處理、數(shù)據(jù)分析實戰(zhàn)方法與技巧。本書力求通俗易懂地介紹相關(guān)知識,在不影響學(xué)習(xí)理解的前提下,盡可能地避免使用晦澀難懂的Python 編程、統(tǒng)計術(shù)語或模型公式。本書定位是帶領(lǐng)Python 數(shù)據(jù)分析初學(xué)者入門,并能解決學(xué)習(xí)、工作中大部分的問題或需求。入門后如還需要進(jìn)一步進(jìn)階學(xué)習(xí),可自行擴(kuò)展閱讀相關(guān)書籍或資料,學(xué)習(xí)是永無止境的,正所謂“師傅領(lǐng)進(jìn)門,修行在個人”。
方小敏,“數(shù)據(jù)分析實戰(zhàn)”公眾號主理人,資深機器學(xué)習(xí)工程師;曾服務(wù)于BAT等知名互聯(lián)網(wǎng)企業(yè),熟練掌握Python、R、Spark、Hive、TensorFlow等工具進(jìn)行機器學(xué)習(xí)。張文霖,新浪博客“小蚊子數(shù)據(jù)分析”博主,資深數(shù)據(jù)分析師,曾服務(wù)于國內(nèi)知名市場研究公司、中國移動等公司,具有多年移動互聯(lián)網(wǎng)數(shù)據(jù)分析經(jīng)驗,略懂Excel、PPT、SPSS、水晶易表等工具。
第1章 數(shù)據(jù)分析概況 /1
1.1 數(shù)據(jù)分析定義(What) /2
1.2 數(shù)據(jù)分析作用(Why) /4
1.3 數(shù)據(jù)分析步驟(How) /5
1.3.1 明確分析目的和思路 /6
1.3.2 數(shù)據(jù)收集 /7
1.3.3 數(shù)據(jù)處理 /9
1.3.4 數(shù)據(jù)分析 /9
1.3.5 數(shù)據(jù)展現(xiàn) /10
1.3.6 報告撰寫 /10
1.4 數(shù)據(jù)分析的三大誤區(qū) /12
1.5 常用的數(shù)據(jù)分析工具 /13
1.5.1 Excel /13
1.5.2 SPSS /14
1.5.3 R語言 /15
1.5.4 Python語言 /16
第2章 Python 概況 /17
2.1 Python簡介 /18
2.2 Python特點 /19
2.3 Python模塊 /20
2.3.1 函數(shù) /20
2.3.2 模塊 /24
2.4 Python使用場景 /27
2.5 Python 2與Python 3 /28
2.6 Python與數(shù)據(jù)科學(xué) /29
2.7 Anaconda簡介 /30
2.8 安裝Anaconda /31
2.8.1 下載Anaconda /31
2.8.2 安裝Anaconda /33
2.9 使用Anaconda /37
2.9.1 PyCharm 與Spyder /37
2.9.2 Anaconda 開始菜單 /38
2.9.3 Spyder 工作界面簡介 /39
2.9.4 項目管理 /40
2.9.5 代碼提示 /43
2.9.6 變量瀏覽 /44
2.9.7 圖形查看 /44
2.9.8 幫助文檔 /45
第3章 編程基礎(chǔ) /47
3.1 數(shù)據(jù)類型 /48
3.1.1 數(shù)值型 /48
3.1.2 字符型 /50
3.1.3 邏輯型 /56
3.2 賦值和變量 /57
3.2.1 賦值和變量 /57
3.2.2 變量命名規(guī)則 /58
3.3 數(shù)據(jù)結(jié)構(gòu) /59
3.3.1 列表 /59
3.3.2 字典 /63
3.3.3 序列 /66
3.3.4 數(shù)據(jù)框 /72
3.3.5 四種數(shù)據(jù)結(jié)構(gòu)的區(qū)別 /80
3.4 向量化運算 /81
3.5 for 循環(huán) /83
3.6 Python 編程注意事項 /87
第4章 數(shù)據(jù)處理 /90
4.1 數(shù)據(jù)導(dǎo)入與導(dǎo)出 /91
4.1.1 數(shù)據(jù)導(dǎo)入 /91
4.1.2 數(shù)據(jù)導(dǎo)出 /99
4.2 數(shù)據(jù)清洗 /100
4.2.1 數(shù)據(jù)排序 /101
4.2.2 重復(fù)數(shù)據(jù)處理 /102
4.2.3 缺失數(shù)據(jù)處理 /106
4.2.4 空格數(shù)據(jù)處理 /109
4.3 數(shù)據(jù)轉(zhuǎn)換 /110
4.3.1 數(shù)值轉(zhuǎn)字符 /110
4.3.2 字符轉(zhuǎn)數(shù)值 /112
4.3.3 字符轉(zhuǎn)時間 /113
4.4 數(shù)據(jù)抽取 /115
4.4.1 字段拆分 /116
4.4.2 記錄抽取 /121
4.4.3 隨機抽樣 /127
4.5 數(shù)據(jù)合并 /130
4.5.1 記錄合并 /130
4.5.2 字段合并 /133
4.5.3 字段匹配 /135
4.6 數(shù)據(jù)計算 /140
4.6.1 簡單計算 /140
4.6.2 時間計算 /141
4.6.3 數(shù)據(jù)標(biāo)準(zhǔn)化 /142
4.6.4 數(shù)據(jù)分組 /144
第5章 數(shù)據(jù)分析 /148
5.1 對比分析 /149
5.2 基本統(tǒng)計分析 /152
5.3 分組分析 /155
5.4 結(jié)構(gòu)分析 /158
5.5 分布分析 /159
5.6 交叉分析 /162
5.7 RFM 分析 /164
5.8 矩陣分析 /173
5.9 相關(guān)分析 /176
5.10 回歸分析 /178
5.10.1 回歸分析簡介 /178
5.10.2 簡單線性回歸分析 /180
5.10.3 多重線性回歸分析 /185
第6章 數(shù)據(jù)可視化 /189
6.1 數(shù)據(jù)可視化簡介 /190
6.1.1 什么是數(shù)據(jù)可視化 /190
6.1.2 數(shù)據(jù)可視化常用圖表 /190
6.1.3 通過關(guān)系選擇圖表 /191
6.2 散點圖 /192
6.3 矩陣圖 /203
6.4 折線圖 /210
6.5 餅圖 /215
6.6 柱形圖 /217
6.7 條形圖 /222