定 價:59 元
叢書名:面向新工科高等院校大數(shù)據(jù)專業(yè)系列教材
- 作者:呂云翔姚澤良李伊琳等編著
- 出版時間:2022/4/1
- ISBN:9787111701187
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:TP311.561
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
《Python數(shù)據(jù)分析與可視化》介紹了數(shù)據(jù)分析的各主要流程,并引入了6個完整的數(shù)據(jù)分析案例。《Python數(shù)據(jù)分析與可視化》從理論和案例兩個角度對數(shù)據(jù)分析與可視化以及Python的工具進行了介紹,采用理論分析和編程實踐相結合的形式,按照數(shù)據(jù)分析的基本步驟介紹了數(shù)據(jù)分析的理論知識,并對相應的Python庫進行了詳細介紹,讓讀者在了解數(shù)據(jù)分析的基本理論知識的同時能夠快速上手實現(xiàn)數(shù)據(jù)分析的程序。
《Python數(shù)據(jù)分析與可視化》適合Python語言初學者、數(shù)據(jù)分析從業(yè)人士以及高等院校計算機、軟件工程、大數(shù)據(jù)、人工智能等相關專業(yè)的師生使用。
1)信息技術新工科產學研聯(lián)盟數(shù)據(jù)科學與大數(shù)據(jù)工作委員會推薦教材。
2)按照數(shù)據(jù)預處理、分析與知識發(fā)現(xiàn)、可視化三個步驟,講解數(shù)據(jù)分析涉及的理論。
3)引入了6個完整的數(shù)據(jù)分析案例,從理論和案例兩個角度,介紹數(shù)據(jù)分析與可視化和Python的工具。
4)隨書配備電子課件、習題答案、教學大綱、代碼和數(shù)據(jù)集、案例視頻講解等教學資源。
本書是面向初學者的數(shù)據(jù)分析與可視化的入門教程。按照數(shù)據(jù)分析的數(shù)據(jù)預處理、分析與知識發(fā)現(xiàn)和可視化3個主要步驟,逐步對數(shù)據(jù)分析涉及的理論進行講解,并對實現(xiàn)這些步驟所用到的Python庫進行了詳細的介紹。通過理論與實踐相結合的講解方式,讀者能夠在了解數(shù)據(jù)分析基礎知識的同時快速上手實現(xiàn)一些簡單的數(shù)據(jù)分析程序。
全書分14章,通過閱讀第1~8章的內容,讀者可以對數(shù)據(jù)分析的各主要流程具有一定的認識,但這些知識可能還未能形成一個完整的體系。因此在第9~14章引入了6個完整的數(shù)據(jù)分析案例,以幫助讀者建立知識點之間的聯(lián)系,形成對數(shù)據(jù)分析整個知識體系的清晰認知。建議讀者在閱讀實戰(zhàn)章節(jié)時,可以跟隨介紹自己動手嘗試一下,一定會發(fā)現(xiàn)數(shù)據(jù)分析的魅力所在。
作為一本數(shù)據(jù)分析的入門書籍,本書著重對基礎知識的介紹,因此對前沿的內容涉及不多,這些內容留待讀者在更進一步的學習中深入探索。對于Python語言的知識,本書僅對與數(shù)據(jù)分析和可視化相關的庫進行了介紹,如果讀者對Python語言本身感興趣,還可以參考Python語言工具書及官方文檔等詳細了解Python的語法和底層原理等。另外,本書所有數(shù)據(jù)分析的程序實現(xiàn)均是在單機的情況下進行的,并沒有對如何使用Python進行分布式數(shù)據(jù)分析的介紹,感興趣的讀者可以去了解一下Python分布式數(shù)據(jù)分析的相關庫,如Pyspark等。
本書的作者為呂云翔、姚澤良、李伊琳、王肇一、許麗華、韓延剛、謝謹蔓、洪振東、姜嶠、孔子喬,曾洪立參與了部分內容的編寫并進行了素材整理及配套資源制作等。
由于編者水平和能力有限,書中難免有疏漏之處,懇請廣大讀者給予批評指正,也希望各位能將實踐過程中的經驗和心得與我們交流。
前言
第1章數(shù)據(jù)分析是什么
1.1海量數(shù)據(jù)蘊藏的知識
1.2數(shù)據(jù)分析與數(shù)據(jù)挖掘的關系
1.3機器學習概述
1.4機器學習與數(shù)據(jù)分析的關系
1.5數(shù)據(jù)分析的基本步驟
1.6Python和數(shù)據(jù)分析
習題
第2章Python語言基礎
2.1Python發(fā)展史
2.2Python及Pandas、scikit-
learn、Matplotlib的
安裝
2.2.1Windows環(huán)境下Python的
安裝
2.2.2Ubuntu和Mac環(huán)境下
Python的安裝
2.2.3集成開發(fā)環(huán)境
2.2.4使用pip安裝Pandas、
scikit-learn和Matplotlib
2.2.5使用第三方科學計算發(fā)行版
Python進行快速安裝
2.3Pycharm
2.4Python基礎知識
2.4.1Python編碼規(guī)范
2.4.2模塊化的系統(tǒng)
2.5Python基礎語法
2.5.1數(shù)據(jù)類型
2.5.2基本計算
2.5.3控制語句
2.6重要的Python庫
2.6.1Pandas
2.6.2scikit-learn
2.6.3Matplotlib
2.6.4其他
2.7Jupyter
習題
第3章數(shù)據(jù)預處理
3.1了解數(shù)據(jù)
3.2數(shù)據(jù)質量
3.2.1完整性
3.2.2一致性
3.2.3準確性
3.2.4及時性
3.3數(shù)據(jù)清洗
3.4特征工程
3.4.1特征選擇
3.4.2特征構建
3.4.3特征提取
習題
第4章NumPy數(shù)據(jù)分析基礎
工具
4.1多維數(shù)組對象:ndarray
4.1.1ndarray的創(chuàng)建
4.1.2ndarray的數(shù)據(jù)類型
4.2ndarray的索引、切片和
迭代
4.3ndarray的shape操作
4.4ndarray的基礎操作
4.5習題
第5章Pandas處理結構化
數(shù)據(jù)
5.1基本數(shù)據(jù)結構
5.1.1Series
5.1.2DataFrame
5.2基于Pandas的Index對象的
訪問操作
5.2.1Pandas的Index對象
5.2.2索引的不同訪問方式
5.3數(shù)學統(tǒng)計和計算工具
5.3.1統(tǒng)計函數(shù):協(xié)方差、相關
系數(shù)、排序
5.3.2窗口函數(shù)
5.4數(shù)學聚合和分組運算
5.4.1agg函數(shù)的聚合操作
5.4.2transform函數(shù)的轉換
操作
5.4.3apply函數(shù)實現(xiàn)一般的
操作
習題
第6章數(shù)據(jù)分析與知識發(fā)現(xiàn)的一些
常用方法
6.1分類分析
6.1.1邏輯回歸
6.1.2線性判別分析
6.1.3支持向量機
6.1.4決策樹
6.1.5K鄰近
6.1.6樸素貝葉斯
6.2關聯(lián)分析
6.2.1基本概念
6.2.2典型算法
6.3聚類分析
6.3.1K均值算法
6.3.2DBSCAN算法
6.4回歸分析
6.4.1線性回歸分析
6.4.2支持向量回歸
6.4.3K鄰近回歸
習題
第7章Pandas與scikit-learn實
現(xiàn)數(shù)據(jù)的分析
7.1分類方法
7.1.1Logistic回歸
7.1.2支持向量機
7.1.3近鄰算法
7.1.4決策樹
7.1.5隨機梯度下降
7.1.6高斯過程分類
7.1.7神經網(wǎng)絡分類(多層感
知器)
7.1.8樸素貝葉斯
7.2回歸方法
7.2.1小二乘法
7.2.2嶺回歸
7.2.3Lasso
7.2.4貝葉斯嶺回歸
7.2.5決策樹回歸
7.2.6高斯過程回歸
7.2.7近鄰回歸
7.3聚類方法
7.3.1K-means算法
7.3.2AffinityPropagation算法
7.3.3Mean-shift算法
7.3.4SpectralClustering算法
7.3.5HierarchicalClustering
算法
7.3.6DBSCAN算法
7.3.7Birch算法
習題
第8章Matplotlib交互式圖表
繪制
8.1基本布局對象
8.2圖表樣式的修改以及裝飾項
接口
8.3基礎圖表繪制
8.3.1直方圖
8.3.2散點圖
8.3.3餅圖
8.3.4柱狀圖
8.3.5折線圖
8.3.6表格
8.3.7不同坐標系下的圖像
8.4matplot3D
8.5Matplotlib與Jupyter結合
習題
第9章案例:新生信息分析與
可視化
9.1使用Pandas對數(shù)據(jù)預
處理
9.2使用Matplotlib庫畫圖
9.3使用Pandas進行繪圖
第10章案例:用戶流失預警
10.1讀入數(shù)據(jù)
10.2數(shù)據(jù)預處理
10.3五折交叉驗證
10.4引入3種模型
10.5調整prob閾值輸出精確
評估
第11章案例:美國加利福尼亞房價
預測的數(shù)據(jù)分析
11.1數(shù)據(jù)分析常用的Python
工具庫
11.1.1Pandas
11.1.2NumPy
11.1.3Matplotlib
11.1.4Sklearn
11.2數(shù)據(jù)的讀入和初步分析
11.2.1數(shù)據(jù)讀入
11.2.2分割測試集與訓練集
11.2.3數(shù)據(jù)的初步分析
11.3數(shù)據(jù)的預處理
11.3.1拆分數(shù)據(jù)
11.3.2空白值的填充
11.3.3數(shù)據(jù)的標準化
11.3.4數(shù)據(jù)的流程化處理
11.4模型的構建
11.4.1查看不同模型的表現(xiàn)
11.4.2選擇效果好的模型進行
預測
第12章案例:基于上下文感知的
多模態(tài)交通推薦
12.1題目理解
12.1.1題目背景
12.1.2數(shù)據(jù)說明
12.1.3評測指標
12.1.4輸出格式
12.2解決方案
12.2.1工具包導入
12.2.2特征工程
第13章案例:機器人路徑走
迷宮
13.1關鍵技術
13.1.1馬爾科夫決策過程
13.1.2Bellman方程
13.2程序設計步驟
13.2.1初始化迷宮地圖
13.2.2計算不同位置
路徑
第14章案例:基于Python Elasticsearch
實現(xiàn)搜索附近小區(qū)房價
14.1程序設計
14.2準備數(shù)據(jù)
14.3安裝以及使用
Elasticsearch
14.4實現(xiàn)附近房價搜索
的搜索引擎
參考文獻