《Python數(shù)據(jù)科學實踐》是由狗熊會推出的一本利用Python介紹數(shù)據(jù)科學基本過程的著作。本書以Python語言為基礎,介紹利用Python進行數(shù)據(jù)科學研究與商業(yè)分析的全貌。其核心的設計理念是通過經(jīng)典的商業(yè)應用案例對數(shù)據(jù)爬取、數(shù)據(jù)存儲、數(shù)據(jù)清洗、數(shù)據(jù)建模的核心Python模塊做相應的介紹。
本書的特點是強調數(shù)據(jù)科學帶來的商業(yè)價值理念,所以其可以作為高等學校數(shù)據(jù)科學、大數(shù)據(jù)管理與應用、統(tǒng)計或相關專業(yè)的教材,也適合從事數(shù)據(jù)分析的工作者和愛好者閱讀。
本書是狗熊會政委團隊力作,特別適合數(shù)據(jù)科學領域的Python小白快速上手。
——王漢生(北京大學光華管理學院教授)
本書依托數(shù)據(jù)科學精品案例并結合大量場景和行業(yè)應用,讓Python不再枯燥,更加有用、有趣。
——李廣雨(狗熊會CEO)
仿照本書第8章的方法,我對本書書名進行了一次分詞:Python、數(shù)據(jù)科學、實踐。這三個關鍵詞各自都擁有海量的書籍資料,但用生動有趣的語言將三者結合起來,卻是一件極為難的事情。在閱讀本書的過程中,我驚奇地發(fā)現(xiàn)原來日常生活中形形色色的數(shù)據(jù)能與Python編程發(fā)生如此奇妙的“化學反應”,而本書正是通過這種方式讓讀者真切地感受到數(shù)據(jù)科學的魅力。
——邱怡軒(美國普渡大學統(tǒng)計學專業(yè)博士,卡內基梅隆大學博士后)
常象宇,西安交通大學管理學院副教授,西安交通大學應用數(shù)學系與加州大學伯克利分校統(tǒng)計系聯(lián)合培養(yǎng)博士,華盛頓大學西雅圖分校工業(yè)與系統(tǒng)工程系客座副教授,狗熊會聯(lián)合創(chuàng)始人,負責歐亞·狗熊會數(shù)據(jù)科學研究院的工作。對人工智能、統(tǒng)計機器學習、深度學習等有深入研究。
曾智億,畢業(yè)于西南交通大學金融學專業(yè),曾參與西南交通大學智慧營銷實驗室、平安證券、建設銀行、榮耀電商、三一重工等實習或駐場項目,對爬蟲數(shù)據(jù)采集、數(shù)據(jù)分析、自然語言處理等有深入研究。
李春艷,西安交通大學工業(yè)工程專業(yè)碩士在讀,曾參與狗熊會火鍋系列精品案例的編寫,以及參與新浪微博和百詞斬等項目實踐,對商務統(tǒng)計分析有深入研究。
程茜,西安歐亞學院金融學院教師。2015年進入狗熊會數(shù)據(jù)分析研究院,2017年開始承擔金融學院數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)教學工作,教授課程有編程和程序設計、回歸分析和數(shù)據(jù)挖掘等。
第1章 基于Python的數(shù)據(jù)科學環(huán)境搭建 1
1.1 Python是數(shù)據(jù)科學 “大勢所趨”2
1.2 Anaconda入門 ——工欲善其事,必先利其器 4
1.3 Jupyter Notebook入門 15
1.4 Markdown單元格的使用 25
1.5 Spyder入門 34
1.6 小結 38
第2章 Python基礎 39
2.1 “火鍋團購數(shù)據(jù)”簡介 40
2.2 讀寫數(shù)據(jù) 41
2.3 Python數(shù)據(jù)類型與結構 44
2.4 控制流、函數(shù)與模塊 58
2.5 面向對象編程的基本概念 66
2.6 Numpy簡介 72
2.7 小結 77
第3章 Python的數(shù)據(jù)處理模塊 78
3.1 初級篇 ——相遇 Pandas79
3.2 進階篇 ——相識 Pandas90
3.3 小結 99
第4章 Python的繪圖模塊 100
4.1 為什么需要數(shù)據(jù)可視化 101
4.2 初級篇 ——Matplotlib基礎 102
4.3 高級篇 ——Plotly基礎 121
4.4 小結 139
第5章 Python的統(tǒng)計建模模塊 141
5.1 Statsmodels簡介 142
5.2 數(shù)據(jù)接入 143
5.3 統(tǒng)計模型參數(shù)估計 145
5.4 統(tǒng)計假設檢驗 153
5.5 探索分析 159
5.6 小結 165
第6章 Python的機器學習模塊 166
6.1 機器學習的定義 167
6.2 使用 scikit -learn169
6.3 小結 182
第7章 Python的爬蟲模塊 183
7.1 爬蟲的定義 184
7.2 初級篇 ——單頁面靜態(tài)爬蟲 185
7.3 中級篇 ——多頁面靜態(tài)爬蟲 197
7.4 高級篇 ——爬蟲的偽裝 205
7.5 終級篇 ——動態(tài)爬蟲 212
7.6 爬蟲注意事項 217
7.7 小結 217
第8章 Python的文本分析模塊 218
8.1 準備 :理解文本分析流程 219
8.2 實戰(zhàn) 224
8.3 小結 232
第9章 Python的數(shù)據(jù)庫模塊 233
9.1 為什么需要數(shù)據(jù)庫 234
9.2 初級篇 ——SQLAlchemy的基本使用 235
9.3 高級篇 244
9.4 小結 248
第10章 精品案例——火鍋團購分析 249
10.1 背景介紹 250
10.2 數(shù)據(jù)描述 252
10.3 建模分析 264
10.4 小結 269