趣玩Python:自動(dòng)化辦公真簡(jiǎn)單(雙色+視頻版)
定 價(jià):89 元
- 作者:關(guān)東升
- 出版時(shí)間:2021/11/1
- ISBN:9787121422973
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP311.561
- 頁(yè)碼:280
- 紙張:
- 版次:01
- 開(kāi)本:16開(kāi)
本書(shū)以數(shù)據(jù)收集→數(shù)據(jù)清洗→數(shù)據(jù)分析→數(shù)據(jù)可視化→根據(jù)數(shù)據(jù)可視化結(jié)果(即圖表)做決策為脈絡(luò),介紹Python在實(shí)際工作場(chǎng)景中的應(yīng)用,側(cè)重于用Python解決工作中的數(shù)據(jù)處理問(wèn)題,并通過(guò)實(shí)戰(zhàn)形式講解如何用Python實(shí)現(xiàn)數(shù)據(jù)收集、數(shù)據(jù)清洗、數(shù)據(jù)分析及可視化等工作。本書(shū)還詳細(xì)講解了Python自動(dòng)化辦公方面的內(nèi)容,包括:Excel自動(dòng)化、Word自動(dòng)化、PPT自動(dòng)化、PDF文件處理、圖形圖像處理和RPA(機(jī)器人流程自動(dòng)化),并介紹了GUI技術(shù)和應(yīng)用程序打包相關(guān)知識(shí)。本書(shū)秉承有趣、有料、好玩、好用的理念,特意設(shè)計(jì)了兩個(gè)人物角色,通過(guò)這兩個(gè)人物角色的輕松對(duì)話、搞笑形象及夸張動(dòng)作,把復(fù)雜的技術(shù)問(wèn)題講解得深入淺出,非常適合廣大讀者閱讀。
關(guān)東升一個(gè)在IT領(lǐng)域摸爬滾打20多年的老程序員、軟件架構(gòu)師、高級(jí)培訓(xùn)講師、IT作家。熟悉Java、Kotlin、Python、iOS、Android、游戲開(kāi)發(fā)、數(shù)據(jù)庫(kù)開(kāi)發(fā)與設(shè)計(jì)、軟件架構(gòu)設(shè)計(jì)等多種IT技術(shù)。參與設(shè)計(jì)和開(kāi)發(fā)北京市公交一卡通百億級(jí)大型項(xiàng)目,開(kāi)發(fā)國(guó)家農(nóng)產(chǎn)品追溯系統(tǒng)、金融系統(tǒng)微博等移動(dòng)客戶端項(xiàng)目。曾為中國(guó)移動(dòng)、中國(guó)聯(lián)通、南方航空、中國(guó)石油、工商銀行、平安銀行和天津港務(wù)局等企事業(yè)單位授課。著有《Java從小白到大!贰禟otlin從小白到大牛》《Python從小白到大!贰犊绰(huà)學(xué)Python》等40多部計(jì)算機(jī)書(shū)籍。
第1章 千里之行,始于足下——Python基礎(chǔ) 1
1.1 Python解釋器 2
1.2 PyCharm開(kāi)發(fā)工具 3
1.2.1 下載和安裝 4
1.2.2 設(shè)置PyCharm工具 5
1.3 第一個(gè)Python程序 7
1.3.1 創(chuàng)建項(xiàng)目 7
1.3.2 創(chuàng)建Python代碼文件 9
1.3.3 編寫(xiě)代碼 10
1.3.4 運(yùn)行程序 11
1.4 文本編輯工具+Python解釋器實(shí)現(xiàn) 11
1.4.1 編寫(xiě)代碼 11
1.4.2 運(yùn)行程序 12
1.4.3 代碼解釋 13
1.5 Python中的基礎(chǔ)語(yǔ)法 14
1.5.1 標(biāo)識(shí)符 14
1.5.2 關(guān)鍵字 15
1.5.3 變量聲明 15
1.5.4 語(yǔ)句 15
1.5.5 代碼塊 16
1.5.6 模塊 16
1.6 數(shù)據(jù)類型與運(yùn)算符 17
1.6.1 數(shù)據(jù)類型 17
1.6.2 運(yùn)算符 19
1.7 控制語(yǔ)句 22
1.7.1 分支語(yǔ)句 22
1.7.2 循環(huán)語(yǔ)句 24
1.7.3 跳轉(zhuǎn)語(yǔ)句 27
1.8 序列 28
1.8.1 索引操作 28
1.8.2 序列切片 29
1.8.3 可變序列——列表 30
1.8.4 不可變序列——元組 31
1.8.5 列表推導(dǎo)式 32
1.9 集合 33
1.9.1 創(chuàng)建集合 33
1.9.2 集合推導(dǎo)式 34
1.10 字典 34
1.10.1 創(chuàng)建字典 35
1.10.2 字典推導(dǎo)式 36
1.11 字符串 36
1.11.1 字符串的表示方式 36
1.11.2 將字符串格式化 38
1.11.3 正則表達(dá)式 39
1.12 函數(shù) 40
1.12.1 匿名函數(shù)與lambda表達(dá)式 41
1.12.2 數(shù)據(jù)處理中的兩個(gè)常用函數(shù) 42
1.13 文件操作與目錄管理 44
1.13.1 文件操作 44
1.13.2 文本文件讀寫(xiě) 46
1.13.3 二進(jìn)制文件讀寫(xiě) 47
1.13.4 os模塊 48
1.13.5 os.path模塊 49
1.14 異常處理機(jī)制 51
1.14.1 捕獲異常 51
1.14.2 釋放資源 52
第2章 讓“蟲(chóng)子”幫你收集數(shù)據(jù)——網(wǎng)絡(luò)爬蟲(chóng)技術(shù) 56
2.1 數(shù)據(jù)從哪里來(lái)——收集數(shù)據(jù) 56
2.2 收集股票的歷史交易數(shù)據(jù) 58
2.3 自動(dòng)爬取數(shù)據(jù) 60
2.4 從繁雜的HTML代碼中解析數(shù)據(jù)——使用BeautifulSoup庫(kù) 62
2.5 爬不到數(shù)據(jù)怎么辦——使用Selenium工具 68
2.5.1 Ajax動(dòng)態(tài)數(shù)據(jù) 70
2.5.2 使用Selenium爬取數(shù)據(jù) 70
2.6 有驗(yàn)證碼怎么辦 74
2.6.1 驗(yàn)證碼概述 74
2.6.2 驗(yàn)證碼識(shí)別 74
2.6.3 安裝OCR引擎Tesseract 75
2.6.4 安裝pytesseract 76
2.6.5 安裝Pillow庫(kù) 77
2.6.6 安裝OpenCV 78
2.6.7 驗(yàn)證碼識(shí)別前的圖像預(yù)處理 78
2.6.8 驗(yàn)證碼識(shí)別過(guò)程 79
2.7 實(shí)戰(zhàn)訓(xùn)練:電網(wǎng)考試平臺(tái)的驗(yàn)證碼識(shí)別 81
2.7.1 配置自己的Web服務(wù)器 81
2.7.2 啟動(dòng)Web服務(wù)器 82
2.7.3 使用Selenium模擬登錄過(guò)程 82
2.8 提高“蟲(chóng)子”的工作效率 86
第3章 洗一洗“臟數(shù)據(jù)”——數(shù)據(jù)清洗 89
3.1 數(shù)據(jù)清洗那些事兒 89
3.2 訪問(wèn)Excel文件庫(kù)——xlwings庫(kù) 90
3.2.1 xlwings庫(kù)中對(duì)象的層次關(guān)系 91
3.2.2 打開(kāi)Excel文件并讀取其單元格數(shù)據(jù) 91
3.2.3 如何獲取表格區(qū)域 93
3.2.4 獲取表格行數(shù)和列數(shù) 96
3.2.5 轉(zhuǎn)置表格 97
3.2.6 單元格默認(rèn)的數(shù)據(jù)類型 98
3.2.7 寫(xiě)入單元格數(shù)據(jù) 99
3.2.8 設(shè)置單元格樣式 102
3.2.9 這樣遍歷單元格太麻煩了 104
3.2.10 刪除列 105
3.2.11 刪除行 106
3.2.12 調(diào)用VBA宏批量刪除重復(fù)的數(shù)據(jù) 107
3.2.13 找出格式不統(tǒng)一的數(shù)據(jù) 110
3.3 填充缺失的值 111
3.3.1 固定值填充 112
3.3.2 平均值填充 113
第4章 把“寶貝”收好了——數(shù)據(jù)存儲(chǔ) 115
4.1 讀取CSV文件 116
4.2 將爬取的數(shù)據(jù)保存為CSV文件 117
4.3 SQLite數(shù)據(jù)庫(kù) 118
4.4 使用GUI管理工具管理SQLite數(shù)據(jù)庫(kù) 119
4.5 sqlite3模塊API 121
4.6 將爬取的數(shù)據(jù)保存到SQLite數(shù)據(jù)庫(kù) 122
4.7 在數(shù)據(jù)庫(kù)中查詢數(shù)據(jù) 124
第5章 找出隱藏在數(shù)據(jù)中的“黃金屋”——數(shù)據(jù)分析 126
5.1 數(shù)據(jù)分析那些事兒 126
5.2 使用Excel進(jìn)行數(shù)據(jù)分析 127
5.2.1 老板讓我找出北京周邊的房?jī)r(jià)信息 127
5.2.2 找出北京周邊房屋面積大于120m2的小區(qū) 129
5.2.3 找出東城區(qū)和西城區(qū)房屋面積大于120m2的小區(qū) 130
5.2.4 找出有北京最高房?jī)r(jià)的小區(qū) 131
5.3 讓“熊貓”幫我們分析數(shù)據(jù)——使用pandas庫(kù) 132
5.3.1 Series數(shù)據(jù)結(jié)構(gòu) 132
5.3.2 DataFrame數(shù)據(jù)結(jié)構(gòu) 134
5.4 使用pandas庫(kù)讀取Excel文件 136
5.4.1 舉個(gè)“栗子”:從Excel文件中讀取全國(guó)總?cè)丝跀?shù)據(jù) 137
5.4.2 跳過(guò)頭部行和尾部行 138
5.4.3 當(dāng)“熊貓”遇到CSV文件 139
5.4.4 當(dāng)“熊貓”遇到SQLite 141
5.4.5 使用pandas庫(kù)寫(xiě)入數(shù)據(jù)到CSV文件 143
5.4.6 使用pandas庫(kù)寫(xiě)入數(shù)據(jù)到Excel文件 144
5.4.7 使用pandas庫(kù)找出各城區(qū)有最高房?jī)r(jià)的小區(qū) 145
5.4.8 按照各城區(qū)的平均房?jī)r(jià)排序 146
5.5 數(shù)據(jù)分析與數(shù)據(jù)透視表的故事 148
第6章 一圖抵萬(wàn)言——數(shù)據(jù)可視化 151
6.1 數(shù)據(jù)可視化那些事兒 151
6.2 使用Matplotlib庫(kù)繪制圖表 152
6.2.1 安裝Matplotlib庫(kù) 152
6.2.2 圖表的基本構(gòu)成要素 152
6.2.3 繪制城區(qū)最高房?jī)r(jià)柱狀圖 153
6.2.4 北京房?jī)r(jià)區(qū)間占比餅狀圖 155
6.2.5 北京各城區(qū)房?jī)r(jià)分布散點(diǎn)圖 157
6.2.6 貴州茅臺(tái)股票的歷史成交量折線圖 158
6.2.7 繪制股票的歷史OHLC圖 159
6.3 調(diào)用Excel繪制圖表 161
6.3.1 繪制三維折線圖 161
6.3.2 繪制三維簇狀條形圖 163
第7章 辦公離不開(kāi)的“字”處理——操作Word文件 165
7.1 訪問(wèn)Word文件庫(kù)——python-docx庫(kù) 165
7.1.1 python-docx庫(kù)中的那些對(duì)象 166
7.1.2 打開(kāi)Word文件并讀取內(nèi)容 167
7.1.3 寫(xiě)入數(shù)據(jù)到Word文件 169
7.1.4 在Word文件中添加表格 171
7.1.5 設(shè)置文件樣式 173
7.1.6 修改文件樣式 175
7.2 解決在工作中使用Word時(shí)遇到的問(wèn)題 176
7.2.1 批量轉(zhuǎn)換.doc文件為.docx文件 176
7.2.2 采用模板批量生成證書(shū)文件 178
7.2.3 批量統(tǒng)計(jì)文件頁(yè)數(shù)和字?jǐn)?shù) 181
7.2.4 批量轉(zhuǎn)換Word文件為PDF文件 183
第8章 演示利器PPT——操作PPT文檔 186
8.1 訪問(wèn)PowerPoint文檔庫(kù)——python-pptx庫(kù) 186
8.1.1 PPT中的基本概念 187
8.1.2 python-pptx庫(kù)中的那些對(duì)象 188
8.1.3 創(chuàng)建PPT文檔 189
8.1.4 添加更多的幻燈片 190
8.1.5 在PPT幻燈片中添加表格 192
8.1.6 在PPT幻燈片中添加圖表 195
8.2 解決在工作中使用PPT時(shí)遇到的實(shí)際問(wèn)題 197
8.2.1 批量轉(zhuǎn)換.ppt文檔為.pptx文檔 197
8.2.2 批量轉(zhuǎn)換PPT文檔為PDF文件 199
第9章 操作跨平臺(tái)的文件格式——PDF文件 201
9.1 PDF文件的優(yōu)勢(shì) 201
9.2 操作PDF文件庫(kù)——PyPDF2庫(kù) 202
9.2.1 PyPDF2庫(kù)中的對(duì)象 202
9.2.2 讀取PDF文件的內(nèi)容 202
9.2.3 拆分PDF文件 204
9.2.4 用更多的方法拆分PDF文件 205
9.2.5 合并PDF文件 207
9.2.6 對(duì)PDF文件批量添加水印 208
9.2.7 批量加密PDF文件 211
9.2.8 批量解密PDF文件 213
9.2.9 暴力破解PDF文件的密碼 214
9.3 解析PDF文件庫(kù)——pdfplumber庫(kù) 216
9.3.1 提取PDF文件中的文本信息 216
9.3.2 提取PDF文件中的表格信息 217
第10章 有圖有真相——批量處理圖像文件 218
10.1 圖像處理庫(kù)——Pillow庫(kù) 218
10.1.1 讀取圖像文件的信息 219
10.1.2 我想要png文件——批量轉(zhuǎn)換圖像格式 221
10.1.3 批量設(shè)置圖像的大小 222
10.2 旋轉(zhuǎn)圖像 225
10.3 添加水印 226
10.4 生成各種各樣的“碼” 228
10.4.1 批量生成二維碼 228
10.4.2 批量生成條碼 231
第11章 坐在旁邊喝點(diǎn)茶——RPA(機(jī)器人流程自動(dòng)化) 234
11.1 自動(dòng)化Windows GUI庫(kù)——pywinauto庫(kù) 234
11.1.1 如何使用pywinauto庫(kù) 235
11.1.2 在記事本中自動(dòng)輸入信息 240
11.2 微信客服機(jī)器人 242
第12章 給你的程序穿上“馬甲”——使用GUI庫(kù) 247
12.1 為什么選擇Tkinter 247
12.1.1 編寫(xiě)第一個(gè)Tkinter程序 248
12.1.2 為按鈕添加事件處理功能 249
12.2 布局管理 250
12.2.1 pack布局的更多屬性 251
12.2.2 grid布局 252
12.3 工作中常用的控件 253
12.3.1 使用messagebox 253
12.3.2 進(jìn)度條 256
12.3.3 文件選擇器 259
第13章 將Python程序打包成.exe文件 263
13.1 安裝auto-py-to-exe工具 264
13.2 使用auto-py-to-exe工具 265
13.3 打包成單個(gè)文件還是目錄 268
13.4 包含資源文件怎么辦 268