智能分析:ChatGPT+Excel+Python超強(qiáng)組合玩轉(zhuǎn)數(shù)據(jù)分析
定 價(jià):89 元
- 作者:童大謙
- 出版時(shí)間:2023/12/1
- ISBN:9787121466205
- 出 版 社:電子工業(yè)出版社
寫作本書的目的是希望讓不懂編程的讀者也能使用ChatGPT生成代碼,輕松實(shí)現(xiàn)Excel數(shù)據(jù)處理自動(dòng)化,讓讀者從零基礎(chǔ)成為高手;讓懂編程的讀者也能收獲良多,快速提升工作效率。書中用ChatGPT自動(dòng)生成代碼,實(shí)現(xiàn)了Excel數(shù)據(jù)處理自動(dòng)化的絕大部分內(nèi)容,包括數(shù)據(jù)導(dǎo)入和導(dǎo)出、數(shù)據(jù)整理、數(shù)據(jù)預(yù)處理、數(shù)據(jù)統(tǒng)計(jì)分析、數(shù)據(jù)可視化和與Excel工作表交互等。書中針對(duì)數(shù)據(jù)處理的每個(gè)問題都提供了示例,結(jié)合示例實(shí)踐了提示詞的編寫技巧,并對(duì)與表達(dá)、數(shù)據(jù)、輸出、效率和語言等相關(guān)的主題進(jìn)行了探討和總結(jié)。書中的代碼是使用pandas、xlwings和OpenPyXL編寫的,這也是目前通過編程方式處理Excel數(shù)據(jù)最優(yōu)的工具組合。本書適合任何對(duì)ChatGPT和Excel數(shù)據(jù)處理感興趣的讀者閱讀,包括職場(chǎng)辦公人員、數(shù)據(jù)分析人員、大學(xué)生、科研人員和程序員等。
童大謙,具有15年以上VB、VBA、.NET開發(fā)經(jīng)驗(yàn),開發(fā)了多個(gè)數(shù)學(xué)、數(shù)據(jù)分析與可視化方面的軟件,以及與科研院所合作開發(fā)了若干個(gè)軟件系統(tǒng)。對(duì)Python、MATLAB、SPSS、R等數(shù)據(jù)分析軟件非常熟悉,出版多本相關(guān)圖書。曾在高校執(zhí)教,CSDN高級(jí)講師,全網(wǎng)學(xué)員目前近30萬人。
第1章 概述1
1.1 Excel和Python數(shù)據(jù)處理簡(jiǎn)介1
1.1.1 Excel數(shù)據(jù)處理1
1.1.2 使用Python處理數(shù)據(jù)2
1.1.3 pandas、xlwings和OpenPyXL組合的優(yōu)勢(shì)2
1.1.4 DataFrame和Series3
1.1.5 Python及各種包的安裝4
1.1.6 Python IDLE編程環(huán)境5
1.2 ChatGPT及其操作基礎(chǔ)7
1.2.1 ChatGPT簡(jiǎn)介7
1.2.2 得到想要的答案:提示詞簡(jiǎn)介7
1.2.3 使用ChatGPT生成代碼9
1.2.4 面向問題重構(gòu)與提示詞模板11
1.2.5 使用ChatGPT進(jìn)行數(shù)據(jù)分析的主要思想和步驟小結(jié)11
1.3 提示詞的編寫技巧12
1.3.1 基本技巧12
1.3.2 數(shù)據(jù)相關(guān)12
1.3.3 表達(dá)相關(guān)13
1.3.4 輸出相關(guān)14
1.3.5 效率相關(guān)14
1.3.6 語言相關(guān)15
1.4 怎樣使用本書16
1.4.1 不同讀者怎樣使用本書16
1.4.2 在使用提示詞時(shí)可能遇到的問題及解決辦法16
第2章 使用ChatGPT+pandas實(shí)現(xiàn)數(shù)據(jù)導(dǎo)入和導(dǎo)出18
2.1 使用ChatGPT+pandas導(dǎo)入Excel文件中的數(shù)據(jù)18
2.1.1 導(dǎo)入Excel文件中的全部數(shù)據(jù)18
2.1.2 導(dǎo)入Excel文件中的部分?jǐn)?shù)據(jù)20
2.2 使用ChatGPT+pandas將數(shù)據(jù)寫入Excel文件中21
2.3 使用ChatGPT+pandas實(shí)現(xiàn)CSV文件中數(shù)據(jù)的導(dǎo)入和導(dǎo)出23
2.4 將數(shù)據(jù)保存到新工作簿的工作表中25
2.5 將數(shù)據(jù)保存到同一工作簿的新工作表中27
2.6 局部區(qū)域數(shù)據(jù)的導(dǎo)入和導(dǎo)出(與xlwings交互)31
2.7 局部區(qū)域數(shù)據(jù)的導(dǎo)入和導(dǎo)出(與OpenPyXL交互)33
第3章 使用ChatGPT+pandas實(shí)現(xiàn)單個(gè)文件數(shù)據(jù)的整理36
3.1 使用ChatGPT+pandas實(shí)現(xiàn)列操作36
3.1.1 直接添加一個(gè)新列36
3.1.2 利用已有列數(shù)據(jù)通過簡(jiǎn)單計(jì)算得到新列38
3.1.3 利用已有列數(shù)據(jù)通過轉(zhuǎn)換得到新列39
3.1.4 利用已有列數(shù)據(jù)通過統(tǒng)計(jì)得到新列42
3.1.5 根據(jù)簡(jiǎn)單條件得到新列45
3.1.6 根據(jù)多級(jí)條件得到新列46
3.1.7 根據(jù)多列數(shù)據(jù)組成的條件得到新列48
3.1.8 根據(jù)條件得到新列(mask方法)50
3.1.9 根據(jù)條件得到新列(where方法)51
3.1.10 插入列53
3.1.11 修改單個(gè)列的列名54
3.1.12 修改多個(gè)列的列名56
3.1.13 給所有列名添加前綴和后綴57
3.1.14 修改列數(shù)據(jù)的數(shù)據(jù)類型59
3.1.15 修改列數(shù)據(jù)61
3.1.16 修改列數(shù)據(jù)的格式63
3.1.17 將列中的字符串?dāng)?shù)據(jù)修改為數(shù)字65
3.1.18 根據(jù)條件修改數(shù)據(jù)67
3.1.19 刪除列68
3.2 使用ChatGPT+pandas實(shí)現(xiàn)行操作70
3.2.1 直接添加一個(gè)新行70
3.2.2 利用已有行數(shù)據(jù)通過計(jì)算得到新行72
3.2.3 插入行74
3.2.4 修改行名76
3.2.5 修改行數(shù)據(jù)78
3.2.6 刪除行79
3.3 使用ChatGPT+pandas實(shí)現(xiàn)值操作81
3.3.1 修改單個(gè)值81
3.3.2 修改局部區(qū)域中的值82
3.3.3 修改所有值84
3.4 使用ChatGPT+pandas實(shí)現(xiàn)數(shù)據(jù)查詢86
3.4.1 單條件查詢86
3.4.2 多條件查詢88
3.5 使用ChatGPT+pandas實(shí)現(xiàn)數(shù)據(jù)排序89
3.5.1 單條件排序89
3.5.2 多條件排序91
3.5.3 提取前3名數(shù)據(jù)92
3.6 使用ChatGPT+pandas實(shí)現(xiàn)數(shù)據(jù)篩選94
3.6.1 單條件篩選94
3.6.2 多條件篩選96
3.7 使用ChatGPT+pandas實(shí)現(xiàn)數(shù)據(jù)排名97
3.7.1 中國(guó)式排名97
3.7.2 美國(guó)式排名99
第4章 使用ChatGPT+pandas實(shí)現(xiàn)多個(gè)文件數(shù)據(jù)的整理102
4.1 使用ChatGPT+pandas拆分?jǐn)?shù)據(jù)102
4.1.1 簡(jiǎn)單拆分——垂直102
4.1.2 簡(jiǎn)單拆分——水平104
4.1.3 根據(jù)變量的值將數(shù)據(jù)拆分到不同工作簿中105
4.2 使用ChatGPT+pandas合并數(shù)據(jù)107
4.2.1 合并不同工作表中的數(shù)據(jù)107
4.2.2 合并不同工作簿中的數(shù)據(jù)112
4.3 使用ChatGPT+pandas拼接數(shù)據(jù)114
4.4 使用ChatGPT+pandas連接數(shù)據(jù)116
4.5 使用ChatGPT+pandas追加數(shù)據(jù)118
第5章 使用ChatGPT+pandas實(shí)現(xiàn)文本數(shù)據(jù)的整理120
5.1 使用ChatGPT+pandas提取子文本120
5.2 使用ChatGPT+pandas改變文本大小寫122
5.3 使用ChatGPT+pandas實(shí)現(xiàn)分列124
5.3.1 使用單一分隔符進(jìn)行分列124
5.3.2 使用多種分隔符進(jìn)行分列126
5.3.3 按照固定寬度進(jìn)行分列128
5.4 使用ChatGPT+pandas合并文本129
5.5 使用ChatGPT+pandas查找和替換子文本132
5.6 使用ChatGPT+pandas輸出文本的格式133
第6章 使用ChatGPT+pandas實(shí)現(xiàn)日期時(shí)間數(shù)據(jù)的整理136
6.1 使用ChatGPT+pandas實(shí)現(xiàn)時(shí)間點(diǎn)數(shù)據(jù)的整理136
6.1.1 從給定的日期時(shí)間中提取單位對(duì)應(yīng)的數(shù)字136
6.1.2 計(jì)算給定日期是星期幾138
6.2 使用ChatGPT+pandas實(shí)現(xiàn)時(shí)間段數(shù)據(jù)的整理140
6.2.1 計(jì)算兩個(gè)日期之間的間隔天數(shù)140
6.2.2 已知起始日期和間隔天數(shù)計(jì)算終止日期142
第7章 使用ChatGPT+pandas實(shí)現(xiàn)時(shí)間序列數(shù)據(jù)的整理144
7.1 時(shí)間序列數(shù)據(jù)144
7.1.1 創(chuàng)建時(shí)間序列數(shù)據(jù)144
7.1.2 從文件中導(dǎo)入時(shí)間序列數(shù)據(jù)146
7.2 使用ChatGPT+pandas實(shí)現(xiàn)時(shí)間序列數(shù)據(jù)的常見處理148
7.2.1 數(shù)據(jù)查詢148
7.2.2 數(shù)據(jù)篩選149
7.2.3 數(shù)據(jù)轉(zhuǎn)換150
7.2.4 數(shù)據(jù)匯總152
7.3 使用ChatGPT+pandas實(shí)現(xiàn)時(shí)間序列數(shù)據(jù)偏移153
7.3.1 日期時(shí)間偏移153
7.3.2 工作日偏移154
7.4 使用ChatGPT+pandas實(shí)現(xiàn)時(shí)間序列數(shù)據(jù)平滑156
7.5 使用ChatGPT+pandas實(shí)現(xiàn)時(shí)間序列數(shù)據(jù)重采樣158
第8章 使用ChatGPT+pandas實(shí)現(xiàn)分類數(shù)據(jù)的整理160
8.1 分類數(shù)據(jù)160
8.1.1 創(chuàng)建分類數(shù)據(jù)160
8.1.2 設(shè)置分類值162
8.1.3 對(duì)分類數(shù)據(jù)進(jìn)行排序163
8.2 使用ChatGPT+pandas處理分類數(shù)據(jù)164
8.2.1 查詢分類165
8.2.2 增加分類值166
8.2.3 修改分類值167
8.2.4 刪除分類值168
第9章 使用ChatGPT+pandas實(shí)現(xiàn)數(shù)據(jù)預(yù)處理170
9.1 使用ChatGPT+pandas處理重復(fù)數(shù)據(jù)170
9.1.1 整行數(shù)據(jù)重復(fù)的處理170
9.1.2 指定數(shù)據(jù)重復(fù)的處理172
9.2 使用ChatGPT+pandas處理缺失值173
9.2.1 發(fā)現(xiàn)缺失值174
9.2.2 刪除缺失值176
9.2.3 填充缺失值177
9.3 使用ChatGPT+pandas處理異常值179
9.3.1 發(fā)現(xiàn)異常值179
9.3.2 刪除異常值182
9.3.3 替換異常值184
9.4 使用ChatGPT+pandas實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換185
9.4.1 數(shù)據(jù)標(biāo)準(zhǔn)化186
9.4.2 數(shù)據(jù)歸一化187
?
第10章 使用ChatGPT+pandas實(shí)現(xiàn)統(tǒng)計(jì)分析190
10.1 使用ChatGPT+pandas實(shí)現(xiàn)描述性統(tǒng)計(jì)190
10.1.1 描述數(shù)據(jù)集中趨勢(shì)190
10.1.2 描述數(shù)據(jù)離中趨勢(shì)192
10.1.3 描述數(shù)據(jù)分布形狀194
10.2 使用ChatGPT+pandas實(shí)現(xiàn)分組統(tǒng)計(jì)195
10.2.1 分組描述性統(tǒng)計(jì)195
10.2.2 分組提取首次數(shù)據(jù)和末次數(shù)據(jù)197
10.2.3 多條件匯總199
10.2.4 分組按條件統(tǒng)計(jì)201
10.3 使用ChatGPT+pandas實(shí)現(xiàn)頻數(shù)分析202
10.4 使用ChatGPT+pandas實(shí)現(xiàn)數(shù)據(jù)透視表204
10.4.1 創(chuàng)建數(shù)據(jù)透視表204
10.4.2 設(shè)置數(shù)據(jù)透視表中值的輸出格式206
10.4.3 處理數(shù)據(jù)透視表中的缺失值208
10.4.4 設(shè)置數(shù)據(jù)透視表的聚合函數(shù)210
10.4.5 為數(shù)據(jù)透視表添加行匯總和列匯總213
10.4.6 設(shè)置數(shù)據(jù)透視表中數(shù)據(jù)的顯示方式215
10.4.7 對(duì)數(shù)據(jù)透視表中的數(shù)據(jù)進(jìn)行排序217
10.4.8 聚合函數(shù)為連接字符串219
第11章 使用ChatGPT實(shí)現(xiàn)與Excel工作表相關(guān)的設(shè)置223
11.1 使用ChatGPT+xlwings設(shè)置Excel工作表223
11.1.1 設(shè)置邊框223
11.1.2 設(shè)置背景色227
11.1.3 設(shè)置字體229
11.1.4 設(shè)置對(duì)齊方式231
11.1.5 單元格合并和取消合并233
11.2 使用ChatGPT+OpenPyXL設(shè)置Excel工作表235
11.2.1 設(shè)置邊框235
11.2.2 設(shè)置背景色238
11.2.3 設(shè)置字體239
11.2.4 設(shè)置對(duì)齊方式241
11.2.5 單元格合并和取消合并242
第12章 使用ChatGPT實(shí)現(xiàn)數(shù)據(jù)可視化244
12.1 使用ChatGPT+xlwings實(shí)現(xiàn)數(shù)據(jù)可視化244
12.1.1 條形圖244
12.1.2 餅圖247
12.2 使用ChatGPT+OpenPyXL實(shí)現(xiàn)數(shù)據(jù)可 視化249
12.2.1 條形圖249
12.2.2 餅圖251
12.3 使用ChatGPT+Matplotlib實(shí)現(xiàn)數(shù)據(jù)可視化252
12.3.1 條形圖253
12.3.2 餅圖254
第13章 Python語法基礎(chǔ)256
13.1 常量和變量256
13.1.1 常量256
13.1.2 變量及其聲明、賦值和刪除256
13.1.3 變量的數(shù)據(jù)類型257
13.2 數(shù)字257
13.2.1 整型數(shù)字257
13.2.2 浮點(diǎn)型數(shù)字258
13.3 字符串258
13.3.1 創(chuàng)建字符串258
13.3.2 索引和切片258
13.3.3 字符串的長(zhǎng)度和大小寫259
13.3.4 字符串的分割、連接和刪除259
13.4 列表260
13.4.1 創(chuàng)建列表260
13.4.2 添加列表元素261
13.4.3 索引和切片261
13.4.4 刪除列表元素262
13.5 元組 262
13.5.1 元組的創(chuàng)建和刪除263
13.5.2 索引和切片263
13.6 字典263
13.6.1 字典的創(chuàng)建263
13.6.2 字典元素的增、刪、改、查264
13.7 表達(dá)式265
13.7.1 算術(shù)運(yùn)算符265
13.7.2 關(guān)系運(yùn)算符265
13.7.3 邏輯運(yùn)算符266
13.8 流程控制266
13.8.1 判斷結(jié)構(gòu)266
13.8.2 循環(huán)結(jié)構(gòu)——for循環(huán)268
13.8.3 循環(huán)結(jié)構(gòu)——while循環(huán)268
13.9 函數(shù)269
13.9.1 內(nèi)部函數(shù)269
13.9.2 標(biāo)準(zhǔn)模塊函數(shù)和第三方模塊 函數(shù)269
13.9.3 自定義函數(shù)269
第14章 pandas基礎(chǔ)271
14.1 NumPy數(shù)組271