業(yè)務(wù)可視化分析: 從問題到圖形的Tableau方法(全彩)
定 價:139 元
- 作者:喜樂君
- 出版時間:2021/8/1
- ISBN:9787121417641
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP317.3
- 頁碼:356
- 紙張:
- 版次:01
- 開本:16開
對廣大的業(yè)務(wù)分析師而言,業(yè)務(wù)分析(或者稱為商業(yè)分析)應(yīng)該從業(yè)務(wù)和問題出發(fā),可視化是實現(xiàn)的方法,輔助決策是最終的目的。本書以業(yè)務(wù)分析為起點,介紹了“樣本范圍、問題描述和問題答案”的解析方法,以及聚合過程、連續(xù)與離散的字段分類,共同作為業(yè)務(wù)分析、可視化分析的理論基礎(chǔ)。本書借助敏捷BI工具Tableau,詳細介紹了7種基本問題類型(排序、時序、占比、文本、分布、相關(guān)性、地理)及其對應(yīng)的基本圖形,并介紹了基于標記、坐標軸、參考線、計算的增強分析方法。本書的目的是讓讀者從“三圖一表”的結(jié)果分析,經(jīng)由分布和相關(guān)性的特征分析,走向業(yè)務(wù)分析中的關(guān)鍵領(lǐng)域——多個問題的結(jié)構(gòu)化分析。
Tableau Zen Master,Tableau Desktop & Server CA Certification,Tableau培訓師和咨詢顧問;山東大學法學學士、教育學碩士,首屆研究生國家獎學金獲得者(2013);多次創(chuàng)業(yè)者、知識工作者,忠于分享,全心全意服務(wù)客戶。
第1 篇 從業(yè)務(wù)和問題出發(fā)的可視化體系
第1 章 我的故事:業(yè)務(wù)分析需要可視化 2
1.1 生活/工作面前,我們都一樣 . 2
1.2 帶著問題啟程 6
第2 章 奠基:業(yè)務(wù)可視化分析的價值 . 7
2.1 古往今來,分析的終極目的是輔助決策 7
2.2 決策:獲得信息、做出判斷 10
2.3 簡單可視化:幫助領(lǐng)導更快地獲得信息 11
2.4 交互可視化:可視化是假設(shè)驗證的工具 14
2.5 高級可視化:分布、相關(guān)性分析與結(jié)構(gòu)化分析 16
2.6 Tableau:敏捷BI 助力決策分析 18
第3 章 地平線:問題分析的方法與數(shù)據(jù)基礎(chǔ) . 20
3.1 問題的結(jié)構(gòu)化分析與“第一字段分類” 21
3.2 分析的動態(tài)過程:聚合是本質(zhì) 23
3.2.1 Excel 數(shù)據(jù)透視表:拖曳即聚合 23
3.2.2 SQL 的聚合查詢:窗口式查詢 24
3.2.3 Tableau VizQL 可視化聚合查詢 . 26
3.3 行級別明細數(shù)據(jù)是聚合的起點,是分析的原料 27
3.3.1 數(shù)據(jù)表中包含的數(shù)據(jù)常識:數(shù)據(jù)類型與分類 . 27
3.3.2 理解數(shù)據(jù)表行級別的業(yè)務(wù)邏輯及其唯一性 . 34
3.3.3 聚合度是以數(shù)據(jù)表行級別為基準點的、衡量問題層次高低的尺度 . 37
3.4 直接聚合:基于行級別的直接聚合類型 40
3.4.1 描述規(guī)模:總和、平均值、計數(shù) . 40
3.4.2 描述數(shù)據(jù)的波動程度:方差和標準差 . 41
3.4.3 關(guān)注個體、走向分布:百分位函數(shù)及最大值、最小值、中位數(shù) . 44
3.5 從數(shù)據(jù)到問題的關(guān)鍵:“第三字段分類” 47
3.5.1 第三字段分類:行級別計算與聚合計算 . 47
3.5.2 理解聚合計算中的典型代表:“比值聚合” . 49
3.6 間接聚合:基于視圖聚合的二次聚合 50
3.6.1 “復雜問題”的兩個方向特征 . 50
3.6.2 基于直接聚合的二次聚合:大數(shù)據(jù)的OLAP 分析 51
3.7 從問題分析視角看數(shù)據(jù)分析的發(fā)展階段 57
3.7.1 小數(shù)據(jù)時代的多角度明細展示 . 57
3.7.2 數(shù)據(jù)統(tǒng)計時代的聚合匯總 57
3.7.3 大數(shù)據(jù)時代的結(jié)構(gòu)化分析 58
第4 章 啟程:可視化構(gòu)建方法與擴展路徑 60
4.1 從聚合到圖形:第二字段分類與圖形構(gòu)成要素 60
4.1.1 可視化坐標空間:坐標系與坐標軸 . 62
4.1.2 “第二字段分類”與坐標軸. 63
4.1.3 可視化視覺模式與圖形類型. 70
4.1.4 可視化的意義描述 74
4.2 7 種主要的問題類型及其主要圖形 . 75
4.2.1 傳統(tǒng)三大圖及其局限性 76
4.2.2 文本表:側(cè)重度量指標的高密度展現(xiàn) . 78
4.2.3 分布分析的三大典型圖形 78
4.2.4 相關(guān)性:散點圖與雙軸折線圖 . 82
4.2.5 地理位置可視化 83
4.3 從基本問題類型到復雜圖形的延伸方法綜述 85
4.3.1 從問題分析到圖形增強分析的完整路徑 . 85
4.3.2 基于行列的空間擴展:分區(qū)與矩陣 . 86
4.3.3 基于標記的增強分析:分層繪制方法 . 89
4.3.4 基于坐標軸的擴展:雙軸、同步與多軸的合并處理 . 96
4.3.5 基于參考線的擴展:增加視圖聚合的二次聚合 . 97
第2 篇 問題的7 種基本類型與可視化方法
第5 章 從問題到圖形的可視化邏輯 . 102
5.1 從問題到圖形的啟蒙與進化 102
5.1.1 《用圖表說話》中的三步走方法 . 102
5.1.2 “問題的字段解析方法”與基本問題類型 . 103
5.2 可視化圖形分類方法與可視化過程 105
5.2.1 FT 可視化詞典 . 105
5.2.2 Data Points 中的數(shù)據(jù)可視化過程 107
5.2.3 Abela 的“圖形推薦”邏輯 108
5.2.4 面向IT 的Echarts 分類與Tableau . 109
第6 章 排序與對比(部分與部分) . 111
6.1 基本條形圖與多個離散維度條形圖 111
6.1.1 并排條形圖(side-by-side bar):離散字段并排構(gòu)成分區(qū) . 112
6.1.2 條形圖矩陣:離散字段交叉構(gòu)成矩陣 . 113
6.1.3 矩陣實例:日歷矩陣條形圖. 114
6.1.4 堆疊條形圖:你喜歡喝什么咖啡 . 116
6.1.5 比例條形圖:把堆疊條形圖轉(zhuǎn)化為占比分析 . 118
6.2 包含多個度量坐標軸的條形圖 119
6.2.1 字段重要性遞減的多種布局方式 . 119
6.2.2 考慮字段關(guān)系的雙軸布局方式 . 120
6.2.3 并排條形圖:多個絕對值度量字段的對比 . 122
6.2.4 重疊條形圖:多個絕對值度量字段的包含關(guān)系 . 124
6.3 字段類型和屬性對可視化的影響 125
6.3.1 字段類型和屬性對顏色的影響 . 125
6.3.2 “絕對值”與比值:字段屬性對標記選擇的影響 . 127
6.4 坐標軸的調(diào)整與組合 128
6.4.1 默認零點:除非必要,謹慎更改 . 129
6.4.2 坐標軸“倒序”:有些數(shù)據(jù)越大越差 . 129
6.4.3 絕對值刻度與百分位刻度 130
6.4.4 從“等距坐標軸”到“不等距坐標軸” . 131
6.4.5 棒棒糖圖:虛擬雙軸 132
6.5 以條形圖為底色的進階與高級圖形 133
6.5.1 靶心圖:在排序基礎(chǔ)上增加對比關(guān)系 . 133
6.5.2 “進度條”:展示單一對比關(guān)系的條形圖變種 . 135
6.5.3 結(jié)構(gòu)化分析實例:條形圖的“高級化” . 138
第7 章 時間序列與序列相關(guān)性 140
7.1 時間序列的構(gòu)成 140
7.2 折線圖的多種延伸形式 141
7.2.1 時間的層次與連續(xù)/離散屬性 . 141
7.2.2 并排折線圖和矩陣折線圖 143
7.2.4 多維度折線圖、堆疊面積圖、百分比堆疊面積圖 . 144
7.2.3 包含時序的柱狀圖與結(jié)構(gòu)化分析 . 147
7.3 包含多個度量的時間序列 149
7.3.1 時間序列中的雙軸與柱狀圖. 149
7.3.2 雙軸的改變:柱狀圖與折線圖的結(jié)合 . 150
7.3.3 基于公共基準的多軸合并 151
7.4 時間序列與條形圖的結(jié)合:甘特圖及其變種 152
7.4.1 標準甘特圖:沿著連續(xù)日期延伸 . 152
7.4.2 股票蠟燭圖:兩個甘特圖的重疊 . 154
7.4.3 跨度圖:“偽裝的甘特圖樣式” . 155
7.4.4 階梯圖:以階梯方式表達“跨度” . 157
7.5 日期的高級轉(zhuǎn)化:絕對日期與相對日期 159
7.5.1 原理:何為絕對和相對時間軸 . 159
7.5.2 “公共基準”案例:產(chǎn)品在不同時間段的業(yè)績對比 . 160
7.5.3 “公共基準”案例:客戶復購分析 . 163
7.6 時序分析中度量的處理與高級圖形 166
7.6.1 聚合度量的累計匯總處理 166
7.6.2 絕對值與同比雙軸圖:同比或環(huán)比的比率 . 167
7.6.3 排序圖:絕對值轉(zhuǎn)化為相對排序 . 168
7.6.4 高級案例:地平線圖——借助高級計算處理度量 . 170
7.7 坡面圖:次序字段的前后變化 174
7.8 在趨勢中增加對比關(guān)系:雙折線增加陰影區(qū) 175
第8 章 占比(部分與總體占比) . 179
8.1 占比問題類型與餅圖 179
8.2 樹狀圖:占比與層次關(guān)系 181
8.3 初級:餅圖作為輔助圖形查看結(jié)構(gòu) 184
8.4 中級:結(jié)合計算自定義分組及其占比 186
8.4.1 行級別分組:使用組和行級別計算自定義分組 . 186
8.4.2 特定層次的分組:使用集和高級計算動態(tài)分組 . 187
8.5 中級:使用多種方法展示類別的占比 189
8.5.1 方法一:使用“隱藏”功能分析單一類別占比 . 189
8.5.2 方法二:使用“行級別計算”分析單一類別占比 . 190
8.5.3 方法三:使用“篩選和高級計算”分析單一類別占比 . 191
8.6 高級圖形:環(huán)形圖、旭日圖、南丁格爾玫瑰圖 192
8.6.1 環(huán)形圖:最簡單的雙層次結(jié)構(gòu) . 192
8.6.2 旭日圖:雙層占比 193
8.6.3 南丁格爾玫瑰圖及個人建議. 194
第9 章 文本表及其延伸形式 196
9.1 文本表的關(guān)鍵場景:最高聚合與“總分結(jié)構(gòu)” 196
9.2 交叉表的優(yōu)勢與推薦場景 198
9.3 讓交叉表更實用:增加可視化修飾的方法 200
9.3.1 典型交叉表的樣式與說明 200
9.3.2 簡易法:基于度量名稱的顏色修飾 . 201
9.3.3 簡易法:基于單一度量的突出顯示表 . 203
9.3.4 高級法:基于坐標軸和標記的“文本自定義” . 204
9.3.5 高級法:使用自定義字段邏輯控制形狀或其他 . 208
9.4 讓簡單豐富起來:善用工具提示與儀表板互動 209
9.5 文字云與氣泡圖:不常使用和不推薦的圖形 211
9.6 總結(jié):用好“三圖一表”,展開業(yè)務(wù)面紗 212
第10 章 大數(shù)據(jù)的關(guān)鍵:超越個體、走向分布 . 214
10.1 從個體分析到分布分析 214
10.2 直方圖:分布分析第一圖 215
10.2.1 簡單直方圖:使用數(shù)據(jù)桶(bin)在數(shù)據(jù)表行級別創(chuàng)建直方圖 216
10.2.2 高級直方圖:使用高級聚合計算和數(shù)據(jù)桶生成直方圖區(qū)間 . 217
10.2.3 基于RFM 模型的客戶分布分析 219
10.3 箱線圖:離散分布與異常發(fā)現(xiàn) 221
10.4 帕累托圖:特殊的頭部集中分布 222
10.4.1 橫軸百分位處理:將離散維度序列轉(zhuǎn)化為連續(xù)百分位坐標軸 . 224
10.4.2 縱軸累計百分比處理:連續(xù)度量的百分位轉(zhuǎn)化 . 224
10.4.3 空間分類處理:帕累托圖的顏色分類和互動篩選 . 225
10.5 自定義分布分析:參考線與參考分布模型 227
10.5.1 使用多條“百分比”參考線構(gòu)建區(qū)間 . 228
10.5.2 自定義百分位分布區(qū)間 229
10.5.3 分位數(shù)分布區(qū)間 230
10.5.4 標準差分布與“質(zhì)量控制圖”和“六西格瑪區(qū)間” . 230
第11 章 超越經(jīng)驗,走向探索:廣義相關(guān)性分析 . 234
11.1 散點圖與參考分區(qū):波士頓矩陣 234
11.2 中級:散點圖矩陣和“散點圖松散化” 237
11.3 高級:用皮爾遜系數(shù)生成相關(guān)值矩陣 241
11.4 層次關(guān)系:多個維度字段之間的結(jié)構(gòu)關(guān)系. 244
11.5 次序字段的流向分析:漏斗圖和;鶊D 247
11.5.1 漏斗圖(上):基于次序字段的變化 . 247
11.5.2 漏斗圖(下):基于度量值的變化 . 250
11.5.3 ;鶊D:多階段的流向變化(簡要) . 252
11.6 瀑布圖:多個數(shù)值的依賴關(guān)系 253
11.7 雷達圖:多角度的綜合關(guān)系 256
11.8 相關(guān)性或因果關(guān)系:基于空間的流行病學案例 . 259
第12 章 特殊的分布:地理空間分析 . 264
12.1 地理空間和地理圖層 264
12.2 點圖與熱力圖:地理空間分布 265
12.3 符號地圖與填充地圖 267
12.4 自定義地理空間與空間矩陣 270
12.4.1 為數(shù)據(jù)點增加緩沖區(qū) 270
12.4.2 自定義地理空間:“化學元素周期表” . 271
12.4.3 高級案例:使用表計算自定義空間矩陣 . 272
12.5 路徑地圖:兩種數(shù)據(jù)結(jié)構(gòu),兩種繪制方式 274
12.6 地理空間圖形的說明 275
第3 篇 超越:從可視化分析走向結(jié)構(gòu)化洞察
第13 章 樣本控制與假設(shè)驗證:交互 . 279
13.1 在Excel、SQL、Tableau 中構(gòu)建分析樣本 . 279
13.1.1 Excel 與SQL 中的靜態(tài)篩選 . 279
13.1.2 在Tableau 中創(chuàng)建篩選的基本方法 281
13.2 樣本控制的形式與歸類 282
13.2.1 快速篩選器的常見形式與優(yōu)先級 . 282
13.2.2 關(guān)聯(lián)篩選器和共用篩選器 285
13.3 基于中間變量的高級樣本控制 286
13.4 樣本控制的高級形式:指定層次的條件篩選 289
13.4.1 指定層次條件篩選的3 種方式 . 289
13.4.2 購物籃關(guān)聯(lián)分析的樣本解讀——量化篩選條件 . 290
13.5 性能:邏輯計算位置對篩選的影響 293
13.5.1 篩選的本質(zhì)與篩選的標準位置 . 293
13.5.2 在聚合過程中間接篩選的“非標準操作”及其代價 . 295
13.5.3 不同篩選方法的高級分類與適用場景 . 296
第14 章 從表象到本質(zhì):結(jié)構(gòu)化分析是業(yè)務(wù)可視化分析的靈魂 . 299
14.1 結(jié)構(gòu)化分析是通往業(yè)務(wù)探索的必由之路 299
14.1.1 結(jié)構(gòu)化分析是業(yè)務(wù)復雜性的要求 . 300
14.1.2 結(jié)構(gòu)化分析的基本形式 301
14.2 可視化分析中常見的層次及其組合關(guān)系 303
14.2.1 行級別層次、問題層次及聚合度 . 303
14.2.2 結(jié)構(gòu)化分析的基本類型 305
14.3 結(jié)構(gòu)化分析的幾種典型場景和案例 305
14.3.1 交易的利潤結(jié)構(gòu)分析:主視圖引入行級別層次的聚合 . 305
14.3.2 客戶的利潤結(jié)構(gòu)分析:主視圖引入更低層次的聚合 . 307
14.3.3 客戶矩陣分析:當前視圖層次引入獨立層次的聚合 . 309
14.3.4 環(huán)形圖:當前視圖層次引入更高聚合度層次的聚合 . 310
14.4 結(jié)構(gòu)化分析的高級形式:嵌套LOD 的多遍聚合 313
14.4.1 客戶購買力:使用嵌套LOD 完成多遍聚合 . 313
14.5 通用的層次分析方法 316
14.5.1 結(jié)構(gòu)化分析與“問題結(jié)構(gòu)” . 316
14.5.2 層次分析的4 個步驟 317
14.6 和結(jié)構(gòu)化分析相反的“努力”方法 318
14.6.1 “形式大于內(nèi)容”的圖形 318
14.6.2 缺乏代表性和意義的指標 321
14.6.3 缺乏互動性的圖表 321
14.6.4 不符合直覺的設(shè)計 322
第15 章 歸來:成為優(yōu)秀的業(yè)務(wù)分析師的個人建議 . 323
15.1 好奇、探索和持續(xù)學習的欲望,是前進的源泉 323
15.2 學習理解原理,方能舉一反三、事半功倍 324
15.3 深入理解業(yè)務(wù),方能立于不敗之地 325
15.4 分析要從明細開始,過度整理會遠離真相 326
15.6 循序漸進,不要好高騖遠 328
后記&參考資料 . 330