為什么要學習數據分析
以往在增量時代,每天都有新的領域、新的市場被開發(fā)。尤其是在互聯網、電商等領域的紅利期,似乎只要做好單點的突破就能獲得市場。在那個時代,業(yè)務運營主要依 靠經驗和直覺驅動。例如跨境電商領域初期,憑借世界工廠平臺的優(yōu)勢,國內廠家只需 基于經驗選品即可大賣。
但是隨著規(guī)則的成熟,更多玩家的進入,市場從藍海變?yōu)榧t海,進入存量期,僅靠 經驗驅動的增長模式不再有效。還是拿跨境電商舉例:由于賣家劇增,海外市場飽和, 跨境電商進入存量運營時代,已經不存在絕對的藍海市場,每個細分領域都有許多競爭對手。
此時,要求商家從粗放運營轉為精細化運營,由經驗驅動轉為數據驅動,而這個轉變中最重要的一點就是數據,也就是用數據分析報告決定市場是否值得投入,用數據選 品,用數據做經營分析,用數據管理庫存。
從這個角度來看,數據分析已然成為了大數據時代各個崗位的通用能力。因此,為 了保持競爭力,任何人都有必要用數據分析能力武裝自己:利用數據思維分析問題,依 靠數據支撐決策。
如何開始 數據分析師勝任力模型
由于數據分析是一門綜合學科,相關的知識點繁雜不一,許多初學者會有一種 不知如何開始的迷茫感。
大家都知道《西游記》中孫悟空會 72 般變化,《列仙傳》中給出的神仙也是 72 位, 傳說中黃帝戰(zhàn)蚩尤也是經過了 72 戰(zhàn)才勝利?梢娙藗儗72這個數字的認知和接受 程度較深。
因此,有多年數據分析工作經驗的筆者團隊匯總并撰寫了 72 個數據分析核心問題, 沉淀出了完整的數據分析能力知識體系,幫助讀者全面認識數據分析。
下圖是數據分析師勝任力模型,包括底層認知、業(yè)務場景、能力三板斧三個部分: 首先,底層認知是對數據的基本認知,強調數據思維的應用。 其次,業(yè)務場景指的是只有對業(yè)務有足夠的理解,才能開展分析工作,而這里
包括了用戶、產品、場景三個方面。 最后,才是硬實力對應的能力三板斧,包括工具技術、項目能力、思維方法。
底層認知、業(yè)務場景、能力三板斧共同鑄造了完整的數據分析能力,相輔相成,而 本書則是圍繞著它們展開介紹。
本書內容介紹
1. 底層認知
本書第 1 章主要講解數據分析中的底層認知。 在建立數據分析思維之前,應該先在底層認知達成共識。什么是認知?是對事物底層邏輯的了解,是對世界萬物的判斷。認知的本質就是做決定,也就是說,為了幫助判 斷數據分析中每個決策的有效性(選擇什么指標、分析方法?接下來做什么?等等), 需要先建立底層認知。
本書第 1 章通過 11 個問題對數據分析的底層認知進行詳細的討論。這一步,我們 需要對數據分析的概念進行討論:數據分析是什么?數據分析的價值點在哪里?
(1)數據分析是什么?
大家在求職過程中會發(fā)現,同樣是數據分析師崗位,但是面試的內容千差萬別,有 考查機器學習、統(tǒng)計學等專業(yè)能力的,也有考查市場 / 行業(yè)分析的,還有考查產品分析 的。此時就有讀者問,這些真的是數據分析該做的嗎?
我們從字面上拆解,數據分析 = 數據 分析,進一步拆解: 數據能力 = 統(tǒng)計學 機器學習 建模能力 工具使用 …… 分析能力 = 經營分析 用戶分析 產品分析 ……
這就是認知上的偏差:當一些讀者認為數據分析就是用 Excel 做表、用 Python 寫腳 本、用機器學習建模時,其實求職市場對數據分析師的要求更為完整。
既然說數據分析 = 數據 分析,那分析的本質是什么?當我們在談論分析時, 一般會談論以下幾點:
●發(fā)生了什么追溯過去,了解真相。
●為什么發(fā)生洞察事物發(fā)生的本質,尋找根源。
●未來可能發(fā)生什么掌握事物發(fā)展的規(guī)律,預測未來。
●我們該怎么做基于已經知道的發(fā)生了什么 為什么會發(fā)生未來可能發(fā)生什么的分析,確定可以采取的措施。
分析的本質,即面臨各種問題時,能通過數據找到問題,準確地定位問題,準確地
找到問題產生的原因,為下一步的改進找到機會點,也就是所謂的數據驅動。
在數據分析相關崗位求職的過程中,讀者會發(fā)現有許多不同的職位名稱,這些職位
有什么區(qū)別聯系?詳細內容可參閱 第6問:數據分析領域主要的崗位有哪些?
回過頭來看,數據分析到底是什么?筆者團隊認為,數據分析是一個利用數據能力
做分析的過程:發(fā)現問題,分析原因,然后給出落地建議。這還是一個解構的過程:
從整體到局部,從一般到特殊,從面到線到點,不斷下鉆剖析,找到具體可落地的點。
同時,也是從業(yè)務到數據,再回到業(yè)務的過程:起點是業(yè)務需求,需要專業(yè)分析師轉換為數據問題,最終的分析結論需要回到業(yè)務場景中落地。
在這個過程中,數據分析師需要借助指標,甚至是多指標編制的指標體系進行業(yè)務洞察。本書第3、4問將圍繞指標展開論述。
(2)數據分析的價值點在哪里?
社群中,經常會看到關于數據分析師價值的討論:數據分析師天花板很低。還有一些勸退數據分析的文章。這些脫離場景、只講問題不講解決方案的內容除了徒增焦慮外,別無用處。
為了更好地了解數據分析的定位,有必要對其起源進行討論,只有了解為什么市場會產生數據分析師崗位的需求,才能清楚這個崗位在業(yè)務運營中的作用定位。(詳細內容可參閱第2問:數據分析是怎么來的?)
在業(yè)務運營中,定位是重要的起點,理解數據分析價值在企業(yè)如何落地,能幫助讀者解疑答惑。(詳細內容可參閱第9問:數據分析的產出價值是什么?)
2.業(yè)務場景
前面,我們討論過數據分析是一個從業(yè)務需求出發(fā)再回歸業(yè)務的過程。從這個角度做定義的目的是強調業(yè)務場景的重要性:脫離業(yè)務場景的分析往往無法落地。
根據業(yè)務經驗,筆者團隊總結了一套便于理解的模型:業(yè)務場景 = 用戶 產品 場景。
也就是說,要理解業(yè)務,就要了解用戶,熟悉產品,明確分析所處的場景。它們決定了分析的目標、處理邏輯以及落地建議。
此部分在第60~63問有更詳細的介紹。
3.能力三板斧
對數據分析有了底層認知、了解業(yè)務場景后,就需要有看得見、摸得著的招式來行動:通過思維方法、工具技術和項目能力這三板斧組成不同的招式以應對多變的問題。
經?吹接腥苏f數據分析如做飯,如果是這樣的話,工具技術就是鏟子、鐵鍋、勺子等器皿,思維方法就是切配、烹飪、打荷等手法,項目能力則是最后的裝盤上菜。
(1)思維方法。
本書第2章主要講解數據分析中的思維方法。
很多人學做飯,可能是因為在抖音或B站看到某個美食視頻,然后就開始按照視頻展示的步驟備料烹飪。這個過程,也就是數據分析中學習思維方法的過程。數據分析要先有思維方法,才能談得上分析。
剛開始學做飯時,通常先學基礎的煎、炒、炸、烤、煮、蒸、燜、拌等烹飪方式。
這些基礎的能力在數據分析中就是統(tǒng)計學、相關分析、歸因分析等通用分析思維。
正如美食有八大菜系,分別滿足不同地域人群的口味,數據分析在不同場景下,也有不同的分析招式來滿足不同的業(yè)務需求:
●用戶分析:同期群分析、漏斗分析、RFM用戶分層模型等;
●產品分析:競品分析、帕累托分析等;
●商業(yè)分析: PEST分析、SWOT分析等;
●……
(2)工具技術。
本書第3章主要講解數據分析中的工具技術。
習得了做飯的方法后,就可以選擇幾件趁手的器皿,來提高烹飪效率。之所以不是先選擇器皿再研究做飯流程,是因為工具始終是工具,完成同一個目標或許有多種工具可以實現,再不濟用原始的土灶也能燒飯。對于部分復雜的烹飪需求,則需要選擇特定
的器皿才能完成。
對于初學者而言,建議學習高性價比的分析工具,如Excel、SQL、Python、PowerBI等。
(3)項目能力。
本書第4章主要講解數據分析中的項目落地。
菜做好后一定要及時出鍋、裝盤、上菜,項目能力強調的是數據分析項目在業(yè)務側的落地。理論的分析方法如何在業(yè)務場景中落地賦能,如何體現數據價值,這是很多企業(yè)數據團隊在討論的課題。
首先,理解并刻意練習落地思維對數據分析價值的體現大有裨益(第54~57問)。
其次,學習實際場景中數據分析如何落地驅動業(yè)務的案例,能為實操提供參考(第64~67問)。
數據分析項目價值落地的最后一公里是報告呈現,學會用數據講故事,橫向跨部門溝通、向上匯報都依賴結構化思維,報告呈現(第68~70問)會有詳細的討論。
小結
本書定位于數據分析的知識框架,更多是橫向地補充知識范圍,故因篇幅所限,單個知識的縱向深度無法窮盡,但本書已經針對各知識點的核心及高頻問題進行回答。在閱讀的過程中,倘若對某個知識點有深入學習、探索實踐應用的進一步需求,讀者可以通過知乎等平臺補充學習,在本書的基礎上,針對核心方法論,對技術工具做延伸的閱讀學習。
此外,筆者團隊準備了一份與本書搭配使用的小冊子,請掃碼獲取。本書勘誤、知識加餐等內容也會放在小冊子中。
可以關注筆者團隊的微信公眾號:木木自由、數據分析星球、餅干哥哥數據分析,這三個公眾號專注于數據分析思維、方法、工具、項目能力及案例的分享。
作者
第 1 章 底層認知
1.1 基礎認知
第 1 問:數據分析怎么學?本書學習指南 / 2
第 2 問:數據分析是怎么來的?數據分析極簡發(fā)展史 / 4
第 3 問:什么是數據指標? / 6
第 4 問:常見的指標有哪些? / 9
第 5 問:對于數據分析領域,統(tǒng)計學要學到什么程度? / 10
第 6 問:數據分析領域主要的崗位有哪些? / 13
1.2 底層邏輯 / 17
第 7 問:如何建立完整有效的數據指標體系? / 17
第 8 問:數據指標體系如何應用?數據監(jiān)控體系 / 21
第 9 問:數據分析的產出價值是什么? / 24
第 10 問:數據分析的常見陷阱有哪些? / 26
第 11 問:如何讓數據驅動業(yè)務?數據分析流程 / 28
第 2 章 思維方法 / 32
2.1 數據思維 / 33
第 12 問:什么是數據思維? / 33
第 13 問:怎么使用數據思維? / 35
第 14 問:怎么訓練數據思維? / 38
2.2 通用分析方法 / 41
第 15 問:什么是數據異常分析? / 41
第 16 問:什么是描述性分析? / 43
第 17 問:什么是對比分析? / 46
第 18 問:什么是細分分析? / 48
第 19 問:什么是歸因分析? / 52
第 20 問:什么是預測分析? / 56
第 21 問:什么是相關性分析? / 58
第 22 問:什么是二八定律 / 帕累托定律分析? / 61
2.3 商業(yè)分析方法 / 63
第 23 問:什么是 PEST 分析? / 63
第 24 問:什么是 SWOT 分析? / 65
第 25 問:什么是邏輯樹分析? / 68
第 26 問:什么是STP 4P分析? / 71
第 27 問:什么是波士頓矩陣分析? / 73
第 28 問:什么是 5W2H 分析? / 77
2.4 產品分析方法 / 79
第 29 問:什么是生命周期分析? / 80
第 30 問:什么是 AB 測試分析? / 83
第 31 問:什么是競品分析? / 88
2.5 用戶分析方法 / 90
第 32 問:什么是用戶畫像分析? / 90
第 33 問:什么是漏斗分析? / 96
第 34 問:什么是 RFM 用戶分層分析? / 100
第 35 問:什么是同期群分析? / 104
第 3 章 工具技術 / 107
第 36 問:分析工具如何選?常用場景說明 / 108
3.1 Excel / 109
第 37 問:用 Excel 做數據分析夠嗎? Excel 的學習路徑 / 109
第 38 問:Excel 中有哪些重要的函數或功能?Excel 高頻常用函數介紹 / 110
第 39 問:如何用 Excel 做數據分析?Excel 透視表最全指南 / 114
3.2 SQL / 127
第 40 問:什么是 SQL ?SQL 的學習路徑 / 127
第 41 問:SQL 基礎操作有哪些? / 129
第 42 問:SQL 有哪些高頻函數? / 130
第 43 問:SQL 的表連接該如何做? / 130
第 44 問:什么是 SQL 的窗口函數? / 137
第 45 問:SQL 要學習到什么程度?SQL 在數據分析中落地 / 147
3.3 Python / 151
第 46 問:什么是 Python ?Python 的介紹與開始 / 151
第 47 問:Python 基礎語法有哪些? / 152
第 48 問:Python 數據分析工具包 Pandas 是什么? / 160
第 49 問:Python 數據可視化工具包 Matplotlib 是什么? / 177
第 50 問:Pandas 如何解決業(yè)務問題?數據分析流程詳解 / 183
3.4 PowerBI / 195
第 51 問:什么是商業(yè)智能?商業(yè)智能與 PowerBI 入門 / 195
第 52 問:PowerBI 的核心概念有哪些?一文看懂 PowerBI 運行邏輯 / 198
第 53 問:如何用 PowerBI 做數據分析?PowerBI 完整數據分析流程案例 / 208
第 4 章 項目落地 / 222
4.1 落地思維 / 223
第 54 問:數據分析的結果該如何落地? / 223
第 55 問:數據分析沒有思路怎么辦?數據分析中以終為始的思考邏輯 / 226
第 56 問:如何從不同層次理解業(yè)務?數據分析中點線面體的思考邏輯 / 229
第 57 問:數據分析怎么做才有價值?數據分析中的目標管理 / 231
4.2 理解業(yè)務本質 / 235
第 58 問:常說的業(yè)務場景是什么?從營銷角度出發(fā)構建業(yè)務場景模型 / 235
第 59 問:零售行業(yè)常說的人貨場是什么?從人貨場模型看落地場景中的數據
分析 / 240
第 60 問:如何深入理解業(yè)務?利用點線面思維構建業(yè)務模型 / 242
第 61 問:如何梳理業(yè)務流程?從線的層次思考業(yè)務 / 245
第 62 問:如何看懂公司的商業(yè)模式?從面的層次思考業(yè)務 / 250
第 63 問:從戰(zhàn)略層次全局看待業(yè)務?從體的層次思考業(yè)務 / 254
4.3 互聯網產品數據分析實踐 / 258
第 64 問:如何分析用戶行為數據?還原實際業(yè)務中的落地分析流程 / 258
第 65 問:如何定義問題?AARRR 模型中獲取階段的落地分析 / 263
第 66 問:如何形成分析思路?AARRR 模型中促活階段的落地分析 / 268
第 67 問:如何給落地建議?AARRR 模型中留存階段的落地分析 / 274
4.4 報告呈現 / 279
第 68 問:為什么要做數據分析報告?向上匯報與橫向溝通 / 279
第 69 問:如何用數據來講故事?報告結構與金字塔原理 / 281
第 70 問:如何制作一個圖表?數據可視化的邏輯 / 284
4.5 項目復現實戰(zhàn) / 287
第 71 問:游戲行業(yè),如何分析活動? / 287
第 5 章 展望 / 298
第 72 問:數據分析師的前景及如何成長? / 299