這是一部營銷和廣告數(shù)據(jù)挖掘與分析的實戰(zhàn)指南,橫跨技術(shù)和業(yè)務(wù)兩個維度,理論與實踐相結(jié)合。技術(shù)維度,結(jié)合營銷與廣告行業(yè)的實際需求,系統(tǒng)講解了廣告數(shù)據(jù)挖掘的模型、算法以及數(shù)據(jù)分析方法,從而實現(xiàn)面向用戶的精準營銷;業(yè)務(wù)維度,結(jié)合廣告業(yè)務(wù)的具體場景,為廣告中的具體問題提供解決方案。更重要的是,本書還講解了熱門的機器學(xué)習(xí)算法在廣告數(shù)據(jù)挖掘與分析中的應(yīng)用。
全書共 10 章,從邏輯上可分為技術(shù)理論知識和具體業(yè)務(wù)應(yīng)用兩個部分。前6章以及第10章主要講解了廣告數(shù)據(jù)分析與挖掘的技術(shù)、方法和應(yīng)用,第7~9 章則主要講解了廣告業(yè)務(wù)中的具體問題及相應(yīng)的解決方法。
第1~2 章主要介紹了Python的安裝和環(huán)境配置,以及廣告數(shù)據(jù)和廣告數(shù)據(jù)分析的基礎(chǔ)知識;
第3~6章深入講解了Python常用的工具包、模型常用的評價指標,以及如何利用Python建立廣告分類模型和集成模型。
第7~8章講解了廣告數(shù)據(jù)分析的典型案例和常用分析方法,以及如何做一份滿意的數(shù)據(jù)分析報告。
第9章講解了如何運用數(shù)據(jù)分析與挖掘方法解決廣告業(yè)務(wù)中的實際問題。
第 10 章主要講解了常用的數(shù)據(jù)預(yù)處理及特征選擇方法。
適讀人群 :在校大學(xué)生或?qū)σ苿訌V告營銷數(shù)據(jù)分析感興趣的小白;想轉(zhuǎn)行做廣告數(shù)據(jù)分析的職場白領(lǐng)、開發(fā)人員、其他技術(shù)人員等;由于工作需要學(xué)習(xí)相關(guān)數(shù)據(jù)分析知識的產(chǎn)品經(jīng)理、運營相關(guān)人員 (1)兩位作者是資深的數(shù)據(jù)分析與挖掘技術(shù)專家、AI技術(shù)專家,在廣告和金融行業(yè)有深厚的積累。
(2)橫跨技術(shù)和業(yè)務(wù)兩個維度,理論與實踐相結(jié)合,循序漸進,系統(tǒng)且全面。
(3)技術(shù)維度,系統(tǒng)講解廣告數(shù)據(jù)挖掘的模型、算法和方法,實現(xiàn)精準營銷。
(4)業(yè)務(wù)維度,為廣告業(yè)務(wù)中的具體問題提供解決方案,包含大量案例和代碼。
為何寫作本書
近幾年來大數(shù)據(jù)、云計算、人工智能等概念越來越深入人心,相關(guān)技術(shù)也越來越成熟。技術(shù)的進步必然會帶來社會的發(fā)展,進而推動整個人類社會不斷進步。機器學(xué)習(xí)、深度學(xué)習(xí)、強化學(xué)習(xí)等均屬于人工智能的細分領(lǐng)域,數(shù)據(jù)分析又是機器學(xué)習(xí)的基礎(chǔ),近幾年在現(xiàn)實中的應(yīng)用場景非常多,作用越發(fā)明顯,因而越來越受到重視。隨著5G時代的到來,數(shù)據(jù)分析、AI方面的人才將更加緊缺,可以說未來很長一段時間數(shù)據(jù)分析人才都會是招聘市場上的高端人才,備受企業(yè)青睞。本書旨在幫助讀者快速了解移動廣告相關(guān)業(yè)務(wù)知識及具體應(yīng)用,掌握數(shù)據(jù)分析相關(guān)理論和實踐技能。
本書主要特點
本書將深入剖析廣告營銷行業(yè)的常見數(shù)據(jù)分析案例,并結(jié)合當前熱門的機器學(xué)習(xí)和AI算法在廣告營銷場景的具體應(yīng)用進行介紹,幫助讀者更好地理解廣告行業(yè)相關(guān)業(yè)務(wù)與技術(shù)應(yīng)用,快速掌握廣告營銷數(shù)據(jù)分析所需要的基本知識和技能。書中采用Python作為項目實戰(zhàn)編程語言,可幫助讀者學(xué)習(xí)用Python進行數(shù)據(jù)分析和解決現(xiàn)實問題。
本書讀者對象
本書是一本廣告營銷行業(yè)數(shù)據(jù)分析入門指導(dǎo)書,適合的讀者對象主要分為下面幾類:
廣告營銷專業(yè)的在校學(xué)生;
對廣告營銷數(shù)據(jù)分析感興趣的其他行業(yè)從業(yè)者;
想轉(zhuǎn)行做廣告數(shù)據(jù)分析的職場白領(lǐng)、開發(fā)人員、其他技術(shù)人員等。
如何閱讀本書
本書共10章,從邏輯上可分為技術(shù)理論知識和具體業(yè)務(wù)應(yīng)用兩部分。其中,第1~2章主要介紹Python的安裝和環(huán)境配置,帶領(lǐng)讀者認識廣告數(shù)據(jù),理解廣告數(shù)據(jù)分析的意義。第3~6章主要介紹Python常用工具包以及模型常用評價指標,并利用Python建立廣告分類模型。第7~8章主要介紹廣告數(shù)據(jù)分析典型案例及常用分析方法,教讀者如何做一份滿意的數(shù)據(jù)分析報告。第9章主要介紹如何運用數(shù)據(jù)分析挖掘方法解決廣告業(yè)務(wù)中的實際問題。第10章主要介紹常用的數(shù)據(jù)預(yù)處理及特征選擇方法。
總之,前6章以及第10章主要介紹廣告數(shù)據(jù)分析挖掘技術(shù)理論和應(yīng)用,第7~9章則主要介紹廣告業(yè)務(wù)中的具體問題及相應(yīng)的解決方法,讀者可以有選擇性地閱讀相應(yīng)內(nèi)容,有興趣的話也可以通讀全書。
勘誤
盡管作者已經(jīng)盡了自己最大的努力,但書中仍有不盡如人意的地方。若讀者發(fā)現(xiàn)本書有錯誤之處,或者針對本書內(nèi)容有更好的寫作建議及意見,可以在微信公眾號“數(shù)據(jù)挖掘與AI算法”上進行反饋。
致謝
動手寫作本書時,我已有孕在身,所以一直顧慮頗多,很擔心無法按時交稿。如今書稿付梓在即,心中感慨萬千。首先要感謝本書的另一位作者周健的努力和配合,其次要感謝我的家人對我的理解和支持,沒有他們,本書是無法順利完成的。還要特別感謝機械工業(yè)出版社華章公司的兩位編輯楊福川和李藝,他們的大力支持和辛勤付出才讓本書得以順利出版。
楊游云
楊游云
資深數(shù)據(jù)分析專家和AI技術(shù)專家,在廣告領(lǐng)域工作多年,目前就職于微思敦深圳分公司皓量科技。在AI技術(shù)領(lǐng)域有非常深厚的積累,擅長機器學(xué)習(xí)和自然語言處理,對圖像識別技術(shù)也有一定的研究。
個人微信公眾號:數(shù)據(jù)挖掘與AI算法。
周健
資深數(shù)據(jù)挖掘工程師,現(xiàn)就職于國內(nèi)某大型征信服務(wù)公司,曾為多家國有銀行、股份制銀行、大型金融機構(gòu)提供反欺詐、信用評分方案。在傳統(tǒng)機器學(xué)習(xí)方面有深入的理解和豐富的實戰(zhàn)經(jīng)驗,在網(wǎng)絡(luò)爬蟲和自然語言處理方面也有自己獨特的見解。
前言
第1章 Python安裝方法1
1.1 Python介紹1
1.2 Anaconda安裝2
1.3 PyCharm安裝及環(huán)境配置9
1.4 為什么建議使用Python17
1.5 本章小結(jié)18
第2章 認識廣告數(shù)據(jù)分析19
2.1 廣告數(shù)據(jù)概述19
2.2 廣告數(shù)據(jù)分布20
2.3 異常值診斷24
2.4 數(shù)據(jù)相關(guān)性26
2.5 顯著性檢驗27
2.6 本章小結(jié)27
第3章 Python廣告數(shù)據(jù)分析常用工具包29
3.1 數(shù)據(jù)基礎(chǔ)運算工具:NumPy29
3.2 數(shù)據(jù)預(yù)處理工具:Pandas46
3.3 數(shù)據(jù)可視化分析工具:Matplotlib63
3.4 本章小結(jié)74
第4章 模型常用評價指標75
4.1 回歸模型常用評價指標75
4.2 分類模型常用評價指標77
4.3 本章小結(jié)87
第5章 利用Python建立廣告分類模型88
5.1 邏輯回歸88
5.2 決策樹92
5.3 KNN98
5.4 SVM101
5.5 神經(jīng)網(wǎng)絡(luò)110
5.6 本章小結(jié)118
第6章 利用Python建立廣告集成模型119
6.1 隨機森林119
6.2 GBDT124
6.3 XGBoost128
6.5 LR+GBDT137
6.6 FM142
6.6.1 FM的原理142
6.6.2 FM的改進145
6.6.3 FM的Python實現(xiàn)145
6.7 本章小結(jié)147
第7章 移動廣告常用數(shù)據(jù)分析方法149
7.1 App下載數(shù)據(jù)分析149
7.2 游戲行業(yè)用戶分析151
7.3 電商類App用戶轉(zhuǎn)化分析156
7.4 工具類App用戶分析162
7.5 本地O2O婚紗攝影行業(yè)分析163
7.6 品牌廣告與效果廣告166
7.7 本章小結(jié)168
第8章 廣告數(shù)據(jù)分析報告169
8.1 分析觀點明確,邏輯清晰169
8.2 匯報結(jié)果,用數(shù)據(jù)說話170
8.3 分析過程有理有據(jù)171
8.4 圖表說明171
8.5 數(shù)據(jù)驗證173
8.6 分析建議173
8.7 本章小結(jié)174
第9章 廣告用戶數(shù)據(jù)挖掘與分析175
9.1 廣告用戶曝光與響應(yīng)率分析175
9.2 廣告用戶曝光與點擊率分析178
9.3 廣告訂單消耗與延時性分析181
9.4 Lookalike聚類分析186
9.5 Lookalike技術(shù)在廣告中的應(yīng)用190
9.6 本章小結(jié)192
第10章 廣告數(shù)據(jù)預(yù)處理與特征選擇193
10.1 廣告數(shù)據(jù)預(yù)處理193
10.2 常用特征選擇方法197
10.3 PCA209
10.4 本章小結(jié)214