大數(shù)據(jù)實訓案例——電信用戶行為分析(Scala版)
定 價:45 元
- 作者:林子雨
- 出版時間:2019/5/1
- ISBN:9787115501233
- 出 版 社:人民郵電出版社
- 中圖法分類:F626-39
- 頁碼:179
- 紙張:
- 版次:01
- 開本:16開
本書詳細介紹了一個大數(shù)據(jù)應用案例——電信用戶行為分析,案例涉及數(shù)據(jù)預處理、數(shù)據(jù)存儲與管理、數(shù)據(jù)分析和數(shù)據(jù)可視化等流程,涵蓋Linux、MySQL、Hadoop、Spark、IntelliJ IDEA、Spring等系統(tǒng)和軟件的安裝與使用方法。案例采用的編程語言是Scala和Java。
本書是廈門大學作者團隊長期經(jīng)驗總結(jié)的結(jié)晶。本書是在廈門大學《大數(shù)據(jù)技術原理與應用》入門級大數(shù)據(jù)教材的基礎之上編寫的。為了確保教程質(zhì)量,在編著出版紙質(zhì)教材之前,實驗室已經(jīng)于2016年10月通過實驗室官網(wǎng)免費發(fā)布共享了簡化版的Spark在線教程和相關教學資源,同時,該在線教程也已經(jīng)用于廈門大學計算機科學系研究生的大數(shù)據(jù)課程教學,并成為全國高校大數(shù)據(jù)課程教師培訓交流班的授課內(nèi)容。實驗室根據(jù)讀者對在線Spark教程的大量反饋意見以及教學實踐中發(fā)現(xiàn)的問題,對Spark在線教程進行了多次修正和完善,所有這些前期準備工作,都為紙質(zhì)教材的編著出版打下了堅實的基礎。
林子雨(1978-),男,博士,廈門大學計算機科學系助理教授,廈門大學云計算與大數(shù)據(jù)研究中心創(chuàng)始成員,廈門大學數(shù)據(jù)庫實驗室負責人,中國計算機學會數(shù)據(jù)庫專委會委員,中國計算機學會信息系統(tǒng)專委會委員。于2001年獲得福州大學水利水電專業(yè)學士學位,2005年獲得廈門大學計算機專業(yè)碩士學位,2009年獲得北京大學計算機專業(yè)博士學位。中國高校首個“數(shù)字教師”提出者和建設者(http://www.cs.xmu.edu.cn/linziyu),2009年至今,“數(shù)字教師”大平臺累計向網(wǎng)絡免費發(fā)布超過500萬字高價值的教學和科研資料,累計網(wǎng)絡訪問量超過500萬次。 主要研究方向為數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘和大數(shù)據(jù),發(fā)表期刊和會議學術論文多篇,并作為課題負責人主持了1項國家自然科學基金、1項福建省自然科學基金項目和1項福建省教改課題。曾作為志愿者翻譯了Google Spanner、BigTable和《Architecture of a Database System》等大量英文學術資料,與廣大網(wǎng)友分享,深受歡迎。2013年開始在廈門大學開設大數(shù)據(jù)課程,并因在教學領域的突出貢獻和學生的認可,成為2013年度和2017年度廈門大學教學類獎教金獲得者。獲得2017年福建省精品在線開放課程、2018年廈門大學高等教育教學成果特等獎、2018年福建省高等教育教學成果二等獎。 主講課程:《大數(shù)據(jù)處理技術》。 個人主頁:http://www.cs.xmu.edu.cn/linziyu。 E-mail: ziyulin@xmu.edu.cn。 數(shù)據(jù)庫實驗室網(wǎng)站:http://dblab.xmu.edu.cn。 建設了高校大數(shù)據(jù)課程公共服務平臺(http://dblab.xmu.edu.cn/post/bigdata-teaching- platform/),成為全國高校大數(shù)據(jù)教學知名品牌。平臺為教師教學和學生學習大數(shù)據(jù)課程提供包括教學大綱、講義PPT、學習指南、備課指南、實驗指南、上機習題、授課視頻、技術資料等全方位、一站式免費服務,平臺年訪問量超過100萬次,同時提供面向高校的大數(shù)據(jù)實驗平臺建設方案和大數(shù)據(jù)課程師資培訓服務。
第1章 案例概述 1
1.1 案例目的 1
1.2 適用對象 1
1.3 時間安排 1
1.4 預備知識 2
1.5 硬件要求 2
1.6 軟件工具 2
1.7 數(shù)據(jù)集 3
1.8 案例任務 3
1.9 實驗步驟 4
1.10 在線資源 6
1.10.1 在線資源一覽表 6
1.10.2 下載專區(qū) 6
1.10.3 先修課程 7
1.10.4 大數(shù)據(jù)課程公共服務平臺 7
1.11 本章小結(jié) 8
第2章 大數(shù)據(jù)實驗環(huán)境搭建 9
2.1 Linux系統(tǒng)及相關軟件使用方法 9
2.1.1 Shell 10
2.1.2 root用戶 10
2.1.3 創(chuàng)建普通用戶 10
2.1.4 sudo命令 11
2.1.5 常用的Linux系統(tǒng)命令 11
2.1.6 文件解壓縮 12
2.1.7 常用的目錄 12
2.1.8 目錄的權限 13
2.1.9 更新APT 13
2.1.10 切換中英文輸入法 14
2.1.11 vim編輯器的安裝和使用方法 15
2.2 JDK的安裝 15
2.3 Scala的安裝 16
2.4 Hadoop的安裝和基本使用方法 17
2.4.1 安裝Hadoop前的準備工作 17
2.4.2 安裝Hadoop 19
2.4.3 HDFS操作常用Shell命令 22
2.5 Spark的安裝和基本使用方法 24
2.5.1 下載安裝文件 24
2.5.2 配置相關文件 25
2.5.3 Spark和Hadoop的交互 25
2.5.4 在spark-shell中運行代碼 26
2.6 MySQL數(shù)據(jù)庫的安裝和基本
使用方法 28
2.6.1 安裝MySQL 28
2.6.2 MySQL常用操作 31
2.7 安裝Tomcat 33
2.7.1 安裝方式的選擇 33
2.7.2 下載安裝文件 33
2.7.3 安裝和啟動Tomcat 34
2.8 本章小結(jié) 35
第3章 IntelliJ IDEA開發(fā)工具的
安裝和使用方法 36
3.1 下載和安裝IDEA 36
3.2 下載Scala插件安裝包 36
3.3 啟動IDEA 37
3.4 為IDEA安裝Scala插件 40
3.5 配置項目的JDK 44
3.6 使用IDEA開發(fā)WordCount程序 45
3.6.1 創(chuàng)建一個新項目WordCount 46
3.6.2 為WordCount項目添加Scala
框架支持 48
3.6.3 設置項目目錄 51
3.6.4 新建Scala代碼文件 53
3.6.5 配置pom.xml文件 55
3.6.6 更新Maven的依賴文件 57
3.6.7 運行WordCount程序 57
3.6.8 打包WordCount程序生成
JAR包 59
3.6.9 把JAR包提交到Spark中運行 63
3.7 本章小結(jié) 63
第4章 使用Spring、Spring
MVC和MyBatis開發(fā)
網(wǎng)頁應用 64
4.1 MVC模型 64
4.2 Spring框架 65
4.3 Spring MVC框架 66
4.3.1 網(wǎng)頁開發(fā)中的“請求-響應”
模型 66
4.3.2 采用Spring MVC框架后的
網(wǎng)頁請求處理過程 67
4.4 MyBatis 68
4.5 一個簡單的網(wǎng)頁應用開發(fā)實例 69
4.5.1 新建項目 69
4.5.2 配置pom.xml文件 71
4.5.3 設置項目目錄 74
4.5.4 編寫代碼文件 75
4.5.5 對項目文件進行編譯打包 77
4.5.6 把WebDemo.war發(fā)布到
Tomcat中 81
4.5.7 實現(xiàn)Spring MVC和
Spring的整合 83
4.5.8 實現(xiàn)Spring、Spring MVC和
MyBatis三者的融合 86
4.5.9 把后端數(shù)據(jù)提交給網(wǎng)頁顯示 93
4.6 在IntelliJ IDEA中使用Tomcat
調(diào)試網(wǎng)頁程序 96
4.7 本章小結(jié) 104
第5章 使用ECharts制作
可視化圖表 105
5.1 ECharts簡介 105
5.2 ECharts圖表制作方法 105
5.2.1 下載ECharts 105
5.2.2 在HTML中引入ECharts 106
5.2.3 繪制一個簡單的圖表 106
5.2.4 導出圖片 107
5.3 可視化圖表制作實例 109
5.3.1 快速制作圖表方法 109
5.3.2 實例1:柱狀圖 110
5.3.3 實例2:餅狀圖 113
5.4 本章小結(jié) 117
第6章 電信用戶行為分析
實現(xiàn)過程 118
6.1 數(shù)據(jù)分析整體過程 118
6.2 本地數(shù)據(jù)集上傳到HDFS 119
6.2.1 數(shù)據(jù)集下載 119
6.2.2 把數(shù)據(jù)集上傳到HDFS 119
6.3 在MySQL中創(chuàng)建數(shù)據(jù)庫 120
6.3.1 啟動進入MySQL Shell環(huán)境 120
6.3.2 創(chuàng)建一個數(shù)據(jù)庫 120
6.3.3 創(chuàng)建一個數(shù)據(jù)匯總表 120
6.3.4 創(chuàng)建一個數(shù)據(jù)明細表 121
6.3.5 創(chuàng)建一個數(shù)據(jù)原始明細表 121
6.3.6 創(chuàng)建一個區(qū)域維表 121
6.3.7 創(chuàng)建一個渠道維表 121
6.3.8 創(chuàng)建一個請求類型維表 122
6.3.9 創(chuàng)建五個視圖 122
6.3.10 添加MySQL數(shù)據(jù)庫
驅(qū)動程序JAR包 123
6.4 開發(fā)Spark程序分析用戶行為 123
6.4.1 新建項目 124
6.4.2 設置依賴包 125
6.4.3 設置項目目錄 127
6.4.4 新建Scala代碼文件 127
6.4.5 配置pom.xml文件 133
6.4.6 在IDEA中運行程序 136
6.4.7 生成應用程序JAR包 138
6.4.8 使用spark-submit命令
運行程序 142
6.5 使用Spring MVC框架進行
數(shù)據(jù)可視化分析 144
6.5.1 新建項目 144
6.5.2 配置pom.xml文件 145
6.5.3 設置項目目錄 148
6.5.4 編寫代碼文件 150
6.5.5 生成應用程序JAR包 173
6.5.6 把網(wǎng)頁應用部署到Tomcat
服務器中 175
6.6 本章小結(jié) 178
參考文獻 179