我分類故我在!大數(shù)據(jù)也要大思維!思維革新比數(shù)據(jù)技術(shù)更重要!
在商業(yè)分析和商業(yè)智慧的場(chǎng)景下,人們需要的是建構(gòu)大數(shù)據(jù),而不是從巨量資料當(dāng)中大海撈針。
如果只是把資料變多,認(rèn)知學(xué)習(xí)能力的維度卻沒有變高,接下來會(huì)如何?從少量數(shù)據(jù)都學(xué)習(xí)不到的價(jià)值,大數(shù)據(jù)只會(huì)讓它更遙不可及。
大數(shù)據(jù)時(shí)代來臨,獲取數(shù)據(jù)和信息的技術(shù)越發(fā)精進(jìn),每天產(chǎn)生的數(shù)據(jù)量也越來越龐大,該如何發(fā)揮龐大信息的影響力呢?未來,容易上手的程序語言與免費(fèi)的教材只會(huì)越來越普及,唯有絕佳的資料素養(yǎng)和決策分析能力才能真正讓你出類拔萃!
本書內(nèi)容豐富,從多個(gè)角度切入,探討大數(shù)據(jù)所必備的工具,例如R Commander、決策樹、隨機(jī)森林與R語言強(qiáng)大的視覺化功能。除了概念解析之外,作者更逐行解析專業(yè)程序語言,再加碼實(shí)際操作與應(yīng)用功能說明。本書非常適合作為R語言的基礎(chǔ)自學(xué)書。
在未來,容易上手的程序語言與免費(fèi)的教材只會(huì)越來越普及,唯有絕佳的資料素養(yǎng)和決策分析能力,才能真正讓你出類拔萃!
◎內(nèi)行引入門本書作者實(shí)力雄厚,擁有多年教學(xué)經(jīng)驗(yàn),更是R語言中文版的編譯者。
◎功力就大增解析型企業(yè)、時(shí)間序列、決策樹、隨機(jī)森林等十個(gè)大數(shù)據(jù)核心講題幫你全方位大提升!
◎思維超展開程序語言專業(yè)講解與發(fā)人省思的分析探討同步幫你掌握關(guān)鍵。
◎展望大未來每講皆以國際化的大數(shù)據(jù)時(shí)事開頭,引發(fā)學(xué)習(xí)興趣,增進(jìn)視野高度!
第 1 講 分析型企業(yè)的概念 001
大數(shù)據(jù)有大用 ▲007
數(shù)據(jù)分析過程涉及的兩個(gè)大數(shù)據(jù)環(huán)境 ▲009
算法的概念 ▲013
數(shù)據(jù)分析之信息概論 ▲017
測(cè)量的哲學(xué)自我學(xué)習(xí)之路 ▲030
本書內(nèi)容安排 ▲032
第 2 講 統(tǒng)計(jì)分布的數(shù)字特征 037
統(tǒng)計(jì)圖 ▲040
平均值 ▲041
四分位距 ▲043
標(biāo)準(zhǔn)差 ▲045
偏度 ▲047
峰度 ▲049
分析大數(shù)據(jù)時(shí)需要注意的問題 ▲051
商業(yè)模式的數(shù)字挑戰(zhàn) ▲052
第 3 講 時(shí)間序列 053
時(shí)間序列的概念 ▲057
時(shí)間序列的特點(diǎn) ▲057
時(shí)間序列分析之低頻分析 ▲059
時(shí)間序列的分類分析 ▲061
時(shí)間序列分析之日高頻分析 ▲069
分類分析 ▲072
時(shí)間序列分析之日內(nèi)高頻分析 ▲077
分析大數(shù)據(jù)時(shí)需要注意的問題 ▲080
預(yù)測(cè)失靈 ▲081
第 4 講 期望值與信賴區(qū)間 083
期望的概念 ▲087
簡單的統(tǒng)計(jì)原理 ▲087
R Commander 項(xiàng)目實(shí)戰(zhàn) ▲096
殘差診斷 ▲103
R 語言程序?qū)崙?zhàn) ▲113
分析大數(shù)據(jù)時(shí)需要注意的問題 ▲117
基于區(qū)塊鏈的決策思考 ▲120
第 5 講 二元選擇模型與 Logistic 模型 123
二元選擇模型 ▲126
R Commander 項(xiàng)目實(shí)戰(zhàn) ▲131
R 語言程序?qū)崙?zhàn) ▲137
分析大數(shù)據(jù)時(shí)需要注意的問題 ▲142
大數(shù)據(jù)的經(jīng)濟(jì)預(yù)測(cè) ▲144
第 6 講 主成分分析 147
主成分分析的概念 ▲150
R Commander 項(xiàng)目實(shí)戰(zhàn) ▲153
R 語言程序?qū)崙?zhàn) ▲168
分析大數(shù)據(jù)時(shí)需要注意的問題 ▲173
都是預(yù)測(cè)惹的禍 ▲174
第 7 講 聚類分析 177
聚類分析的基本概念 ▲180
R Commander 項(xiàng)目實(shí)戰(zhàn) ▲184
R 語言程序?qū)崙?zhàn) ▲196
分析大數(shù)據(jù)時(shí)需要注意的問題 ▲203
平臺(tái)經(jīng)濟(jì)的數(shù)據(jù)決策 ▲204
第 8 講 決策樹 207
決策樹的概念 ▲210
決策樹的分類原理 ▲210
R Commander 項(xiàng)目實(shí)戰(zhàn) ▲213
R 語言程序?qū)崙?zhàn) ▲222
分析大數(shù)據(jù)時(shí)需要注意的問題 ▲230
當(dāng)數(shù)據(jù)變成噪聲 ▲232
第 9 講 隨機(jī)森林 235
隨機(jī)森林的概念 ▲238
隨機(jī)森林的特點(diǎn) ▲239
R Commander 項(xiàng)目實(shí)戰(zhàn) ▲239
R 語言程序?qū)崙?zhàn) ▲248
分析大數(shù)據(jù)時(shí)需要注意的問題 ▲250
都是隨機(jī)惹的禍 ▲251
第 10 講 購物車分析 253
購物車分析的概念 ▲256
關(guān)聯(lián)分析的原理 ▲256
R Commander 項(xiàng)目實(shí)戰(zhàn) ▲258
R 語言程序?qū)崙?zhàn) ▲263
分析大數(shù)據(jù)時(shí)需要注意的問題 ▲278
數(shù)據(jù)產(chǎn)品化大數(shù)據(jù)決策的最后一段路 ▲280
附錄 A 關(guān)于 R 語言的安裝 283
R 語言簡介及安裝 ▲284
R Commander 簡介 ▲291
安裝 R Commander ▲292
附錄 B rattle 包的安裝 295
加載外部數(shù)據(jù) ▲298
加載 R 語言內(nèi)置數(shù)據(jù) ▲301
附錄 C 數(shù)據(jù)文件的讀取和 MySQL 數(shù)據(jù)庫的使用 303
數(shù)據(jù)的讀取 ▲304
使用數(shù)據(jù)庫讀取數(shù)據(jù) ▲317
常用的數(shù)據(jù)處理函數(shù) ▲321
數(shù)據(jù)計(jì)算函數(shù) apply() 家族 ▲322