本書以小說的形式展開,講述了主人公俵太從大學文科專業(yè)畢業(yè)后進入征信所,從零開始學習數據分析的故事。書中以主人公就職的征信所所在的商業(yè)街為舞臺,選取貼近生活的案例,將平均值、t檢驗、卡方檢驗、相關、回歸分析、文本挖掘以及時間序列分析等數據分析的基礎知識融入到了生動有趣的偵探故事中,講解由淺入深、寓教于樂,沒有深奧的理論和晦澀的術語,同時提供了大量實際數據,使用免費自由軟件RStudio引領讀者進一步體驗數據分析,實踐性非常強。本書適合所有對數據分析感興趣但又苦于無從下手的讀者閱讀。
數學菜鳥也能搞懂數據分析!
從零學起:沒有深奧的理論和晦澀的知識
實際體驗:免費軟件RStudio 提供模擬數據
應用R語言輕松學統(tǒng)計:
平均值/直方圖/t檢驗/卡方檢驗/相關/回歸分析/邏輯回歸分析/文本挖掘……
商家的抽獎促銷有貓膩?
面包店的面包缺金少兩?
調查問卷的結果該怎么分析?
曾經的熱銷商品為什么不好賣了?
網絡上的匿名中傷者找得出來嗎?
壞事的發(fā)生是否能預測?
讓數據告訴你答案!
石田基廣
生于1962年。德島大學研究生院Socio-Arts and Sciences研究部教授。著作有《便當店統(tǒng)計師2:因子分析大作戰(zhàn)》《R語言逆序手冊(第2次修訂版)》《R語言數據挖掘入門》,譯著有《最短路徑讀本:蕾娜的神奇數學之旅》等。
序 故事就這樣開始了 1
00-01 遭賊的概率 1
00-02 兩把鑰匙都選對的概率 5
01 事件簿 是欺詐還是巧合?開業(yè)紀念抽獎促銷 9
01-01 征信所這個地方 10
01-02 商業(yè)街會長的委托 13
01-03 案件的梗概 15
01-04 骰子沒有記憶嗎 18
01-05 逸子小姐的講解 20
01-06 模擬實驗與直方圖 23
01-07 直方圖與概率 28
01-08 淺嘗RStudio 32
01-09 用RStudio求總和的方法 35
01-10 骰子的模擬實驗 38
01-11 用RStudio生成直方圖 42
01-12 平均值·期望值 45
◎天羽總經理的統(tǒng)計學指南 50
◎本章出現的R代碼 52
02 事件簿 從白胡子老師的牢騷中拯救祖?zhèn)髅姘辍 ?7
02-01 RStudio基礎練習 58
02-02 面包店老店主的煩惱 61
02-03 拜訪白胡子老師 64
02-04 以數據服人 67
02-05 從輸入數據做起 68
02-06 標準差的概念 71
02-07 總體與樣本 73
02-08 正態(tài)分布 75
02-09 檢驗平均值的差異 77
02-10 在RStudio上做均值差異檢驗 79
◎天羽總經理的統(tǒng)計學指南 85
◎本章出現的R代碼 88
03 事件簿 關于搞活商業(yè)街的調查問卷,這東西該怎么做 91
03-01 傳統(tǒng)吉祥物還是萌系美少女 92
03-02 調查問卷 93
03-03 輸入調查問卷的數據 97
03-04 將數據制成列聯(lián)表 99
03-05 獨立性檢驗 103
03-06 獨立性檢驗的意義 106
03-07 這是搞啥 111
天羽總經理的統(tǒng)計學指南 115
本章出現的R代碼 117
04 事件簿 酒館的熱銷菜品之飯團,探究其銷售額下滑的原因 121
04-01 櫻田先生的酒館 122
04-02 酒館的銷售額 124
04-03 偽相關 129
04-04 飯團與牛奶的關聯(lián)性 132
04-05 相關與相關系數 136
04-06 預測冰激凌的銷售量 141
天羽總經理的統(tǒng)計學指南 153
本章出現的R代碼 155
05 事件簿 圈定網絡上的惡意中傷者 163
05-01 對抗中傷者 164
05-02 文本挖掘 167
05-03 寫文章時的習慣 174
05-04 圈定惡意中傷者 181
05-05 口碑信息 185
◎天羽總經理的統(tǒng)計學指南 199
◎本章出現的R代碼 202
06 事件簿 雜貨店屢遭賊!預測小偷的行為 207
06-01 初次周末上班 208
06-02 雜貨店的小太郎 209
06-03 用圖來表示失竊數額 211
06-04 時間序列分析 215
06-05 邏輯回歸分析 220
06-06 優(yōu)勢比 223
06-07 用RStudio作邏輯回歸分析 226
◎天羽總經理的統(tǒng)計學指南 234
◎本章出現的R代碼 235
番外篇 進行數據分析前的RStudio環(huán)境搭建 237
參考文獻簡介 247