1.全面講解商業(yè)領(lǐng)域中的數(shù)據(jù)處理、機(jī)器學(xué)習(xí)和人工智能,數(shù)據(jù)科學(xué)家的手冊。深圳數(shù)據(jù)交易所數(shù)據(jù)應(yīng)用部負(fù)責(zé)人李可順、浙江大學(xué)客座教授 曹嘉飛傾情推薦。
2.不僅介紹了數(shù)據(jù)科學(xué)的基本概念和技術(shù),更重要的是闡述了如何將這些技術(shù)應(yīng)用到商業(yè)領(lǐng)域中。書中提供了很多實(shí)用的建議和技巧,可以幫助讀者更好地應(yīng)用數(shù)據(jù)科學(xué)來推動商業(yè)決策和實(shí)現(xiàn)商業(yè)價(jià)值。
3.評估企業(yè)是否需要數(shù)據(jù)科學(xué)家,以及數(shù)據(jù)科學(xué)家需要哪些能力;評估項(xiàng)目是否需要大數(shù)據(jù)技術(shù),以及大數(shù)據(jù)為何會約束分析師;介紹更適合解決眾多問題的前沿人工智能工具以及經(jīng)典方法。
第一章 前言 001
1.1 為什么企業(yè)管理者需要了解數(shù)據(jù)科學(xué) 003
1.2 新時(shí)代的數(shù)據(jù)素養(yǎng) 005
1.3 數(shù)據(jù)驅(qū)動式開發(fā) 007
1.4 如何使用本書 010
第二章 商業(yè)領(lǐng)域中的數(shù)據(jù)科學(xué) 013
2.1 什么是數(shù)據(jù)科學(xué) 015
2.2 企業(yè)中的數(shù)據(jù)科學(xué) 036
2.3 聘請數(shù)據(jù)科學(xué)家 048
2.4 管理失敗案例 067
第三章 處理現(xiàn)代數(shù)據(jù) 073
3.1 非結(jié)構(gòu)化數(shù)據(jù)和被動收集 076
3.2 數(shù)據(jù)類型和來源 078
3.3 數(shù)據(jù)格式 079
3.4 數(shù)據(jù)庫 087
3.5 數(shù)據(jù)分析軟件架構(gòu) 093
第四章 講述故事和總結(jié)數(shù)據(jù) 101
4.1 選擇要度量的內(nèi)容 104
4.2 異常值、可視化和概要統(tǒng)計(jì)的局限性:一圖抵千數(shù) 108
4.3 實(shí)驗(yàn)、相關(guān)性和因果關(guān)系 113
4.4 以一個數(shù)字進(jìn)行總結(jié) 117
4.5 評估關(guān)鍵特征:集中趨勢、擴(kuò)散程度和重尾 118
4.6 總結(jié)兩個數(shù)字:相關(guān)系數(shù)和散點(diǎn)圖 128
4.7 高階內(nèi)容:擬合直線或曲線 133
4.8 統(tǒng)計(jì)學(xué):如何不自欺欺人 142
4.9 高階內(nèi)容:值得了解的概率分布 158
第五章 機(jī)器學(xué)習(xí) 175
5.1 監(jiān)督式學(xué)習(xí)、非監(jiān)督式學(xué)習(xí)、二元分類 178
5.2 測量性能 188
5.3 高階內(nèi)容:重要分類器 198
5.4 數(shù)據(jù)結(jié)構(gòu):無監(jiān)督式學(xué)習(xí) 217
5.5 邊做邊學(xué):強(qiáng)化學(xué)習(xí) 235
第六章 了解工具 241
6.1 關(guān)于學(xué)習(xí)編碼的注意事項(xiàng) 244
6.2 速查表 245
6.3 數(shù)據(jù)科學(xué)生態(tài)系統(tǒng)的組成部分 246
6.4 高階內(nèi)容:數(shù)據(jù)庫查詢速成課 264
第七章 深度學(xué)習(xí)和人工智能 275
7.1 人工智能概述 278
7.2 神經(jīng)網(wǎng)絡(luò) 282
7.3 自然語言處理(NLP) 296
7.4 知識庫和圖表 305
后記 309