數(shù)據(jù)自助服務(wù)實(shí)踐指南:數(shù)據(jù)開放與洞察提效
定 價:99 元
叢書名:O'Reilly精品圖書系列
- 作者:[美]桑迪普·烏坦坎達(dá)尼(SandeepUttamchandani)著,吳瑞誠,熊暢,王曉倩譯
- 出版時間:2022/5/1
- ISBN:9787111703853
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP274-62
- 頁碼:228
- 紙張:膠版紙
- 版次:1
- 開本:16開
本書主要介紹數(shù)據(jù)洞察及其四個階段,第1部分為自助服務(wù)數(shù)據(jù)發(fā)現(xiàn),包括元數(shù)據(jù)目錄服務(wù)、搜索服務(wù)、特征存儲服務(wù)、數(shù)據(jù)遷移服務(wù)、點(diǎn)擊流跟蹤服務(wù)。第二部分 為自助服務(wù)數(shù)據(jù)準(zhǔn)備包括數(shù)據(jù)湖管理服務(wù)、數(shù)據(jù)整理服務(wù)、數(shù)據(jù)權(quán)限治理服務(wù)。第三部分為自助服務(wù)數(shù)據(jù)構(gòu)建,包括、數(shù)據(jù)虛擬化服務(wù)、模型訓(xùn)練服務(wù)、持續(xù)集成服務(wù)、A/B測試服務(wù)。第四部分為自助服務(wù)數(shù)據(jù)實(shí)施,包括查詢優(yōu)化服務(wù)、管道編排服務(wù)、模型部署服務(wù)、質(zhì)量監(jiān)控服務(wù)、成本管理服務(wù)。通過學(xué)習(xí)本書,數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家和團(tuán)隊經(jīng)理將學(xué)習(xí)如何構(gòu)建一個自助數(shù)據(jù)科學(xué)平臺,幫助你的組織中的任何人從數(shù)據(jù)中提取見解。
適讀人群 :數(shù)據(jù)工程師、數(shù)據(jù)平臺開發(fā)人員
數(shù)據(jù)驅(qū)動的洞察是當(dāng)今所有行業(yè)的關(guān)鍵競爭優(yōu)勢。從原始數(shù)據(jù)中提取洞察往往需要幾天或幾周時間,大多數(shù)組織無法足夠快地擴(kuò)大數(shù)據(jù)科學(xué)團(tuán)隊以跟上需要轉(zhuǎn)換的數(shù)據(jù)量的增長。那么如何解決這一問題呢?答案是實(shí)現(xiàn)數(shù)據(jù)自助服務(wù)。
通過本書,數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家和團(tuán)隊經(jīng)理將學(xué)習(xí)如何構(gòu)建自助數(shù)據(jù)平臺,以幫助組織從數(shù)據(jù)中提取洞察。作者在書中提供了一個記分卡,用于跟蹤并解決在數(shù)據(jù)發(fā)現(xiàn)、轉(zhuǎn)換、處理和生產(chǎn)過程中增加洞察耗時的瓶頸問題。
本書彌合了數(shù)據(jù)科學(xué)家與數(shù)據(jù)工程師之間的鴻溝——數(shù)據(jù)科學(xué)家被工程現(xiàn)實(shí)所束縛,而數(shù)據(jù)工程師對自助服務(wù)的工作方式一無所知。
通過學(xué)習(xí)本書,你將能夠:
? 構(gòu)建自助服務(wù)門戶以支持?jǐn)?shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)沿襲和數(shù)據(jù)治理。
? 使用開源技術(shù)為每個自助服務(wù)功能選擇佳方法。
? 為數(shù)據(jù)的發(fā)現(xiàn)、準(zhǔn)備、構(gòu)建、實(shí)施定制自助服務(wù)。
? 實(shí)現(xiàn)數(shù)據(jù)開放與洞察提效的功能。
? 擴(kuò)展自助服務(wù)門戶以為組織內(nèi)的大量用戶提供支持。
排版約定
本書中使用以下排版約定:
斜體(Italic)
表示新的術(shù)語、URL、電子郵件地址、文件名和文件擴(kuò)展名。
等寬字體(Constant width)
用于程序清單,以及段落中的程序元素,例如變量名、函數(shù)名、數(shù)據(jù)庫、數(shù)據(jù)類型、環(huán)境變量、語句以及關(guān)鍵字。
等寬粗體(Constant width bold)
表示應(yīng)由用戶直接輸入的命令或其他文本。
等寬斜體(Constant width italic)
表示應(yīng)由用戶提供的值或由上下文確定的值替換的文本。
該圖示表示提示或建議。
該圖示表示一般性說明。
該圖示表示警告或注意。
示例代碼
可以從https://oreil.ly/ssdr-book下載補(bǔ)充材料(示例代碼、練習(xí)、勘誤等)。
這里的代碼是為了幫助你更好地理解本書的內(nèi)容。通常,可以在程序或文檔中使用本書中的代碼,而不需要聯(lián)系O’Reilly獲得許可,除非需要大段地復(fù)制代碼。例如,使用本書中所提供的幾個代碼片段來編寫一個程序不需要得到我們的許可,但銷售或發(fā)布O’Reilly的示例代碼則需要獲得許可。引用本書的示例代碼來回答問題也不需要許可,將本書中的很大一部分示例代碼放到自己的產(chǎn)品文檔中則需要獲得許可。
非常歡迎讀者使用本書中的代碼,希望(但不強(qiáng)制)注明出處。注明出處時包含書名、作者、出版社和ISBN,例如:
The Self-Service Data Roadmap,作者Sandeep Uttamchandani,由O’Reilly出版,書號978-1-492-07525-7
如果讀者覺得對示例代碼的使用超出了上面所給出的許可范圍,歡迎通過permissions@oreilly.com聯(lián)系我們。
O’Reilly在線學(xué)習(xí)平臺(O’Reilly Online Learning)
40多年來,O’Reilly Media致力于提供技術(shù)和商業(yè)培訓(xùn)、知識和卓越見解,來幫助眾多公司取得成功。
我們擁有獨(dú)一無二的專家和革新者組成的龐大網(wǎng)絡(luò),他們通過圖書、文章、會議和我們的在線學(xué)習(xí)平臺分享他們的知識和經(jīng)驗(yàn)。O’Reilly的在線學(xué)習(xí)平臺允許你按需訪問現(xiàn)場培訓(xùn)課程、深入的學(xué)習(xí)路徑、交互式編程環(huán)境,以及O’Reilly和200多家其他出版商提供的大量文本和視頻資源。有關(guān)的更多信息,請訪問http://oreilly.com。
如何聯(lián)系我們
對于本書,如果有任何意見或疑問,請按照以下地址聯(lián)系本書出版商。
美國:
O’Reilly Media,Inc.
1005 Gravenstein Highway North
Sebastopol,CA 95472
中國:
北京市西城區(qū)西直門南大街2號成銘大廈C座807室(100035)
奧萊利技術(shù)咨詢(北京)有限公司
要詢問技術(shù)問題或?qū)Ρ緯岢鼋ㄗh,請發(fā)送電子郵件至bookquestions@oreilly.com。
本書配套網(wǎng)站https://oreil.ly/ssdr上列出了勘誤表、示例以及其他信息。
關(guān)于書籍、課程、會議和新聞的更多信息,請訪問我們的網(wǎng)站http://www.oreilly.com。
我們在Facebook上的地址:http://facebook.com/oreilly
我們在Twitter上的地址:http://twitter.com/oreillymedia
我們在YouTube上的地址:http://www.youtube.com/oreillymedia
前言1
第1章 數(shù)據(jù)介紹5
1.1 從原始數(shù)據(jù)到洞察6
1.2 定義洞察耗時記分卡13
1.3 建立數(shù)據(jù)自助服務(wù)路線圖17
第一部分 數(shù)據(jù)發(fā)現(xiàn)自助服務(wù)
第2章 元數(shù)據(jù)目錄服務(wù)21
2.1 路線圖22
2.2 最小化解釋耗時23
2.3 定義需求26
2.4 實(shí)現(xiàn)模式28
2.5 總結(jié)32
第3章 搜索服務(wù)33
3.1 路線圖33
3.2 最小化搜索耗時34
3.3 定義需求36
3.4 實(shí)現(xiàn)模式38
3.5 總結(jié)45
第4章 特征存儲服務(wù)46
4.1 路線圖47
4.2 最小化特征處理耗時48
4.3 定義需求49
4.4 實(shí)現(xiàn)模式51
4.5 總結(jié)55
第5章 數(shù)據(jù)遷移服務(wù)56
5.1 路線圖56
5.2 最小化數(shù)據(jù)可用性耗時57
5.3 定義需求58
5.4 實(shí)現(xiàn)模式62
5.5 總結(jié)68
第6章 點(diǎn)擊流跟蹤服務(wù)69
6.1 路線圖70
6.2 最小化點(diǎn)擊指標(biāo)耗時71
6.3 定義需求73
6.4 實(shí)現(xiàn)模式75
6.5 總結(jié)79
第二部分 數(shù)據(jù)準(zhǔn)備自助服務(wù)
第7章 數(shù)據(jù)湖管理服務(wù)83
7.1 路線圖84
7.2 最小化數(shù)據(jù)湖管理耗時86
7.3 實(shí)現(xiàn)模式91
7.4 總結(jié)94
第8章 數(shù)據(jù)整理服務(wù)95
8.1 路線圖96
8.2 最小化數(shù)據(jù)整理耗時97
8.3 定義需求98
8.4 實(shí)現(xiàn)模式98
8.5總結(jié)100
第9章 數(shù)據(jù)權(quán)限治理服務(wù)101
9.1 路線圖102
9.2 最小化合規(guī)耗時103
9.3 定義需求104
9.4 實(shí)現(xiàn)模式107
9.5總結(jié)111
第三部分 數(shù)據(jù)構(gòu)建自助服務(wù)
第10章 數(shù)據(jù)虛擬化服務(wù)115
10.1 路線圖116
10.2 最小化查詢耗時116
10.3 定義需求117
10.4 實(shí)現(xiàn)模式119
10.5 總結(jié)124
第11章 數(shù)據(jù)轉(zhuǎn)換服務(wù)125
11.1 路線圖125
11.2 最小化轉(zhuǎn)換耗時126
11.3 定義需求127
11.4 實(shí)現(xiàn)模式128
11.5總結(jié)133
第12章 模型訓(xùn)練服務(wù)134
12.1 路線圖135
12.2 最小化訓(xùn)練耗時136
12.3 定義需求138
12.4實(shí)現(xiàn)模式140
12.5 總結(jié)144
第13章 持續(xù)集成服務(wù)145
13.1 路線圖146
13.2 最小化集成耗時147
13.3 定義需求148
13.4 實(shí)現(xiàn)模式149
13.5 總結(jié)152
第14章 A/B測試服務(wù)153
14.1 路線圖155
14.2 最小化A/B測試耗時156
14.3 實(shí)現(xiàn)模式158
14.4 總結(jié)160
第四部分 數(shù)據(jù)實(shí)施自助服務(wù)
第15章 查詢優(yōu)化服務(wù)163
15.1 路線圖164
15.2 最小化優(yōu)化耗時165
15.3 定義需求167
15.4 實(shí)現(xiàn)模式168
15.5 總結(jié)173
第16章 管道編排服務(wù)174
16.1 路線圖175
16.2 最小化編排耗時176
16.3 定義需求177
16.4 實(shí)現(xiàn)模式179
16.5總結(jié)183
第17章 模型部署服務(wù)184
17.1 路線圖184
17.2 最小化部署耗時185
17.3 定義需求186
17.4 實(shí)現(xiàn)模式189
17.5 總結(jié)193
第18章 質(zhì)量可觀測性服務(wù)194
18.1 路線圖195
18.2 最小化洞察質(zhì)量耗時196
18.3 定義需求198
18.4 實(shí)現(xiàn)模式199
18.5 總結(jié)204
第19章 成本管理服務(wù)205
19.1 路線圖206
19.2 最小化優(yōu)化成本耗時207
19.3 定義需求208
19.4 實(shí)現(xiàn)模式209
19.5 總結(jié)213