數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)導(dǎo)論實(shí)驗(yàn)
定 價:32.8 元
叢書名:新世紀(jì)高等學(xué)校規(guī)劃教材·大數(shù)據(jù)系列
- 作者:陳明
- 出版時間:2018/8/1
- ISBN:9787303234509
- 出 版 社:北京師范大學(xué)出版社
- 中圖法分類:TP274-33
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
本書是《數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)導(dǎo)論實(shí)驗(yàn)》課程的實(shí)驗(yàn)教材,可以配合主教材使用。主要內(nèi)容包括:Linux環(huán)境部署、Hadoop開發(fā)環(huán)境部署、網(wǎng)頁數(shù)據(jù)采集、大數(shù)據(jù)去重、大數(shù)據(jù)*值計(jì)算、大數(shù)據(jù)排序、大數(shù)據(jù)倒排索引、大數(shù)據(jù)平均值計(jì)算、大數(shù)據(jù)單表關(guān)聯(lián)、大數(shù)據(jù)可視化。
本書選材先進(jìn)、特點(diǎn)鮮明,注重應(yīng)用。通過本書所提供的實(shí)驗(yàn)練習(xí),可以提高大數(shù)據(jù)處理能力?捎糜诖髷(shù)據(jù)實(shí)驗(yàn)教材,也可以作為科學(xué)技術(shù)人員學(xué)習(xí)和應(yīng)用大數(shù)據(jù)的科技參考書。
基于開源的大數(shù)據(jù)處理軟件工具 呈現(xiàn)數(shù)據(jù)生命周期中的典型實(shí)驗(yàn)
本書中的十個實(shí)驗(yàn),涉及了大數(shù)據(jù)生命周期中的內(nèi)容的基本實(shí)驗(yàn),主要在大數(shù)據(jù)處理平臺Hadoop開發(fā)環(huán)境下完成。主要應(yīng)用了MapReduce分布編程模型,完成基本的分析處理功能。
陳明,博士生導(dǎo)師,曾任吉林大學(xué)計(jì)算機(jī)科學(xué)系副教授、教研室主任;大連理工大學(xué)計(jì)算機(jī)科學(xué)與工程系教授、系主任;中國石油大學(xué)(北京)計(jì)算機(jī)科學(xué)與技術(shù)系教授、系主任。北京高校計(jì)算機(jī)與信息類專業(yè)群專家委員會委員兼教學(xué)協(xié)作委員會委員。
實(shí)驗(yàn)1 Linux操作系統(tǒng)部署
實(shí)驗(yàn)2 Hadoop開發(fā)環(huán)境部署
實(shí)驗(yàn)3 網(wǎng)頁數(shù)據(jù)獲取
實(shí)驗(yàn)4 大數(shù)據(jù)去重
實(shí)驗(yàn)5 大數(shù)據(jù)最大值計(jì)算
實(shí)驗(yàn)6 大數(shù)據(jù)排序
實(shí)驗(yàn)7 Hadoop倒排索引
實(shí)驗(yàn)8 大數(shù)據(jù)平均值計(jì)算
實(shí)驗(yàn)9 大數(shù)據(jù)單表關(guān)聯(lián)
實(shí)驗(yàn)10 大數(shù)據(jù)可視化
參考文獻(xiàn)