大數(shù)據(jù)平臺運(yùn)維是大數(shù)據(jù)應(yīng)用人才培養(yǎng)的基本技能之一。本書講解了大數(shù)據(jù)平臺運(yùn)維過程中的各個主要階段及其任務(wù),主要包括安裝部署、優(yōu)化監(jiān)控、架構(gòu)原理、生態(tài)系統(tǒng)、運(yùn)維工具等。本書內(nèi)容全面,涵蓋了Hadoop生態(tài)絕大部分組件的運(yùn)維,兼具基礎(chǔ)理論與運(yùn)維實(shí)踐經(jīng)驗(yàn);主要特色是將知識點(diǎn)凝練到圖形中,通過視覺記憶,看圖聯(lián)想,理解知識點(diǎn)的含義
本書介紹大數(shù)據(jù)技術(shù)的基本概念和相應(yīng)的技術(shù)應(yīng)用。全書共為10章,分別是大數(shù)據(jù)介紹、云計算基礎(chǔ)、大數(shù)據(jù)架構(gòu)、數(shù)據(jù)采集、數(shù)據(jù)清洗、大數(shù)據(jù)存儲、大數(shù)據(jù)分析與挖掘、大數(shù)據(jù)可視化、大數(shù)據(jù)安全和大數(shù)據(jù)的行業(yè)應(yīng)用。本書將理論與實(shí)踐操作相結(jié)合,通過大量的案例幫助讀者快速了解和應(yīng)用大數(shù)據(jù)相關(guān)基本技術(shù),并對書中重要的、核心的知識點(diǎn)加大練習(xí)的
本書以面向應(yīng)用、面向?qū)崙?zhàn)為指導(dǎo)思想,緊扣企業(yè)技術(shù)人才培養(yǎng)的特點(diǎn),在知識點(diǎn)講解和實(shí)驗(yàn)中避免復(fù)雜的理論,使學(xué)生能快速上手體驗(yàn)、驗(yàn)證大數(shù)據(jù)處理的魅力,以激發(fā)學(xué)生的學(xué)習(xí)興趣。本書覆蓋了大數(shù)據(jù)生命周期主要技術(shù)要點(diǎn),全書共8章。第1章介紹大數(shù)據(jù)的產(chǎn)生和特點(diǎn)及思維的變革,第2章了解大數(shù)據(jù)生態(tài)環(huán)境,第3章-第7章是按照大數(shù)據(jù)的生命周期
該書通過對數(shù)據(jù)庫和信息系統(tǒng)中的數(shù)據(jù)與信息質(zhì)量的現(xiàn)狀和未來發(fā)展進(jìn)行充分、完整而全面的綜述,對組成數(shù)據(jù)與信息質(zhì)量研究核心的技術(shù)進(jìn)行了深入探討,包括對象識別、數(shù)據(jù)集成、錯誤定位與糾正等,并在一個原創(chuàng)框架下對相關(guān)技術(shù)進(jìn)行比較研究。該書除了將數(shù)據(jù)與信息質(zhì)量作為獨(dú)立研究領(lǐng)域進(jìn)行系統(tǒng)描述,還包括了從其他領(lǐng)域借鑒的研究成果,如概率論、
本書采用項目驅(qū)動方式,從理論到實(shí)踐,由淺入深地設(shè)計了17個項目,包括認(rèn)識大數(shù)據(jù)分析、Python數(shù)據(jù)分析工具、numpy數(shù)據(jù)分析和處理、Pandas數(shù)據(jù)分析和處理、Matplotlib數(shù)據(jù)分析可視化、基于HADOOP的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)。
本書系統(tǒng)闡述了Pandas基礎(chǔ)知識、應(yīng)用原理,以及應(yīng)用流程和應(yīng)用技巧等實(shí)戰(zhàn)知識。全書共分為5篇:第一篇為入門篇(第1和2章),第二篇為基礎(chǔ)篇(第3和4章),第三篇為基礎(chǔ)強(qiáng)化篇(第5-7章),第四篇為進(jìn)階篇(第8-11章),第五篇為案例篇(第12章)。書中主要內(nèi)容包括Python簡介、NumPy基礎(chǔ)、Pandas入門、數(shù)
這是一本從實(shí)戰(zhàn)角度解讀如何進(jìn)行智能數(shù)據(jù)分析及搭建智能數(shù)據(jù)分析平臺的工具書,目的是幫助讀者全面認(rèn)識并在實(shí)際工作中靈活使用智能數(shù)據(jù)分析,同時構(gòu)建可用的智能數(shù)據(jù)分析環(huán)境。本書不僅包含關(guān)于智能數(shù)據(jù)分析的基礎(chǔ)知識,還包含進(jìn)行智能數(shù)據(jù)分析必備的方法、工具、案例,以及平臺的搭建方案。全書共分為8章。第1-2章在全面剖析了智能數(shù)據(jù)分析
《Offer來敲門大數(shù)據(jù)開發(fā)面試筆試精講在線真題實(shí)訓(xùn)視頻版》圍繞大數(shù)據(jù)開發(fā)的相關(guān)技術(shù),以大數(shù)據(jù)開發(fā)的基本要求為綱,以企業(yè)在筆試和面試中的試題為核心,從企業(yè)考核的角度組織內(nèi)容,并對這些試題加上了詳細(xì)的分析說明,以考促學(xué)!禣ffer來敲門大數(shù)據(jù)開發(fā)面試筆試精講在線真題實(shí)訓(xùn)視頻版》既包括Java、Python等基礎(chǔ)編程知識
本教材基于數(shù)據(jù)技術(shù)概念的提出,建立由數(shù)據(jù)生成、數(shù)據(jù)組織管理與數(shù)據(jù)信息汲取三個模塊構(gòu)成的數(shù)據(jù)技術(shù)應(yīng)用全流程體系框架。通過對計算機(jī)信息系統(tǒng)、抽樣技術(shù)與數(shù)據(jù)庫系統(tǒng)等基礎(chǔ)技術(shù)原理的概念化解讀,以及對網(wǎng)絡(luò)爬蟲與文本數(shù)據(jù)生成、SQL語言、數(shù)據(jù)預(yù)處理、回歸模型、Logistic建模、關(guān)聯(lián)規(guī)則、決策樹分類規(guī)則、K-平均聚類、神經(jīng)網(wǎng)絡(luò)、
本書主要內(nèi)容包括大數(shù)據(jù)概論、初識Hadoop、Linux基礎(chǔ)、Hadoop集群搭建、HDFS分布式文件系統(tǒng)、MapReduce分布式計算框架、以及項目實(shí)戰(zhàn)--美國新冠疫情covid-19分析。 本書將理論與實(shí)踐結(jié)合,補(bǔ)充相關(guān)Linux基礎(chǔ),注重大數(shù)據(jù)技術(shù)的系統(tǒng)性、實(shí)用性和先進(jìn)性,配有大量的應(yīng)用案例,不僅能夠幫助提高大