本書采用理論知識(shí)與任務(wù)案例相結(jié)合的形式,以PyCharm為主要開發(fā)工具,系統(tǒng)地闡述大數(shù)據(jù)分析處理流程中的常用的第三方庫。全書共13個(gè)單元,單元1介紹大數(shù)據(jù)分析的概念等內(nèi)容;單元2和單元3介紹使用numpy與pandas實(shí)現(xiàn)科學(xué)計(jì)算與統(tǒng)計(jì)分析的相關(guān)知識(shí);單元4-單元7介紹使用pandas實(shí)現(xiàn)數(shù)據(jù)預(yù)處理的方法;單元8介紹使
《數(shù)據(jù)治理——理論、方法與實(shí)踐》關(guān)注以數(shù)據(jù)為關(guān)鍵要素的數(shù)字經(jīng)濟(jì)時(shí)代背景下的數(shù)據(jù)治理問題,分為8章。第1、2章以數(shù)據(jù)治理基礎(chǔ)概念作為鋪墊,重點(diǎn)對(duì)數(shù)據(jù)、數(shù)據(jù)治理以及數(shù)據(jù)治理體系所涵蓋的內(nèi)容進(jìn)行全面梳理,明晰數(shù)據(jù)治理的現(xiàn)狀、趨勢,并進(jìn)行國內(nèi)外數(shù)據(jù)治理理念與體系的比較;第3~7章是數(shù)據(jù)治理核心問題探討,重點(diǎn)對(duì)數(shù)據(jù)開放、數(shù)據(jù)交易
本書共分三個(gè)部分,分別是基礎(chǔ)篇、實(shí)踐篇和拓展篇;A(chǔ)篇是對(duì)整個(gè)課程的歷史、背景和技術(shù)原理的解釋部分,基礎(chǔ)篇包含三個(gè)項(xiàng)目,講解了的大數(shù)據(jù)處理流程、大數(shù)據(jù)存儲(chǔ)架構(gòu)、大數(shù)據(jù)存儲(chǔ)技術(shù)路線等知識(shí)。實(shí)踐篇?jiǎng)t是更偏重于理論的實(shí)驗(yàn)部分,實(shí)驗(yàn)內(nèi)容較多,注重簡單、易學(xué)和實(shí)用等原則,實(shí)踐篇包含三個(gè)項(xiàng)目,講解了結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)技術(shù)路線、Post
本書按照“理論+實(shí)戰(zhàn)”的形式編寫,將企業(yè)項(xiàng)目需求分解為單獨(dú)的任務(wù),全面系統(tǒng)地講解了大數(shù)據(jù)采集與預(yù)處理的相關(guān)知識(shí)與技術(shù)。全書針對(duì)數(shù)據(jù)采集的不同來源,將知識(shí)內(nèi)容分為五個(gè)項(xiàng)目,包括網(wǎng)絡(luò)數(shù)據(jù)采集、分布式消息系統(tǒng)Kafka、實(shí)時(shí)數(shù)據(jù)庫采集工具Canal和Maxwell、ETL日志采集技術(shù)棧以及ETL工具——Kettle。本書針對(duì)
全書共9章,內(nèi)容涉及數(shù)據(jù)采集、環(huán)境部署、Kettle安裝及應(yīng)用、pandas應(yīng)用以及Python應(yīng)用案例,由淺入深地介紹了數(shù)據(jù)可視化的基礎(chǔ)內(nèi)容。
"本書是一本面向大數(shù)據(jù)基礎(chǔ)知識(shí)學(xué)習(xí)、基本技能訓(xùn)練和場景應(yīng)用的項(xiàng)目化教程。全書共分為8個(gè)單元,內(nèi)容包括初識(shí)大數(shù)據(jù)、Linux應(yīng)用基礎(chǔ)、大數(shù)據(jù)存儲(chǔ)與計(jì)算、大數(shù)據(jù)編程基礎(chǔ)、數(shù)據(jù)采集與預(yù)處理、數(shù)據(jù)分析與挖掘、數(shù)據(jù)可視化、大數(shù)據(jù)典型行業(yè)應(yīng)用分析。本書知識(shí)點(diǎn)全面,融合了大數(shù)據(jù)應(yīng)用開發(fā)的新技術(shù)和多個(gè)典型行業(yè)應(yīng)用場景,突出情境案例導(dǎo)引
本書以大數(shù)據(jù)分析與挖掘的常用技術(shù)與真實(shí)案例相結(jié)合的方式,按照“概念和原理講解、案例分析、能力拓展——Python軟件應(yīng)用”的層次進(jìn)行闡述,深入淺出地介紹大數(shù)據(jù)分析與挖掘的重要內(nèi)容。全書共11章,第1章作為全書的緒論,介紹了大數(shù)據(jù)分析與挖掘的基本概念、行業(yè)應(yīng)用等;第2章介紹了Python的安裝、編程基礎(chǔ)以及常用的數(shù)據(jù)分析
Spark是業(yè)界主流的大數(shù)據(jù)計(jì)算框架。本書通過一系列大數(shù)據(jù)應(yīng)用案例和實(shí)踐項(xiàng)目貫穿始終,使用Python詳細(xì)闡述了Spark大數(shù)據(jù)環(huán)境的搭建、SparkRDD離線數(shù)據(jù)計(jì)算、SparkSQL離線數(shù)據(jù)處理、SparkStreaming實(shí)時(shí)數(shù)據(jù)計(jì)算等一系列常見的大數(shù)據(jù)處理問題,并在此基礎(chǔ)上對(duì)Spark的核心概念及技術(shù)原理進(jìn)行了
本書第4版根據(jù)計(jì)算機(jī)控制與網(wǎng)絡(luò)技術(shù)的發(fā)展,基于工業(yè)界、科技界和教育界的成果進(jìn)行了全面修訂。本書面向新工科建設(shè)、工程教育專業(yè)認(rèn)證和卓越工程人才培養(yǎng)計(jì)劃,以立德樹人為根本任務(wù),以科學(xué)家精神、企業(yè)家精神、工匠精神等中國精神為動(dòng)力,以培養(yǎng)學(xué)生解決復(fù)雜工程和實(shí)際問題的綜合能力為出發(fā)點(diǎn),以主流機(jī)型PC/ISA/PCI/PCIE總
本書是備受廣大讀者推崇的數(shù)據(jù)結(jié)構(gòu)與算法入門教程,已在GitHub獲得超60k的Star,并多次登頂GitHubTrending。書中系統(tǒng)介紹了數(shù)據(jù)結(jié)構(gòu)與算法基礎(chǔ)、復(fù)雜度分析、數(shù)組與鏈表、棧與隊(duì)列、哈希表、樹、堆、圖、搜索、排序、分治、回溯、動(dòng)態(tài)規(guī)劃和貪心算法等核心知識(shí),通過清晰易懂的解釋和豐富的代碼示例,以及生動(dòng)形象的