欧美人c交zooz0oxx,色八A级在线观看

《Hadoop大數(shù)據(jù)技術(shù)基礎(chǔ)（Python版）微課視頻版》從初學(xué)者角度出發(fā)，通過豐富的示例和實戰(zhàn)項目，詳細(xì)講解大數(shù)據(jù)開發(fā)環(huán)境、關(guān)鍵技術(shù)及其應(yīng)用。全書共分10章，第1~9章的內(nèi)容分別為大數(shù)據(jù)概述、Linux系統(tǒng)的安裝與使用、Python 3語言基礎(chǔ)、Hadoop開發(fā)環(huán)境、HDFS技術(shù)、MapReduce技術(shù)、Hive數(shù)據(jù)倉庫、HBase分布式數(shù)據(jù)庫、Sqoop工具，第10章詳細(xì)解析了實戰(zhàn)項目貨運車分布分析平臺，幫助初學(xué)者快速入門。本書所有知識點都結(jié)合具體的編程示例，對于重要知識點提供視頻講解，還設(shè)計了多個實訓(xùn)，使讀者通過實踐環(huán)節(jié)加強對知識點的理解和掌握。本書適合作為高等院校計算機(jī)應(yīng)用、大數(shù)據(jù)技術(shù)及相關(guān)專業(yè)的教材，也適合作為大數(shù)據(jù)技術(shù)相關(guān)培訓(xùn)的教材和大數(shù)據(jù)技術(shù)初學(xué)者的自學(xué)資料。

1. 為什么要學(xué)習(xí)本書
隨著5G、工業(yè)互聯(lián)網(wǎng)、人工智能等前沿科技的發(fā)展，工業(yè)大數(shù)據(jù)將從探索起步階段邁入縱深發(fā)展階段，迎來快速發(fā)展的機(jī)遇期，全球工業(yè)大數(shù)據(jù)行業(yè)的競爭也將變得更為激烈。隨著市場數(shù)據(jù)增長的加劇，國家對數(shù)據(jù)服務(wù)的要求也越來越多樣化、專業(yè)化、快速化，大數(shù)據(jù)的存儲和分析無疑對所有數(shù)據(jù)企業(yè)是一個挑戰(zhàn)。
Apache Hadoop是用于大規(guī)模數(shù)據(jù)存儲及處理的分析引擎，具有高可靠性、高效性、高擴(kuò)展性、高容錯性、低成本等特點，并且在Hadoop生態(tài)體系中，包含了分布式文件存儲系統(tǒng)、分布式計算系統(tǒng)、分布式列存儲數(shù)據(jù)庫、分布式協(xié)作服務(wù)、數(shù)據(jù)倉庫等多方面的解決方案，深受廣大軟件開發(fā)工程師的喜愛。對于想從事大數(shù)據(jù)行業(yè)的開發(fā)人員來說，學(xué)好Hadoop尤為重要。
Hadoop技術(shù)功能強大，涉及知識面較廣，沒有基礎(chǔ)的讀者很難深入Hadoop體系架構(gòu)之中，因此本書采用理論和案例相結(jié)合的講解方式，將知識點由淺入深、由易到難地進(jìn)行解析，讓初學(xué)者能夠在逐漸深入的學(xué)習(xí)過程中掌握Hadoop的生態(tài)體系。
2. 本書內(nèi)容
本書共分10章，各章內(nèi)容簡介如下。
第1章主要介紹大數(shù)據(jù)的產(chǎn)生與發(fā)展，以及大數(shù)據(jù)技術(shù)的生態(tài)工具。通過本章的學(xué)習(xí)，讀者應(yīng)了解為什么要學(xué)習(xí)大數(shù)據(jù)、大數(shù)據(jù)生態(tài)系統(tǒng)有哪些成員。
第2章主要介紹Linux系統(tǒng)的安裝、基本命令操作、權(quán)限與目錄管理、文件操作及網(wǎng)絡(luò)配置。通過本章的學(xué)習(xí)，讀者應(yīng)掌握Linux系統(tǒng)的常用操作。
第3章主要介紹Python 3語言的基礎(chǔ)語法。通過本章的學(xué)習(xí)，讀者應(yīng)掌握Python 3環(huán)境的安裝與配置，熟悉Python 3的基礎(chǔ)語法。
第4章主要介紹Hadoop生態(tài)圈常用工具和Hadoop大數(shù)據(jù)集群環(huán)境的搭建。通過本章的學(xué)習(xí)，讀者應(yīng)掌握Hadoop大數(shù)據(jù)集群環(huán)境的搭建及Hadoop大數(shù)據(jù)集群常見問題的處理。
第5章主要介紹HDFS的工作原理及HDFS的操作。通過本章的學(xué)習(xí)，讀者應(yīng)掌握HDFS的工作原理、HDFS命令與HDFS API的常用操作，并且能夠使用API解決實際問題。
第6章主要介紹MapReduce的工作原理及API的操作。通過本章的學(xué)習(xí)，讀者應(yīng)掌握MapReduce的工作原理和API的常用操作，并且能夠使用MRJob模型編程解決實際問題。
第7章主要介紹Hive數(shù)據(jù)倉庫的工作原理、Hive環(huán)境的搭建和HiveQL的使用。通過本章的學(xué)習(xí)，讀者應(yīng)掌握Hive環(huán)境的安裝與配置，熟悉HiveQL的基礎(chǔ)語法，并且能夠使用HiveQL解決實際問題。
第8章主要介紹HBase分布式數(shù)據(jù)庫的數(shù)據(jù)模型以及操作方式。通過本章的學(xué)習(xí)，讀者應(yīng)掌握部署HBase集群的方法，了解HBase存儲數(shù)據(jù)的架構(gòu)原理，并且能夠使用HBase分布式數(shù)據(jù)庫解決實際問題。
第9章主要介紹Sqoop工具的環(huán)境搭建及Sqoop工具的使用。通過本章的學(xué)習(xí)，讀者應(yīng)掌握Sqoop工具的安裝和操作，并且能夠使用Sqoop工具實現(xiàn)ETL操作。
第10章主要介紹貨運車分布分析平臺的構(gòu)建、開發(fā)和部署，該平臺是基于HDFS的離線分析項目，使用Python語言對分析結(jié)果進(jìn)行了可視化展示。通過本章的學(xué)習(xí)，讀者應(yīng)掌握如何基于Python語言開發(fā)Hadoop程序。
3. 作者與致謝
本書由劉彬斌著，參與本書的編寫、資料整理、書稿校對、課件制作等工作的有周磊、廖云華、胡涵等。感謝清華大學(xué)出版社專業(yè)嚴(yán)謹(jǐn)?shù)墓ぷ鲬B(tài)度，為本書的順利出版提供了寶貴的意見，并付出了辛勤的勞動。
4. 配套資源
讀者在學(xué)習(xí)本書時，可以配合與本書配套的講解視頻、教學(xué)大綱、PPT課件、習(xí)題和實例源碼等資源，快速提升編程水平和解決實際問題的能力。
讀者掃描本書封底文泉云盤涂層下的二維碼，綁定微信后，即可掃描書中的二維碼觀看對應(yīng)視頻來進(jìn)行學(xué)習(xí)（配有視頻的章節(jié)已在目錄中標(biāo)出）。
教學(xué)大綱、PPT課件、習(xí)題答案和實例源碼等資源可以從清華大學(xué)出版社官方微信公眾號書圈（見封底）下載。關(guān)于本書及資源使用中的問題，請聯(lián)系404905510@qq.com。

編者2022年1月

你還可能感興趣

我要評論