脱了美女的内裤打屁股视频,7160香蕉视频

本書基于云計算和大數(shù)據(jù)，介紹大數(shù)據(jù)處理和分析的技術(shù)，分為兩部分。第一部分介紹Hadoop基礎(chǔ)知識，內(nèi)容包括：Hadoop的介紹和集群構(gòu)建、Hadoop的分部式系統(tǒng)架構(gòu)、MapReduce及其應(yīng)用、Hadoop的版本特征及進化。第二部分以云計算為主題，詳細論述利用Hadoop的大數(shù)據(jù)分析和處理工具，以及NoSQL技術(shù)，內(nèi)容包括：云計算和Hadoop、*服務(wù)中的MapReduce應(yīng)用、Hadoop應(yīng)用下的大數(shù)據(jù)分析、NoSQL、HBase。本書不單純地講述理論和概念，而是基于目具體的工具和技術(shù)(Hadoop和NoSQL)，利用大量實際案例，通過實際的操作和應(yīng)用來組織大數(shù)據(jù)處理和分析技術(shù)，有利于讀者從工程應(yīng)用的角度進行實際掌握和利用。適合相關(guān)專業(yè)的本科生、研究生和軟件工程師學習。

　　前言
　　歐盟的“INFO2000計劃”中對內(nèi)容產(chǎn)業(yè)的定義是：那些制造、開發(fā)、包裝和銷售信息產(chǎn)品及其服務(wù)的企業(yè)，其中包括在各種媒介上的印刷品（報紙、書籍、雜志等）；電子出版物（聯(lián)機數(shù)據(jù)庫、音像制品服務(wù)，以傳真及光盤為基礎(chǔ)的服務(wù)以及電子游戲等）；音像傳播（電視、錄像、廣播和影院），還有一些定義把部分軟件業(yè)（包括課程軟件）也放進去了。
　　“在不久未來，信息服務(wù)內(nèi)容的質(zhì)量高低將取決于如何加工大數(shù)據(jù)”。
　　很久以前就已經(jīng)感覺到，內(nèi)容（contents），在大部分的服務(wù)和產(chǎn)品中，已經(jīng)成為最重要的決定要素。最初由谷歌出世、最近各家廠商紛紛推出的互聯(lián)網(wǎng)電視，就是這樣一個例子，雖然產(chǎn)品硬件各有特色地優(yōu)異，但其中最核心的內(nèi)容提供才是吸引顧客的關(guān)鍵。
　　問題是，隨著互聯(lián)網(wǎng)技術(shù)的急速發(fā)展，構(gòu)建信息內(nèi)容的數(shù)據(jù)量也在急速增加。這類量級巨大、急速增加的數(shù)據(jù)信息我們稱為“大數(shù)據(jù)”。一般來講，當我們說“信息內(nèi)容的質(zhì)量高低取決于如何加工信息大數(shù)據(jù)”的時候，就意味著優(yōu)質(zhì)高效地加工這些信息大數(shù)據(jù)所對應(yīng)的軟件技術(shù)是必需的。
　　我們通過本書試圖和讀者們分享和思考“如何存儲和處理這類信息大數(shù)據(jù)”。我們看到的YouTube或別的視頻網(wǎng)站已經(jīng)在多年前就在思考這些問題：適應(yīng)不同的服務(wù)平臺，從成千上萬個視頻中，根據(jù)顧客的興趣，精心地經(jīng)過推薦和過濾等環(huán)節(jié)，向顧客提供高質(zhì)量的內(nèi)容視頻。本書中，正是要介紹可以簡單地完成這些數(shù)據(jù)加工任務(wù)的開源軟件Hadoop及其關(guān)聯(lián)工具。特別的，對和Hadoop一起用于實際大數(shù)據(jù)分析的專用工具進行了有深度的探討，并基于圖表和案例進行了形象的說明。通過本書，比起對Hadoop的相關(guān)開源代碼的理解來說，作者更著重于讀者在實戰(zhàn)中對實際大數(shù)據(jù)分析平臺的理解和見識。特別是，在數(shù)據(jù)分析處理、平臺架構(gòu)構(gòu)建時針對大數(shù)據(jù)處理所遇見的共通性必需技術(shù)進行了詳細的介紹。
　　第一部分包括第1章Hadoop的介紹和集群構(gòu)建、第2章Hadoop分布式處理文件系統(tǒng)、第3章大數(shù)據(jù)和MapReduce和第4章Hadoop版本特征及進化。該部分從Hadoop的歷史起源起，分析了Hadoop分布式文件系統(tǒng)的系統(tǒng)結(jié)構(gòu)；講述了大數(shù)據(jù)分析所需的軟件框架MapReduce，并通過豐富的應(yīng)用案例，探討了MapReduce應(yīng)用；最后通過對Hadoop版本發(fā)展和各版本特征的講述，描繪了Hadoop的發(fā)展方向。
　　第二部分包括第5章云計算和Hadoop、第6章AmazonElasticMapReduce的倍增利用、第7章Hadoop應(yīng)用下的大數(shù)據(jù)分析、第8章數(shù)據(jù)中的DBMS、NoSQL和第9章HBase：Hadoop中的NoSQL。該部分從云計算的基本概念講起，通過介紹Amazon的主要服務(wù)內(nèi)容，詳細了解將云計算和大數(shù)據(jù)有效結(jié)合的典型云服務(wù)——AmazonHadoop服務(wù)，對Hive、Pig、EC2等可供應(yīng)用的技術(shù)進行了說明；通過了解Mahout、R+RHive和GiraphFramework等工具的設(shè)置方法和應(yīng)用實例，進一步了解大數(shù)據(jù)分析的具體方法；最后介紹了高度綜合大數(shù)據(jù)存儲、實時查詢及分析功能為一體的NoSQL技術(shù)，并詳細講解了Hadoop生態(tài)界中的NoSQL——HBase技術(shù)。
　　本書的讀者包括希望成為數(shù)據(jù)分析師、平臺架構(gòu)師的大學生、研究生和相關(guān)研發(fā)人員們，希望借此對中國的大數(shù)據(jù)的相關(guān)軟件技術(shù)教育有相應(yīng)的貢獻。
　　作者
　　2017年春于西南

你還可能感興趣

我要評論