這本書的目的是幫助所有人通過R使用ApacheSpark。第1章~第5章,簡單地介紹了如何大規(guī)模執(zhí)行數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)項(xiàng)目。第6~9章介紹了使用Spark進(jìn)行集群計(jì)算中令人激動(dòng)的基本概念。第10章~第13章涵蓋一些高級主題,包括分布式R、Streaming和社區(qū)貢獻(xiàn)等。
《大數(shù)據(jù)處理:從采集到可視化》共分為9章,章數(shù)據(jù)采集,主要介紹了大數(shù)據(jù)的概念、類型及其特征,常見的數(shù)據(jù)采集方法;第2章數(shù)據(jù)清洗,主要討論數(shù)據(jù)質(zhì)量的維度,數(shù)據(jù)可能存在的質(zhì)量問題,常見的數(shù)據(jù)清洗方法;第3章數(shù)據(jù)ETL,重點(diǎn)介紹了MGO方法;第4章數(shù)據(jù)存儲(chǔ),主要介紹了大數(shù)據(jù)時(shí)代的一些主流數(shù)據(jù)存儲(chǔ)平臺和相關(guān)技術(shù);第5章回歸算法
《大數(shù)據(jù)計(jì)算機(jī)基礎(chǔ)(第2版)/大數(shù)據(jù)分析統(tǒng)計(jì)應(yīng)用叢書》是中國人民大學(xué)、北京大學(xué)、中國科學(xué)院大學(xué)、中央財(cái)經(jīng)大學(xué)、首都經(jīng)濟(jì)貿(mào)易大學(xué)五所高校聯(lián)合培養(yǎng)大數(shù)據(jù)分析碩士實(shí)驗(yàn)班的計(jì)算機(jī)基礎(chǔ)教材,目標(biāo)是培養(yǎng)學(xué)生掌握大數(shù)據(jù)分析處理必備的計(jì)算機(jī)基礎(chǔ)知識與技能。
l數(shù)據(jù)倉庫、大數(shù)據(jù)、數(shù)據(jù)科學(xué)的簡單介紹。l了解企業(yè)建立數(shù)據(jù)湖的各種途徑。l探索如何構(gòu)建自助服務(wù)模型,以及如何讓分析師便捷訪問數(shù)據(jù)的最佳實(shí)踐。l使用不同的方法來構(gòu)建數(shù)據(jù)湖。l了解不同行業(yè)專家實(shí)現(xiàn)數(shù)據(jù)湖的方法。
這是一個(gè)大數(shù)據(jù)爆發(fā)的時(shí)代。面對信息的激流,多元化數(shù)據(jù)的涌現(xiàn),大數(shù)據(jù)已經(jīng)為個(gè)人生活、企業(yè)經(jīng)營,甚至國家與社會(huì)的發(fā)展都帶來了機(jī)遇和挑戰(zhàn),大數(shù)據(jù)已經(jīng)成為IT信息產(chǎn)業(yè)中最具潛力的藍(lán)海。“大數(shù)據(jù)導(dǎo)論”是一門理論性和實(shí)踐性都很強(qiáng)的課程。本書是為高等職業(yè)院校大數(shù)據(jù)技術(shù)與應(yīng)用專業(yè)“大數(shù)據(jù)導(dǎo)論”課程全新設(shè)計(jì)改編的,是一本具有豐富實(shí)踐特色
近年來,以ApacheSpark為代表的大數(shù)據(jù)處理框架在學(xué)術(shù)界和工業(yè)界得到了廣泛的使用。本書以ApacheSpark框架為核心,總結(jié)了大數(shù)據(jù)處理框架的基礎(chǔ)知識、核心理論、典型的Spark應(yīng)用,以及相關(guān)的性能和可靠性問題。本書分9章,主要包含四部分內(nèi)容。第一部分大數(shù)據(jù)處理框架的基礎(chǔ)知識(第1~2章):介紹大數(shù)據(jù)處理框架的
本書以獨(dú)特的方式講解數(shù)據(jù)科學(xué),不僅讓讀者可以輕松學(xué)習(xí)數(shù)據(jù)科學(xué)理論,又可以動(dòng)手(手算和機(jī)算)進(jìn)行數(shù)據(jù)科學(xué)實(shí)戰(zhàn)。本書特色:全彩印刷,圖形、表格、思維導(dǎo)圖豐富;避免深?yuàn)W的數(shù)學(xué)證明,采用簡單的數(shù)學(xué)說明;用各種學(xué)習(xí)圖將本書內(nèi)容貫穿起來;實(shí)戰(zhàn)計(jì)算,包含小型數(shù)據(jù)的演算和大型數(shù)據(jù)的實(shí)戰(zhàn)程序。 本書共13章,內(nèi)容涵蓋豐富的數(shù)據(jù)科學(xué)
概述了OPCUA;介紹如何操作已經(jīng)建立好的OPCUA信息模型;OPCA的應(yīng)用程序架構(gòu)和系統(tǒng)架構(gòu),*后本書對OPCUA協(xié)議子集進(jìn)行介紹,并對OPCUA與傳統(tǒng)OPC的性能進(jìn)行了對比。對于那些需要進(jìn)一步查詢OPCUA詳情的讀者,本書的附錄給出了參考。
本書由國際數(shù)據(jù)挖掘領(lǐng)域泰斗、UIUC韓家瑋教授和其學(xué)生張超博士(現(xiàn)為佐治亞理工學(xué)院助理教授)合著。介紹了將非結(jié)構(gòu)化文本數(shù)據(jù)轉(zhuǎn)換為多維知識的數(shù)據(jù)挖掘技術(shù),并講解了他們開發(fā)的文本多維數(shù)據(jù)集框架的原理和使用方法。
本書是根據(jù)我國當(dāng)前測控技術(shù)與儀器專業(yè)教學(xué)改革和教材建設(shè)的需要而編寫的一本關(guān)于自動(dòng)檢測技術(shù)及儀表的教材。全書共分4篇19章,深入、系統(tǒng)地介紹了自動(dòng)檢測技術(shù)及儀表的相關(guān)理論、原理、技術(shù)及其應(yīng)用等知識。第1篇介紹了檢測技術(shù)及儀表的基本概念及基礎(chǔ)理論,包括檢測技術(shù)及儀表概述、檢測誤差及其處理、信號的描述及其分析、檢測系統(tǒng)及其特