本書(shū)是作者基于其多年的科研經(jīng)驗(yàn)而撰寫(xiě)的聚類(lèi)分析專(zhuān)著。全書(shū)從基礎(chǔ)知識(shí)和實(shí)際應(yīng)用兩方面系統(tǒng)地介紹了聚類(lèi)分析方法;A(chǔ)知識(shí)部分闡述了聚類(lèi)分析基本過(guò)程、數(shù)據(jù)預(yù)處理、相似度計(jì)算、驗(yàn)證指標(biāo)、常見(jiàn)聚類(lèi)方法原理和特點(diǎn),并給出了應(yīng)用實(shí)例和程序供讀者參考。應(yīng)用部分則針對(duì)高維數(shù)據(jù)非監(jiān)督學(xué)習(xí)問(wèn)題,分別以心電識(shí)別、腦電識(shí)別、行為識(shí)別以及智能材料
本書(shū)為一本大數(shù)據(jù)技術(shù)的入門(mén)書(shū)籍,介紹Hadoop大數(shù)據(jù)平臺(tái)和Spark大數(shù)據(jù)平臺(tái)及相關(guān)工具的原理,以及如何進(jìn)行部署和簡(jiǎn)單開(kāi)發(fā)。全書(shū)包含13章:第1、2章介紹如何為深入學(xué)習(xí)Hadoop和Spark做環(huán)境準(zhǔn)備,包括VMware虛擬機(jī)的創(chuàng)建和CentOS操作系統(tǒng)安裝。第3~6章介紹Hadoop大數(shù)據(jù)平臺(tái)的基本原理,包括HDF
數(shù)據(jù)管道通過(guò)整合、清理、分析、可視化等方式來(lái)管理初始收集的數(shù)據(jù)流。ApacheAirflow提供了一個(gè)統(tǒng)一的平臺(tái),可以使用它設(shè)計(jì)、實(shí)施、監(jiān)控和維護(hù)數(shù)據(jù)的流動(dòng)。Airflow具有易于使用的UI、即插即用的選項(xiàng)以及靈活的Python腳本,這些都使Airflow能夠非常輕松地完成任何數(shù)據(jù)管理任務(wù)。在《ApacheAirflo
本書(shū)基于“基礎(chǔ)知識(shí)”+“代碼示例”+“應(yīng)用案例”的模式編寫(xiě),共包括7個(gè)項(xiàng)目。項(xiàng)目1主要介紹互聯(lián)網(wǎng)數(shù)據(jù)采集的入門(mén)知識(shí);項(xiàng)目2通過(guò)一個(gè)入門(mén)級(jí)的簡(jiǎn)單案例,介紹互聯(lián)網(wǎng)數(shù)據(jù)采集的基本流程;項(xiàng)目3通過(guò)一個(gè)進(jìn)階的案例,詳細(xì)介紹在沒(méi)有給出官方開(kāi)放API的情況下,如何通過(guò)抓包工具獲取XHR請(qǐng)求地址;項(xiàng)目4主要介紹HTML文檔數(shù)據(jù)的采集,
文本數(shù)據(jù)挖掘是通過(guò)機(jī)器學(xué)習(xí)、自然語(yǔ)言處理和推理等相關(guān)技術(shù)或方法,理解、分析和挖掘文本的內(nèi)容,從而完成信息抽取、關(guān)系發(fā)現(xiàn)、熱點(diǎn)預(yù)測(cè)、文本分類(lèi)和自動(dòng)摘要等具體任務(wù)的信息處理技術(shù)!段谋緮(shù)據(jù)挖掘(第2版)》主要介紹與文本數(shù)據(jù)挖掘有關(guān)的基本概念、理論模型和實(shí)現(xiàn)算法,包括數(shù)據(jù)預(yù)處理、文本表示、文本分類(lèi)、文本聚類(lèi)、主題模型、情感分
本書(shū)系統(tǒng)介紹了智能調(diào)度領(lǐng)域的理論知識(shí),清晰地勾勒出智能調(diào)度的知識(shí)體系。全書(shū)共7章,分別是:緒論、智能調(diào)度的理論基礎(chǔ)、單機(jī)調(diào)度問(wèn)題、并行機(jī)調(diào)度問(wèn)題、開(kāi)放車(chē)間調(diào)度、流水車(chē)間調(diào)度和作業(yè)車(chē)間調(diào)度。全書(shū)系統(tǒng)、深入淺出地講解了智能調(diào)度的理論知識(shí),同時(shí)強(qiáng)化了各調(diào)度類(lèi)型的數(shù)學(xué)模型和優(yōu)化方法,重點(diǎn)培養(yǎng)分析問(wèn)題與解決調(diào)度問(wèn)題的能力。為幫助
本書(shū)為普通高等教育十一五國(guó)家級(jí)規(guī)劃教材。本書(shū)從工程應(yīng)用的角度出發(fā),注重基礎(chǔ)性、系統(tǒng)性和實(shí)用性,較深入地介紹計(jì)算機(jī)控制系統(tǒng)的基本知識(shí)、分析和設(shè)計(jì)方法。全書(shū)共10章,包括:緒論、計(jì)算機(jī)控制系統(tǒng)設(shè)計(jì)的硬件基礎(chǔ)、計(jì)算機(jī)控制系統(tǒng)的數(shù)學(xué)基礎(chǔ)、計(jì)算機(jī)控制系統(tǒng)特性分析、計(jì)算機(jī)控制系統(tǒng)的間接設(shè)計(jì)方法、計(jì)算機(jī)控制系統(tǒng)的直接設(shè)計(jì)方法、數(shù)字控
本書(shū)系統(tǒng)地介紹了Hadoop、Spark、Flink等開(kāi)源大數(shù)據(jù)組件的相關(guān)知識(shí)和實(shí)踐技能。全書(shū)共9章,涉及大數(shù)據(jù)采集、大數(shù)據(jù)存儲(chǔ)與管理、大數(shù)據(jù)處理與分析等大數(shù)據(jù)應(yīng)用生命周期中各階段典型組件的部署、使用和基本編程方法,內(nèi)容包括部署全分布模式Hadoop集群、HDFS實(shí)戰(zhàn)、MapReduce編程、部署ZooKeeper集群
本書(shū)介紹了克服日常面臨的各種挑戰(zhàn)的實(shí)踐知識(shí),以及各種數(shù)據(jù)科學(xué)解決方案,主要包括數(shù)據(jù)科學(xué)概論,機(jī)器學(xué)習(xí)模型測(cè)試,人工智能基礎(chǔ),理想的數(shù)據(jù)科學(xué)團(tuán)隊(duì),數(shù)據(jù)科學(xué)團(tuán)隊(duì)招聘面試,組建數(shù)據(jù)科學(xué)團(tuán)隊(duì),創(chuàng)新管理,管理數(shù)據(jù)科學(xué)項(xiàng)目,數(shù)據(jù)科學(xué)項(xiàng)目的常見(jiàn)陷阱,創(chuàng)造產(chǎn)品與提升可重用性,實(shí)施ModelOps,建立技術(shù)棧和結(jié)論。本書(shū)的目標(biāo)讀者是希望
大計(jì)算是融合了算力生產(chǎn)、算力傳輸和算力服務(wù)的一個(gè)綜合體,通過(guò)深度應(yīng)用云計(jì)算、大數(shù)據(jù)、人工智能等新興技術(shù),有力支撐了我國(guó)數(shù)字經(jīng)濟(jì)發(fā)展。本書(shū)從技術(shù)和應(yīng)用兩個(gè)角度出發(fā),系統(tǒng)總結(jié)了作者多年來(lái)在云計(jì)算、大數(shù)據(jù)、人工智能、數(shù)據(jù)中心等領(lǐng)域的工作實(shí)踐經(jīng)驗(yàn),在闡述大計(jì)算相關(guān)理論的基礎(chǔ)上,結(jié)合國(guó)際最新技術(shù)發(fā)展方向及典型應(yīng)用案例進(jìn)行編寫(xiě),并