文本挖掘與信息檢索是近年來(lái)人工智能領(lǐng)域的熱點(diǎn)研究方向。本書(shū)共分8章,包括信息檢索概述、信息檢索模型、信息檢索的評(píng)價(jià)、文本分類(lèi)技術(shù)、文本聚類(lèi)技術(shù)、自動(dòng)摘要技術(shù)、文本推薦技術(shù)和網(wǎng)頁(yè)鏈接分析,融合了統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)等知識(shí),具有多學(xué)科交叉的特點(diǎn)。
本書(shū)的主要內(nèi)容有:提取API與網(wǎng)頁(yè)的數(shù)據(jù)。統(tǒng)計(jì)分析和機(jī)器學(xué)習(xí)的文本數(shù)據(jù)預(yù)處理。機(jī)器學(xué)習(xí)分類(lèi)、主題建模與摘要。解釋AI模型與分類(lèi)的結(jié)果。利用單詞嵌入,探索及可視化語(yǔ)義相似性。分析產(chǎn)品評(píng)論中的客戶(hù)情感。根據(jù)命名實(shí)體及其關(guān)系創(chuàng)建知識(shí)圖。JensAlbrecht是紐倫堡理工學(xué)院計(jì)算機(jī)科學(xué)系的全職教授。主要從事數(shù)據(jù)管理與分析領(lǐng)域
本書(shū)分為六章,具體如下:第一章導(dǎo)論,介紹虛假信息定義及威脅、產(chǎn)生虛假信息的原因、社交機(jī)器賬戶(hù)的興起等;第二章虛假信息傳播的研究現(xiàn)狀,包括傳播的參與者、傳播的內(nèi)容、傳播的網(wǎng)絡(luò)與模型等;第三章基于新聞源的虛假信息采集與追蹤系統(tǒng),包括系統(tǒng)原理、系統(tǒng)模型與實(shí)現(xiàn)、系統(tǒng)可行性的再驗(yàn)證、系統(tǒng)部署與數(shù)據(jù)統(tǒng)計(jì)等,第四章基于k-核的網(wǎng)絡(luò)剖
本書(shū)重點(diǎn)介紹收集、分析和解釋數(shù)據(jù)所需的關(guān)鍵技能,以及成為優(yōu)秀數(shù)據(jù)科學(xué)家的基本原則,特別強(qiáng)調(diào)分析數(shù)據(jù)時(shí)什么是真正重要的內(nèi)容。本書(shū)從底層邏輯出發(fā),由淺入深地介紹了數(shù)據(jù)科學(xué)的概念、所需的數(shù)學(xué)基礎(chǔ)、數(shù)據(jù)的整理清洗方法、數(shù)據(jù)分析方法(包括統(tǒng)計(jì)分析、可視化、數(shù)學(xué)模型、線(xiàn)性回歸、logistic回歸、機(jī)器學(xué)習(xí)算法等)以及學(xué)習(xí)大數(shù)據(jù)分
本書(shū)從計(jì)算機(jī)控制系統(tǒng)的信號(hào)轉(zhuǎn)換開(kāi)始,詳細(xì)闡述了計(jì)算機(jī)控制系統(tǒng)的建模、性能分析、控制器設(shè)計(jì)及控制系統(tǒng)仿真與實(shí)現(xiàn)的理論、方法和實(shí)用技術(shù)。
本書(shū)簡(jiǎn)要闡述了數(shù)據(jù)治理的基本概念及相關(guān)理論,側(cè)重于數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)集成兩方面,介紹相關(guān)基本理論的同時(shí),詳細(xì)描述了自主研發(fā)的數(shù)據(jù)質(zhì)量管理系統(tǒng)和多源數(shù)據(jù)匯集處理系統(tǒng);谶@些數(shù)據(jù)治理軟件,結(jié)合具體的實(shí)際案例,詳細(xì)描述了數(shù)據(jù)質(zhì)量管理與數(shù)據(jù)集成的典型功能。本書(shū)案例內(nèi)容豐富,步驟翔實(shí)具體,有助于讀者在理解數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)集成
本書(shū)內(nèi)容按照數(shù)學(xué)知識(shí)的由淺入深分成了四個(gè)部分。基本分析部分介紹了非線(xiàn)性系統(tǒng)的基本概念和基本分析方法;反饋系統(tǒng)分析部分介紹了輸入輸出穩(wěn)定性、無(wú)源性和反饋系統(tǒng)的頻域分析;現(xiàn)代分析部分介紹了現(xiàn)代穩(wěn)定性分析的基本概念、擾動(dòng)系統(tǒng)的穩(wěn)定性、擾動(dòng)理論和平均化以及奇異擾動(dòng)理論;非線(xiàn)性反饋控制部分介紹了反饋控制的基本概念的反饋線(xiàn)性化,并
本書(shū)系統(tǒng)梳理總結(jié)ApacheHadoop大數(shù)據(jù)相關(guān)技術(shù),介紹大數(shù)據(jù)存儲(chǔ)、并行計(jì)算、數(shù)據(jù)處理等內(nèi)容,幫助讀者形成對(duì)大數(shù)據(jù)知識(shí)體系及其應(yīng)用領(lǐng)域的輪廓性認(rèn)識(shí),為讀者在大數(shù)據(jù)領(lǐng)域進(jìn)行更深入的學(xué)習(xí)和研究奠定基礎(chǔ)、指明方向。
本書(shū)基礎(chǔ)理論和案例分析相結(jié)合,全面介紹了大數(shù)據(jù)技術(shù)的基礎(chǔ)知識(shí),以提升讀者對(duì)大數(shù)據(jù)的認(rèn)知。全書(shū)共11章,內(nèi)容包括大數(shù)據(jù)概述、大數(shù)據(jù)時(shí)代的思維變革、大數(shù)據(jù)的采集與存儲(chǔ)、數(shù)據(jù)可視化、支撐大數(shù)據(jù)的技術(shù)、商業(yè)大數(shù)據(jù)、民生大數(shù)據(jù)、工業(yè)大數(shù)據(jù)、政務(wù)大數(shù)據(jù)、安全大數(shù)據(jù)和大數(shù)據(jù)的未來(lái)。本書(shū)既可作為全國(guó)高等學(xué)校計(jì)算機(jī)及相關(guān)專(zhuān)業(yè)“大數(shù)據(jù)導(dǎo)論
《精通Hadoop3》詳細(xì)闡述了與Hadoop3相關(guān)的基礎(chǔ)知識(shí),主要包括Hadoop3簡(jiǎn)介、深入理解Hadoop分布式文件系統(tǒng)、YARN資源管理器、MapReduce內(nèi)部機(jī)制、Hadoop中的SQL、實(shí)時(shí)處理引擎、Hadoop生態(tài)圈組件、定義Hadoop中的應(yīng)用程序、Hadoop中的實(shí)時(shí)流處理、Hadoop中的機(jī)器學(xué)習(xí)