本書(shū)采用“問(wèn)題描述+解決方案”模式,通過(guò)500個(gè)案例介紹了使用Pandas進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)處理的技術(shù)亮點(diǎn)。全書(shū)共分為8章,主要案例包括:讀寫(xiě)CSV、Excel、JSON、HTML等格式的數(shù)據(jù);根據(jù)行標(biāo)簽、列名和行列數(shù)字索引篩選和修改數(shù)據(jù),使用各種函數(shù)根據(jù)數(shù)據(jù)大小、日期范圍、正則表達(dá)式、lambda表達(dá)式、文本類(lèi)型等多
本書(shū)系統(tǒng)介紹Spark大數(shù)據(jù)處理框架。全書(shū)共8章,內(nèi)容包括大數(shù)據(jù)技術(shù)概述、Spark大數(shù)據(jù)處理框架、SparkRDD編程、SparkSQL結(jié)構(gòu)化數(shù)據(jù)處理、HBase分布式數(shù)據(jù)庫(kù)、SparkStreaming流計(jì)算、SparkMLlib機(jī)器學(xué)習(xí)、數(shù)據(jù)可視化。本書(shū)可作為高等院校計(jì)算機(jī)科學(xué)與技術(shù)、信息管理與信息系統(tǒng)、軟件工程
本書(shū)從系統(tǒng)的角度,成體系地研究動(dòng)態(tài)數(shù)據(jù)驅(qū)動(dòng)原理與方法。以數(shù)據(jù)驅(qū)動(dòng)為根本出發(fā)點(diǎn),揭示了復(fù)雜系統(tǒng)的設(shè)計(jì)、運(yùn)行、控制與優(yōu)化規(guī)律,從信號(hào)感知、結(jié)構(gòu)感知、環(huán)境感知、情景感知、語(yǔ)境感知、能量感知、過(guò)程感知、網(wǎng)絡(luò)感知、系統(tǒng)感知等不同維度,介紹了主流的理論與方法,提供了研究復(fù)雜系統(tǒng)問(wèn)題的新思路、新方法。
本書(shū)系統(tǒng)介紹了大數(shù)據(jù)領(lǐng)域的相關(guān)知識(shí),幫助讀者快速了解大數(shù)據(jù)的相關(guān)理論知識(shí)和技術(shù)。全書(shū)一共包含十個(gè)章節(jié),分別為大數(shù)據(jù)概述、大數(shù)據(jù)與其他新型技術(shù)、大數(shù)據(jù)技術(shù)基礎(chǔ)、大數(shù)據(jù)預(yù)采集、大數(shù)據(jù)預(yù)處理、大數(shù)據(jù)存儲(chǔ)、大數(shù)據(jù)處理框架、大數(shù)據(jù)挖掘、大數(shù)據(jù)可視化、大數(shù)據(jù)安全。全書(shū)全面系統(tǒng)地對(duì)大數(shù)據(jù)的相關(guān)知識(shí)進(jìn)行了講述,能夠幫助讀者后續(xù)更好地學(xué)
本專(zhuān)著主要介紹基于數(shù)據(jù)驅(qū)動(dòng)的個(gè)性化需求預(yù)測(cè)理論與方法。根據(jù)交互場(chǎng)景的特點(diǎn),分別從基本交互、交互廣度、交互深度和交互多樣性四個(gè)角度介紹最新個(gè)性化需求預(yù)測(cè)理論與方法。在基本交互場(chǎng)景中,主要研究了基于用戶(hù)和產(chǎn)品的交互的個(gè)性化需求預(yù)測(cè);在交互廣度方面,主要研究了融合用戶(hù)與好友關(guān)系交互以及融合用戶(hù)與群組交互場(chǎng)景的個(gè)性化需求預(yù)測(cè);
數(shù)據(jù)是組織的重要資產(chǎn),做好數(shù)據(jù)管理是盤(pán)活數(shù)據(jù)資源,釋放數(shù)據(jù)價(jià)值的有效手段。本書(shū)以數(shù)據(jù)管理為主題,分為背景篇、標(biāo)準(zhǔn)篇、貫標(biāo)篇、評(píng)估篇和政策篇五個(gè)篇章,首先梳理了數(shù)據(jù)管理的概念、背景和發(fā)展歷程,為讀者建立對(duì)數(shù)據(jù)管理的總體認(rèn)識(shí);其次詳細(xì)解讀國(guó)家標(biāo)準(zhǔn)——數(shù)據(jù)管理能力成熟度評(píng)估模型(以下簡(jiǎn)稱(chēng)DCMM),幫助讀者深入理解DCMM標(biāo)
本書(shū)是在大數(shù)據(jù)時(shí)代已經(jīng)到來(lái)之際,在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域中,在基于數(shù)據(jù)和分析去發(fā)現(xiàn)問(wèn)題并做出科學(xué)、客觀的決策越來(lái)越重要的背景下,為了滿(mǎn)足日益增長(zhǎng)的數(shù)據(jù)分析人才需求,特開(kāi)設(shè)基于Python的《數(shù)據(jù)挖掘與數(shù)據(jù)分析》課程。通過(guò)本課程的學(xué)習(xí),使學(xué)生學(xué)會(huì)使用Python進(jìn)行科學(xué)計(jì)算、可視化繪圖、數(shù)據(jù)處理,分析與建模,并詳細(xì)拆解學(xué)習(xí)
在大數(shù)據(jù)時(shí)代,我們并不缺少數(shù)據(jù),缺少的是利用數(shù)據(jù)分析的思維和工具去解決實(shí)際問(wèn)題的能力。數(shù)據(jù)化分析是運(yùn)用恰當(dāng)?shù)姆椒ê凸ぞ,?duì)數(shù)據(jù)進(jìn)行科學(xué)、有效的分析,從而提出有理有據(jù)、具有可操作性的建議,以解決現(xiàn)實(shí)中的難題。本書(shū)主要介紹了數(shù)據(jù)分析的9種思維、7種工具、學(xué)習(xí)方法、基本方法、展現(xiàn)方法、制作數(shù)據(jù)分析報(bào)告的方法,以及數(shù)據(jù)分析的思
本書(shū)主要從電子商務(wù)數(shù)據(jù)分析入手,系統(tǒng)介紹在電子商務(wù)環(huán)境下進(jìn)行數(shù)據(jù)分析的各種思路和方法。全書(shū)共分為12個(gè)項(xiàng)目,主要內(nèi)容包括初識(shí)電子商務(wù)與數(shù)據(jù)分析、使用數(shù)據(jù)分析工具、分析市場(chǎng)數(shù)據(jù)、分析競(jìng)爭(zhēng)對(duì)手?jǐn)?shù)據(jù)、分析商品定價(jià)數(shù)據(jù)、分析流量數(shù)據(jù)、分析運(yùn)營(yíng)與銷(xiāo)售數(shù)據(jù)、分析庫(kù)存數(shù)據(jù)、分析會(huì)員數(shù)據(jù)、分析利潤(rùn)數(shù)據(jù)、制作數(shù)據(jù)分析報(bào)告,最后一個(gè)項(xiàng)目以
數(shù)據(jù)科學(xué)是一門(mén)全新的學(xué)科,涵蓋了從發(fā)現(xiàn)罪犯到預(yù)測(cè)流行病的信息時(shí)代。但這不僅僅是我們的電腦、智能手機(jī)和信用卡收集的大量信息。本書(shū)為全彩印刷,圖文并茂地探討了數(shù)據(jù)科學(xué)如何在科學(xué)、社會(huì)、商業(yè)、娛樂(lè)和我們的世界的未來(lái)各個(gè)方面影響我們。在本書(shū)中,數(shù)據(jù)科學(xué)領(lǐng)域的專(zhuān)家解釋了該領(lǐng)域的50個(gè)發(fā)人深省的主題,每個(gè)主題,無(wú)論多復(fù)雜,作者都會(huì)