本教材為新商科一流本科專業(yè)群建設(shè)“十四五”規(guī)劃教材之一,“商業(yè)大數(shù)據(jù)分析”為上海商學(xué)院本科專業(yè)核心平臺(tái)課程。全書(shū)共分11個(gè)章節(jié),圍繞開(kāi)源、圖形化商業(yè)大數(shù)據(jù)分析工具為主要內(nèi)容,從大數(shù)據(jù)概述、分析工具、數(shù)據(jù)操作、機(jī)器學(xué)習(xí)基礎(chǔ)、客戶價(jià)值數(shù)據(jù)分析、零件推薦數(shù)據(jù)分析、信貸風(fēng)險(xiǎn)數(shù)據(jù)分析、社交媒體數(shù)據(jù)分析、網(wǎng)頁(yè)瀏覽數(shù)據(jù)分析、交通出行數(shù)據(jù)分析、支付安全的數(shù)據(jù)分析等幾個(gè)方面全面講解商業(yè)大數(shù)據(jù)分析方方面面。具體目錄如下:第1章 大數(shù)據(jù)分析概述1.1數(shù)據(jù)和大數(shù)據(jù)1.2數(shù)據(jù)類型與數(shù)據(jù)格式 1.3大數(shù)據(jù)分析第2章 大數(shù)據(jù)分析工具2.1 KNIME簡(jiǎn)介2.2 KNIME數(shù)據(jù)工作流2.3 KNIME自定義分析環(huán)境2.4 數(shù)據(jù)節(jié)點(diǎn)操作2.5 KNIME數(shù)據(jù)結(jié)構(gòu)和類型第3章 基于KNIME的數(shù)據(jù)操作3.1 讀取數(shù)據(jù)3.2 過(guò)濾數(shù)據(jù)3.3 保存數(shù)據(jù)集3.4 數(shù)據(jù)清洗第4章 機(jī)器學(xué)習(xí)基礎(chǔ)4.1 機(jī)器學(xué)習(xí)概述4.2 機(jī)器學(xué)習(xí)基本方法4.3 模型的評(píng)估與選擇4.4 數(shù)值數(shù)據(jù)的分析——房產(chǎn)價(jià)格預(yù)測(cè)4.5 文本數(shù)據(jù)的分析——關(guān)鍵詞提取4.6 圖像數(shù)據(jù)的分析——圖像識(shí)別第5章 客戶價(jià)值的數(shù)據(jù)分析5.1 客戶價(jià)值概述5.2 客戶價(jià)值數(shù)據(jù)預(yù)處理5.3 客戶價(jià)值分析的算法5.4客戶價(jià)值數(shù)據(jù)分析的實(shí)踐第6章 零售推薦的數(shù)據(jù)分析6.1 推薦系統(tǒng)概述6.2零售數(shù)據(jù)的預(yù)處理(購(gòu)物)6.3 零售推薦分析的算法6.4 零售推薦數(shù)據(jù)分析的實(shí)踐第7章 信貸風(fēng)險(xiǎn)的數(shù)據(jù)分析7.1 信貸風(fēng)險(xiǎn)概述7.2信貸風(fēng)險(xiǎn)數(shù)據(jù)的預(yù)處理7.3 信貸風(fēng)險(xiǎn)分析的算法7.4 信貸風(fēng)險(xiǎn)數(shù)據(jù)分析的實(shí)踐第8章 社交媒體的數(shù)據(jù)分析8.1 社交媒體分析概述8.2社交媒體數(shù)據(jù)的預(yù)處理8.3 社交媒體數(shù)據(jù)分析的算法8.4 社交媒體數(shù)據(jù)分析的實(shí)踐第9章 網(wǎng)頁(yè)瀏覽的數(shù)據(jù)分析9.1 網(wǎng)頁(yè)瀏覽概述9.2網(wǎng)頁(yè)瀏覽數(shù)據(jù)的預(yù)處理9.3網(wǎng)頁(yè)點(diǎn)擊數(shù)據(jù)分析的實(shí)踐第10章 交通出行的數(shù)據(jù)分析10.1 交通出行分析概述10.2交通出行數(shù)據(jù)的預(yù)處理10.3 交通出行數(shù)據(jù)分析的算法10.4 交通出行數(shù)據(jù)分析的實(shí)踐第11章 支付安全的數(shù)據(jù)分析11.1 支付安全概述11.2支付安全數(shù)據(jù)的預(yù)處理11.3 支付安全數(shù)據(jù)分析的算法11.4 支付安全數(shù)據(jù)分析的實(shí)踐
《商業(yè)大數(shù)據(jù)分析》為上海商學(xué)院核心平臺(tái)課,已配套慕課上線智慧樹(shù)在線課程平臺(tái),并申報(bào)*精品課程。本書(shū)與在線課程互為輔助,配套視頻教學(xué),全方面解讀商業(yè)大數(shù)據(jù)的方方面面。教材由淺入深,已開(kāi)源圖形化商業(yè)大數(shù)據(jù)分析工具為主要內(nèi)容,適合文科類學(xué)生學(xué)習(xí)使用,同時(shí)數(shù)據(jù)分析也適合理工類學(xué)生使用,且理論案例比較前沿,屬于國(guó)內(nèi)領(lǐng)先水平。教材配套資源豐富,包括教材相關(guān)軟件安裝包、數(shù)據(jù)模型、課件、試題庫(kù)、案例庫(kù)、MOOC視頻等資源,為教學(xué)提供全面支持。
大數(shù)據(jù)時(shí)代的到來(lái)對(duì)商業(yè)應(yīng)用型人才提出了新的要求,需要掌握大數(shù)據(jù)和人工智能主要技術(shù)和模型,結(jié)合大數(shù)據(jù)分析技能和商業(yè)領(lǐng)域知識(shí),發(fā)現(xiàn)和解決商業(yè)問(wèn)題的復(fù)合型人才。在此背景下,本書(shū)收錄了三個(gè)國(guó)家一流商科和上海一個(gè)一流商科類本科專業(yè)開(kāi)設(shè)的“大數(shù)據(jù)概論”“商業(yè)大數(shù)據(jù)分析”通識(shí)必修課的教學(xué)實(shí)踐,在酒店管理、電子商務(wù)、工商管理、金融學(xué)等專業(yè)中建成了面向?qū)W習(xí)過(guò)程、由淺入深的商業(yè)大數(shù)據(jù)分析課程。
本書(shū)從掌握大數(shù)據(jù)分析系統(tǒng)知識(shí),培養(yǎng)大數(shù)據(jù)獲取,加工、分析和展現(xiàn)能力出發(fā)﹐按照大數(shù)據(jù)分析的流程,全書(shū)分為七章:
第一章“大數(shù)據(jù)分析概述”,介紹大數(shù)據(jù)分析的生態(tài)全貌,介紹大數(shù)據(jù)分析當(dāng)前的總體狀況。
第二章“大數(shù)據(jù)基礎(chǔ)設(shè)施”,介紹大數(shù)據(jù)計(jì)算所需要的軟硬件基礎(chǔ)設(shè)施。第三章“大數(shù)據(jù)采集”,介紹大數(shù)據(jù)的來(lái)源和獲取方式,特別是網(wǎng)絡(luò)爬蟲(chóng)技術(shù)。第四章“數(shù)據(jù)預(yù)處理”,介紹對(duì)原始數(shù)據(jù)的預(yù)處理方式,提高數(shù)據(jù)資源質(zhì)量。
第五章“數(shù)據(jù)存儲(chǔ)與管理”,介紹數(shù)據(jù)庫(kù)系統(tǒng)的相關(guān)知識(shí)和技能﹐是大數(shù)據(jù)存儲(chǔ)的核心部件。
第六章“大數(shù)據(jù)分析”,介紹機(jī)器學(xué)習(xí)的歷史發(fā)展,主要的12種機(jī)器學(xué)習(xí)算法,以及機(jī)器學(xué)習(xí)在商業(yè)分析中的應(yīng)用。
第七章“大數(shù)據(jù)可視化”,介紹大數(shù)據(jù)產(chǎn)品的展現(xiàn)方式。
根據(jù)章節(jié)的知識(shí)點(diǎn),以上各章都設(shè)計(jì)了相關(guān)的大數(shù)據(jù)分析進(jìn)階實(shí)驗(yàn)﹐讓讀者不僅掌握知識(shí),更能運(yùn)用相關(guān)的商業(yè)大數(shù)據(jù)分析技能,做到學(xué)以致用;同時(shí)能加深讀者對(duì)商業(yè)大數(shù)據(jù)知識(shí)的理解,極大地提高讀者對(duì)商業(yè)大數(shù)據(jù)分析學(xué)習(xí)和使用的興趣。
在目前眾多的商業(yè)大數(shù)據(jù)分析工具中,我們選取了國(guó)際著名開(kāi)放、開(kāi)源的圖形化商業(yè)大數(shù)據(jù)分析工具KNIME4.1作為商業(yè)大數(shù)據(jù)分析的實(shí)踐工具。因?yàn)镵NIME完全兼容Python 3計(jì)算機(jī)編程語(yǔ)言,所以可以讓有一定程序設(shè)計(jì)基礎(chǔ)的讀者將Python程序直接在KNIME中運(yùn)行,進(jìn)行大數(shù)據(jù)分析。
本書(shū)作為大數(shù)據(jù)時(shí)代新型立體化教材,涵蓋了商業(yè)大數(shù)據(jù)分析知識(shí)和技能體系,其配套的教學(xué)視頻以及教學(xué)大綱、知識(shí)題庫(kù),課程文檔等教學(xué)資源已在公開(kāi)網(wǎng)站(https : / /coursehome.zhihuishu.com/ courseHome/1000008230/45672/15# teachTeam)上發(fā)布。即便是零基礎(chǔ)的讀者也可以通過(guò)本書(shū)及其配套教學(xué)資源快速地掌握商業(yè)大數(shù)據(jù)初步分析技能。本書(shū)所載的教學(xué)資源在僅僅一學(xué)年內(nèi)已有超過(guò)42所不同類型的全國(guó)高校、10000余人進(jìn)行了線上學(xué)習(xí),教學(xué)效果好,滿意度達(dá)到92.9%,推薦率更是高達(dá)93.4 %。
本書(shū)不僅適合酒店管理、電子商務(wù)、工商管理、金融學(xué),市場(chǎng)營(yíng)銷(xiāo)、商務(wù)經(jīng)濟(jì)學(xué)等商科類專業(yè)的本科生或研究生作為教材使用,也適合大數(shù)據(jù)分析領(lǐng)域的初學(xué)者、從業(yè)者及科技人員作為參考。
本書(shū)的出版受益于2019年上海市高校大學(xué)計(jì)算機(jī)課程教學(xué)改革項(xiàng)目----《商業(yè)大數(shù)據(jù)分析課程群改革與實(shí)踐》。感謝姜紅,蔣傳進(jìn)等各級(jí)院系領(lǐng)導(dǎo)的學(xué)術(shù)指導(dǎo),同事許洪云、李周平和張玲玲等的支持和幫助,也要感謝我的學(xué)生蔡致禮,林哲顯、楊宇林,楊雪晴、陳夏童和王喆等提供的整理和協(xié)助,更要感謝我家人默默的奉獻(xiàn)﹐同時(shí)也很感謝華中科技大學(xué)出版社王乾編輯對(duì)本書(shū)出版提供的寶貴意見(jiàn)。
葉龍,現(xiàn)任上海商學(xué)院信息與計(jì)算機(jī)學(xué)院計(jì)算機(jī)系專職教師、系主任,主要研究方向?yàn)槿斯ぶ悄芗皯?yīng)用,是RedHat、Oracle認(rèn)證高級(jí)工程師。主要從事計(jì)算機(jī)系的教學(xué)、科研和日常管理工作。主講課程有《程序設(shè)計(jì)基礎(chǔ)》、《計(jì)算機(jī)組成原理》、《互聯(lián)網(wǎng)金融》及全英語(yǔ)課程《物聯(lián)網(wǎng)與電子標(biāo)簽》。歷年來(lái)完成校級(jí)以上重點(diǎn)課程建設(shè)項(xiàng)目3項(xiàng),教改項(xiàng)目4項(xiàng),多次指導(dǎo)學(xué)生獲得市級(jí)以上計(jì)算機(jī)類競(jìng)賽獎(jiǎng)項(xiàng)。歷年來(lái)主持、參與校級(jí)以上科研項(xiàng)目3項(xiàng),發(fā)表論文16篇,其中EI 源刊2篇、中文核心1篇,創(chuàng)新型專利2項(xiàng);參編教材3本。
第一章大數(shù)據(jù)分析概述
第一節(jié)數(shù)據(jù)與大數(shù)據(jù)/1
第二節(jié)大數(shù)據(jù)分析/7
第三節(jié)大數(shù)據(jù)分析應(yīng)用/12
第四節(jié)大數(shù)據(jù)崗位需求/15
第二章大數(shù)據(jù)基礎(chǔ)設(shè)施
第一節(jié)大數(shù)據(jù)計(jì)算部件/25
第二節(jié)云計(jì)算/28
第三節(jié)其他云技術(shù)/33
第四節(jié)大數(shù)據(jù)軟件/34
第五節(jié)大數(shù)據(jù)計(jì)算模式/39
第三章大數(shù)據(jù)采集
第一節(jié)大數(shù)據(jù)采集/50
第二節(jié)大數(shù)據(jù)來(lái)源/55
第三節(jié)網(wǎng)絡(luò)爬蟲(chóng)/58
第四章數(shù)據(jù)預(yù)處理
第一節(jié)數(shù)據(jù)預(yù)處理概述/75
第二節(jié)數(shù)據(jù)質(zhì)量/77
第二節(jié)數(shù)據(jù)探索/80
第四節(jié)數(shù)據(jù)清洗/85
第五節(jié)數(shù)據(jù)集成/88
第六節(jié)數(shù)據(jù)規(guī)約/89
第七節(jié)數(shù)據(jù)變換/90
第五章數(shù)據(jù)存儲(chǔ)與管理
第一節(jié)―數(shù)據(jù)管理/107
第二節(jié)數(shù)據(jù)庫(kù)概述/109
第三節(jié)關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)/111
第四節(jié)大數(shù)據(jù)存儲(chǔ)與管理/114
第六章大數(shù)據(jù)分析
第一節(jié)大數(shù)據(jù)分析概述/132
第二節(jié)機(jī)器學(xué)習(xí)/135
第三節(jié)特征工程與數(shù)據(jù)分割/154
第四節(jié)機(jī)器學(xué)習(xí)建模算法/158
第五節(jié)模型的訓(xùn)練與性能評(píng)估/167
第七章大數(shù)據(jù)可視化
第一節(jié)數(shù)據(jù)可視化/181
第二節(jié)視覺(jué)感知/189
第三節(jié)統(tǒng)計(jì)圖/193
第四節(jié)視覺(jué)可視化案例/201
參考文獻(xiàn)