基于SAP的企業(yè)級實(shí)用數(shù)據(jù)分析
定 價:99 元
- 作者:[美] 格雷格·福斯(Greg Foss) 著,于俊偉 劉楠譯 譯
- 出版時間:2021/3/1
- ISBN:9787111674030
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:F272.7
- 頁碼:272
- 紙張:膠版紙
- 版次:1
- 開本:16開
本書向SAP專業(yè)人員介紹了機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)科學(xué)基本原理,也向數(shù)據(jù)科學(xué)家介紹了SAP系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)服務(wù)等概念和過程。接著介紹了數(shù)據(jù)探索性分析和異常檢測這兩個非常基礎(chǔ)又十分重要的數(shù)據(jù)準(zhǔn)備階段,然后通過模擬Big Bonanza Warehouse的業(yè)務(wù)場景,進(jìn)行基于時間序列的銷量預(yù)測分析、基于聚類的客戶細(xì)分、基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘和基于自然語言處理的情感分析等實(shí)際分析過程。
適讀人群 :SAP業(yè)務(wù)分析師、數(shù)據(jù)分析師,數(shù)據(jù)科學(xué)家
本書向SAP專業(yè)人員介紹了機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)科學(xué)基本原理,也向數(shù)據(jù)科學(xué)家介紹了SAP系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)服務(wù)等概念和過程。接著介紹了數(shù)據(jù)探索性分析和異常檢測這兩個非;A(chǔ)又十分重要的數(shù)據(jù)準(zhǔn)備階段,后通過模擬Big Bonanza Warehouse的業(yè)務(wù)場景,進(jìn)行基于時間序列的銷量預(yù)測分析、基于聚類的客戶細(xì)分、基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘和基于自然語言處理的情感分析等實(shí)際分析過程。
數(shù)據(jù)科學(xué)和人工智能的未來從未像現(xiàn)在這樣光明,F(xiàn)在,人工智能(AI)在多種游戲中都能擊敗人類,從緊張的游戲Pong到需要深入思考的圍棋游戲等。深度學(xué)習(xí)模型識別物體的能力幾乎和人類不相上下。甚至有人說,自動駕駛汽車的表現(xiàn)比那些注意力不集中的人還要好。過去十年來,數(shù)據(jù)量、存儲容量和計算能力的大幅提升,使數(shù)據(jù)科學(xué)得以快速發(fā)展。.當(dāng)然,現(xiàn)在技術(shù)已經(jīng)滲透到業(yè)務(wù)的各個方面,從財務(wù)、銷售到生產(chǎn)和物流。然而,業(yè)務(wù)的每一部分都是由數(shù)據(jù)科學(xué)和人工智能驅(qū)動的嗎?很可能不是。盡管這些技術(shù)非常好,但如果你的工作不是設(shè)計自動駕駛汽車或預(yù)測客戶行為,你可能就不會用到它們。.許多組織可能會從SAP之類的企業(yè)資源計劃(ERP)系統(tǒng)訪問業(yè)務(wù)數(shù)據(jù),你所在的組織可能也不例外。來自SAP這樣的業(yè)務(wù)系統(tǒng)的數(shù)據(jù)在很大程度上是完美的,因?yàn)樵谠试S將其保存到數(shù)據(jù)庫之前,通常會進(jìn)行驗(yàn)證和檢查(數(shù)據(jù)科學(xué)家最重要、回報率最少的一個任務(wù)就是數(shù)據(jù)清洗)。這意味著SAP中的ERP數(shù)據(jù)已經(jīng)“成熟”,而數(shù)據(jù)科學(xué)就是來收獲果實(shí)的!.讓我們來看一個假設(shè)的場景。Big Bonanza Warehouse公司的SAP團(tuán)隊一直在不斷地進(jìn)行流程改進(jìn)。他們知道如何配置SAP系統(tǒng)以完成用戶想要的任務(wù),像拉小提琴一樣操作著這個系統(tǒng),盡職盡責(zé)地接受請求并提供解決方案。然而,在報告和分析方面存在一些問題。他們有一個數(shù)據(jù)倉庫和商業(yè)智能系統(tǒng),但開發(fā)報告是一個耗時幾個月的過程。該團(tuán)隊經(jīng)常使用標(biāo)準(zhǔn)的ALV(ABAP列表查看器)報告,因?yàn)樾枰_發(fā)人員來編寫代碼,所以功能相當(dāng)有限。此外,利用可與SAP結(jié)合使用的公共數(shù)據(jù)也很困難。與許多其他企業(yè)一樣,Big Bonanza Warehouse公司的SAP數(shù)據(jù)就像一座孤島,孤立在自己的系統(tǒng)中。不使用SAP系統(tǒng)的團(tuán)隊不了解這些數(shù)據(jù),而那些使用SAP的團(tuán)隊要花費(fèi)大量的時間維護(hù)系統(tǒng),以至于沒有機(jī)會查看系統(tǒng)外部的數(shù)據(jù)。.可是,SAP數(shù)據(jù)不應(yīng)該是一個孤島。團(tuán)隊人員了解他們的數(shù)據(jù),知道如何找到這些數(shù)據(jù),也知道用這些數(shù)據(jù)能做些什么。然而,要分析這些數(shù)據(jù)時,每個人都被長達(dá)數(shù)月的報告開發(fā)過程所束縛。.故事聽起來是不是很熟悉?幾乎所有我們工作過的SAP現(xiàn)場都是如此。在我們30多年的工作經(jīng)歷中,這樣的事例比比皆是。.我們希望為SAP團(tuán)隊(當(dāng)然包括你的團(tuán)隊)提供一些現(xiàn)代工具和技術(shù),讓團(tuán)隊人員無須定義數(shù)據(jù)立方、數(shù)據(jù)倉庫對象或?qū)W習(xí)復(fù)雜的前沿報告就能使用這些技術(shù)。在本書中,我們將介紹一些簡單的場景,比如直接將數(shù)據(jù)從SAP轉(zhuǎn)儲到平面文件,并導(dǎo)入報表工具中。這對于特別的報告和調(diào)查非常有用。我們也會考慮更復(fù)雜的場景,包括使用云中的數(shù)據(jù)抽取工具和神經(jīng)網(wǎng)絡(luò)模型,以SAP或當(dāng)前數(shù)據(jù)倉庫中不可能的方式來分析數(shù)據(jù)。.如何閱讀本書.你需要從概念的角度來理解本書。我們提出了分析業(yè)務(wù)數(shù)據(jù)的替代技術(shù),要求讀者以全新的、有趣的方式來思考業(yè)務(wù)數(shù)據(jù)(尤其是SAP數(shù)據(jù))。本書旨在縮小你所擁有的特定業(yè)務(wù)數(shù)據(jù)分析技術(shù)和先進(jìn)數(shù)據(jù)科學(xué)技術(shù)之間的差距,既不需要你是精于計算神經(jīng)網(wǎng)絡(luò)中梯度下降這樣的復(fù)雜算法的專家,也不需要你是業(yè)務(wù)數(shù)據(jù)方面的專家。但是,你需要有跨越這兩個陣營的強(qiáng)烈愿望,并想在這個過程中獲得樂趣注。.從數(shù)據(jù)科學(xué)家的角度來看,本書中的數(shù)據(jù)科學(xué)原理只是一個入門介紹。如果你很熟悉sigmoid、tanh、relu等激活函數(shù),就可以跳過這些部分。我們將重點(diǎn)關(guān)注SAP,展示如何從系統(tǒng)中提取數(shù)據(jù),并演示如何使用真實(shí)的業(yè)務(wù)數(shù)據(jù)。.從SAP專業(yè)人員的角度來看,你將突破傳統(tǒng)的報表和分析模式,學(xué)會思考業(yè)務(wù)應(yīng)用,并用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的術(shù)語來生成報告。這聽起來可能很神秘,但到本書結(jié)束時,你將擁有邁出這一步所需的工具。在此過程中,你將自動檢測銷售數(shù)據(jù)中的異常,根據(jù)歷史數(shù)據(jù)預(yù)測未來,將文本處理為自然語言,將客戶細(xì)分為智能群組,將所有這些東西出色地可視化,并教會機(jī)器使用業(yè)務(wù)數(shù)據(jù)。.在人工智能和數(shù)據(jù)科學(xué)的世界里,對數(shù)據(jù)提出同樣的老問題是陳腐和幼稚的,更坦率地說是無聊的。我們希望你對自己的數(shù)據(jù)提出這樣的問題,即連你自己都不知道能夠問出的問題。也許中國的茶葉價格真的會對你的銷售產(chǎn)生巨大的影響。.從開發(fā)者的角度來看,你會深受啟發(fā),去學(xué)習(xí)Python和R等美妙的編程語言。我們不教你這些語言,但鼓勵你學(xué)習(xí)這些語言。如果你已經(jīng)是一個有經(jīng)驗(yàn)的R或Python開發(fā)人員,則可以很好地完成代碼部分的學(xué)習(xí)。如果你是R或Python語言的新手,我們將為你提供資源,幫助你入門。如果你傾向于使用Java等其他語言,也不要覺得自己被排除在外了,本書的根本目標(biāo)是讓你以不同的方式來思考業(yè)務(wù)數(shù)據(jù),如果你想使用Java,請盡情使用吧。.數(shù)據(jù)科學(xué)的實(shí)施本身就可以寫成一本書。我們會經(jīng)常涉及如何實(shí)現(xiàn)我們提出的想法,但是深入探討創(chuàng)建魯棒的數(shù)據(jù)科學(xué)流程超出了本書的討論范圍。.數(shù)據(jù)科學(xué)家可以跳過本書第2章,SAP專業(yè)人員可以跳過本書第3章。本書后面的內(nèi)容融合了這兩個門類,所以,我們希望來自兩方的讀者都能夠有效地學(xué)習(xí)本書。.致謝.感謝本書的技術(shù)審校者Hau Ngo、Jesse Stiff、Franco Rizzo、Brad Barker和Christoph Wertz,他們寶貴的反饋意