數(shù)據(jù)科學(xué)與大數(shù)據(jù)分析 數(shù)據(jù)的發(fā)現(xiàn) 分析 可視化與表示
定 價:69 元
- 作者:[美] EMC教育服務(wù)團隊(EMC Education Services) 著
- 出版時間:2016/7/1
- ISBN:9787115416377
- 出 版 社:人民郵電出版社
- 中圖法分類:TP274
- 頁碼:356
- 紙張:膠版紙
- 版次:1
- 開本:16K
數(shù)據(jù)科學(xué)與大數(shù)據(jù)分析在當前是炙手可熱的概念,關(guān)注的是如何通過分析海量數(shù)據(jù)來洞悉隱藏于數(shù)據(jù)背后的見解。本書是數(shù)據(jù)科學(xué)領(lǐng)域為數(shù)不多的實用性技術(shù)圖書,它通過詳細剖析數(shù)據(jù)分析生命周期的各個階段來講解用于發(fā)現(xiàn)、分析、可視化、表示數(shù)據(jù)的相關(guān)方法和技術(shù)。
《數(shù)據(jù)科學(xué)與大數(shù)據(jù)分析——數(shù)據(jù)的發(fā)現(xiàn) 分析 可視化與表示》總共分為12章,主要內(nèi)容包括大數(shù)據(jù)分析的簡單介紹,數(shù)據(jù)分析生命周期的各個階段,使用R語言進行基本的數(shù)據(jù)分析,以及高級的分析理論和方法,主要涉及數(shù)據(jù)的聚類、關(guān)聯(lián)規(guī)則、回歸、分類、時間序列分析、文本分析等方法。此外,本書還涵蓋了用來進行高級數(shù)據(jù)分析所使用的技術(shù)和工具,比如MapReduce和Hadoop、數(shù)據(jù)庫內(nèi)分析等。
《數(shù)據(jù)科學(xué)與大數(shù)據(jù)分析——數(shù)據(jù)的發(fā)現(xiàn) 分析 可視化與表示》內(nèi)容詳細,示例豐富,側(cè)重于理論與練習(xí)的結(jié)合,因此比較適合對大數(shù)據(jù)分析、數(shù)據(jù)科學(xué)感興趣的人員閱讀,有志于成為數(shù)據(jù)科學(xué)家的讀者也可以從本書中獲益。
數(shù)據(jù)科學(xué)和大數(shù)據(jù)分析是指利用數(shù)據(jù)的力量來發(fā)現(xiàn)新的見解。本書涵蓋了數(shù)據(jù)科學(xué)涉及的行為廣度以及所使用的方法和工具。本書內(nèi)容側(cè)重于任何行業(yè)和技術(shù)環(huán)境中都會用到的概念、原理和實際應(yīng)用,并通過開源軟件來分析案例,以幫助讀者更好地理解。
本書將幫助您:
成為數(shù)據(jù)科學(xué)團隊中的一名貢獻者;
部署結(jié)構(gòu)化的生命周期方法來分析數(shù)據(jù)問題;
應(yīng)用合適的分析技術(shù)和工具來分析大數(shù)據(jù);
學(xué)習(xí)如何用數(shù)據(jù)來講一個動人的故事,以推動商業(yè)行為;
備考EMC Proven Professional數(shù)據(jù)科學(xué)家認證。
EEMC專家認證是IT行業(yè)領(lǐng)先的教育和認證項目,涵蓋了信息存儲技術(shù)、虛擬化技術(shù)、云計算、數(shù)據(jù)科學(xué)與大數(shù)據(jù)分析等領(lǐng)域。
通過認證是一種很好的自我投資方式,同時也是對自己專業(yè)知識的正式驗證。
本書可以作為準備數(shù)據(jù)科學(xué)專員(EMCDSA)認證的資料。
在驅(qū)動企業(yè)和服務(wù)提供商轉(zhuǎn)型其運營方式以及以服務(wù)形式交付IT(IT as a service)方面,EMC是全球領(lǐng)導(dǎo)者。而該轉(zhuǎn)型的基礎(chǔ)則是云計算。通過創(chuàng)新的產(chǎn)品和服務(wù),EMC加速了云計算的進展,旨在幫助IT部門以一種更為敏捷、可信和具備成本效益的方式來存儲、管理、保護和分析它們有價值的資產(chǎn)——信息。關(guān)于EMC的更多信息,請訪問www.EMC.com。
David Dietrich是EMC Education Services的數(shù)據(jù)科學(xué)教育團隊的負責人,他領(lǐng)導(dǎo)著大數(shù)據(jù)分析和數(shù)據(jù)科學(xué)相關(guān)的課程、策略和課程開發(fā)工作。他參與編寫了EMC數(shù)據(jù)科學(xué)課程的首門課程,以及兩門額外的EMC課程(以向領(lǐng)導(dǎo)和管理人員講授大數(shù)據(jù)和數(shù)據(jù)科學(xué)為主),而且還是本書的作者兼編輯。他在數(shù)據(jù)科學(xué)、數(shù)據(jù)隱私和云計算領(lǐng)域已經(jīng)申請了14項專利。
David曾指導(dǎo)若干所大學(xué)開設(shè)數(shù)據(jù)分析相關(guān)的課程項目,而且還經(jīng)常在會議和行業(yè)活動中發(fā)表演講。他還是波士頓地區(qū)幾所大學(xué)的客座講師。他的作品已被精選到包括福布斯雜志、哈佛商業(yè)評論以及由美國馬薩諸塞州長Deval Patrick委托起草的2014 馬薩諸塞大數(shù)據(jù)報告等內(nèi)在的主流出版物中。
David在分析和技術(shù)領(lǐng)域已經(jīng)浸淫了近20年。在其職業(yè)生涯中,他曾在多家財富500強公司工作過,出任多個與數(shù)據(jù)分析相關(guān)的職位,其中包括管理分析和運營團隊,提供分析咨詢服務(wù),管理用于規(guī)范美國銀行業(yè)的分析軟件產(chǎn)品線,以及開發(fā)軟件即服務(wù)(Software-as-a-Service)和Bl即服務(wù)(Bl-as-a-Service)的產(chǎn)品。此外,David還曾與美聯(lián)儲一起合作開發(fā)用于監(jiān)控房產(chǎn)抵押貸款的預(yù)測模型。
Barry Heller是EMC Education Services的一名咨詢技術(shù)教育顧問。Barry是大數(shù)據(jù)和數(shù)據(jù)科學(xué)新興技術(shù)領(lǐng)域的課程開發(fā)人員和課程顧問。在此之前,Barry曾是一名顧問研究科學(xué)家,在EMC全面客戶體驗(Total Customer Experience)部門內(nèi)發(fā)起并領(lǐng)導(dǎo)了許多與數(shù)據(jù)分析相關(guān)的項目。在其EMC職業(yè)生涯的早期,他負責管理統(tǒng)計工程團隊,并負責企業(yè)資源企劃(ERP)實施中的數(shù)據(jù)倉庫工作。在加盟EMC之前,Barry在醫(yī)療診斷和技術(shù)公司擔任過可靠性工程功能(Reliability Engineering Functions)的管理和分析角色。在此期間,他將其數(shù)量分析技能應(yīng)用到了客戶服務(wù)、工程、制造、銷售/營銷、金融和法律領(lǐng)域內(nèi)的無數(shù)商業(yè)應(yīng)用中。他強調(diào)與客戶管理人員深入互動的重要性,他的許多成功案例不僅源自對分析的技術(shù)細節(jié)的關(guān)注,也源自針對分析結(jié)果會做出的決策的關(guān)注。Barry擁有羅徹斯特理工學(xué)院計算數(shù)學(xué)專業(yè)的本科學(xué)位,以及紐約州立大學(xué)新帕爾茲分校數(shù)學(xué)專業(yè)的碩士學(xué)位。
Beibei Yang是EMC Education Services的一名技術(shù)教育顧問,在EMC負責開發(fā)若干與數(shù)據(jù)科學(xué)和大數(shù)據(jù)分析相關(guān)的公開課程。Bebei在IT行業(yè)有7年的從業(yè)經(jīng)驗。在加盟EMC之前,她在一家財富500強公司先后擔任過軟件工程師、系統(tǒng)管理員和網(wǎng)絡(luò)管理員等職位,并引入了多種提升效率和鼓勵合作的新技術(shù)。Beibei曾在國際會議上發(fā)表過學(xué)術(shù)論文,并申請了多項專利。她在馬薩諸塞大學(xué)盧維爾分校獲得了計算機科學(xué)專業(yè)的博士學(xué)位。她專注于自然語言處理和數(shù)據(jù)挖掘,尤其是使用各種工具和技術(shù)來發(fā)現(xiàn)數(shù)據(jù)中隱藏的模式,以及用數(shù)據(jù)來講故事。數(shù)據(jù)科學(xué)和大數(shù)據(jù)分析是一個令人振奮的領(lǐng)域。在這個領(lǐng)域,數(shù)字信息的潛力可以很大程度地用來幫助做出明智的商業(yè)決策。我們相信,無論是短期、中期還是長期來看,這一領(lǐng)域都將會吸引越來越多有才華的學(xué)生和專業(yè)人士投身其中。
譯者簡介
曹逾,于新加坡國立大學(xué)獲得計算機博士學(xué)位,杰出大數(shù)據(jù)與機器學(xué)習(xí)專家,當前供職于EMC中國卓越研發(fā)集團首席技術(shù)官辦公室,同時擔任EMC中國研究院數(shù)據(jù)科學(xué)實驗室主任,主要負責EMC大中華區(qū)大數(shù)據(jù)與數(shù)據(jù)科學(xué)方向的應(yīng)用型研究以及創(chuàng)新解決方案研發(fā),同時也負責EMC在亞太特別是中國大陸地區(qū)的高?蒲泻献黜椖俊2懿┦吭赟IGMOD、VLDB、ICDE、VLDB Journal等國際會議和期刊發(fā)表論文20余篇,并多次受邀擔任國際會議和期刊審稿人,而且其相關(guān)研究成果在EMC內(nèi)部產(chǎn)品及解決方案中得以廣泛應(yīng)用。曹博士擁有60余項美國及國際專利授權(quán)或申請。
劉文苗,現(xiàn)任EMC IT第三平臺高級項目經(jīng)理,對大數(shù)據(jù)、存儲系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)以及文件系統(tǒng)具有一定研究,還具有國內(nèi)金融行業(yè)多年從業(yè)經(jīng)驗。劉先生曾經(jīng)參與過上海證券交易所新一代交易系統(tǒng)、海通期貨核心交易系統(tǒng)的設(shè)計與建設(shè)工作。
李楓林,于上海交通大學(xué)獲得軟件工程碩士學(xué)位,曾在微軟中國公司擔任數(shù)據(jù)庫工程師,現(xiàn)就職于EMC中國研發(fā)中心,擔任Senior Social Engagement Manager一職,主要負責EMC中文技術(shù)社區(qū)的運營與后臺數(shù)據(jù)處理工作,近年來潛心鉆研數(shù)據(jù)存儲與大數(shù)據(jù)相關(guān)技術(shù),曾在EMC中文社區(qū)及社交媒體上發(fā)表多篇大數(shù)據(jù)技術(shù)相關(guān)的文章。
主審人員簡介
孫宇熙(Ricky Sun),EMC中國研究院院長,在EMC主要負責大數(shù)據(jù)、軟件定義的數(shù)據(jù)中心、云計算、超融合架構(gòu)、高性能計算、高效存儲等領(lǐng)域的研發(fā)、戰(zhàn)略合作與創(chuàng)新等工作。
Ricky有在硅谷和國內(nèi)近20年的學(xué)習(xí)、工作、生活和創(chuàng)業(yè)的經(jīng)驗。Ricky既有在大型跨國公司(EMC、微軟、Yahoo!)的工作經(jīng)歷,也有過往成功的創(chuàng)業(yè)經(jīng)歷,曾于2001年在美國加州硅谷地區(qū)創(chuàng)立WL科技公司并成功帶領(lǐng)公司在2004年與香港Telewave集團合并。Ricky在混合云架構(gòu)、大數(shù)據(jù)快數(shù)據(jù)處理與分析、軟件定義存儲等領(lǐng)域有著多年的國際領(lǐng)先的工作經(jīng)驗業(yè)界的影響力,并持有多項專利。Ricky在近年的專業(yè)著作有《程序員生存手冊:面試篇》、《軟件定義數(shù)據(jù)中心:技術(shù)與實踐》等。