關(guān)于我們
書單推薦
新書推薦
|
數(shù)據(jù)采集與預(yù)處理 隨著國家大數(shù)據(jù)相關(guān)政策、規(guī)劃的密集出臺,大數(shù)據(jù)、人工智能商業(yè)落地速度加快,其在各個領(lǐng)域的應(yīng)用也越來越廣泛,其中面向企業(yè)服務(wù)、金融、醫(yī)療健康、電子政務(wù)、電子商務(wù)等細分領(lǐng)域的大數(shù)據(jù)應(yīng)用展現(xiàn)出巨大的潛力。 大數(shù)據(jù)是需要新處理模式才能適應(yīng)的海量、高增長率和多樣化的信息資產(chǎn),被譽為未來的新石油,以至于數(shù)據(jù)的獲取、存儲、搜索、共享、分析以及可視化呈現(xiàn)都成為當(dāng)前重要的研究課題。 本書重點講述數(shù)據(jù)采集與預(yù)處理的相關(guān)內(nèi)容,并以真實案例介紹不同數(shù)據(jù)源的采集方式及基本的數(shù)據(jù)預(yù)處理方法。全書共10章。其中,第1章為概述,第2~5章介紹靜態(tài)網(wǎng)頁數(shù)據(jù)爬取,第6章介紹動態(tài)網(wǎng)頁數(shù)據(jù)爬取,第7、8章介紹爬蟲(Scrapy)框架應(yīng)用,第9章介紹數(shù)據(jù)預(yù)處理,第10章給出了一個綜合項目實訓(xùn)。 本書可作為高校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)相關(guān)課程的教材或教學(xué)參考書,也可作為人工智能、大數(shù)據(jù)領(lǐng)域從業(yè)者的自學(xué)參考書。
你還可能感興趣
我要評論
|