久久亚洲国产精品一区二区软,中文字幕精品二区,精品人成

AutoML可以將部分機器學習過程自動化，減輕數(shù)據(jù)科學從業(yè)者的工作負擔，深受高級分析人員的喜愛。本書介紹搭建AutoML模塊的基礎(chǔ)知識，并通過練習幫助讀者消化這些知識。讀者將學習使用機器學習流水線自動實現(xiàn)數(shù)據(jù)預處理、特征選擇、模型訓練、模型優(yōu)化等任務，學習應用auto-sklearn和MLBox等已有的自動化庫，并且創(chuàng)建和擴展自定義的AutoML環(huán)節(jié)。閱讀本書，你將對AutoML有更清晰的認識，能利用真實數(shù)據(jù)集完成自動化任務。書中知識可運用到實際的機器學習項目中，或者在機器學習競賽中助你一臂之力。

自動機器學習（AutoML）將特征預處理、模型選擇和超參數(shù)優(yōu)化等常用步驟自動化，以簡化機器學習的建模流程。接下來的章節(jié)會詳細介紹這些步驟，并且會教讀者動手構(gòu)建一套AutoML系統(tǒng)，從而對AutoML工具和庫有更深刻的理解。
在開始之前，有必要回顧一下什么是機器學習模型，以及如何訓練模型。
機器學習算法對數(shù)據(jù)進行處理，識別特定的模式，這一學習過程稱為模型訓練（model training）。模型訓練的結(jié)果是機器學習模型。有了機器學習模型，你不用制定明確的規(guī)則，它就可針對數(shù)據(jù)提出見解或解答。
在實際應用機器學習模型時，需要輸入大量數(shù)據(jù)，用于算法訓練。訓練后的成果是可用于預測的機器學習模型。這種預測可根據(jù)服務器當前狀態(tài)來確定它未來四個小時是否需要維護，或者判斷客戶會不會投向競爭對手。
有時待解決的問題本身都沒有明確定義，甚至我們都不知道需要什么樣的答案。在這種情況下，機器學習模型可幫助探索數(shù)據(jù)集，比如識別行為相似的客戶群，或者根據(jù)不同股票之間的關(guān)聯(lián)關(guān)系發(fā)現(xiàn)股票的層級結(jié)構(gòu)。
模型劃分出客戶群后，有什么用？至少可以知道：同一群體的客戶有哪些相似的特征，比如年齡、職業(yè)、婚姻狀況、性別、喜好、日常消費習慣、總消費額等。不同群體的客戶是彼此不同的。有了這些信息，我們就可以針對每個群體推送不同的廣告。
可以使用簡單的數(shù)學術(shù)語說明這一流程。設(shè)有數(shù)據(jù)集，包含個樣本。樣本可代表客戶或不同的動物。通常，每個樣本都是一個實數(shù)集，稱為特征（feature），比如，一位35歲的女性客戶在商店消費了12000美元，可以用向量（0.0，35.0，12000.0）表示。注意，這里性別是用表示的，男性客戶可以用表示。向量的大小稱為維度，通常用表示。這是一個大小為3的向量，即三維數(shù)據(jù)集。

你還可能感興趣

我要評論