MLOps工程實踐:工具、技術(shù)與企業(yè)級應(yīng)用
定 價:109 元
叢書名:智能系統(tǒng)與技術(shù)叢書
內(nèi)容簡介這是一本能指導(dǎo)企業(yè)利用MLOps技術(shù)構(gòu)建可靠、高效、可復(fù)用、可擴展的機器學(xué)習(xí)模型從而實現(xiàn)AI工程化落地的著作。由國內(nèi)AI領(lǐng)域的獨角獸企業(yè)第四范式的聯(lián)合創(chuàng)始人和技術(shù)VP領(lǐng)銜撰寫,從工具、技術(shù)、企業(yè)級應(yīng)用、成熟度評估4個維度對MLOps進行了全面的講解。本書的主要內(nèi)容包括如下9個方面:(1)MLOps的核心概念和方法,可以幫助讀者全面了解MLOps的基本原理;(2)MLOps涉及的幾種角色,以及這些角色之間如何協(xié)作;(3)機器學(xué)習(xí)項目的基礎(chǔ)知識和全流程,是學(xué)習(xí)和應(yīng)用MLOps的基礎(chǔ);(4)MLOps中的數(shù)據(jù)處理、主要流水線工具Airflow和MLflow、特征平臺和實時特征平臺OpenMLDB、推理工具鏈Adlik,為讀者系統(tǒng)講解MLOps的技術(shù)和工具;(5)云服務(wù)供應(yīng)商的端到端MLOps解決方案;(6)第四范式、網(wǎng)易、小米、騰訊、眾安金融等企業(yè)的MLOps工程實踐案例和經(jīng)驗;(7)MLOps的成熟度模型,以及微軟、谷歌和信通院對MLOps成熟度模型的劃分;(8)針對不同規(guī)模的企業(yè)和團隊的MLOps最佳實踐,幫助他們量身定做MLOps策略;(9)MLOps的未來發(fā)展趨勢,以及如何將新技術(shù)融入MLOps實踐中。本書深入淺出、循序漸進地講解了如何在實際項目中利用MLOps進行機器學(xué)習(xí)模型的部署、監(jiān)控與優(yōu)化,以及如何利用MLOps實現(xiàn)持續(xù)集成與持續(xù)交付等高效的工作流程。通過企業(yè)級的MLOps案例和解決方案,幫助讀者輕松掌握MLOps的設(shè)計思路以及如何應(yīng)用MLOps解決實際問題。
(1)作者背景資深:AI獨角獸第四范式的聯(lián)合創(chuàng)始人和技術(shù)VP領(lǐng)銜,騰訊、小米、百度、網(wǎng)易、中興、眾安保險等企業(yè)的技術(shù)專家共同參與。(2)4個維度展開:從工具、技術(shù)、企業(yè)級應(yīng)用、成熟度評估4個維度全面講解MLOps,指導(dǎo)企業(yè)構(gòu)建可靠、高效、可復(fù)用、可擴展的機器學(xué)習(xí)模型。(3)大廠現(xiàn)身說法:騰訊、小米、百度、網(wǎng)易、中興、眾安保險的AI技術(shù)專家通過案例方式詳細講解他們在MLOps領(lǐng)域的工程實踐。(4)9大主題內(nèi)容:通過9大主題內(nèi)容講解如何在實際項目中利用MLOps進行機器學(xué)習(xí)模型的部署、監(jiān)控與優(yōu)化,以及如何利用MLOps實現(xiàn)持續(xù)集成與持續(xù)交付等高效工作流程。(5)9位專家推薦:來自小米、字節(jié)、網(wǎng)易、百度、騰訊等企業(yè)的9位知名技術(shù)專家高度評價并鼎力推薦。
PREFACE前 言為什么寫作本書我們非常幸運地見證了AlphaGo、ChatGPT等令人激動的人工智能技術(shù)的突破。不可否認,人工智能已經(jīng)像手機、電力、網(wǎng)絡(luò)一樣融入每個人的工作和生活,進入各個行業(yè)。人工智能從早期在互聯(lián)網(wǎng)企業(yè)的推薦、廣告、搜索等場景中大放光彩,發(fā)展到在視覺、安防、金融等領(lǐng)域落地,再到今天走入交通、制造、生命科學(xué)等領(lǐng)域,并在排工排產(chǎn)、自動駕駛等場景中嶄露頭角。作為計算機科學(xué)的一個重要領(lǐng)域,機器學(xué)習(xí)也是目前人工智能領(lǐng)域非;钴S的分支之一。機器學(xué)習(xí)通過分析海量數(shù)據(jù)、總結(jié)規(guī)律,幫助人們解決眾多實際問題。隨著機器學(xué)習(xí)技術(shù)的發(fā)展,越來越多的企業(yè)將機器學(xué)習(xí)技術(shù)作為核心競爭力,并運用在實際業(yè)務(wù)中。但是,機器學(xué)習(xí)應(yīng)用落地并非一件輕松的事情,AI開發(fā)者往往需要面對各個環(huán)節(jié)的挑戰(zhàn)。這些環(huán)節(jié)包括目標定義、數(shù)據(jù)收集、數(shù)據(jù)清洗、特征提取、模型選擇、模型訓(xùn)練、模型部署和模型監(jiān)控等,其中任何一個環(huán)節(jié)出現(xiàn)失誤,都可能影響算法和策略在最終業(yè)務(wù)中落地的效果,造成成倍的損失。反過來看,利用工程化技術(shù)去優(yōu)化模型的自學(xué)習(xí)能力,能讓模型保持持續(xù)更新、迭代和演進,隨著數(shù)據(jù)和業(yè)務(wù)的變化不斷進行自適應(yīng),避免衰退,始終保持在最佳狀態(tài),為業(yè)務(wù)場景帶來更好的效果、更多的價值。除了效果之外,機器學(xué)習(xí)應(yīng)用的開發(fā)效率也是阻礙落地的關(guān)鍵因素。像Google這樣的互聯(lián)網(wǎng)領(lǐng)頭羊企業(yè),其AI科學(xué)家與AI工程師也常常會遇到開發(fā)一周,上線三月的情況。因此需要針對每個模型花費數(shù)月時間進行正確性排查,覆蓋模型魯棒性、數(shù)據(jù)時序穿越、線上線下一致性、數(shù)據(jù)完整性等各個維度。從團隊協(xié)作角度來看,數(shù)據(jù)、模型、算法的開發(fā)和部署需要不同的技能和知識,需要團隊敏捷地進行溝通和協(xié)作。因此,建設(shè)一種可以在任何時間、任何環(huán)境被信任的團隊合作模式、溝通渠道以及反饋機制,形成一個如敏捷迭代、Kubernetes一樣的事實標準,可方便AI工程師敏捷、快速地上線AI應(yīng)用。除了效果和效率兩個AI開發(fā)者所關(guān)注的維度外,成本、人才、安全也是機器學(xué)習(xí)應(yīng)用開發(fā)落地時需要權(quán)衡的。成本:無論軟件、硬件成本還是人力成本,企業(yè)需要在落地AI應(yīng)用的效益和成本之間進行權(quán)衡,確保投入產(chǎn)出比是可行的,而這要求開發(fā)者對成本和產(chǎn)出有更加精準的預(yù)測和判斷。人才:人才短缺是一個普遍問題,哪怕是在硅谷、中關(guān)村等科技人才聚集地,具備機器學(xué)習(xí)和軟件開發(fā)能力的人也是供不應(yīng)求的。開發(fā)者需要更好地精進技能,規(guī)劃好AI工程化的技能樹和學(xué)習(xí)路徑,把自己變成有競爭力的人才。安全:幾乎所有的企業(yè)都會要求AI應(yīng)用背后的數(shù)據(jù)、算法和模型符合法規(guī)和標準。開發(fā)者需要確保AI應(yīng)用和系統(tǒng)不會向企業(yè)外部泄露數(shù)據(jù),不讓非法的攻擊侵入并影響業(yè)務(wù)系統(tǒng)。正是在這樣的背景下,MLOps快速成為機器學(xué)習(xí)生產(chǎn)落地中不可或缺的關(guān)鍵能力。構(gòu)建一個靠譜、永遠可以信任、從容應(yīng)對新技術(shù)演進的機器學(xué)習(xí)系統(tǒng),匹配讓AI開發(fā)者高效且省心省力的機器學(xué)習(xí)應(yīng)用開發(fā)流程,成為當(dāng)前機器學(xué)習(xí)領(lǐng)域面臨的極為關(guān)鍵的問題之一。作為當(dāng)今企業(yè)和研究人員關(guān)注的熱點領(lǐng)域,MLOps相關(guān)的知識和實踐仍然相對分散,因此,迫切需要一本系統(tǒng)化介紹MLOps實踐方法的書籍,這也正是我們撰寫本書的動力所在。我們希望本書能夠:梳理MLOps的核心概念和方法,幫助讀者全面了解MLOps的基本原理;提供實用的案例分析和操作指南,使讀者能夠在實際項目中應(yīng)用MLOps,提高工作效率;針對不同規(guī)模的企業(yè)和團隊,給出相應(yīng)的MLOps最佳實踐,幫助它們量身定制MLOps策略;探討MLOps的未來發(fā)展趨勢,以及如何將新技術(shù)方向(如人工智能倫理、可解釋性等)融入MLOps實踐。我們深知MLOps實踐的推廣和普及需要時間和努力,希望本書可以為研究人員提供全面、系統(tǒng)和實用的指南,以便他們在實際應(yīng)用中構(gòu)建可靠、高效和穩(wěn)健的機器學(xué)習(xí)模型,實現(xiàn)業(yè)務(wù)價值最大化。本書內(nèi)容本書是一本面向MLOps的工程實踐指南,旨在幫助讀者了解如何在實際工作中應(yīng)用MLOps技術(shù)。本書介紹了不同的主流工具和技術(shù),這些工具和技術(shù)可以幫助構(gòu)建可靠、可重復(fù)使用和可擴展的機器學(xué)習(xí)模型。通過實際案例,讀者可以更好地理解這些工具和技術(shù)的用途和優(yōu)缺點,以及如何將它們應(yīng)用于實際項目。本書內(nèi)容如下。第1章系統(tǒng)地介紹MLOps出現(xiàn)的背景,給出MLOps的定義和內(nèi)涵,然后比較MLOps和DevOps及其他XOps的異同,幫助讀者對MLOps有較全面的了解。第2章介紹MLOps涉及的幾種角色,包括產(chǎn)品經(jīng)理、數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師、機器學(xué)習(xí)工程師、DevOps工程師、IT運維工程師等,并分析AI科學(xué)家與AI工程師協(xié)作中容易出現(xiàn)的問題及其解決辦法。第3章重點介紹機器學(xué)習(xí)項目涉及的相關(guān)概念和問題,并以全局視角解讀機器學(xué)習(xí)項目的全流程,探討在這個過程中MLOps需要解決的痛點問題,為后續(xù)深入學(xué)習(xí)MLOps方法論和工具做準備。第4章重點介紹MLOps中有關(guān)數(shù)據(jù)的內(nèi)容,介紹什么是以數(shù)據(jù)為中心,以數(shù)據(jù)為中心的人工智能與以模型為中心的人工智能有什么區(qū)別,MLOps中數(shù)據(jù)的生命周期是什么樣的,數(shù)據(jù)架構(gòu)是如何演進的,主要的數(shù)據(jù)問題是什么以及應(yīng)該如何解決。第5章結(jié)合機器學(xué)習(xí)難以落地在工程層面存在的問題,介紹MLOps領(lǐng)域出現(xiàn)的通用流水線工具以及如何幫助提升MLOps流程的串聯(lián)效率,并重點介紹兩個典型的流水線工具:Airflow和MLflow。第6章主要介紹MLOps中特有的特征平臺,從特征平臺的起源、作用、現(xiàn)狀以及未來趨勢,分析當(dāng)前的幾個主流商業(yè)產(chǎn)品和相關(guān)的開源項目,讓讀者對特征平臺有一個全面的了解,同時對如何挑選特征平臺給出一些建議。第7章從構(gòu)建企業(yè)級實時特征平臺的方法論出發(fā),講述線上線下一致性的重要性,以及所帶來的工程化挑戰(zhàn);基于開源的機器學(xué)習(xí)數(shù)據(jù)庫OpenMLDB,深入介紹如何踐行線上線下一致性;通過案例演示,帶領(lǐng)讀者了解OpenMLDB的基本使用方法。第8章從機器學(xué)習(xí)模型落地的挑戰(zhàn)開始,引出對Adlik推理工具鏈的介紹,包括Adlik架構(gòu)、端到端模型推理優(yōu)化實踐等,幫助讀者全方位了解如何利用Adlik構(gòu)建完整的機器學(xué)習(xí)推理方案。第9章以業(yè)界領(lǐng)先的某國際知名云服務(wù)提供商開發(fā)的SageMaker為例,介紹這種全家桶式服務(wù)是如何幫助客戶應(yīng)對大規(guī)模機器學(xué)習(xí)業(yè)務(wù)開發(fā)所帶來的挑戰(zhàn)的。第10章通過信用卡交易反欺詐系統(tǒng)、推薦系統(tǒng)案例來展示MLOps在不同場景下的挑戰(zhàn)和解決思路,幫助讀者更好地理解和應(yīng)用MLOps。第11章以網(wǎng)易云音樂實時模型應(yīng)用為例,介紹網(wǎng)易云音樂FeatureBox在特征工程上如何解決特征開發(fā)效率、特征數(shù)據(jù)準確性、特征讀寫性能、使用資源大小等一系列問題。第12章以小米廣告機器學(xué)習(xí)平臺實踐為例,介紹小米如何將機器學(xué)習(xí)開發(fā)流程抽象化、工具化、系統(tǒng)化、平臺化,從而提升算法迭代效率,并不斷提升算法效果。第13章介紹騰訊金融業(yè)務(wù)推薦系統(tǒng)建設(shè)的方法,包括如何圍繞業(yè)務(wù)增長、用戶體驗優(yōu)化和效率提升等關(guān)鍵目標,應(yīng)用大數(shù)據(jù)和機器學(xué)習(xí)技術(shù),以數(shù)據(jù)驅(qū)動方法推動各個業(yè)務(wù)目標的迭代實現(xiàn)。第14章介紹眾安金融的MLOps建設(shè)背景和整體的實施思路,同時重點介紹實時特征平臺的架構(gòu)設(shè)計、實時特征計算的實現(xiàn)方式,以及特征平臺如何支持反欺詐場景的特征應(yīng)用。第15章介紹MLOps成熟度模型,然后介紹谷歌、微軟及信通院對MLOps成熟度模型的劃分方式,讓讀者對MLOps在業(yè)內(nèi)的發(fā)展有更全面的了解。讀者對象本書旨在幫助讀者掌握MLOps技術(shù),從而構(gòu)建可靠、可重復(fù)使用和可擴展的機器學(xué)習(xí)工作流程。我們更加強調(diào)實踐和操作,通過示例來幫助讀者更好地理解并應(yīng)用這些技術(shù)和工具。本書適用的讀者對象如下。數(shù)據(jù)科學(xué)家和AI研究人員:希望了解如何將自己的模型和算法更有效地部署到實際生產(chǎn)環(huán)境,提高工作效率和質(zhì)量。機器學(xué)習(xí)工程師和DevOps工程師:想要掌握MLOps的最佳實踐,以便在組織內(nèi)更好地支持AI和ML項目的開發(fā)、部署與維護。產(chǎn)品經(jīng)理和業(yè)務(wù)負責(zé)人:希望了解MLOps的概念和實踐,以便更好地推動組織內(nèi)AI和ML項目的落地,提高項目成功率和產(chǎn)出價值。教育者和學(xué)者:在教學(xué)和研究過程中需要掌握MLOps的理論和實踐知識,以便為學(xué)生和咨詢者提供指導(dǎo)。與我們聯(lián)系若本書中有描述不到位或錯誤的情況,懇請讀者批評指正,意見可發(fā)送至郵箱startogether2022@163.com。致謝在本書撰寫過程中,我深深地感到,要想打造完美的內(nèi)容,個人的力量是遠遠不夠的。在這里,我要感謝所有為本書寫作提供幫助的人,感謝我的同事、家人和朋友,他們一直支持并鼓勵我完成寫作。感謝所有致力于MLOps領(lǐng)域的人,他們的努力為這個領(lǐng)域的發(fā)展做出了重要貢獻。鄭 曌 第四范式技術(shù)副總裁
目錄作者簡介前言第1章 全面了解MLOps 11.1 人工智能的趨勢和現(xiàn)狀 11.1.1 趨勢1:人工智能在企業(yè)中加速落地,彰顯更多業(yè)務(wù)價值 11.1.2 趨勢2:人工智能應(yīng)用從以模型為中心向以數(shù)據(jù)為中心轉(zhuǎn)變 31.1.3 現(xiàn)狀:人工智能落地成功率低,成本高 41.2 人工智能的問題、挑戰(zhàn)以及應(yīng)對措施 51.2.1 問題1:機器學(xué)習(xí)代碼只是整個系統(tǒng)的一小部分 51.2.2 問題2:數(shù)據(jù)是最主要的問題 61.2.3 挑戰(zhàn):人工智能系統(tǒng)如何規(guī);涞 71.2.4 應(yīng)對措施:MLOps 81.3 MLOps簡介 81.3.1 MLOps的定義 81.3.2 MLOps相關(guān)的工具和平臺 121.3.3 MLOps的優(yōu)勢 131.4 MLOps與DevOps 141.4.1 DevOps的3個優(yōu)點 141.4.2 MLOps延續(xù)了DevOps的優(yōu)點 171.4.3 MLOps和DevOps的不同之處 191.4.4 MLOps和DevOps的目標與實踐理念 201.5 MLOps與其他XOps的區(qū)別 201.5.1 MLOps與AIOps的區(qū)別 211.5.2 MLOps與DataOps的區(qū)別 211.5.3 MLOps與ModelOps的區(qū)別 221.5.4 XOps的相同點:都基于DevOps原則 221.6 本章小結(jié) 22第2章 MLOps涉及的角色 232.1 角色類型 232.1.1 產(chǎn)品經(jīng)理 242.1.2 數(shù)據(jù)科學(xué)家 242.1.3 數(shù)據(jù)工程師 252.1.4 機器學(xué)習(xí)工程師 262.1.5 DevOps工程師 272.1.6 IT運維工程師 272.2 角色劃分以及角色之間存在的問題 282.2.1 角色劃分 282.2.2 問題1:技術(shù)棧不一致導(dǎo)致人工智能模型線上、線下效果不一致 282.2.3 問題2:關(guān)注點不同導(dǎo)致對系統(tǒng)的需求不同 292.2.4 協(xié)作問題及解決辦法 302.3 本章小結(jié) 30第3章 機器學(xué)習(xí)項目概論 313.1 機器學(xué)習(xí)項目簡介 313.1.1 機器學(xué)習(xí)的定義 313.1.2 機器學(xué)習(xí)相關(guān)概念 333.1.3 機器學(xué)習(xí)能解決的問題 373.1.4 機器學(xué)習(xí)項目度量 383.1.5 機器學(xué)習(xí)項目難以落地的原因 413.2 深入理解機器學(xué)習(xí)項目全流程 443.2.1 方案調(diào)研 453.2.2 方案投產(chǎn) 493.3 本章小結(jié) 51第4章 MLOps中的數(shù)據(jù)部分 524.1 從以模型為中心到以數(shù)據(jù)為中心 524.1.1 以模型為中心的時代 524.1.2 以數(shù)據(jù)為中心的時代 534.2 MLOps中的數(shù)據(jù)生命周期管理 554.3 數(shù)據(jù)存儲架構(gòu)演進 564.4 MLOps中主要的數(shù)據(jù)問題及解決方案 574.4.1 常見的數(shù)據(jù)質(zhì)量問題及解決方案 574.4.2 時序數(shù)據(jù)穿越問題及解決方案 594.4.3 離線和實時數(shù)據(jù)一致性問題及解決方案 644.4.4 數(shù)據(jù)安全問題及解決方案 664.4.5 數(shù)據(jù)共享與復(fù)用問題及解決方案 674.5 本章小結(jié) 67第5章 流水線工具 695.1 Airflow 695.1.1 Airflow的功能和應(yīng)用場景 695.1.2 Airflow的核心概念 725.1.3 Airflow的使用方法 725.2 MLflow 805.2.1 MLflow的功能和應(yīng)用場景 805.2.2 MLflow的核心概念 815.2.3 MLflow的使用方法 825.3 其他流水線工具 915.4 本章小結(jié) 93第6章 特征平臺 946.1 特征平臺的概念和起源 946.2 特征平臺的特性 966.3 特征平臺的現(xiàn)狀 976.4 主流的特征平臺 986.4.1 Tecton的特征平臺 996.4.2 AWS的SageMaker特征平臺 1006.4.3 Databricks的特征平臺 1026.4.4 Feast項目 1036.4.5 OpenMLDB項目 1056.5 特征平臺的發(fā)展趨勢 1066.6 本章小結(jié) 107第7章 實時特征平臺OpenMLDB 1087.1 實時特征平臺構(gòu)建方法論 1087.1.1 機器學(xué)習(xí)閉環(huán) 1087.1.2 實時特征計算 1097.1.3 痛點:線上線下計算一致性校驗帶來的高成本 1107.1.4 目標:開發(fā)即上線 1127.1.5 技術(shù)需求 1127.1.6 抽象架構(gòu) 1137.1.7 OpenMLDB架構(gòu)設(shè)計實踐 1147.2 OpenMLDB項目介紹 1167.2.1 設(shè)計理念 1167.2.2 生產(chǎn)級機器學(xué)習(xí)特征平臺 1167.2.3 核心特性 1177.2.4 常見問題 1177.3 核心模塊在線引擎 1187.3.1 概覽 1187.3.2 Apache ZooKeeper 1197.3.3 Nameserver 1197.3.4 Tablet 1207.4 核心數(shù)據(jù)結(jié)構(gòu) 1227.4.1 背景介紹 1227.4.2 雙層跳表索引 1227.4.3 預(yù)聚合技術(shù) 1247.4.4 性能表現(xiàn) 1257.5 高級特性主從集群部署 1277.5.1 定義和目標 1277.5.2 技術(shù)方案 1277.5.3 主從集群搭建實踐 1307.5.4 主從集群部署常見問題 1317.6 高級特性雙存儲引擎 1337.6.1 內(nèi)存和磁盤雙存儲引擎架構(gòu) 1337.6.2 功能支持對比 1347.6.3 性能對比 1357.7 執(zhí)行流程介紹 1367.7.1 執(zhí)行流程概覽 1367.7.2 執(zhí)行模式概覽 1377.7.3 離線模式 1377.7.4 在線模式 1387.7.5 請求模式 1387.8 實踐 1397.8.1 準備 1407.8.2 使用流程 1417.8.3 實時特征計算的結(jié)果說明 1447.9 生態(tài)整合在線數(shù)據(jù)源Kafka 1457.9.1 簡介 1457.9.2 準備工作 1467.9.3 步驟1:啟動OpenMLDB并創(chuàng)建數(shù)據(jù)庫 1467.9.4 步驟2:啟動Kafka并創(chuàng)建Topic 1477.9.5 步驟3:啟動Connector 1477.9.6 步驟4:測試 1487.10 生態(tài)整合離線數(shù)據(jù)源Hive 1497.10.1 配置 1497.10.2 數(shù)據(jù)類型 1497.10.3 通過LIKE語法快速建表 1507.10.4 將Hive數(shù)據(jù)導(dǎo)入OpenMLDB 1507.10.5 將OpenMLDB數(shù)據(jù)導(dǎo)出到Hive 1517.11 案例:出租車行程時間預(yù)測 1517.11.1 環(huán)境準備和預(yù)備知識 1517.11.2 全流程演示 1527.12 本章小結(jié) 155第8章 Adlik推理工具鏈 1568.1 機器學(xué)習(xí)模型落地挑戰(zhàn) 1568.2 Adlik的優(yōu)勢 1578.3 Adlik的架構(gòu) 1588.3.1 模型優(yōu)化器 1598.3.2 模型編譯器 1618.3.3 推理引擎模塊 1618.4 快速入門 1648.4.1 編譯模型 1648.4.2 部署模型 1668.4.3 模型推理 1668.4.4 引入自定義運行時 1678.5 Adlik端到端模型推理優(yōu)化實踐 1688.5.1 模型結(jié)構(gòu)優(yōu)化 1688.5.2 模型推理引擎 1708.6 本章小結(jié) 171第9章 云服務(wù)供應(yīng)商的端到端MLOps解決方案 1729.1 認識SageMaker 1739.1.1 SageMaker的主要組成部分 1739.1.2 廣泛的數(shù)據(jù)源和數(shù)據(jù)集成支持 1749.2 無代碼實現(xiàn)供應(yīng)鏈中到貨時間的預(yù)測 1769.2.1 數(shù)據(jù)準備 1779.2.2 簡單的數(shù)據(jù)合并 1799.2.3 構(gòu)建、訓(xùn)練和分析機器學(xué)習(xí)模型 1809.2.4 模型預(yù)測 1839.3 應(yīng)用SageMaker Notebook進行 MLOps 管理 1839.3.1 數(shù)據(jù)導(dǎo)入 1849.3.2 數(shù)據(jù)清洗和特征設(shè)計 1849.3.3 模型訓(xùn)練 1859.3.4 模型評估 1869.3.5 模型上線 1879.3.6 使用模型倉庫和 Pipeline系統(tǒng)管理訓(xùn)練成果 1879.4 本章小結(jié) 194第10章 MLOps 在反欺詐與推薦系統(tǒng)中的應(yīng)用 19610.1 案例1:信用卡交易反欺詐系統(tǒng) 19610.1.1 定義業(yè)務(wù)目標 19610.1.2 系統(tǒng)設(shè)計的挑戰(zhàn) 19810.1.3 數(shù)據(jù)準備與特征設(shè)計思路 20110.1.4 系統(tǒng)設(shè)計與實現(xiàn) 20210.2 案例2:推薦系統(tǒng) 20510.2.1 推薦系統(tǒng)介紹 20510.2.2 定義優(yōu)化目標 20610.2.3 系統(tǒng)設(shè)計挑戰(zhàn)與實現(xiàn)思路 20810.3 本章小結(jié) 210第11章 網(wǎng)易云音樂實時模型大規(guī)模應(yīng)用之道 21111.1 從云音樂直播推薦中的實時性說起 21111.1.1 直播對實時性的強需求 21311.1.2 推薦引擎實時性的三要素 21311.1.3 直播精排模型的實時化演進 21611.2 實時增量模型的構(gòu)建 21611.2.1 實時特征快照 21711.2.2 實時樣本歸因 21911.2.3 實時樣本拼接 22211.2.4 增量訓(xùn)練和更新 22311.2.5 線上效果 22411.3 特征平臺將實時能力泛化到更多場景 22511.4 FeatureBox 22611.4.1 FeatureBox解決的問題 22611.4.2 FeatureBox整體架構(gòu) 22711.4.3 DataHub模塊 22711.4.4 Transform模塊 23111.4.5 MFDL模塊 23211.4.6 Storage模塊 23311.4.7 Monitor模塊 23411.5 在線預(yù)估基于FeatureBox的構(gòu)建 23611.5.1 特征與模型的高效迭代 23611.5.2 高性能預(yù)估計算 24211.5.3 預(yù)估與FeatureBox實時性方案 24611.6 本章小結(jié) 248第12章 小米廣告機器學(xué)習(xí)平臺實踐 24912.1 小米廣告一站式機器學(xué)習(xí)平臺簡介 24912.1.1 傳統(tǒng)機器學(xué)習(xí)流程的問題 24912.1.2 小米廣告機器學(xué)習(xí)平臺模塊簡介 25112.2 特征工程模塊 25212.2.1 特征工程簡介 25212.2.2 數(shù)據(jù)源管理 25312.2.3 特征管理 25312.2.4 樣本管理 25712.3 模型訓(xùn)練平臺 25912.3.1 算法管理 26012.3.2 離線模型訓(xùn)練管理 26112.3.3 模型更新 26212.4 線上推理模塊 26412.4.1 線上推理服務(wù)介紹 26412.4.2 高性能和高可用保證 26612.4.3 模型部署 26812.5 本章小結(jié) 273第13章 騰訊金融推薦中臺實踐 27413.1 業(yè)務(wù)介紹 27413.1.1 業(yè)務(wù)優(yōu)化目標 27413.1.2 業(yè)務(wù)特點 27513.2 現(xiàn)狀及挑戰(zhàn) 27613.2.1 推薦系統(tǒng)復(fù)雜性 27713.2.2 算法工程技術(shù)壁壘 27813.3 MLOps實踐 27813.4 推薦系統(tǒng)產(chǎn)品體系 28013.4.1 特征系統(tǒng) 28113.4.2 模型訓(xùn)練系統(tǒng) 28113.4.3 模型服務(wù)系統(tǒng) 28213.4.4 推薦運營系統(tǒng) 28313.5 系統(tǒng)設(shè)計 28313.5.1 特征系統(tǒng) 28413.5.2 模型服務(wù)系統(tǒng) 29013.6 本章小結(jié) 293第14章 眾安金融實時特征平臺實踐 29414.1 眾安金融的MLOps建設(shè)背景 29414.2 眾安金融的MLOps建設(shè)思路 29514.2.1 眾安金融的MLOps流程說明 29514.2.2 眾安金融特征平臺能力要求 29714.3 實時特征平臺的架構(gòu)設(shè)計 29714.3.1 實時特征平臺架構(gòu)說明 29814.3.2 實時特征數(shù)據(jù)源層 29814.3.3 實時特征平臺的核心功能 29914.4 實時業(yè)務(wù)特征計算 30014.4.1 實時業(yè)務(wù)特征計算系統(tǒng)設(shè)計 30014.4.2 實時業(yè)務(wù)特征核心數(shù)據(jù)模型 30114.4.3 實時業(yè)務(wù)特征計算引擎 30214.5 反欺詐場景中的特征計算 30314.5.1 反欺詐特征計算系統(tǒng)設(shè)計 30314.5.2 反欺詐特征分類說明 30414.5.3 用戶關(guān)系圖譜實現(xiàn)方案 30514.6 本章小結(jié) 306第15章 MLOps成熟度模型 30815.1 能力成熟度模型概述 30815.2 谷歌的MLOps成熟度模型 30915.2.1 谷歌對MLOps的理解和認識 30915.2.2 谷歌對MLOps成熟度等級的定義 31015.3 微軟的MLOps成熟度模型 31715.3.1 微軟對MLOps成熟度模型的理解和認識 31715.3.2 微軟對MLOps成熟度等級的定義 31815.4 信通院的MLOps成熟度模型 32215.4.1 需求管理能力子域相關(guān)內(nèi)容 32315.4.2 數(shù)據(jù)工程能力子域相關(guān)內(nèi)容 32515.5 本章小結(jié) 329