聯(lián)邦學(xué)習(xí):算法詳解與系統(tǒng)實(shí)現(xiàn)
定 價(jià):99 元
叢書名:智能科學(xué)與技術(shù)叢書
- 作者:薄列峰,[美]黃恒,顧松庠,陳彥卿等著
- 出版時(shí)間:2022/4/1
- ISBN:9787111703495
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP181
- 頁(yè)碼:
- 紙張:膠版紙
- 版次:
- 開(kāi)本:16開(kāi)
本書首先介紹聯(lián)邦學(xué)習(xí)的定義和發(fā)展歷史,按類別介紹聯(lián)邦學(xué)習(xí)算法和發(fā)展現(xiàn)狀,介紹聯(lián)邦學(xué)習(xí)的應(yīng)用場(chǎng)景,以及相關(guān)安全機(jī)器學(xué)習(xí)的技術(shù)。然后我們將介紹zui新zui前沿的聯(lián)邦學(xué)習(xí)算法,用數(shù)科系統(tǒng)作為實(shí)例,對(duì)聯(lián)邦學(xué)習(xí)系統(tǒng)構(gòu)建和實(shí)現(xiàn)進(jìn)行講解。zui后我們將介紹數(shù)科自研的基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí)技術(shù)。
作者都是扎根于聯(lián)邦學(xué)習(xí)前沿的研究者和從業(yè)者。
本書提出了眾多不同于其他書籍的全新聯(lián)邦學(xué)習(xí)算法,以饗讀者。
作者參考了近年全新的文章和綜述,緊跟學(xué)術(shù)和業(yè)界的聯(lián)邦學(xué)習(xí)動(dòng)態(tài)。
機(jī)器學(xué)習(xí)技術(shù)在近20年飛速發(fā)展,從一個(gè)個(gè)數(shù)學(xué)概念逐漸演變成一個(gè)個(gè)算法實(shí)現(xiàn),為工業(yè)界和學(xué)術(shù)界帶來(lái)了新的力量。然而,近幾年,數(shù)據(jù)隱私保護(hù)問(wèn)題愈發(fā)受到人們的關(guān)注,研究者們開(kāi)始開(kāi)發(fā)各種技術(shù)來(lái)進(jìn)行數(shù)據(jù)層面的隱私保護(hù)。聯(lián)邦學(xué)習(xí)作為其中一項(xiàng)重要技術(shù),勢(shì)必迎來(lái)新的發(fā)展前景。本書將從概念、應(yīng)用場(chǎng)景到具體的先進(jìn)算法,再到后的系統(tǒng)實(shí)現(xiàn),對(duì)聯(lián)邦學(xué)習(xí)技術(shù)進(jìn)行全盤的梳理與總結(jié),希望給讀者一些啟發(fā)。注意,本書僅從技術(shù)視角對(duì)聯(lián)邦學(xué)習(xí)進(jìn)行回顧展望,如有涉及數(shù)據(jù)收集與授權(quán)方面的信息,還需要滿足管轄地法律法規(guī)及監(jiān)管的要求。
本書分三個(gè)部分,共17章。
部分為聯(lián)邦學(xué)習(xí)基礎(chǔ)知識(shí),主要介紹聯(lián)邦學(xué)習(xí)的定義、挑戰(zhàn)、應(yīng)用場(chǎng)景和常用技術(shù),包括以下3章。
第1章聯(lián)邦學(xué)習(xí)概述,詳細(xì)介紹了什么是聯(lián)邦學(xué)習(xí)、聯(lián)邦學(xué)習(xí)的應(yīng)用現(xiàn)狀與挑戰(zhàn),然后介紹了分布式學(xué)習(xí)和聯(lián)邦學(xué)習(xí)的區(qū)別與關(guān)聯(lián)。
第2章聯(lián)邦學(xué)習(xí)應(yīng)用場(chǎng)景,本章從金融、生物醫(yī)學(xué)、計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理等多個(gè)方面對(duì)聯(lián)邦學(xué)習(xí)的應(yīng)用場(chǎng)景進(jìn)行介紹。
第3章常用隱私保護(hù)技術(shù),我們首先對(duì)當(dāng)前基于隱私保護(hù)的機(jī)器學(xué)習(xí)算法進(jìn)行了簡(jiǎn)要綜述,然后重點(diǎn)介紹了差分隱私、安全多方計(jì)算和同態(tài)加密等常用的隱私保護(hù)技術(shù)。
第二部分為聯(lián)邦學(xué)習(xí)算法詳述,主要介紹了我們針對(duì)縱向聯(lián)邦學(xué)習(xí)和橫向聯(lián)邦學(xué)習(xí)場(chǎng)景提出來(lái)的諸多創(chuàng)新性聯(lián)邦學(xué)習(xí)算法,包括以下10章。
第4章縱向聯(lián)邦樹模型算法,基于兩種不同的集成方法Bagging和Boosting分別設(shè)計(jì)了兩種算法:縱向聯(lián)邦隨機(jī)森林算法和縱向聯(lián)邦梯度提升算法。
第5章縱向聯(lián)邦線性回歸算法,提出了全新的縱向聯(lián)邦多視角線性回歸算法,從多個(gè)視角對(duì)對(duì)象進(jìn)行建模并聯(lián)合優(yōu)化所有函數(shù)。
第6章縱向聯(lián)邦核學(xué)習(xí)算法,提出了一個(gè)針對(duì)縱向聯(lián)邦場(chǎng)景的核學(xué)習(xí)算法,并設(shè)計(jì)了一個(gè)完整的聯(lián)邦學(xué)習(xí)框架。
第7章異步縱向聯(lián)邦學(xué)習(xí)算法,針對(duì)當(dāng)前縱向聯(lián)邦學(xué)習(xí)算法主要采用的同步并行方法提出了相應(yīng)的異步并行算法,并針對(duì)強(qiáng)凸問(wèn)題提供了理論保證。
第8章基于反向更新的雙層異步縱向聯(lián)邦學(xué)習(xí)算法,提出了一個(gè)反向更新的異步并行算法,以在實(shí)際應(yīng)用中同時(shí)實(shí)現(xiàn)標(biāo)簽數(shù)據(jù)保護(hù)和并行計(jì)算(更新)。
第9章縱向聯(lián)邦深度學(xué)習(xí)算法,提出了一個(gè)針對(duì)當(dāng)下流行的深度學(xué)習(xí)模型的縱向聯(lián)邦學(xué)習(xí)基礎(chǔ)框架,并對(duì)框架進(jìn)行了簡(jiǎn)要的綜合分析。
第10章快速安全的同態(tài)加密數(shù)據(jù)挖掘框架,針對(duì)當(dāng)前同態(tài)加密時(shí)間復(fù)雜度高的問(wèn)題,提出了一個(gè)基于同態(tài)加密的快速分布式數(shù)據(jù)挖掘框架。
第11章橫向聯(lián)邦學(xué)習(xí)算法,在闡述分布式學(xué)習(xí)和橫向聯(lián)邦學(xué)習(xí)之間關(guān)系的基礎(chǔ)上,對(duì)當(dāng)前橫向聯(lián)邦學(xué)習(xí)的主流算法進(jìn)行了較為詳細(xì)的介紹。
第12章混合聯(lián)邦學(xué)習(xí)算法,結(jié)合橫向聯(lián)邦學(xué)習(xí)和縱向聯(lián)邦學(xué)習(xí)的特點(diǎn),提出了適用性更廣、使用步驟簡(jiǎn)單的混合聯(lián)邦學(xué)習(xí)算法。
第13章聯(lián)邦強(qiáng)化學(xué)習(xí),首先介紹了強(qiáng)化學(xué)習(xí)的定義和常用技術(shù)方案,然后介紹了多種聯(lián)邦強(qiáng)化學(xué)習(xí)算法。
第三部分為聯(lián)邦學(xué)習(xí)系統(tǒng)相關(guān)知識(shí),主要介紹了科技設(shè)計(jì)的聯(lián)邦學(xué)習(xí)系統(tǒng)及算法落地的性能優(yōu)化技術(shù),包括以下4章。
第14章FedLearn聯(lián)邦學(xué)習(xí)系統(tǒng),從編程語(yǔ)言與環(huán)境、系統(tǒng)架構(gòu)、跨語(yǔ)言算法支持(函數(shù)調(diào)用)、系統(tǒng)服務(wù)和工程部署等方面全方位地介紹了FedLearn聯(lián)邦學(xué)習(xí)系統(tǒng)。
第15章gRPC在FedLearn中的聯(lián)邦學(xué)習(xí)應(yīng)用實(shí)例,以橫向聯(lián)邦學(xué)習(xí)和縱向聯(lián)邦學(xué)習(xí)的應(yīng)用場(chǎng)景為切入點(diǎn),詳細(xì)介紹了如何使用FedLearn中采用的高性能框架gRPC。
第16章落地場(chǎng)景中的性能優(yōu)化實(shí)踐,介紹了如何在實(shí)際應(yīng)用中對(duì)系統(tǒng)進(jìn)行性能優(yōu)化,并給出了實(shí)際應(yīng)用場(chǎng)景中的優(yōu)化結(jié)果。
第17章基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí),引入?yún)^(qū)塊鏈學(xué)習(xí),介紹了基于區(qū)塊鏈的聯(lián)邦學(xué)習(xí)算法和聯(lián)邦學(xué)習(xí)系統(tǒng)的實(shí)現(xiàn)。
其中,第二部分為本書的重點(diǎn)部分,我們提出了諸多聯(lián)邦學(xué)習(xí)的算法、流程詳解及可能的理論保障。如果讀者沒(méi)有充足的時(shí)間完成全書的閱讀,可以選擇性地進(jìn)行重點(diǎn)部分的閱讀。如果讀者有一定的從業(yè)經(jīng)驗(yàn),本書可能會(huì)是一本不錯(cuò)的參考書。然而,如果讀者是一名初學(xué)者,建議在閱讀本書之前,先進(jìn)行一些機(jī)器學(xué)習(xí)、分布式學(xué)習(xí)以及隱私保護(hù)技術(shù)等基礎(chǔ)理論知識(shí)的學(xué)習(xí)。
本書相比于其他聯(lián)邦學(xué)習(xí)書籍的特色與優(yōu)勢(shì)在于:,本書的作者是扎根于聯(lián)邦學(xué)習(xí)前沿的研究者和從業(yè)者;第二,我們?cè)诒緯刑岢隽吮姸嗖煌谄渌麜娜侣?lián)邦學(xué)習(xí)算法,以饗讀者;第三,我們參考了近兩年全新的文章和綜述,緊跟學(xué)術(shù)和業(yè)界的聯(lián)邦學(xué)習(xí)動(dòng)態(tài)。
在本書的編寫過(guò)程中,我們深深地感受到聯(lián)邦學(xué)習(xí)及其相關(guān)領(lǐng)域技術(shù)的繁多冗雜,因此書中難免出現(xiàn)一些錯(cuò)誤或者不準(zhǔn)確的地方,懇請(qǐng)讀者批評(píng)指正。
感謝科技對(duì)我們撰寫本書的大力支持與幫助!
感謝科技硅谷研發(fā)部基礎(chǔ)用戶算法部的顧彬、單華松、王家洲。
感謝科技算法工程研發(fā)部區(qū)塊鏈平臺(tái)組的王義、孫海波。
感謝科技硅谷研發(fā)部聯(lián)邦學(xué)習(xí)算法部的黨致遠(yuǎn)、范明姐、王佩琪、王新左、張青松、張文夕(按姓名首字母排序)。
前言
部分 聯(lián)邦學(xué)習(xí)基礎(chǔ)知識(shí)
第 1 章 聯(lián)邦學(xué)習(xí)概述 2
1.1 什么是聯(lián)邦學(xué)習(xí) 2
1.1.1 聯(lián)邦學(xué)習(xí)的發(fā)展歷史 3
1.1.2 聯(lián)邦學(xué)習(xí)的工作流程 4
1.1.3 聯(lián)邦學(xué)習(xí)的分類 6
1.2 聯(lián)邦學(xué)習(xí)的應(yīng)用和挑戰(zhàn) 8
1.2.1 聯(lián)邦學(xué)習(xí)的應(yīng)用現(xiàn)狀 8
1.2.2 聯(lián)邦學(xué)習(xí)的核心挑戰(zhàn) 9
1.3 分布式機(jī)器學(xué)習(xí)與聯(lián)邦學(xué)習(xí) 10
1.3.1 分布式機(jī)器學(xué)習(xí)的發(fā)展歷史 10
1.3.2 分布式機(jī)器學(xué)習(xí)概述 11
1.3.3 分布式機(jī)器學(xué)習(xí)與聯(lián)邦學(xué)習(xí)的共同發(fā)展 13
1.4 總結(jié) 14
第 2 章 聯(lián)邦學(xué)習(xí)應(yīng)用場(chǎng)景 15
2.1 聯(lián)邦學(xué)習(xí)與金融 15
2.2 聯(lián)邦學(xué)習(xí)與生物醫(yī)學(xué) 17
2.3 聯(lián)邦學(xué)習(xí)與計(jì)算機(jī)視覺(jué) 19
2.4 聯(lián)邦學(xué)習(xí)與自然語(yǔ)言處理 22
2.5 聯(lián)邦學(xué)習(xí)與邊緣計(jì)算和云計(jì)算 25
2.6 聯(lián)邦學(xué)習(xí)與計(jì)算機(jī)硬件 27
2.7 總結(jié) 29
第 3 章 常用隱私保護(hù)技術(shù) 30
3.1 面向隱私保護(hù)的機(jī)器學(xué)習(xí) 30
3.1.1 概述 30
3.1.2 面向隱私保護(hù)的機(jī)器學(xué)習(xí)發(fā)展 33
3.2 常用的隱私保護(hù)技術(shù) 34
3.2.1 差分隱私 34
3.2.2 安全多方計(jì)算 41
3.2.3 同態(tài)加密 49
3.3 總結(jié) 66
第二部分 聯(lián)邦學(xué)習(xí)算法詳述
第 4 章 縱向聯(lián)邦樹模型算法 68
4.1 樹模型簡(jiǎn)介 68
4.2 縱向聯(lián)邦隨機(jī)森林算法 69
4.2.1 算法結(jié)構(gòu) 69
4.2.2 算法詳述 70
4.2.3 安全性分析 71
4.3 縱向聯(lián)邦梯度提升算法 75
4.3.1 XGBoost 算法 76
4.3.2 SecureBoost 算法 76
4.3.3 所提算法詳述 77
4.4 總結(jié) 78
第 5 章 縱向聯(lián)邦線性回歸算法 79
5.1 縱向聯(lián)邦線性回歸 80
5.1.1 算法訓(xùn)練過(guò)程 81
5.1.2 算法預(yù)測(cè)過(guò)程 81
5.1.3 縱向聯(lián)邦的一個(gè)困境 82
5.2 聯(lián)邦多視角線性回歸 82
5.2.1 基于 BFGS 的二階優(yōu)化方法 84
5.2.2 安全計(jì)算協(xié)議 87
5.3 總結(jié) 92
第 6 章 縱向聯(lián)邦核學(xué)習(xí)算法 93
6.1 引言 93
6.2 雙隨機(jī)核方法 95
6.2.1 問(wèn)題定義 95
6.2.2 核方法的簡(jiǎn)要介紹 96
6.2.3 隨機(jī)傅里葉特征近似 98
6.2.4 雙隨機(jī)梯度 98
6.3 所提算法 99
6.3.1 問(wèn)題表示 100
6.3.2 算法結(jié)構(gòu) 100
6.3.3 算法設(shè)計(jì) 101
6.3.4 場(chǎng)景案例 103
6.4 理論分析 105
6.4.1 收斂性分析 105
6.4.2 安全性分析 105
6.4.3 復(fù)雜度分析 106
6.5 實(shí)驗(yàn)驗(yàn)證 106
6.5.1 實(shí)驗(yàn)設(shè)置 106
6.5.2 實(shí)驗(yàn)結(jié)果和討論 107
6.6 總結(jié) 110
第 7 章 異步縱向聯(lián)邦學(xué)習(xí)算法 111
7.1 引言 111
7.2 相關(guān)工作 112
7.2.1 現(xiàn)有工作概述 112
7.2.2 SGD 類算法回顧 113
7.3 問(wèn)題表示 114
7.4 所提算法 114
7.4.1 算法框架 114
7.4.2 算法詳述 116
7.4.3 場(chǎng)景案例 119
7.5 理論分析 120
7.5.1 收斂性分析 120
7.5.2 安全性分析 123
7.5.3 復(fù)雜度分析 124
7.6 實(shí)驗(yàn)驗(yàn)證 125
7.6.1 實(shí)驗(yàn)設(shè)置 125
7.6.2 實(shí)驗(yàn)結(jié)果和討論 127
7.7 總結(jié) 1