在大數(shù)據(jù)和人工智能時代,如何在享受新技術(shù)帶來的便利性的同時保護自己的隱私,是一個重要的問題。本書系統(tǒng)講解了隱私計算的基礎(chǔ)技術(shù)和實踐案例,全書共有11 章,按層次劃分為三部分。第一部分全面系統(tǒng)地闡述隱私加密計算技術(shù),包括秘密共享、同態(tài)加密、不經(jīng)意傳輸和混淆電路。第二部分介紹隱私保護計算技術(shù),包括差分隱私、可信執(zhí)行環(huán)境和聯(lián)邦學(xué)習(xí)。第三部分介紹基于隱私計算技術(shù)構(gòu)建的隱私計算平臺和實踐案例,隱私計算平臺主要包括面向聯(lián)邦學(xué)習(xí)的FATE 平臺和加密數(shù)據(jù)庫的CryptDB 系統(tǒng)等五個平臺,以及隱私計算平臺的效率問題和常見的加速策略;實踐案例部分主要介紹包括金融營銷與風(fēng)控、廣告計費、廣告推薦、數(shù)據(jù)查詢、醫(yī)療、語音識別及政務(wù)等領(lǐng)域的應(yīng)用案例。此外,本書還展望了隱私計算未來的研究和落地方向。在附錄中介紹了當(dāng)前最新的中國數(shù)據(jù)保護法律概況。本書可供計算機科學(xué)、隱私保護、大數(shù)據(jù)和人工智能相關(guān)專業(yè)的學(xué)生,以及對隱私計算有興趣的相關(guān)從業(yè)者閱讀,也適合從事隱私保護相關(guān)研究的研究人員、法律法規(guī)制定者和政府監(jiān)管部門閱讀。
陳 凱香港科技大學(xué)計算機科學(xué)與工程系副教授、博導(dǎo)、研究生部主任,智能網(wǎng)絡(luò)與系統(tǒng)實驗室(iSING Lab)主任,香港科大-微信人工智能技術(shù)聯(lián)合實驗室(WHAT Lab)主任,香港人工智能與機器人學(xué)會(HKSAIR)執(zhí)行副理事長,香港主題研究計劃(Theme-based Reseach Scheme)首席科學(xué)家。主要研究方向包括數(shù)據(jù)中心網(wǎng)絡(luò)、云計算、大數(shù)據(jù)和人工智能底層系統(tǒng)和基礎(chǔ)架構(gòu)。擔(dān)任ACM SIGCOMM、USENIX NSDI、IEEE INFOCOM、IEEE/ACM Transactions on Networking、Big Data、Cloud Computing等國際頂尖會議和期刊的程序委員會委員和編委,亞太網(wǎng)絡(luò)研討會(APNet)的發(fā)起人和執(zhí)行委員會主席。陳凱本科和碩士畢業(yè)于中國科學(xué)技術(shù)大學(xué),獲得中國科學(xué)院院長獎,博士畢業(yè)于美國西北大學(xué)。楊 強加拿大工程院及加拿大皇家科學(xué)院兩院院士,微眾銀行首席人工智能官,香港科技大學(xué)講席教授,AAAI 2021大會主席,中國人工智能學(xué)會(CAAI)榮譽副理事長,香港人工智能與機器人學(xué)會(HKSAIR)理事長以及智能投研技術(shù)聯(lián)盟(ITL)主席。他是AAAI/ACM/CAAI/IEEE/IAPR/AAAS Fellow,也是IEEE Transactions on Big Data和ACM Transactions on Intelligent Systems and Technology創(chuàng)始主編,以及多個國際人工智能和數(shù)據(jù)挖掘領(lǐng)域雜志編委。曾獲2019年度“吳文俊人工智能科學(xué)技術(shù)獎”杰出貢獻獎,2017年ACM SIGKDD杰出服務(wù)獎。楊強畢業(yè)于北京大學(xué),于1989年在馬里蘭大學(xué)獲得計算機博士學(xué)位,之后在加拿大滑鐵盧大學(xué)和Simon Fraser大學(xué)任教,他的研究領(lǐng)域包括人工智能、數(shù)據(jù)挖掘和機器學(xué)習(xí)等。他曾任華為諾亞方舟實驗室主任,第四范式公司聯(lián)合創(chuàng)始人,香港科技大學(xué)計算機與工程系系主任以及國際人工智能聯(lián)合會(IJCAI)理事會主席。領(lǐng)銜全球遷移學(xué)習(xí)和聯(lián)邦學(xué)習(xí)研究及應(yīng)用,最近的著作有《遷移學(xué)習(xí)》、《聯(lián)邦學(xué)習(xí)》和《聯(lián)邦學(xué)習(xí)實戰(zhàn)》等。
推薦序
前言
數(shù)學(xué)符號
第1 章隱私計算介紹/1
1.1 隱私計算的定義與背景/2
1.1.1 隱私計算的定義與分類/2
1.1.2 隱私計算的發(fā)展歷程/6
1.2 隱私計算的技術(shù)實現(xiàn)/8
1.3 隱私計算平臺與案例/10
1.4 隱私計算的挑戰(zhàn)/10
第2 章秘密共享/13
2.1 問題模型及定義/15
2.1.1 秘密共享問題模型/15
2.1.2 秘密共享定義/16
2.2 原理與實現(xiàn)/19
2.2.1 秘密共享方案的發(fā)展/19
2.2.2 經(jīng)典秘密共享方案/21
2.2.3 秘密共享方案的同態(tài)特性/26
2.3 優(yōu)缺點分析/28
2.4 應(yīng)用場景/28
2.4.1 秘密共享在橫向聯(lián)邦學(xué)習(xí)中的應(yīng)用/28
2.4.2 秘密共享在縱向聯(lián)邦學(xué)習(xí)中的應(yīng)用/31
2.4.3 秘密共享在安全多方計算中的應(yīng)用/32
第3 章同態(tài)加密/35
3.1 問題模型及定義/36
3.2 原理與實現(xiàn)/39
3.2.1 群/40
3.2.2 環(huán)/41
3.2.3 格/41
3.2.4 部分同態(tài)加密/42
3.2.5 近似同態(tài)加密/44
3.2.6 全同態(tài)加密/45
3.2.7 層級同態(tài)加密/48
3.3 優(yōu)缺點分析/50
3.3.1 同態(tài)加密的優(yōu)點/50
3.3.2 同態(tài)加密的缺點/51
3.4 應(yīng)用場景/52
3.4.1 密文檢索/52
3.4.2 云機器學(xué)習(xí)服務(wù)/54
第4 章不經(jīng)意傳輸/57
4.1 問題模型及定義/58
4.2 不經(jīng)意傳輸?shù)膶崿F(xiàn)/58
4.2.1 基于公鑰加密的不經(jīng)意傳輸/58
4.2.2 不經(jīng)意傳輸?shù)臄U展與優(yōu)化/59
4.3 應(yīng)用場景/61
第5 章混淆電路/63
5.1 問題模型及定義/64
5.2 混淆電路的實現(xiàn)與優(yōu)化/65
5.2.1 使用不經(jīng)意傳輸?shù)暮唵螌崿F(xiàn)/66
5.2.2 混淆電路計算與門電路/67
5.2.3 任意邏輯門和電路/67
5.2.4 主流的優(yōu)化方案和代價分析/69
5.3 優(yōu)缺點分析/71
5.4 應(yīng)用場景/72
5.4.1 與其他安全多方計算協(xié)議混合使用/72
5.4.2 混淆電路實現(xiàn)一般的安全多方計算/73
第6 章差分隱私/75
6.1 問題模型及定義/7
6.1.1 隨機回答的問題模型及定義/77
6.1.2 差分隱私的問題模型及定義/78
6.2 實現(xiàn)方法及性質(zhì)/83
6.2.1 離散值域:隨機回答/83
6.2.2 連續(xù)值域:拉普拉斯噪聲法和高斯噪聲法/83
6.2.3 差分隱私的性質(zhì)/86
6.3 優(yōu)缺點分析/88
6.4 應(yīng)用場景/90
6.4.1 傳統(tǒng)數(shù)據(jù)分析/90
6.4.2 機器學(xué)習(xí)/92
第7 章可信執(zhí)行環(huán)境/97
7.1 可信執(zhí)行環(huán)境簡介/98
7.2 原理與實現(xiàn)/99
7.2.1 ARM TrustZone/99
7.2.2 Intel SGX/101
7.2.3 AMD SEV/102
7.2.4 AEGIS/104
7.2.5 TPM/104
7.3 優(yōu)缺點分析/104
7.4 應(yīng)用場景/106
7.4.1 移動終端/106
7.4.2 云計算/108
7.4.3 區(qū)塊鏈/110
第8 章聯(lián)邦學(xué)習(xí)/111
8.1 聯(lián)邦學(xué)習(xí)的背景、定義與分類/112
8.1.1 聯(lián)邦學(xué)習(xí)的背景/112
8.1.2 聯(lián)邦學(xué)習(xí)的定義/113
8.1.3 聯(lián)邦學(xué)習(xí)的分類/113
8.1.4 聯(lián)邦學(xué)習(xí)的安全性/115
8.2 橫向聯(lián)邦學(xué)習(xí)/16
8.2.1 橫向聯(lián)邦學(xué)習(xí)架構(gòu)、訓(xùn)練與推理/116
8.2.2 聯(lián)邦平均算法/117
8.2.3 橫向聯(lián)邦學(xué)習(xí)的隱私安全性/118
8.3 縱向聯(lián)邦學(xué)習(xí)/122
8.3.1 縱向聯(lián)邦學(xué)習(xí)架構(gòu)、訓(xùn)練與推理/122
8.3.2 縱向聯(lián)邦線性回歸/123
8.3.3 縱向聯(lián)邦學(xué)習(xí)的隱私安全性/125
8.4 聯(lián)邦遷移學(xué)習(xí)/125
8.4.1 遷移學(xué)習(xí)簡介/126
8.4.2 聯(lián)邦遷移學(xué)習(xí)算法訓(xùn)練和推理/126
8.4.3 聯(lián)邦遷移學(xué)習(xí)的安全性/129
8.5 聯(lián)邦學(xué)習(xí)的應(yīng)用場景/129
8.5.1 自然語言處理/130
8.5.2 醫(yī)療/130
8.5.3 金融/131
8.6 聯(lián)邦學(xué)習(xí)的未來展望/131
8.6.1 隱私與效率、性能的權(quán)衡/132
8.6.2 去中心化的聯(lián)邦學(xué)習(xí)/132
第9 章隱私計算平臺/135
9.1 隱私計算平臺概述/136
9.2 FATE 安全計算平臺/136
9.2.1 平臺概述/136
9.2.2 FATE 中的隱私計算技術(shù)/138
9.2.3 平臺工作流程/139
9.2.4 應(yīng)用場景/141
9.3 CryptDB 加密數(shù)據(jù)庫系統(tǒng)/142
9.3.1 系統(tǒng)概述/142
9.3.2 隱私計算技術(shù)在CryptDB 中的實現(xiàn):基于SQL 感知的加密策略/144
9.3.3 基于密文的查詢方法/145
9.3.4 應(yīng)用場景/147
9.4 MesaTEE 安全計算平臺Teaclave/148
9.4.1 飛槳深度學(xué)習(xí)平臺與安全計算/148
9.4.2 PaddleFL 聯(lián)邦學(xué)習(xí)框架/149
9.4.3 MesaTEE 平臺概述/150
9.4.4 MesaTEE 底層可信執(zhí)行環(huán)境/150
9.4.5 FaaS 服務(wù)/152
9.4.6 執(zhí)行器MesaPy/153
9.4.7 應(yīng)用場景——MesaTEE 與飛槳/154
9.5 Conclave 查詢系統(tǒng)/155
9.5.1 系統(tǒng)概述/155
9.5.2 Conclave 隱私安全技術(shù)介紹/156
9.5.3 Conclave 查詢編譯/158
9.5.4 應(yīng)用場景/161
9.6 PrivPy 隱私計算平臺/161
9.6.1 PrivPy 平臺概述/161
9.6.2 平臺后端安全計算介紹/163
9.6.3 用戶編程接口/165
9.6.4 應(yīng)用場景/166
9.7 隱私計算平臺效率問題和加速策略/166
9.7.1 隱私計算技術(shù)中的效率問題/167
9.7.2 異構(gòu)加速隱私計算/168
9.7.3 網(wǎng)絡(luò)優(yōu)化解決數(shù)據(jù)傳輸問題/171
第10 章隱私計算案例解析/175
10.1 隱私計算在金融營銷與風(fēng)控中的應(yīng)用/176
10.2 隱私計算在廣告計費中的應(yīng)用/182
10.3 隱私計算在廣告推薦中的應(yīng)用/185
10.4 隱私計算在數(shù)據(jù)查詢中的應(yīng)用/187
10.5 隱私計算在醫(yī)療領(lǐng)域的應(yīng)用:基因研究/189
10.6 隱私計算在醫(yī)療領(lǐng)域的應(yīng)用:醫(yī)藥研究/193
10.7 隱私計算在語音識別領(lǐng)域的應(yīng)用/194
10.8 隱私計算在政務(wù)部門的應(yīng)用/196
10.9 隱私計算在用戶數(shù)據(jù)統(tǒng)計的應(yīng)用/ 203
第11 章隱私計算未來展望/209
參考文獻214
附錄A 中國數(shù)據(jù)保護法律概況/233
A.1 《個人信息保護法》與數(shù)據(jù)保護/234
A.1.1 適用范圍/234
A.1.2 個人信息處理原則/234
A.1.3 個人信息保護影響評估制度/235
A.1.4 禁止“大數(shù)據(jù)殺熟”的算法歧視/235
A.1.5 個人信息跨境提供規(guī)則/236
A.1.6 個人信息主體權(quán)利/236
A.2 《數(shù)據(jù)安全法》與數(shù)據(jù)保護/ 237
A.2.1 適用范圍和域外效力/237
A.2.2 數(shù)據(jù)分類分級保護制度/237
A.2.3 數(shù)據(jù)安全保護義務(wù)/237
A.3 《網(wǎng)絡(luò)安全法》與數(shù)據(jù)保護/ 238