大數(shù)據(jù)安全治理與防范——反欺詐體系建設(shè)
隨著互聯(lián)網(wǎng)的蓬勃發(fā)展以及大數(shù)據(jù)時(shí)代的到來(lái),新的欺詐安全問(wèn)題不斷涌現(xiàn),這也誕生了一個(gè)新的概念——大數(shù)據(jù)安全。大數(shù)據(jù)安全指的是針對(duì)大數(shù)據(jù)時(shí)代背景下的安全風(fēng)險(xiǎn),使用大數(shù)據(jù)、人工智能等新興技術(shù)建立對(duì)抗體系,進(jìn)而進(jìn)行安全治理與防范。本書旨在對(duì)大數(shù)據(jù)時(shí)代背景下的欺詐安全問(wèn)題、大數(shù)據(jù)平臺(tái)工具、反欺詐對(duì)抗技術(shù)和系統(tǒng)進(jìn)行全面的闡釋,以幫助讀者全面學(xué)習(xí)大數(shù)據(jù)安全治理與防范的背景、關(guān)鍵技術(shù)和對(duì)抗思路,并能夠從0到1搭建一個(gè)反欺詐對(duì)抗系統(tǒng)。
本書作為入門大數(shù)據(jù)安全對(duì)抗的理想讀物,將理論與實(shí)踐相結(jié)合,既能加強(qiáng)讀者對(duì)大數(shù)據(jù)安全對(duì)抗的安全場(chǎng)景和技術(shù)原理的理解,又能通過(guò)復(fù)現(xiàn)反欺詐實(shí)戰(zhàn)中的內(nèi)容幫助讀者培養(yǎng)業(yè)務(wù)中的安全對(duì)抗能力。無(wú)論是大數(shù)據(jù)、信息安全相關(guān)從業(yè)人員,還是有志于從事大數(shù)據(jù)安全方向相關(guān)工作的初學(xué)者,都會(huì)在閱讀中受益匪淺。
1. 凝結(jié)一線大廠安全團(tuán)隊(duì)十多年的安全對(duì)抗實(shí)戰(zhàn)經(jīng)驗(yàn),幫助讀者學(xué)習(xí)大數(shù)據(jù)安全治理與防范的背景、關(guān)鍵技術(shù)和對(duì)抗思路,手把手教你打造反欺詐對(duì)抗系統(tǒng)。
2. 本書將理論與實(shí)戰(zhàn)相結(jié)合,不論你是網(wǎng)絡(luò)安全相關(guān)從業(yè)人員,還是大數(shù)據(jù)安全方向的初學(xué)者,本書都可作為你入門大數(shù)據(jù)安全對(duì)抗的一本推薦讀物。
3. 既介紹黑灰產(chǎn)技術(shù)洞察,又涵蓋大數(shù)據(jù)安全對(duì)抗技術(shù),再結(jié)合反欺詐實(shí)戰(zhàn)案例與運(yùn)營(yíng)體系建設(shè),讓大數(shù)據(jù)安全簡(jiǎn)單易上手。
張凱,現(xiàn)任騰訊專家工程師。一直從事大數(shù)據(jù)安全方面的工作,積累了10多年的黑灰產(chǎn)對(duì)抗經(jīng)驗(yàn),主要涉及游戲安全對(duì)抗、業(yè)務(wù)防刷、金融風(fēng)控和反詐騙對(duì)抗系統(tǒng)等。
張旭,現(xiàn)任騰訊高級(jí)工程師。主要從事大數(shù)據(jù)下黑產(chǎn)安全對(duì)抗業(yè)務(wù)、反詐騙對(duì)抗系統(tǒng)開發(fā)方面的工作。曾參與中國(guó)信息通信研究院《電話號(hào)碼標(biāo)記應(yīng)用技術(shù)要求》行業(yè)標(biāo)準(zhǔn)制定,并為《電信網(wǎng)絡(luò)詐騙治理與人工智能應(yīng)用白皮書》提供行業(yè)技術(shù)支持。
目 錄
第 1部分 大數(shù)據(jù)安全基礎(chǔ)
第 1章 緒論 2
1.1 大數(shù)據(jù)時(shí)代的興起 2
1.2 安全風(fēng)控新挑戰(zhàn) 3
1.3 大數(shù)據(jù)安全治理架構(gòu) 4
1.4 本章小結(jié) 7
第 2部分 黑灰產(chǎn)洞察
第 2章 黑產(chǎn)現(xiàn)狀與危害 10
2.1 電信網(wǎng)絡(luò)詐騙 10
2.1.1 詐騙的類型及危害 11
2.1.2 詐騙的特點(diǎn) 13
2.2 營(yíng)銷欺詐 15
2.2.1 欺詐的類型及危害 15
2.2.2 欺詐的特點(diǎn) 17
2.3 金融欺詐 18
2.3.1 欺詐的類型及危害 18
2.3.2 欺詐的特點(diǎn) 19
2.4 其他類型 19
2.4.1 網(wǎng)絡(luò)色情 20
2.4.2 網(wǎng)絡(luò)賭博 20
2.4.3 誘導(dǎo)引流 21
2.4.4 網(wǎng)絡(luò)洗錢 22
2.5 本章小結(jié) 23
第3章 產(chǎn)業(yè)工具 24
3.1 養(yǎng)號(hào)工具 24
3.1.1 貓池 24
3.1.2 接碼平臺(tái) 26
3.1.3 打碼平臺(tái) 26
3.1.4 群控和云控系統(tǒng) 27
3.2 設(shè)備工具 27
3.2.1 改機(jī)工具 28
3.2.2 多開軟件 29
3.2.3 虛擬定位工具 29
3.2.4 全息備份 30
3.3 IP工具 30
3.3.1 代理IP 31
3.3.2 秒撥IP 31
3.3.3 IP魔盒 32
3.4 自動(dòng)化腳本工具 32
3.4.1 按鍵精靈 32
3.4.2 Auto.js 32
3.5 本章小結(jié) 33
第3部分 大數(shù)據(jù)基礎(chǔ)建設(shè)
第4章 大數(shù)據(jù)治理與特征工程 36
4.1 大數(shù)據(jù)平臺(tái) 37
4.1.1 計(jì)算框架 38
4.1.2 存儲(chǔ)方式 39
4.1.3 計(jì)算模式 39
4.2 大數(shù)據(jù)治理 40
4.2.1 數(shù)據(jù)模型 40
4.2.2 元數(shù)據(jù)管理 41
4.2.3 數(shù)據(jù)質(zhì)量管理 41
4.2.4 數(shù)據(jù)生命周期管理 42
4.2.5 數(shù)據(jù)安全 42
4.3 數(shù)據(jù)清洗 43
4.3.1 缺失值處理 43
4.3.2 異常值處理 43
4.3.3 歸一化與標(biāo)準(zhǔn)化 45
4.4 特征工程 46
4.4.1 特征提取和構(gòu)建 46
4.4.2 特征學(xué)習(xí) 46
4.4.3 特征評(píng)估與選擇 49
4.5 本章小結(jié) 52
第4部分 大數(shù)據(jù)安全對(duì)抗技術(shù)與反欺詐實(shí)戰(zhàn)案例
第5章 基于流量的對(duì)抗技術(shù) 54
5.1 人機(jī)驗(yàn)證 55
5.1.1 字符驗(yàn)證碼 56
5.1.2 行為驗(yàn)證碼 57
5.1.3 新型驗(yàn)證碼 58
5.2 風(fēng)險(xiǎn)名單 59
5.2.1 風(fēng)險(xiǎn)名單的意義 59
5.2.2 風(fēng)險(xiǎn)名單的設(shè)計(jì) 59
5.2.3 風(fēng)險(xiǎn)名單的管理 61
5.3 規(guī)則引擎 61
5.3.1 基礎(chǔ)通用規(guī)則 62
5.3.2 業(yè)務(wù)定制規(guī)則 66
5.4 異常檢測(cè)模型 67
5.4.1 傳統(tǒng)統(tǒng)計(jì)檢驗(yàn) 68
5.4.2 無(wú)監(jiān)督模型 69
5.4.3 半監(jiān)督模型 72
5.5 多模態(tài)集成模型 73
5.5.1 多模態(tài)子模型 73
5.5.2 多模態(tài)集成模型 74
5.6 新型對(duì)抗方案 75
5.6.1 小樣本場(chǎng)景問(wèn)題 75
5.6.2 跨平臺(tái)聯(lián)防聯(lián)控問(wèn)題 76
5.7 本章小結(jié) 79
第6章 基于內(nèi)容的對(duì)抗技術(shù) 80
6.1 業(yè)務(wù)場(chǎng)景與風(fēng)險(xiǎn) 80
6.2 標(biāo)簽體系 82
6.2.1 黑白標(biāo)簽體系 82
6.2.2 類別細(xì)分體系 82
6.2.3 多標(biāo)簽體系 83
6.3 文本內(nèi)容對(duì)抗技術(shù) 83
6.3.1 文本預(yù)處理 86
6.3.2 文本無(wú)監(jiān)督模型 89
6.3.3 文本監(jiān)督模型 97
6.4 圖像內(nèi)容對(duì)抗技術(shù) 103
6.4.1 圖像預(yù)處理 103
6.4.2 圖像半監(jiān)督模型 109
6.4.3 圖像監(jiān)督模型 114
6.4.4 主動(dòng)學(xué)習(xí) 122
6.5 多模態(tài)內(nèi)容對(duì)抗技術(shù) 124
6.5.1 多模態(tài)定義 124
6.5.2 模態(tài)融合 125
6.5.3 協(xié)同訓(xùn)練 127
6.6 本章小結(jié) 128
第7章 基于復(fù)雜網(wǎng)絡(luò)的對(duì)抗技術(shù) 129
7.1 復(fù)雜網(wǎng)絡(luò)基礎(chǔ) 130
7.1.1 網(wǎng)絡(luò)分類 130
7.1.2 網(wǎng)絡(luò)表示 131
7.1.3 網(wǎng)絡(luò)存儲(chǔ) 133
7.1.4 網(wǎng)絡(luò)可視化 134
7.2 復(fù)雜網(wǎng)絡(luò)測(cè)度 135
7.2.1 度中心性 136
7.2.2 中介中心性 137
7.2.3 接近中心性 138
7.2.4 特征向量中心性 139
7.2.5 PageRank 141
7.2.6 聚集性測(cè)度 142
7.3 復(fù)雜網(wǎng)絡(luò)傳播模型 145
7.3.1 懶惰隨機(jī)游走傳播 146
7.3.2 個(gè)性化PageRank傳播 150
7.3.3 異構(gòu)網(wǎng)絡(luò)傳播 153
7.4 社區(qū)劃分 155
7.4.1 標(biāo)簽傳播社區(qū)劃分 156
7.4.2 Louvain社區(qū)劃分 160
7.5 圖神經(jīng)網(wǎng)絡(luò) 165
7.5.1 隨機(jī)游走圖嵌入 166
7.5.2 譜域圖神經(jīng)網(wǎng)絡(luò) 169
7.5.3 空域圖神經(jīng)網(wǎng)絡(luò) 173
7.6 本章小結(jié) 178
第8章 反欺詐實(shí)戰(zhàn)案例 179
8.1 婚戀交友反詐騙 179
8.1.1 風(fēng)險(xiǎn)場(chǎng)景 179
8.1.2 事前預(yù)防 180
8.1.3 事中攔截 185
8.1.4 事后回溯 188
8.1.5 時(shí)序聯(lián)合打擊 189
8.1.6 反詐對(duì)抗運(yùn)營(yíng) 190
8.2 營(yíng)銷活動(dòng)反作弊 191
8.2.1 場(chǎng)景案例 191
8.2.2 業(yè)務(wù)數(shù)據(jù) 193
8.2.3 人機(jī)驗(yàn)證對(duì)抗 193
8.2.4 風(fēng)險(xiǎn)名單對(duì)抗 194
8.2.5 規(guī)則引擎對(duì)抗 194
8.2.6 多模態(tài)集成模型 196
8.2.7 團(tuán)伙圖模型對(duì)抗 200
8.3 賭博網(wǎng)址檢測(cè) 204
8.3.1 網(wǎng)址信息 205
8.3.2 文本模型 205
8.3.3 圖像模型 207
8.3.4 多模態(tài)集成模型 209
8.3.5 異構(gòu)圖神經(jīng)網(wǎng)絡(luò)模型 210
8.4 惡意短文本識(shí)別 212
8.4.1 對(duì)抗流程 213
8.4.2 常規(guī)文本對(duì)抗 214
8.4.3 文字變形對(duì)抗 215
8.4.4 新類型對(duì)抗 216
8.4.5 穩(wěn)定期對(duì)抗 217
8.4.6 內(nèi)容對(duì)抗運(yùn)營(yíng) 218
8.5 本章小結(jié) 219
第5部分 反欺詐運(yùn)營(yíng)體系與情報(bào)系統(tǒng)
第9章 反欺詐運(yùn)營(yíng)體系 222
9.1 服務(wù)層 223
9.2 模型層 225
9.2.1 離線評(píng)估 225
9.2.2 線上監(jiān)控 225
9.3 特征層 229
9.3.1 穩(wěn)定性監(jiān)控 229
9.3.2 異常值監(jiān)控 229
9.4 數(shù)據(jù)層 230
9.5 事故分級(jí)與告警 231
9.6 本章小結(jié) 232
第 10章 情報(bào)系統(tǒng) 233
10.1 體系架構(gòu) 234
10.2 情報(bào)獲取 235
10.3 情報(bào)加工 235
10.4 情報(bào)分析 236
10.5 情報(bào)應(yīng)用 237
10.6 本章小結(jié) 239