本書是一本理論扎實,同時聯(lián)系實際應(yīng)用的圖書。全書系統(tǒng)地介紹了因果推斷的基本知識、基于機器學習的因果推斷方法和基于因果推斷的機器學習方法及其在一些重要領(lǐng)域的應(yīng)用。 全書共分6章。第1章從結(jié)構(gòu)因果模型和潛在結(jié)果框架出發(fā),介紹因果推斷的基本概念和方法。第2章介紹近年統(tǒng)計和機器學習文獻中出現(xiàn)的一些重要的基于機器學習的因果推斷方法。第3章介紹能夠提高機器學習模型的泛化能力的因果表征學習。第4章介紹因果機器學習如何提高機器學習模型的可解釋性與公平性。第5章介紹因果機器學習在推薦系統(tǒng)和學習排序中的應(yīng)用。第6章是對全書的一個總結(jié)和對未來的展望。 本書對結(jié)合因果推斷和機器學習的理論與實踐進行了介紹。并在第1版的基礎(chǔ)上對一些陳舊的內(nèi)容做了更新。通過閱讀本書,讀者不僅可以掌握因果機器學習的基礎(chǔ)理論,還可對本書中提到的論文代碼進行鉆研,從而在實踐中加深對因果機器學習的理解。
郭若城 倫敦字節(jié)跳動人工智能實驗室機器學習研究員。研究重點為因果推斷和可置信的機器學習在推薦系統(tǒng)、搜索排序和圖數(shù)據(jù)中的應(yīng)用。曾獲美國亞利桑那州立大學杰出計算機科學博士生獎項。程璐 美國伊利諾伊芝加哥分校計算機系助理教授,于2022年獲美國亞利桑那州立大學(ASU)計算機科學專業(yè)博士學位,師從劉歡教授。研究方向包括社會負責任人工智能,具體為人工智能的公平性、可解釋性、隱私保護、可泛化性、對社會的公益性、因果機器學習,以及社會計算。劉昊 美國加州理工學院在讀計算機專業(yè)博士生,本科畢業(yè)于南京大學匡亞明學院,研究方向為可置信的機器學習、因果機器學習。劉歡 美國亞利桑那州立大學計算機科學與工程學院教授,ACM Fellow、AAAI Fellow、AAAS Fellow、IEEE Fellow。研究重點是開發(fā)人工智能、數(shù)據(jù)挖掘、機器學習和社會計算的計算方法,并設(shè)計高效的算法有效地解決了從基礎(chǔ)研究、特征選擇、社會媒體挖掘到現(xiàn)實世界應(yīng)用的問題。
第1章 因果推斷入門 1
1.1 定義因果關(guān)系的兩種基本框架 1
1.1.1 結(jié)構(gòu)因果模型 3
1.1.2 潛在結(jié)果框架 17
1.2 因果識別和因果效應(yīng)估測 21
1.2.1 工具變量 22
1.2.2 斷點回歸設(shè)計 27
1.2.3 前門準則 30
1.2.4 雙重差分模型 32
1.2.5 合成控制 34
1.2.6 因果中介效應(yīng)分析 39
1.2.7 部分識別、ATE的上下界和敏感度分析 44
第2章 用機器學習解決因果推斷問題 52
2.1 基于集成學習的因果推斷 53
2.2 基于神經(jīng)網(wǎng)絡(luò)的因果推斷 57
2.2.1 反事實回歸網(wǎng)絡(luò) 57
2.2.2 因果效應(yīng)變分自編碼器 62
2.2.3 因果中介效應(yīng)分析變分自編碼器 69
2.2.4 針對線上評論多方面情感的多重因果效應(yīng)估計 71
2.2.5 基于多模態(tài)代理變量的多方面情感效應(yīng)估計 74
2.2.6 在網(wǎng)絡(luò)數(shù)據(jù)中解決因果推斷問題 77
第3章 因果表征學習與泛化能力 82
3.1 數(shù)據(jù)增強 84
3.1.1 利用眾包技術(shù)的反事實數(shù)據(jù)增強 84
3.1.2 基于規(guī)則的反事實數(shù)據(jù)增強 89
3.1.3 基于模型的反事實數(shù)據(jù)增強 91
3.2 提高模型泛化能力的歸納偏置 96
3.2.1 使用不變預測的因果推理 96
3.2.2 獨立機制原則 101
3.2.3 因果學習和反因果學習 102
3.2.4 半同胞回歸 103
3.2.5 不變風險最小化 105
3.2.6 不變合理化 113
第4章 可解釋性、公平性和因果機器學習 120
4.1 可解釋性 121
4.1.1 可解釋性的屬性 122
4.1.2 基于相關(guān)性的可解釋性模型 124
4.1.3 基于因果機器學習的可解釋性模型 127
4.2 公平性 144
4.2.1 不公平機器學習的典型實例 145
4.2.2 機器學習不公平的原因 147
4.2.3 基于相關(guān)關(guān)系的公平性定義 149
4.2.4 因果推斷對公平性研究的重要性 153
4.2.5 因果公平性定義 156
4.2.6 基于因果推斷的公平機器學習 162
4.3 因果推斷在可信和負責任的人工智能中的其他應(yīng)用 165
第5章 特定領(lǐng)域的機器學習 168
5.1 推薦系統(tǒng)與因果機器學習 169
5.1.1 推薦系統(tǒng)簡介 169
5.1.2 用因果推斷修正推薦系統(tǒng)中的偏差 179
5.2 基于因果推斷的學習排序 195
5.2.1 學習排序簡介 196
5.2.2 用因果推斷修正學習排序中的偏差 200
第6章 總結(jié)與展望 212
6.1 總結(jié) 212
6.2 展望 218
術(shù)語表 220
參考文獻 231