本書對高維統(tǒng)計學(xué)進(jìn)行了詳盡介紹,重點介紹核心方法論和理論——包括尾部界、集中不等式、一致律和經(jīng)驗過程以及隨機(jī)矩陣。此外還深入探索了特定的模型類,包括稀疏線性模型、用秩約束矩陣模型、圖模型和各種類型的非參數(shù)模型。
本書贊譽
“非漸近、高維統(tǒng)計理論對現(xiàn)代統(tǒng)計和機(jī)器學(xué)習(xí)至關(guān)重要.本書很獨特,用非常清晰、完善且統(tǒng)一的方式介紹了這一領(lǐng)域.作者將概率論及其在統(tǒng)計中的應(yīng)用組合到了一起,涵蓋從測度集中度到圖模型的內(nèi)容.對研究生和科研工作者來說這是非常完美的.本書在接下來很多年里一定會成為這個領(lǐng)域的標(biāo)準(zhǔn)參考書.”
——Larry Wasserman,卡耐基梅隆大學(xué)
“Martin將他大量強(qiáng)大的分析方法用在了當(dāng)前的問題——對大數(shù)據(jù)模型的分析中.這個新領(lǐng)域的海量知識結(jié)合他強(qiáng)大的分析技巧,使得本書成為令人印象深刻并為之傾倒的杰作,這勢必會成為所有敢于嘗試這一領(lǐng)域的科研工作者的重要參考書.”
——Trevor Hastie,斯坦福大學(xué)
“本書很好地介紹了高維理論統(tǒng)計中一個可能發(fā)展最快的領(lǐng)域——研究基于樣本大小和數(shù)據(jù)維度給出估計概率界的非漸近理論.本書給出了這個領(lǐng)域至今最全面、清晰、專業(yè)的介紹,勢必將成為該領(lǐng)域最權(quán)威的參考文獻(xiàn)和教材.”
——Genevera Allen,萊斯大學(xué)
“伴隨著對高維數(shù)據(jù)分析的大量研究,過去二十年里統(tǒng)計理論和應(yīng)用經(jīng)歷了一場復(fù)興.沒有人比Martin對高維統(tǒng)計有更加深刻的理解.本書將他的研究成果以書的形式展現(xiàn)出來.隨著高維統(tǒng)計這個領(lǐng)域持續(xù)產(chǎn)生突破性的研究成果,本書對于剛?cè)腴T的學(xué)生和經(jīng)驗豐富的學(xué)者都將是非常棒的參考資料.”
——John Lafferty,耶魯大學(xué)
“這本有關(guān)高維統(tǒng)計的杰出圖書由這個領(lǐng)域富有創(chuàng)造力的知名學(xué)者所著,全面介紹了統(tǒng)計機(jī)器學(xué)習(xí)中的很多重要內(nèi)容,而且從基礎(chǔ)內(nèi)容到很多前沿領(lǐng)域的最新成果都是自封閉的.對于想要學(xué)習(xí)和研究現(xiàn)代統(tǒng)計機(jī)器學(xué)習(xí)理論、方法和算法的人來說,這是一本必須要讀的書.”
——范劍青,普林斯頓大學(xué)
“本書對高維統(tǒng)計中的數(shù)學(xué)技巧和方法給出了深入、直觀的理解.書中非常詳細(xì)地介紹了概率論中的主要技術(shù)工具,并且用清晰明了的方式展示了高維統(tǒng)計問題中統(tǒng)計方法和算法的構(gòu)造及分析.這是一本杰出的、發(fā)人深省的大師級著作!”
——Peter Bühlmann,蘇黎世聯(lián)邦理工學(xué)院
“Martin的這本新書包含了高維統(tǒng)計推斷中的前沿內(nèi)容,主要關(guān)注稀疏和非參數(shù)估計相關(guān)的精確非漸近結(jié)果.無論是從它所包含的最前沿結(jié)果的廣度還是從它所展現(xiàn)的結(jié)果的深度來說,這都是所有數(shù)理統(tǒng)計和理論機(jī)器學(xué)習(xí)的研究生的必讀圖書.書中的闡述極其清晰,從關(guān)于必要的概率工具的簡介性章節(jié)開始,涵蓋了高維統(tǒng)計中最前沿的進(jìn)展,并且非常巧妙地做到了重要性和數(shù)學(xué)深度之間的完美結(jié)合.”
——Francis Bach,法國國家信息與自動化研究所
“Wainwright的這本書主要介紹了概率理論和數(shù)理統(tǒng)計中對于理解高維統(tǒng)計所遇新現(xiàn)象至關(guān)重要的部分,講述得非常清晰、深刻.每章都用直觀的例子或者模擬來開篇,并將它們系統(tǒng)地延伸成強(qiáng)大的數(shù)學(xué)工具或者推斷中基本問題的完整答案.不管是用來系統(tǒng)閱讀還是作為一本參考書,這本書都不容易,但卻相當(dāng)精致,值得一讀.”
——Peter Bickel,加州大學(xué)伯克利分校
本書贊譽
譯者序
致謝
第1章 簡介1
1.1 經(jīng)典理論和高維理論1
1.2 高維會產(chǎn)生什么問題2
1.2.1 線性判別分析2
1.2.2 協(xié)方差估計4
1.2.3 非參數(shù)回歸6
1.3 高維中什么能幫助我們8
1.3.1 向量的稀疏性8
1.3.2 協(xié)方差矩陣中的結(jié)構(gòu)10
1.3.3 回歸形式的結(jié)構(gòu)11
1.4 什么是非漸近的觀點12
1.5 全書概述13
1.5.1 各章內(nèi)容13
1.5.2 閱讀背景要求14
1.5.3 教學(xué)建議和流程圖15
1.6 參考文獻(xiàn)和背景16
第2章 基本尾部概率界和集中不等式18
2.1 經(jīng)典的界18
2.1.1 從馬爾可夫不等式到Chernoff界18
2.1.2 次高斯隨機(jī)變量和Hoeffding界19
2.1.3 次指數(shù)隨機(jī)變量和Bernstein界22
2.1.4 一些單邊結(jié)果26
2.2 基于鞅的方法28
2.2.1 背景28
2.2.2 鞅差序列的集中度界30
2.3 高斯隨機(jī)變量的Lipschitz函數(shù)35
2.4 附錄A:次高斯隨機(jī)變量的等價性39
2.5 附錄B:次指數(shù)隨機(jī)變量的等價性42
2.6 參考文獻(xiàn)和背景43
2.7 習(xí)題44
第3章 測度集中度51
3.1 基于熵技巧的集中度51
3.1.1 熵及其相關(guān)性質(zhì)51
3.1.2 Herbst方法及其延伸52
3.1.3 可分凸函數(shù)和熵方法54
3.1.4 張量化和可分凸函數(shù)56
3.2 集中度的幾何觀點58
3.2.1 集中度函數(shù)59
3.2.2 與Lipschitz函數(shù)的聯(lián)系60
3.2.3 從幾何到集中度63
3.3 Wasserstein距離和信息不等式66
3.3.1 Wasserstein距離66
3.3.2 傳輸成本和集中不等式67
3.3.3 傳輸成本的張量化70
3.3.4 馬爾可夫鏈的傳輸成本不等式71
3.3.5 非對稱耦合成本72
3.4 經(jīng)驗過程的尾部概率界75
3.4.1 一個泛函Hoeffding不等式75
3.4.2 一個泛函Bernstein不等式77
3.5 參考文獻(xiàn)和背景79
3.6 習(xí)題80
第4章 一致大數(shù)定律85
4.1 動機(jī)85
4.1.1 累積分布函數(shù)的一致收斂85
4.1.2 更一般函數(shù)類的一致定律87
4.2 基于Rademacher復(fù)雜度的一致定律90
4.3 Rademacher復(fù)雜度的上界94
4.3.1 多項式識別的函數(shù)類94
4.3.2 Vapnik-Chervonenkis維數(shù)96
4.3.3 VC維數(shù)的控制99
4.4 參考文獻(xiàn)和背景100
4.5 習(xí)題101
第5章 度量熵及其用途104
5.1 覆蓋和填裝104
5.2 高斯復(fù)雜度和Rademacher復(fù)雜度113
5.3 度量熵和次高斯過程115
5.3.1 一步離散化的上確界116
5.3.2 離散化界的例子117
5.3.3 鏈方法和Dudley熵積分119
5.4 一些高斯比較不等式123
5.4.1 一般的比較不等式結(jié)果123
5.4.2 Slepian和Sudakov-Fernique不等式125
5.4.3 高斯收縮不等式126
5.5 Sudakov下界127
5.6 鏈方法和Orlicz過程128
5.7 參考文獻(xiàn)和背景131
5.8 習(xí)題132
第6章 隨機(jī)矩陣和協(xié)方差估計136
6.1 預(yù)備知識136
6.1.1 符號和基本結(jié)果136
6.1.2 協(xié)方差矩陣估計問題137
6.2 Wishart矩陣及其性質(zhì)138
6.3 次高斯總體的協(xié)方差矩陣141
6.4 一般矩陣的界144
6.4.1 矩陣分析背景知識144
6.4.2 矩陣的尾部條件145
6.4.3 矩陣Chernoff方法和獨立分解147
6.4.4 隨機(jī)矩陣的上尾部概率界149
6.4.5 協(xié)方差矩陣的結(jié)果153
6.5 帶結(jié)構(gòu)的協(xié)方差矩陣的界154
6.5.1 未知稀疏與截斷155
6.5.2 漸近稀疏157
6.6 附錄:定理6.1的證明159
6.7 參考文獻(xiàn)和背景161
6.8 習(xí)題162
第7章 高維情形下的稀疏線性模型167
7.1 問題及應(yīng)用167
7.1.1 不同的稀疏模型167
7.1.2 稀疏線性模型的應(yīng)用168
7.2 無噪情形下的還原171
7.2.1 1松弛172
7.2.2 精確還原和限制零空間172
7.2.3 限制零空間的充分條件174
7.3 有噪情形下的估計178
7.3.1 受限特征值條件178
7.3.2 嚴(yán)格稀疏模型下的2誤差界180
7.3.3 隨機(jī)設(shè)計矩陣的受限零空間和特征值183
7.4 預(yù)測誤差的界186
7.5 變量或子集選擇188
7.5.1 Lasso的變量選擇相合性188
7.5.2 定理7.21的證明191
7.6 附錄:定理7.16的證明193
7.7 參考文獻(xiàn)和背景195
7.8 習(xí)題197
第8章 高維下的主成分分析204
8.1 主成分和降維204
8.1.1 PCA的解釋和應(yīng)用205
8.1.2 特征值和特征空間的擾動208
8.2 一般特征向量的界209
8.2.1 一個一