本書面向廣大資產(chǎn)管理者和各類研究人員,基于機器學習和人工智能,指明從一個投資理念和理論到成功的投資策略具體實施的量化途徑。作者認為一個缺乏理論依據(jù)的投資策略很可能是錯誤的。為此,資產(chǎn)管理者應(yīng)致力于發(fā)展理論,而不僅是回測潛在的交易規(guī)則。本書就是從幫助資產(chǎn)管理者發(fā)現(xiàn)經(jīng)濟和金融理論的角度出發(fā),介紹機器學習的工具。機器學習不是一個黑匣子,也不一定會過擬合。機器學習的工具與經(jīng)典統(tǒng)計方法是互補關(guān)系而不是替代關(guān)系。本書認為機器學習的一些優(yōu)點包括:注重樣本外的可預(yù)測性,而不是樣本內(nèi)的方差判斷;使用計算方法避免依賴一些(或許不切實際的)假設(shè);能夠“學習”復(fù)雜的規(guī)范,包括高維空間中的非線性、分層和非連續(xù)的交互效應(yīng);能夠?qū)⒆兞克阉髋c設(shè)定搜索分離,并能很好地防止多重線性和其他替代效應(yīng)。
中文版序
1 引 言
1.1 動機
1.2 理論很重要
1.3 如何科學地運用機器學習
1.4 過擬合的兩種類型
1.5 提綱
1.6 受眾
1.7 關(guān)于金融機器學習的五個常見誤解
1.8 金融研究的未來
1.9 常見問題
1.10 結(jié)論
1.11 習題
2 降噪和降調(diào)
2.1 動機
2.2 Marcenko-Pastur定理
2.3 帶信號的隨機矩陣
2.4 擬合Marcenko-Pastur分布
2.5 降噪
2.6 降調(diào)
2.7 實驗結(jié)果
2.8 結(jié)論
2.9 習題
3 距離度量
3.1 動機
3.2 基于相關(guān)性的度量
3.3 邊際熵和聯(lián)合熵
3.4 條件熵
3.5 Kullback-Leibler散度
3.6 交叉熵
3.7 互信息
3.8 差異信息
3.9 離散化
3.10 兩個劃分之間的距離
3.11 實驗結(jié)果
3.12 結(jié)論
3.13 習題
4 最優(yōu)聚類
4.1 動機
4.2 相似度矩陣
4.3 聚類的類型
4.4 類集的個數(shù)
4.5 實驗結(jié)果
4.6 結(jié)論
4.7 習題
5 金融標注
5.1 動機
5.2 固定區(qū)間法
5.3 三重阻礙法
5.4 趨勢掃描法
5.5 元標注
5.6 實驗結(jié)果
5.7 結(jié)論
5.8 習題
6 特征重要性分析
6.1 動機
6.2 p值
6.3 變量重要性
6.4 概率加權(quán)準確度
6.5 替代效應(yīng)
6.6 實驗結(jié)果
6.7 結(jié)論
6.8 習題
7 組合構(gòu)建
7.1 動機
7.2 凸組合優(yōu)化
7.3 條件數(shù)
7.4 Markowitz的詛咒
7.5 信號作為協(xié)方差不穩(wěn)定性的來源
7.6 嵌套聚類優(yōu)化算法
7.7 實驗結(jié)果
7.8 結(jié)論
7.9 習題
8 測試集過擬合
8.1 動機
8.2 查準率和召回率
8.3 重復(fù)測試下的查準率和召回率
8.4 夏普比率
8.5 錯誤策略定理
8.6 實驗結(jié)果
8.7 收縮夏普比率
8.8 家族錯誤率
8.9 結(jié)論
8.10 習題
附錄A 合成數(shù)據(jù)測試
附錄B 錯誤策略定理的證明
參考書目
參考文獻