本書全面介紹了擴散模型這種新興的深度生成模型在各個領域的應用,其內容包括AIGC與相關技術、擴散模型基礎、擴散模型的高效采樣、擴散模型的似然最大化、將擴散模型應用于具有特殊結構的數(shù)據(jù)、擴散模型與其他生成模型的關聯(lián)、擴散模型的應用、擴散模型的未來等。本書旨在提供一個情景,幫助讀者深入了解擴散模型,確定擴散模型的關鍵研究領域,以及適合未來進一步探索的研究領域。本書適合高等院校計算機科學、人工智能和醫(yī)學、生物學等交叉學科專業(yè)的師生,以及相關人工智能應用程序的開發(fā)人員閱讀。
楊靈,北京大學博士在讀,研究興趣是機器學習和生成式AI,作為第一作者在ICML、CVPR等人工智能頂會、頂刊發(fā)表過多篇論文,長期擔任TPAMI、ICML、NeurIPS、CVPR、KDD、AAAI等多個頂級學術會議或期刊的程序委員會成員、審稿人,F(xiàn)與OpenAI、斯坦福大學等AI研究機構進行長期的科研合作。曾獲北京大學國家獎學金、學術創(chuàng)新獎、三好學生等獎項。張至隆,北京大學碩士在讀,本科畢業(yè)于北京大學數(shù)學科學學院,研究興趣是擴散模型。曾獲北京大學國琴獎學金、優(yōu)秀畢業(yè)生、三好學生等獎項。張文濤,蒙特利爾學習算法研究所(Mila)博士后研究員。博士畢業(yè)于北京大學計算機學院,師從崔斌教授。研究興趣為大規(guī)模圖學習,作為第一作者在機器學習、數(shù)據(jù)挖掘和數(shù)據(jù)庫等領域發(fā)表論文10余篇。曾獲Apple PhD Fellowship、WAIC云帆獎和北京大學優(yōu)秀博士學位論文等獎項。崔斌,北京大學計算機學院教授、博士生導師、北京大學計算機學院副院長。擔任中國計算機學會數(shù)據(jù)庫專委會副主任,VLDB理事會理事,IEEE TKDE、VLDB Journal、DAPD等國際期刊編委。中國計算機學會杰出會員、IEEE高級會員、ACM會員,2016年入選教育部長江學者特聘教授。
第1 章 AIGC 與相關技術
1.1 AIGC 簡介
1.2 擴散模型簡介
第2 章 擴散模型基礎
2.1 去噪擴散概率模型
2.2 基于分數(shù)的生成模型
2.3 隨機微分方程
2.4 擴散模型的架構
第3 章 擴散模型的高效采樣
3.1 微分方程
3.2 確定性采樣
3.2.1 SDE 求解器
3.2.2 ODE 求解器
3.3 基于學習的采樣
3.3.1 離散方式
3.3.2 截斷擴散
3.3.3 知識蒸餾
第4 章 擴散模型的似然最大化
4.1 似然函數(shù)最大化
4.2 加噪策略優(yōu)化
4.3 逆向方差學習
4.4 精確的對數(shù)似然估計
第5 章 將擴散模型應用于具有特殊結構的數(shù)據(jù)
5.1 離散數(shù)據(jù)
5.2 具有不變性結構的數(shù)據(jù)
5.3 具有流形結構的數(shù)據(jù)
5.3.1 流形已知
5.3.2 流形未知
第6 章 擴散模型與其他生成模型的關聯(lián)
6.1 變分自編碼器與擴散模型
6.2 生成對抗網(wǎng)絡與擴散模型
6.3 歸一化流與擴散模型
6.4 自回歸模型與擴散模型
6.5 基于能量的模型與擴散模型
第7 章 擴散模型的應用
7.1 無條件擴散模型與條件擴散模型
7.2 計算機視覺
7.2.1 圖像超分辨率、圖像修復和圖像翻譯
7.2.2 語義分割
7.2.3 視頻生成
7.2.4 點云補全和點云生成
7.2.5 異常檢測
7.3 自然語言處理
7.4 時間數(shù)據(jù)建模
7.4.1 時間序列插補
7.4.2 時間序列預測
7.5 多模態(tài)學習
7.5.1 文本到圖像的生成
7.5.2 文本到音頻的生成
7.5.3 場景圖到圖像的生成
7.5.4 文本到3D 內容的生成
7.5.5 文本到人體動作的生成
7.5.6 文本到視頻的生成
7.6 魯棒學習
7.7 跨學科應用
7.7.1 人工智能藥物研發(fā)
7.7.2 醫(yī)學影像
第8 章 擴散模型的未來——GPT 及大模型
8.1 預訓練技術簡介
8.1.1 生成式預訓練和對比式預測練
8.1.2 并行訓練技術
8.1.3 微調技術
8.2 GPT 及大模型
8.2.1 GPT-1
8.2.2 GPT-2
8.2.3 GPT-3 和大模型
8.2.4 InstructGPT 和ChatGPT
8.2.5 Visual ChatGPT
8.3 基于GPT 及大模型的擴散模型
8.3.1 算法研究
8.3.2 應用范式
相關資料說明