本書講述了數據庫技術的發(fā)展史,從數據和數據庫始,到區(qū)塊鏈和大模型止,全面介紹了數據庫技術的發(fā)展歷程,包括數據庫領域天才科學家、產品先行者的貢獻,以及中國數據庫的探索和發(fā)展格局,并試圖對中國數據庫的根社區(qū)發(fā)展、數據庫架構演進方向做出推導和建議。
本書深入淺出地探討了數據庫發(fā)展過程中的關鍵技術、核心挑戰(zhàn),以及那些引人入勝的趣聞軼事。同時,書中還對數據庫行業(yè)內的典型企業(yè)進行了細致的分析。通過閱讀本書,讀者不僅能領略到技術的魅力,還能從中汲取關于個人職業(yè)發(fā)展和企業(yè)產品研發(fā)的寶貴啟示。此外,本書通過對數據庫歷史上成功與失敗的企業(yè)案例剖析,還為讀者提供了技術與商業(yè)融合的寶貴經驗。
本書不僅適合對數據庫技術感興趣的讀者,也非常適合作為本科生和研究生的教材,幫助他們深入了解數據庫行業(yè)的發(fā)展歷程。
【1】全面介紹了數據庫技術的發(fā)展歷程,包括數據庫領域天才科學家、產品先行者的貢獻,以及中國數據庫的探索和發(fā)展格局。
【2】通過系統的刻畫,幫助讀者理解數據庫從商業(yè)時代、開源時代到云時代的演進歷程,深入淺出地介紹了數據庫發(fā)展過程中的關鍵技術、核心挑戰(zhàn)、奇聞軼事。
【3】讀者在品味技術的同時,還可以思考技術與商業(yè)結合的成敗得失。
蓋國強,云和恩墨創(chuàng)始人、華為鯤鵬MVP,曾獲頒Oracle中國地區(qū)ACE和ACE總監(jiān)榮譽,著有《數據安全警示錄》《深入解析Oracle》《循序漸進 Oracle》等技術書籍。當前致力于通過云和恩墨公司為全球用戶提供專業(yè)的數據庫軟件、產品和服務。
目 錄
1 第 1章 數據和數據庫
1.1 什么是數據 2
1.2 什么是數據庫 3
1.2.1 數據庫與生活 3
1.2.2 數據庫的三個時代 5
1.3 數據庫的構成 7
1.3.1 優(yōu)化器技術 9
1.3.2 事務管理技術 10
1.3.3 日志和恢復 11
1.4 數據庫的分類 12
1.4.1 從模型看數據庫 13
1.4.2 從架構看數據庫 19
1.4.3 從部署看數據庫 33
1.5 數據倉庫 35
1.5.1 發(fā)展階段 35
1.5.2 Snowflake的崛起 36
1.6 大數據時代 38
1.6.1 大數據的特征 39
1.6.2 Hadoop興衰 40
1.6.3 Hadoop啟示錄 43
1.7 大模型時代 43
1.8 總結 49
50 第 2章 數據庫技術的拓荒者
2.1 前數據庫時代 52
2.1.1 機械數據處理時代 52
2.1.2 計算機數據處理時代 54
2.1.3 文件管理時代 55
2.2 網狀數據庫之父查爾斯·威廉·巴赫曼 57
2.2.1 抓住機遇 57
2.2.2 數據庫生涯 59
2.2.3 標準的開創(chuàng)者 60
2.2.4 想象力比知識更重要 62
2.3 關系型數據庫之父埃德加·科德 62
2.3.1 關系模型的誕生 63
2.3.2 成功是成功者的阻礙 65
2.3.3 天才的偏執(zhí) 67
2.3.4 偉大成就 68
2.4 數據庫先生詹姆斯·尼古拉·格雷 69
2.4.1 聽人勸開啟的職業(yè)生涯 70
2.4.2 開天辟地System R 72
2.4.3 獨具慧眼奠基事務 74
2.4.4 基準測試 75
2.4.5 人格魅力 79
2.4.6 思考未來 80
2.4.7 未解謎團 82
2.4.8 仿佛是解答 83
2.5 持續(xù)創(chuàng)新的天才邁克爾·斯通布雷克 84
2.5.1 很多開始源于偶然 84
2.5.2 Ingres橫空出世 85
2.5.3 桃李滿天下 87
2.5.4 Postgres的時代 89
2.5.5 列存更生 91
2.5.6 永不止息 92
2.6 總結 93
95 第3章 數據庫領域的先知
3.1 埃里森的成長 96
3.2 抓住機遇 97
3.3 鮮為人知的天才鮑勃·邁納 99
3.4 崛起之路 103
3.5 咄咄逼人的行事風格 109
3.6 收購魔法 113
3.7 跨越巔峰 118
3.8 RAC 119
3.9 云端角逐 121
3.10 與Google的恩怨 124
3.11 硅谷江湖 126
3.12 AI制勝 130
132 第4章 數據庫產品的先行者
4.1 遲到的貴族DB2 132
4.1.1 藍色巨人 132
4.1.2 群星閃耀 134
4.1.3 DB2之母 135
4.1.4 SQL的誕生 137
4.1.5 曲折的產品開端 138
4.1.6 關鍵時刻 140
4.1.7 統一數據庫 141
4.1.8 DB2之父 145
4.1.9 中國力量 146
4.1.10 新的世紀 150
4.2 桌面數據庫王者dBASE 152
4.2.1 偶然而生 152
4.2.2 慧眼識珠 153
4.2.3 戛然而止 154
4.2.4 致命訴訟 155
4.3 無冕之王Ingres 158
4.3.1 Ingres公司 158
4.3.2 QUEL與SQL的戰(zhàn)爭 160
4.3.3 Postgres和Illustra 162
4.3.4 Informix 163
4.3.5 Sybase之ASE 168
4.3.6 微軟之SQL Server 172
4.4 開源傳奇MySQL 175
4.4.1 MySQL之前 175
4.4.2 MySQL的誕生 176
4.4.3 開源 178
4.4.4 改變世界 179
4.4.5 Sun和Oracle時代 181
4.4.6 MySQL的蒙提情節(jié) 183
4.5 總結 185
186 第5章 中國數據庫的早期探索
5.1 先知薩師煊 186
5.2 先聲黃山會議 188
5.3 先見數據庫專委會 189
5.4 先育學科設立 192
5.5 先行產品原型 193
5.6 Oracle引進中國 196
5.7 數據庫標準 198
5.8 863和核高基計劃 200
5.9 先河產學研用探究 202
5.10 ITPUB技術社區(qū) 204
5.11 ACOUG 206
5.12 信息技術應用創(chuàng)新 208
5.13 墨天輪和數據庫時代 209
5.14 總結 210
212 第6章 互聯網和云的新篇章
6.1 Google從互聯網到云計算 212
6.1.1 需求驅動創(chuàng)新 212
6.1.2 Google的三駕馬車 213
6.1.3 NewSQL的誕生 215
6.1.4 Google云的數據庫 216
6.2 亞馬遜從電子商務到云計算 217
6.2.1 亞馬遜的Redshift 218
6.2.2 亞馬遜的Aurora 219
6.2.3 亞馬遜的去O運動 221
6.3 阿里巴巴從電子商務到云計算 224
6.3.1 數據庫應用歷程 225
6.3.2 去IOE運動 227
6.3.3 阿里云PolarDB數據庫 229
6.3.4 OceanBase 236
6.4 騰訊從互聯網到云計算 241
6.4.1 TXSQL 241
6.4.2 騰訊云數據庫 242
6.5 PingCAP的TiDB 249
6.5.1 創(chuàng)業(yè)起點 249
6.5.2 技術架構 251
6.5.3 技術優(yōu)勢 253
6.5.4 演進策略 254
6.5.5 學術和行業(yè)影響 256
6.6 總結 257
258 第7章 開源根社區(qū)的崛起
7.1 華為數據庫 258
7.1.1 內部孵化 259
7.1.2 對外輸出 260
7.1.3 全面去O 261
7.1.4 openGauss社區(qū) 262
7.1.5 社區(qū)技術委員會主席李國良 265
7.1.6 openGauss的技術創(chuàng)新 266
7.1.7 openGauss的計算愿景 270
7.1.8 原生分布式GaussDB 273
7.2 云和恩墨數據庫 275
7.2.1 云和恩墨的發(fā)展路徑 275
7.2.2 為什么選擇openGauss 277
7.2.3 MogDB的價值主張 279
7.2.4 回歸本原 290
7.2.5 總結 294
296 第8章 中國數據庫的產業(yè)格局
8.1 數據庫的百家爭鳴 296
8.2 國產數據庫的四大流派 297
8.3 國產數據庫的路線選擇 298
8.3.1 商業(yè)衍生數據庫 298
8.3.2 開源衍生數據庫 300
8.3.3 自研閉源數據庫 300
8.3.4 自研開源數據庫 301
8.4 借鑒Oracle的成功經驗 302
8.4.1 關鍵性選擇 303
8.4.2 技術開放性 304
8.4.3 企業(yè)家精神 305
8.5 中國數據庫的發(fā)展階段 306
8.5.1 學術探究階段 307
8.5.2 產品模仿階段 307
8.5.3 創(chuàng)新引領階段 308
8.6 創(chuàng)新引領擁抱開源 311
8.6.1 開源是正確之路 312
8.6.2 開源的成功之法 315
8.7 產業(yè)繁榮重在生態(tài) 319
8.7.1 中國數據庫元年 320
8.7.2 產業(yè)厚度與創(chuàng)新高度 321
8.8 立足國內和放眼國際 321
8.8.1 聚焦關鍵創(chuàng)新 322
8.8.2 產業(yè)發(fā)展關鍵環(huán)節(jié) 323
325 第9章 數據庫架構的演進和未來
9.1 KISS原則 325
9.2 一個前提假設 326
9.3 單機、集群和分布式 327
9.4 分區(qū)、分表和分庫技術 331
9.4.1 分區(qū)技術 332
9.4.2 分表技術 334
9.4.3 分庫技術 335
9.5 分布式數據庫 336
9.5.1 中間件分布式 336
9.5.2 一體化分布式 338
9.5.3 原生分布式 340
9.6 復雜性的降權 341
9.6.1 RAC One Node 341
9.6.2 共享存儲分布式 342
9.6.3 單機分布式一體化 343
9.7 環(huán)境的進化 344
9.7.1 硬件的進化 344
9.7.2 軟件的協同 345
9.7.3 軟硬件的協同 350
9.7.4 內核革新 353
9.8 HANA的實踐 356
9.9 SQLite 啟示錄 360
9.10 數據庫的簡化 362
9.10.1 大道至簡 362
9.10.2 數據庫無感化 363
9.10.3 智能加持 364
9.10.4 新DBA時代 367
9.11 數據庫的未來 368
373 第 10章 天道酬勤,緣起數據終不悔
10.1 緣起邊陲,恰同學風華正茂 373
10.2 網絡生涯,一念即起無聲長 375
10.3 京師磨煉,轉眼已歷二十載 377
10.4 筆耕不輟,年少曾懷作家夢 379
10.5 挑戰(zhàn)自我,勇于分享登舞臺 382
10.6 三重境界,見山見水見真我 384
10.7 云和恩墨,數據服務起征途 386
10.8 理想實踐,開發(fā)運維平臺化 388
10.8.1 自動巡檢,Bethune探索智能化 389
10.8.2 SQL審核,前置管控問題 391
10.8.3 智能運維,zCloud平臺化 393
10.9 耕獲菑畬,基礎軟件再啟程 394
10.10 未雨綢繆,防患于未然之中 397
10.11 快樂生活,此心安處是吾鄉(xiāng) 399
402 行至水窮處,坐看云起時