知識(shí)圖譜:方法、實(shí)踐與應(yīng)用
定 價(jià):118 元
- 作者:王昊奮
- 出版時(shí)間:2019/8/1
- ISBN:9787121366710
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:G302
- 頁(yè)碼:480
- 紙張:
- 版次:01
- 開本:16開
知識(shí)圖譜是較為典型的多學(xué)科交叉領(lǐng)域,涉及知識(shí)工程、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、圖數(shù)據(jù)庫(kù)等多個(gè)領(lǐng)域。本書系統(tǒng)地介紹知識(shí)圖譜涉及的關(guān)鍵技術(shù),如知識(shí)建模、關(guān)系抽取、圖存儲(chǔ)、自動(dòng)推理、圖譜表示學(xué)習(xí)、語(yǔ)義搜索、知識(shí)問(wèn)答、圖挖掘分析等。此外,本書還嘗試將學(xué)術(shù)前沿和實(shí)戰(zhàn)結(jié)合,讓讀者在掌握實(shí)際應(yīng)用能力的同時(shí)對(duì)前沿技術(shù)發(fā)展有所了解。本書既適合計(jì)算機(jī)和人工智能相關(guān)的研究人員閱讀,又適合在企業(yè)一線從事技術(shù)和應(yīng)用開發(fā)的人員學(xué)習(xí),還可作為高等院校計(jì)算機(jī)或人工智能專業(yè)師生的參考教材。
王昊奮,上海樂(lè)言信息科技有限公司CTO,CCF理事、計(jì)算機(jī)術(shù)語(yǔ)審定工作委員會(huì)主任、中文知識(shí)圖譜zhishi.me創(chuàng)始人、OpenKG發(fā)起人之一、中文信息學(xué)會(huì)語(yǔ)言與知識(shí)計(jì)算委員會(huì)副秘書長(zhǎng),共發(fā)表80余篇高水平論文,在知識(shí)圖譜、問(wèn)答系統(tǒng)和聊天機(jī)器人等諸多領(lǐng)域有豐富的研發(fā)經(jīng)驗(yàn)。其帶隊(duì)構(gòu)建的語(yǔ)義搜索系統(tǒng)在Billion Triple Challenge中榮獲全球第2名;在著名的本體匹配競(jìng)賽OAEI的實(shí)體匹配任務(wù)中斬獲得全球第1名。曾主持并參與多項(xiàng)國(guó)家自然科學(xué)基金、863重大專項(xiàng)和國(guó)家科技支撐項(xiàng)目,以學(xué)術(shù)負(fù)責(zé)人身份參與Paypal、Google、Intel、IBM、百度等企業(yè)的合作項(xiàng)目。
第1章 知識(shí)圖譜概述 1
1.1 什么是知識(shí)圖譜 1
1.2 知識(shí)圖譜的發(fā)展歷史 2
1.3 知識(shí)圖譜的價(jià)值 5
1.4 國(guó)內(nèi)外典型的知識(shí)圖譜項(xiàng)目 9
1.4.1 早期的知識(shí)庫(kù)項(xiàng)目 9
1.4.2 互聯(lián)網(wǎng)時(shí)代的知識(shí)圖譜 9
1.4.3 中文開放知識(shí)圖譜 12
1.4.4 垂直領(lǐng)域知識(shí)圖譜 13
1.5 知識(shí)圖譜的技術(shù)流程 15
1.6 知識(shí)圖譜的相關(guān)技術(shù) 19
1.6.1 知識(shí)圖譜與數(shù)據(jù)庫(kù)系統(tǒng) 19
1.6.2 知識(shí)圖譜與智能問(wèn)答 23
1.6.3 知識(shí)圖譜與機(jī)器推理 25
1.6.4 知識(shí)圖譜與推薦系統(tǒng) 28
1.6.5 區(qū)塊鏈與去中心化的知識(shí)圖譜 29
1.7 本章小結(jié) 30
參考文獻(xiàn) 31
第2章 知識(shí)圖譜表示與建模 40
2.1 什么是知識(shí)表示 40
2.2 人工智能早期的知識(shí)表示方法 43
2.2.1 一階謂詞邏輯 43
2.2.2 霍恩子句和霍恩邏輯 43
2.2.3 語(yǔ)義網(wǎng)絡(luò) 44
2.2.4 框架 45
2.2.5 描述邏輯 47
2.3 互聯(lián)網(wǎng)時(shí)代的語(yǔ)義網(wǎng)知識(shí)表示框架 48
2.3.1 RDF和RDFS 48
2.3.2 OWL和OWL2 Fragments 53
2.3.3 知識(shí)圖譜查詢語(yǔ)言的表示 59
2.3.4 語(yǔ)義Markup表示語(yǔ)言 62
2.4 常見開放域知識(shí)圖譜的知識(shí)表示方法 64
2.4.1 Freebase 64
2.4.2 Wikidata 65
2.4.3 ConceptNet5 66
2.5 知識(shí)圖譜的向量表示方法 68
2.5.1 知識(shí)圖譜表示的挑戰(zhàn) 68
2.5.2 詞的向量表示方法 68
2.5.3 知識(shí)圖譜嵌入的概念 71
2.5.4 知識(shí)圖譜嵌入的優(yōu)點(diǎn) 72
2.5.5 知識(shí)圖譜嵌入的主要方法 72
2.5.6 知識(shí)圖譜嵌入的應(yīng)用 75
2.6 開源工具實(shí)踐:基于Protégé的本體知識(shí)建模 77
2.6.1 簡(jiǎn)介 77
2.6.2 環(huán)境準(zhǔn)備 78
2.6.3 Protégé實(shí)踐主要功能演示 78
2.7 本章小結(jié) 80
參考文獻(xiàn) 80
第3章 知識(shí)存儲(chǔ) 82
3.1 知識(shí)圖譜數(shù)據(jù)庫(kù)基本知識(shí) 82
3.1.1 知識(shí)圖譜數(shù)據(jù)模型 82
3.1.2 知識(shí)圖譜查詢語(yǔ)言 85
3.2 常見知識(shí)圖譜存儲(chǔ)方法 91
3.2.1 基于關(guān)系數(shù)據(jù)庫(kù)的存儲(chǔ)方案 91
3.2.2 面向RDF的三元組數(shù)據(jù)庫(kù) 101
3.2.3 原生圖數(shù)據(jù)庫(kù) 115
3.2.4 知識(shí)圖譜數(shù)據(jù)庫(kù)比較 120
3.3 知識(shí)存儲(chǔ)關(guān)鍵技術(shù) 121
3.3.1 知識(shí)圖譜數(shù)據(jù)庫(kù)的存儲(chǔ):以Neo4j為例 121
3.3.2 知識(shí)圖譜數(shù)據(jù)庫(kù)的索引 124
3.4 開源工具實(shí)踐 126
3.4.1 三元組數(shù)據(jù)庫(kù)Apache Jena 126
3.4.2 Tutorial:面向RDF的三元組數(shù)據(jù)庫(kù)gStore 128
參考文獻(xiàn) 131
第4章 知識(shí)抽取與知識(shí)挖掘 133
4.1 知識(shí)抽取任務(wù)及相關(guān)競(jìng)賽 133
4.1.1 知識(shí)抽取任務(wù)定義 133
4.1.2 知識(shí)抽取相關(guān)競(jìng)賽 134
4.2 面向非結(jié)構(gòu)化數(shù)據(jù)的知識(shí)抽取 136
4.2.1 實(shí)體抽取 137
4.2.2 關(guān)系抽取 142
4.2.3 事件抽取 150
4.3 面向結(jié)構(gòu)化數(shù)據(jù)的知識(shí)抽取 154
4.3.1 直接映射 154
4.3.2 R2RML 156
4.3.3 相關(guān)工具 159
4.4 面向半結(jié)構(gòu)化數(shù)據(jù)的知識(shí)抽取 161
4.4.1 面向百科類數(shù)據(jù)的知識(shí)抽取 161
4.4.2 面向Web網(wǎng)頁(yè)的知識(shí)抽取 165
4.5 知識(shí)挖掘 168
4.5.1 知識(shí)內(nèi)容挖掘:實(shí)體鏈接 168
4.5.2 知識(shí)結(jié)構(gòu)挖掘:規(guī)則挖掘 174
4.6 開源工具實(shí)踐:基于DeepDive的關(guān)系抽取實(shí)踐 178
4.6.1 開源工具的技術(shù)架構(gòu) 178
4.6.2 其他類似工具 180
參考文獻(xiàn) 180
第5章 知識(shí)圖譜的融合 184
5.1 什么是知識(shí)圖譜融合 184
5.2 知識(shí)圖譜中的異構(gòu)問(wèn)題 185
5.2.1 語(yǔ)言層不匹配 186
5.2.2 模型層不匹配 187
5.3 本體概念層的融合方法與技術(shù) 190
5.3.1 本體映射與本體集成 190
5.3.2 本體映射分類 192
5.3.3 本體映射方法和工具 195
5.3.4 本體映射管理 232
5.3.5 本體映射應(yīng)用 235
5.4 實(shí)例層的融合與匹配 236
5.4.1 知識(shí)圖譜中的實(shí)例匹配問(wèn)題分析 236
5.4.2 基于快速相似度計(jì)算的實(shí)例匹配方法 240
5.4.3 基于規(guī)則的實(shí)例匹配方法 241
5.4.4 基于分治的實(shí)例匹配方法 244
5.4.5 基于學(xué)習(xí)的實(shí)例匹配方法 260
5.4.6 實(shí)例匹配中的分布式并行處理 266
5.5 開源工具實(shí)踐:實(shí)體關(guān)系發(fā)現(xiàn)框架LIMES 266
5.5.1 簡(jiǎn)介 266
5.5.2 開源工具的技術(shù)架構(gòu) 267
5.5.3 其他類似工具 269
5.6 本章小結(jié) 269
參考文獻(xiàn) 270
第6章 知識(shí)圖譜推理 279
6.1 推理概述 279
6.1.1 什么是推理 279
6.1.2 面向知識(shí)圖譜的推理 282
6.2 基于演繹的知識(shí)圖譜推理 283
6.2.1 本體推理 283
6.2.2 基于邏輯編程的推理方法 288
6.2.3 基于查詢重寫的方法 295
6.2.4 基于產(chǎn)生式規(guī)則的方法 301
6.3 基于歸納的知識(shí)圖譜推理 306
6.3.1 基于圖結(jié)構(gòu)的推理 306
6.3.2 基于規(guī)則學(xué)習(xí)的推理 313
6.3.3 基于表示學(xué)習(xí)的推理 318
6.4 知識(shí)圖譜推理新進(jìn)展 324
6.4.1 時(shí)序預(yù)測(cè)推理 324
6.4.2 基于強(qiáng)化學(xué)習(xí)的知識(shí)圖譜推理 325
6.4.3 基于元學(xué)習(xí)的少樣本知識(shí)圖譜推理 326
6.4.4 圖神經(jīng)網(wǎng)絡(luò)與知識(shí)圖譜推理 326
6.5 開源工具實(shí)踐:基于Jena和Drools的知識(shí)推理實(shí)踐 327
6.5.1 開源工具簡(jiǎn)介 327
6.5.2 開源工具的技術(shù)架構(gòu) 327
6.5.3 開發(fā)軟件版本及其下載地址 328
6.5.4 基于Jena的知識(shí)推理實(shí)踐 328
6.5.5 基于Drools的知識(shí)推理實(shí)踐 329
6.6 本章小結(jié) 329
參考文獻(xiàn) 330
第7章 語(yǔ)義搜索 334
7.1 語(yǔ)義搜索簡(jiǎn)介 334
7.2 結(jié)構(gòu)化的查詢語(yǔ)言 336
7.2.1 數(shù)據(jù)查詢 338
7.2.2 數(shù)據(jù)插入 341
7.2.3 數(shù)據(jù)刪除 341
7.3 語(yǔ)義數(shù)據(jù)搜索 342
7.4 語(yǔ)義搜索的交互范式 348
7.4.1 基于關(guān)鍵詞的知識(shí)圖譜語(yǔ)義搜索方法 348
7.4.2 基于分面的知識(shí)圖譜語(yǔ)義搜索 350
7.4.3 基于表示學(xué)習(xí)的知識(shí)圖譜語(yǔ)義搜索 352
7.5 開源工具實(shí)踐 355
7.5.1 功能介紹 355
7.5.2 環(huán)境搭建及數(shù)據(jù)準(zhǔn)備 357
7.5.3 數(shù)據(jù)準(zhǔn)備 357
7.5.4 導(dǎo)入Elasticsearch 360
7.5.5 功能實(shí)現(xiàn) (views.py) 361
7.5.6 執(zhí)行查詢 363
參考文獻(xiàn) 364
第8章 知識(shí)問(wèn)答 366
8.1 知識(shí)問(wèn)答概述 366
8.1.1 知識(shí)問(wèn)答的基本要素 366
8.1.2 知識(shí)問(wèn)答的相關(guān)工作 367
8.1.3 知識(shí)問(wèn)答應(yīng)用場(chǎng)景 369
8.2 知識(shí)問(wèn)答的分類體系 371
8.2.1 問(wèn)題類型與答案類型 371
8.2.2 知識(shí)庫(kù)類型 374
8.2.3 智能體類型 375
8.3 知識(shí)問(wèn)答系統(tǒng) 376
8.3.1 NLIDB:早期的問(wèn)答系統(tǒng) 376
8.3.2 IRQA:基于信息檢索的問(wèn)答系統(tǒng) 380
8.3.3 KBQA :基于知識(shí)庫(kù)的問(wèn)答系統(tǒng) 380
8.3.4 CommunityQA/FAQ-QA:基于問(wèn)答對(duì)匹配的問(wèn)答系統(tǒng) 381
8.3.5 Hybrid QA Framework 混合問(wèn)答系統(tǒng)框架 382
8.4 知識(shí)問(wèn)答的評(píng)價(jià)方法 386
8.4.1 問(wèn)答系統(tǒng)的評(píng)價(jià)指標(biāo) 386
8.4.2 問(wèn)答系統(tǒng)的評(píng)價(jià)數(shù)據(jù)集 387
8.5 KBQA前沿技術(shù) 392
8.5.1 KBQA面臨的挑戰(zhàn) 392
8.5.2 基于模板的方法 394
8.5.3 基于語(yǔ)義解析的方法 398
8.5.4 基于深度學(xué)習(xí)的傳統(tǒng)問(wèn)答模塊優(yōu)化 401
8.5.5 基于深度學(xué)習(xí)的端到端問(wèn)答模型 405
8.6 開源工具實(shí)踐 406
8.6.1 使用Elasticsearch搭建簡(jiǎn)單知識(shí)問(wèn)答系統(tǒng) 406
8.6.2 基于gAnswer構(gòu)建中英文知識(shí)問(wèn)答系統(tǒng) 410
8.7 本章小結(jié) 415
參考文獻(xiàn) 416
第9章 知識(shí)圖譜應(yīng)用案例 420
9.1 領(lǐng)域知識(shí)圖譜構(gòu)建的技術(shù)流程 420
9.1.1 領(lǐng)域知識(shí)建模 421
9.1.2 知識(shí)存儲(chǔ) 422
9.1.3 知識(shí)抽取 422
9.1.4 知識(shí)融合 423
9.1.5 知識(shí)計(jì)算 423
9.1.6 知識(shí)應(yīng)用 424
9.2 領(lǐng)域知識(shí)圖譜構(gòu)建的基本方法 425
9.2.1 自頂向下的構(gòu)建方法 425
9.2.2 自頂向下的構(gòu)建方法 426
9.3 領(lǐng)域知識(shí)圖譜的應(yīng)用案例 428
9.3.1 電商知識(shí)圖譜的構(gòu)建與應(yīng)用 428
9.3.2 圖情知識(shí)圖譜的構(gòu)建與應(yīng)用 431
9.3.3 生活?yuàn)蕵?lè)知識(shí)圖譜構(gòu)建與應(yīng)用:以美團(tuán)為例 435
9.3.4 企業(yè)商業(yè)知識(shí)圖譜的構(gòu)建與應(yīng)用 440
9.3.5 創(chuàng)投知識(shí)圖譜的構(gòu)建與應(yīng)用 443
9.3.6 中醫(yī)臨床領(lǐng)域知識(shí)圖譜的構(gòu)建與應(yīng)用 448
9.3.7 金融證券行業(yè)知識(shí)圖譜應(yīng)用實(shí)踐 452
9.4 本章小結(jié) 460
參考文獻(xiàn) 461