如何利用人工智能技術有效地管理知識資產(chǎn),成為企業(yè)保持持續(xù)競爭力的重要問題。作者從數(shù)據(jù)科學的視角出發(fā),提出知識中臺需要管理三類知識(事實知識、原理知識和技能知識)和具備四項能力(知識抽取、知識管理、知識計算和知識演化)。本書結合人工智能的前沿成果,分章節(jié)詳細講述了其中的關鍵技術和實施路徑。同時,從業(yè)務視角出發(fā),講解了知識中臺在營銷、金融、工業(yè)領域的經(jīng)典案例。
張杰,明略科學院知識工程實驗室主任,資深科學家。天津大學計算機專業(yè)博士學位,曾就職于華為諾亞方舟實驗室,后作為聯(lián)合創(chuàng)始人創(chuàng)辦金融科技公司并任CTO。研究方向為知識工程、機器學習、自然語言處理,發(fā)表學術論文十余篇,發(fā)明專利100余項。主持開發(fā)了推薦引擎、知識問答系統(tǒng)、客服機器人、大數(shù)據(jù)風控系統(tǒng)、行業(yè)知識圖譜等多項商業(yè)系統(tǒng),累計銷售額數(shù)億元。吳明輝,明略科技創(chuàng)始人、董事長兼首席執(zhí)行官。人工智能、大數(shù)據(jù)技術及企業(yè)數(shù)字化轉型資深專家。連續(xù)創(chuàng)業(yè)成功者、天使投資人!敦敻弧贰爸袊40位40歲以下商界精英”之一,HAO智能框架理論創(chuàng)立者之一,公安大學特聘教授,北京大學和人民大學創(chuàng)業(yè)導師。吳明輝先生畢業(yè)于北京大學,獲數(shù)學系學士學位、計算機軟件與理論碩士學位。擁有20年軟件工程開發(fā)和算法研究經(jīng)驗、130余項國內外發(fā)明專利,15年企業(yè)級服務領域創(chuàng)業(yè)經(jīng)驗。帶領公司為營銷、廣告、服務業(yè)、公共安全、數(shù)字城市、工業(yè)、金融等垂直領域的2000多個企業(yè)與組織,提供完整的人工智能閉環(huán)解決方案服務。
第1章 知識中臺:厘清功能邊界 1
1.1 知識的類別 2
1.1.1 知識的哲學觀點 2
1.1.2 知識的認知心理學分類 3
1.1.3 知識的管理學分類 5
1.1.4 信息技術視角下的知識 9
1.2 核心概念 14
1.2.1 兩類用戶 14
1.2.2 三類知識 15
1.2.3 六步建設法 17
1.3 數(shù)據(jù)挖掘三范式 19
1.3.1 數(shù)據(jù)湖式 20
1.3.2 數(shù)據(jù)中臺式 20
1.3.3 知識中臺式 21
1.4 知識中臺不是什么 21
1.5 系統(tǒng)架構 22
1.5.1 生命周期 23
1.5.2 技術框架 24
1.6 本章小結 29
第2章 知識建模:從原材料清單到統(tǒng)一藍圖 31
2.1 設計內容:類別與任務體系 31
2.2 設計原則 33
2.3 設計步驟 34
2.3.1 數(shù)據(jù)字典收集 34
2.3.2 數(shù)據(jù)洞察 35
2.3.3 業(yè)務訪談 36
2.3.4 兩個體系設計 36
2.3.5 打通兩體系 39
2.4 典型設計示例 40
2.4.1 詞庫類 40
2.4.2 百科知識類 41
2.4.3 常識知識類 42
2.4.4 領域知識類 43
2.5 實戰(zhàn)六步法手記(1):勾勒全局視圖 45
2.6 本章小結 47
第3章 知識抽取:從數(shù)據(jù)源中提煉知識片段 49
3.1 結構化數(shù)據(jù)的映射 50
3.1.1 數(shù)據(jù)規(guī)范 50
3.1.2 數(shù)據(jù)清洗 53
3.1.3 數(shù)據(jù)映射 57
3.2 非結構化信息的抽取 63
3.2.1 任務、挑戰(zhàn)與技術路線 64
3.2.2 實體識別 67
3.2.3 關系抽取 71
3.2.4 事件抽取 76
3.3 容易被忽視的隱性知識挖掘 80
3.3.1 文本中的事理關系 81
3.3.2 網(wǎng)絡結構中的隱含模式 82
3.3.3 時間序列中的周期與強度 90
3.4 實戰(zhàn)六步法手記(2):先小而精,再大而全 97
3.5 本章小結 101
第4章 知識管理:從分散碎片到集中資產(chǎn) 103
4.1 知識融合 103
4.1.1 本體融合 104
4.1.2 實體融合 105
4.1.3 關系融合 107
4.1.4 流程融合 107
4.2 類目管理 109
4.3 存儲方式的選擇 111
4.3.1 傳統(tǒng)存儲 111
4.3.2 非關系型數(shù)據(jù)庫 111
4.3.3 數(shù)據(jù)庫對比小結 118
4.3.4 知識圖譜 120
4.4 知識的反向溯源 121
4.5 實戰(zhàn)六步法手記(3):人機協(xié)同很有必要 122
4.6 本章小結 124
第5章 知識計算:讓知識可自動執(zhí)行 125
5.1 指標:必備的預置知識 125
5.1.1 邏輯結構 126
5.1.2 指標體系 128
5.2 規(guī)則:帶條件的預置知識 128
5.2.1 規(guī)則引擎 129
5.2.2 常用工具 131
5.2.3 專家系統(tǒng) 135
5.3 模型:復雜問題的簡化表達 137
5.3.1 物理模型 137
5.3.2 機器學習模型 138
5.3.3 因果模型 143
5.4 工作流 148
5.5 業(yè)務流程管理 150
5.5.1 定義規(guī)范 150
5.5.2 基本元素 151
5.5.3 常用工具 152
5.6 機器人流程自動化 152
5.7 實戰(zhàn)六步法手記(4):融合式的執(zhí)行引擎 153
5.8 本章小結 155
第6章 知識應用:開啟知識的變現(xiàn)之旅 156
6.1 知識圖譜嵌入 156
6.1.1 融合事實信息 157
6.1.2 融合附加信息 158
6.2 可視化洞察 160
6.2.1 問題描述 161
6.2.2 常用方法 161
6.2.3 知識庫增強的可視化 163
6.3 信息檢索 165
6.3.1 問題描述 165
6.3.2 常用算法 166
6.3.3 知識庫增強的檢索算法 167
6.4 推薦系統(tǒng) 170
6.4.1 問題描述 170
6.4.2 常用算法 172
6.4.3 知識庫增強的推薦系統(tǒng) 175
6.5 問答系統(tǒng) 178
6.5.1 問題描述 178
6.5.2 常用方法 179
6.5.3 知識庫問答 181
6.6 實戰(zhàn)六步法手記(5):點線面三級跳 186
6.7 本章小結 188
第7章 知識演化:促進新知識的不斷產(chǎn)生 190
7.1 四項共性特征 190
7.2 訂閱推薦 192
7.3 積累改變規(guī)則的規(guī)則 194
7.4 知識推理 194
7.4.1 傳統(tǒng)的規(guī)則推理 196
7.4.2 規(guī)則與知識表示結合的推理 198
7.4.3 實體預測 201
7.4.4 關系路徑推理 204
7.5 在線學習 207
7.6 實戰(zhàn)六步法手記(6):形成持續(xù)學習的閉環(huán) 209
7.7 本章小結 211
第8章 組織保障:技術之外的管理手段 212
8.1 勝任度評估 213
8.1.1 任務類型 213
8.1.2 角色類型 214
8.1.3 團隊類型 215
8.1.4 勝任素質測評 216
8.2 成熟度評估 218
8.2.1 等級遞進規(guī)則嚴格的模型 218
8.2.2 等級遞進規(guī)則靈活的模型 219
8.2.3 面向實施階段的模型 219
8.3 知識資產(chǎn)評估 220
8.3.1 團隊組成 221
8.3.2 評估對象 221
8.3.3 評估方法 222
8.3.4 實施建議 224
8.4 文化建設 225
8.4.1 營造學習型組織 225
8.4.2 融入知識聯(lián)盟 227
8.4.3 產(chǎn)業(yè)集群層面 230
8.5 本章小結 231
第9章 營銷洞察實踐:連接生產(chǎn)者與消費者 233
9.1 營銷要素 234
9.2 營銷知識中臺 235
9.3 美妝輿情洞察示例 237
9.4 零售導購賦能示例 240
9.5 本章小結 243
第10章 金融行業(yè)實踐:信貸風控 244
10.1 零售信貸應用場景 244
10.2 大數(shù)據(jù)風控解決方案 246
10.2.1 數(shù)據(jù)源 246
10.2.2 數(shù)據(jù)中臺 248
10.2.3 決策引擎 249
10.3 信用評分建模 250
10.4 關系圖譜反欺詐 255
10.5 本章小結 256
第11章 其他行業(yè)實踐 257
11.1 軌道交通 257
11.1.1 需求背景 257
11.1.2 解決方案 258
11.1.3 應用效果 260
11.2 媒體資產(chǎn) 262
11.2.1 需求背景 262
11.2.2 解決方案 263
11.2.3 應用效果 265
11.3 數(shù)字城市 267
11.3.1 需求背景 267
11.3.2 解決方案 267
11.3.3 應用效果 272
11.4 本章小結 273
參考文獻 275