《領(lǐng)域本體構(gòu)建方法及實證研究:以測繪學領(lǐng)域為例》從本體的定義、類型、基本元素、描述語言、構(gòu)建方法和構(gòu)建工具分析了本體的基本內(nèi)涵和構(gòu)建本體的基本方法,把本體構(gòu)建方法劃分成概念獲取、關(guān)系獲取和形式化三個部分;運用組詞規(guī)則、N-gram、互信息、信息熵、加權(quán)等算法研究了領(lǐng)域本體的等級關(guān)系和非等級關(guān)系的提取方法;運用Jena工具研究了領(lǐng)域本體的形式化方法。作者通過對現(xiàn)有方法的反復實驗,針對領(lǐng)域本體構(gòu)建過程中存在的問題,對現(xiàn)有的方法進行了綜合用用,并對部分方法進行了改進,最終提出了一套構(gòu)建本體的通用方法。最后,本書以測繪學領(lǐng)域的數(shù)據(jù)為例,對該方法進行了實用檢驗,實驗結(jié)果證明了該方法的可行性。本書結(jié)構(gòu)嚴謹、布局合理、重點突出、邏輯清晰、實例豐富,是一本系統(tǒng)講述領(lǐng)域本體構(gòu)建方法的專著。
余凡,講師,武漢大學質(zhì)量發(fā)展戰(zhàn)略研究院研究員,研究方向為宏觀質(zhì)量管理、質(zhì)量大數(shù)據(jù)等。先后主持中國博士后基金項目、武漢大學自主科研項目,參與國家社會科學基金重大項目、“十二五”科技支撐計劃項目等國家級、省部級項目7項,在Electronic Library、《宏觀質(zhì)量研究》等國內(nèi)外期刊上發(fā)表學術(shù)論文16篇。
0 引言
0.1 選題背景與研究意義
O.1.1 選題背景
0.1.2 研究意義
0.2 國內(nèi)外研究綜述
0.2.1 基于不同數(shù)據(jù)源的本體半自動構(gòu)建方法研究
0.2.2 本體概念獲取方法研究
O.2.3 本體關(guān)系獲取方法研究
O.2.4 本體形式化方法研究
0.2.5 國內(nèi)外研究述評
0.3 研究目標與思路
0.3.1 研究目標
0.3.2 研究思路
0.4 研究方法與工具
0.4.1 研究方法
0.4.2 研究工具
0.5 創(chuàng)新之處
1 本體相關(guān)理論研究
1.1 本體的定義
1.2 本體的類型
1.3 本體的基本元素
1.4 本體描述語言
1.4.1 可擴展標記語言XMI
1.4.2 資源描述框架RDF
1.4.3 網(wǎng)絡(luò)本體語言O(shè)WL
1.5 本體構(gòu)建方法
1.5.1 本體構(gòu)建抽象方法
1.5.2 本體構(gòu)建具體方法
1.6 本體構(gòu)建工具
1.6.1 Prot6g6
1.6.2 Jena
2 領(lǐng)域本體的概念提取方法研究
2.1 基于敘詞表的領(lǐng)域本體概念提取方法
2.1.1 敘詞表的分類及存在的問題
2.1.2 文本存儲方式的轉(zhuǎn)換
2.1.3 關(guān)系二維表的數(shù)據(jù)結(jié)構(gòu)
2.1.4 敘詞表編碼映射
2.1.5 實驗分析
2.2 基于文本的領(lǐng)域本體概念提取方法
2.2.1 領(lǐng)域本體概念提取流程
2.2.2 PDF文獻的下栽和轉(zhuǎn)換
2.2.3 文本切分方法
2.2.4 領(lǐng)域詞匯提取方法
2.2.5 領(lǐng)域詞匯的篩選方法
3 領(lǐng)域本體的關(guān)系提取方法研究
3.1 領(lǐng)域本體的等級關(guān)系提取方法
3.1.1 基于敘詞表的等級關(guān)系提取方法
3.1.2 基于文本的等級關(guān)系提取方法
3.2 領(lǐng)域本體的非等級關(guān)系提取方法
3.2.1 基于敘詞表的非等級關(guān)系提取方法
3.2.2 基于文本的非等級關(guān)系提取方法
4 領(lǐng)域本體形式化方法研究
4.1 本體、0WL和語義
4.2 形式化語言選擇
4.3 本體的形式化
4.3.1 本體形式化目標
4.3.2 本體形式化方法
4.3.3 測繪學領(lǐng)域本體形式化
5 測繪學領(lǐng)域本體構(gòu)建系統(tǒng)的實現(xiàn)
5.1 領(lǐng)域本體構(gòu)建流程
5.2 需求分析
5.3 系統(tǒng)總體設(shè)計
5.4 系統(tǒng)詳細設(shè)計
5.4.1 概念提取模塊
5.4.2 概念篩選模塊
5.4.3 等級關(guān)系提取模塊
5.4.4 非等級關(guān)系提取模塊
5.4.5 領(lǐng)域本體形式化模塊
5.5 測繪學領(lǐng)域本體可視化展示
5.6 測繪學領(lǐng)域本體的應(yīng)用領(lǐng)域
5.7 領(lǐng)域本體構(gòu)建方法性能測試
6 結(jié)論與展望
6.1 結(jié)論
6.2 不足與展望
參考文獻
附錄:測繪學領(lǐng)域本體代碼
后記
《領(lǐng)域本體構(gòu)建方法及實證研究:以測繪學領(lǐng)域為例》:
。1)研究本體以及本體構(gòu)建方法的相關(guān)理論(第1章實現(xiàn))。具體研究本體在信息科學領(lǐng)域的定義是什么;本體具備哪些特征;本體有哪些不同的類型;本體由哪些基本元素組成:描述本體的語言包括哪幾種,它們之間存在什么聯(lián)系;本體包括哪些抽象和具體的構(gòu)建方法;本體構(gòu)建的工具有哪些。
(2)研究本體概念提取方法(第2章實現(xiàn))。具體研究如何從敘詞表和文本中提取領(lǐng)域概念:如何利用關(guān)系二維表的數(shù)據(jù)結(jié)果存儲敘詞表概念;如何實現(xiàn)不同編碼的敘詞表之間的映射;如何利用敘詞表組詞規(guī)則和N—gram算法提取文本概念;如何利用擴展互信息、信息熵過濾概念;如何利用擴展信息熵和加權(quán)算法篩選領(lǐng)域核心概念。
(3)研究本體關(guān)系提取方法(第3章實現(xiàn))。具體研究如何提取敘詞表和文本中的等級和非等級關(guān)系;如何利用基于字和詞的鄰近詞匯相似度算法形成等級關(guān)系以及兩種算法結(jié)果的比較分析;如何利用擴展的關(guān)聯(lián)規(guī)則算法提取本體三元組中的主語和賓語:如何利用規(guī)則統(tǒng)計的方法提取本體三元組中的謂語。
。4)研究本體形式化方法(第4章實現(xiàn))。具體研究如何選擇本體形式化語言;本體形式化的目標和具體方法有哪些;如何實現(xiàn)本體的形式化處理。
。5)對本體構(gòu)建方法進行系統(tǒng)實現(xiàn)(第5章實現(xiàn))。描述領(lǐng)域本體構(gòu)建的總體流程,并以測繪學為例,對上文研究的本體構(gòu)建方法予以系統(tǒng)實現(xiàn)。通過需求分析、總體設(shè)計和詳細設(shè)計,將系統(tǒng)細分為概念提取模塊、概念篩選模塊、等級關(guān)系提取模塊、非等級關(guān)系提取模塊和形式化模塊。系統(tǒng)分別實現(xiàn)每個模塊的具體功能。
0.3.2研究思路
本書首先提出問題,然后分析并解決問題,最后輔以實證研究,以保證本研究的理論和實踐緊密結(jié)合。本書采用總一分一總的研究思路,在總結(jié)本體構(gòu)建理論方法的基礎(chǔ)上,分章節(jié)對本體構(gòu)建的具體步驟進行探究,最后在實證中分別使用這些構(gòu)建方法,從而檢驗構(gòu)建方法的適用性。具體而言,本書既分別對本體構(gòu)建步驟進行研究分析,又對這些方法進行比較分析。既有理論方法的研究,也有對這些方法的應(yīng)用研究。既有單個方法的研究,也有多個方法的綜合研究。既有對現(xiàn)有方法的研究,也有對現(xiàn)有方法改進的研究。本書采用理論與實踐緊密結(jié)合的方法,針對目前構(gòu)建方法的不足,對現(xiàn)有的方法進行適當?shù)木C合和改進,以促進本體構(gòu)建方法的發(fā)展,從而擴大本體應(yīng)用的廣度和深度。
……