《藏語(yǔ)計(jì)算語(yǔ)言學(xué)(藏文信息處理技術(shù))》是國(guó)內(nèi)第一本全面系統(tǒng)地介紹藏語(yǔ)計(jì)算語(yǔ)言學(xué)的著書,由淺入深地講解了藏語(yǔ)計(jì)算語(yǔ)言學(xué)的基本理論和知識(shí)框架!恫卣Z(yǔ)計(jì)算語(yǔ)言學(xué)(藏文信息處理技術(shù))》在漢語(yǔ)、英語(yǔ)等自然語(yǔ)言計(jì)算機(jī)處理的相關(guān)基本知識(shí)和方法的基礎(chǔ)上,結(jié)合藏語(yǔ)特點(diǎn),介紹了基于規(guī)則的藏語(yǔ)自然語(yǔ)言分析方法,也介紹了基于統(tǒng)計(jì)的分析方法!恫卣Z(yǔ)計(jì)算語(yǔ)言學(xué)(藏文信息處理技術(shù))》共分四個(gè)部分,分別為藏文及藏文信息處理的基礎(chǔ)知識(shí)、藏文詞法分析、藏文句法分析和藏文語(yǔ)義分析。第一部分介紹了計(jì)算語(yǔ)言學(xué)的基本理論知識(shí)、藏文及藏文信息處理的基本知識(shí);第二部分針對(duì)藏文信息處理中特有的分詞問題,介紹了藏文自動(dòng)分詞及分詞規(guī)范、分詞中歧義的消解、未登錄詞識(shí)別、藏文詞性標(biāo)注及標(biāo)注標(biāo)準(zhǔn),以及藏文語(yǔ)料庫(kù)的相關(guān)知識(shí);第三部分從藏語(yǔ)語(yǔ)法的表示入手,將藏語(yǔ)自然語(yǔ)言處理形式化,再給出藏語(yǔ)語(yǔ)法分析的算法;第四部分介紹了藏語(yǔ)語(yǔ)義的表示及分析算法。
《藏語(yǔ)計(jì)算語(yǔ)言學(xué)(藏文信息處理技術(shù))》可作為高等學(xué)校和科研院所計(jì)算機(jī)專業(yè)高年級(jí)本科生、藏文信息處理方向研究生的教材,也可以作為從事藏語(yǔ)自然語(yǔ)言處理應(yīng)用領(lǐng)域的研究人員和技術(shù)人員的參考資料。
第1章 計(jì)算語(yǔ)言學(xué)概論
1.1 計(jì)算語(yǔ)言學(xué)的定義
1.2 計(jì)算語(yǔ)言學(xué)的發(fā)展歷程
1.3 計(jì)算語(yǔ)言學(xué)的研究范疇
1.4 計(jì)算語(yǔ)言學(xué)的研究方法
1.5 計(jì)算語(yǔ)言學(xué)與藏語(yǔ)研究
1.6 計(jì)算語(yǔ)言學(xué)的發(fā)展趨勢(shì)
第2章 計(jì)算語(yǔ)言學(xué)基礎(chǔ)知識(shí)
2.1 概率統(tǒng)計(jì)基礎(chǔ)
2.1.1 事件和概率
2.1.2 隨機(jī)變量與分布函數(shù)
2.1.3 隨機(jī)變量的數(shù)字特征
2.1.4 最大似然估計(jì)
2.2 信息論基礎(chǔ)
2.2.1 信息的最優(yōu)編碼設(shè)計(jì)
2.2.2 信息熵
2.2.3 噪聲信道模型
2.3 隱馬爾可夫模型
2.3.1 馬爾可夫過(guò)程
2.3.2 隱馬爾可夫過(guò)程
2.3.3 向前算法和向后算法
2.3.4 韋特比(Viterbi)算法
2.3.5 Baum-We1ch算法
第3章 形式語(yǔ)法與自動(dòng)機(jī)理論
3.1 形式語(yǔ)法
3.1.1 形式定義
3.1.2 形式語(yǔ)法分類
3.2 自動(dòng)機(jī)理論
3.2.1 自動(dòng)機(jī)概述
3.2.2 自動(dòng)機(jī)術(shù)語(yǔ)
3.2.3 形式描述
3.2.4 有限自動(dòng)機(jī)的分類
3.2.5 有限自動(dòng)機(jī)的擴(kuò)展
第4章 藏文信息處理
4.1 藏文概述
4.2 藏文字的構(gòu)件
4.3 藏文的拼與寫
4.3.1 藏文拼音規(guī)則
4.3.2 藏文虛詞形態(tài)規(guī)則
4.3.3 藏文字體
4.4 藏文編碼與標(biāo)準(zhǔn)
4.4.1 編碼標(biāo)準(zhǔn)
4.4.2 鍵盤及字庫(kù)標(biāo)準(zhǔn)
第5章 藏文自動(dòng)分詞
5.1 藏文自動(dòng)分詞概述
5.1.1 藏文自動(dòng)分詞的意義和作用
5.1.2 藏文文本的切分特點(diǎn)
5.1.3 藏文自動(dòng)分詞的難點(diǎn)
5.2 藏文分詞規(guī)范
5.2.1 制定藏文分詞規(guī)范的目標(biāo)
5.2.2 藏文分詞規(guī)范簡(jiǎn)介
5.3 藏文分詞詞典
5.3.1 藏文分詞詞典的機(jī)制
5.3.2 基于詞屬性的藏文分詞詞典
5.4 藏文分詞方法
5.4.1 基于規(guī)則的分詞方法
5.4.2 基于統(tǒng)計(jì)的分詞方法
5.4.3 基于規(guī)則和統(tǒng)計(jì)的方法利弊
5.4.4 專家系統(tǒng)分詞法
5.4.5 基于神經(jīng)網(wǎng)絡(luò)的分詞方法
5.5 藏文分詞歧義理論
5.5.1 藏文分詞歧義的類型
5.5.2 歧義消解的方法
5.6 藏文未登錄詞
5.6.1 藏文未登錄詞分類
5.6.2 藏文未登錄詞的識(shí)別方法
第6章 藏文詞類自動(dòng)標(biāo)注
6.1 藏文詞類劃分的意義
6.2 藏文詞類劃分的理論依據(jù)
6.3 藏文詞類體系
6.4 藏文詞類及標(biāo)記集規(guī)范
6.4.1 適用范圍
6.4.2 詞類及標(biāo)記集規(guī)范確定原則
6.5 藏文詞性自動(dòng)標(biāo)注
6.5.1 詞性標(biāo)注
6.5.2 難點(diǎn)分析
6.6 詞性標(biāo)注方法
6.6.1 基于規(guī)則的方法
6.6.2 基于統(tǒng)計(jì)的方法
6.6.3 規(guī)則與統(tǒng)計(jì)相結(jié)合的方法
6.7 HMM在藏文詞性標(biāo)注中的應(yīng)用
6.7.1 先驗(yàn)概率和條件概率
6.7.2 HMM的三個(gè)基本問題
6.7.3 Viterbi算法
6.7.4 HMM與詞性標(biāo)注的關(guān)系
第7章 藏文語(yǔ)料庫(kù)與詞匯知識(shí)庫(kù)
7.1 語(yǔ)料庫(kù)的定義
7.2 語(yǔ)料庫(kù)的作用
7.2.1 對(duì)藏語(yǔ)語(yǔ)言研究的作用
7.2.2 對(duì)藏語(yǔ)自然語(yǔ)言處理的作用
7.2.3 多學(xué)科綜合研究
7.3 語(yǔ)料庫(kù)的發(fā)展簡(jiǎn)史
7.3.1第一代(20世紀(jì)70-80年代)
7.3.2第二代(20世紀(jì)80-90年代)
7.3.3第三代(20世紀(jì)90年代至今)
7.4 國(guó)內(nèi)語(yǔ)料庫(kù)建設(shè)概況
7.5 語(yǔ)料庫(kù)的分類
7.6 藏文語(yǔ)料庫(kù)的設(shè)計(jì)
7.7 藏文語(yǔ)料庫(kù)構(gòu)建原則
7.8 藏文語(yǔ)料庫(kù)的應(yīng)用
7.9 藏文語(yǔ)料庫(kù)的標(biāo)記及其規(guī)范
7.10 藏文語(yǔ)料庫(kù)的標(biāo)記框架
7.10.1 藏文語(yǔ)料庫(kù)中文本屬性的標(biāo)記
7.10.2 藏語(yǔ)文本結(jié)構(gòu)信息的標(biāo)記
7.10.3 段落標(biāo)記
7.10.4 句子標(biāo)記
7.10.5 詞匯標(biāo)記
7.11 藏文語(yǔ)料庫(kù)框架標(biāo)記范例
7.12 詞匯知識(shí)庫(kù)
7.12.1 FrameNet
7.12.2 WordNet
7.12.3 GKB
7.12.4 HOWNet
第8章 藏語(yǔ)句法知識(shí)的表示
8.1 基于短語(yǔ)結(jié)構(gòu)的藏語(yǔ)句法形式化
8.1.1 短語(yǔ)結(jié)構(gòu)語(yǔ)法概述
8.1.2 短語(yǔ)結(jié)構(gòu)語(yǔ)法構(gòu)成要素
8.2 基于范疇語(yǔ)法的藏語(yǔ)句法形式化
8.2.1 范疇語(yǔ)法概述
8.2.2 范疇語(yǔ)法的基本思想和規(guī)則
8.2.3 范疇語(yǔ)法與藏語(yǔ)句法形式化
8.3 基于詞匯功能的藏語(yǔ)句法形式化
8.3.1 詞匯功能語(yǔ)法概述
8.3.2 詞匯功能語(yǔ)法理論框架
8.3.3 LFG兩種語(yǔ)法層次結(jié)構(gòu)
8.4 基于功能合一的藏語(yǔ)句法形式化
8.4.1 復(fù)雜特征集的定義
8.4.2 藏語(yǔ)詞匯的定義描述
8.4.3 藏語(yǔ)句法規(guī)則的描述
8.4.4 藏語(yǔ)語(yǔ)義規(guī)則的描述
8.4.5 藏語(yǔ)句子合一運(yùn)算的描述
8.5 基于依存的藏語(yǔ)句法形式化
8.5.1 依存語(yǔ)法概述
8.5.2 依存語(yǔ)法理論
8.5.3 依存語(yǔ)法的定義
8.5.4 依存結(jié)構(gòu)圖
第9章 藏語(yǔ)句法分析
9.1 句法分析概述
9.2 基于規(guī)則的分析方法
9.2.1 自頇向下分析算法
9.2.2 自底向上分析算法
9.2.3 富田算法
9.2.4 左角分析法
9.2.5 CYK算法
9.2.6 Earley算法
9.3 基于統(tǒng)計(jì)的分析方法
9.3.1 基于概率上下文無(wú)關(guān)文法模型
9.3.2 上下文依存的概率模型
9.3.3 詞匯語(yǔ)法的概率模型
9.3.4 基于歷史的模型
第10章 藏語(yǔ)語(yǔ)義知識(shí)的表示
10.1 語(yǔ)義和邏輯形式
10.2 基本邏輯形式語(yǔ)言
10.3 動(dòng)詞與邏輯形式中的狀態(tài)
10.4 框架知識(shí)表示
10.4.1 框架知識(shí)概述
10.4.2 框架知識(shí)結(jié)構(gòu)與組織
10.4.3 框架知識(shí)語(yǔ)義關(guān)系
第11章 藏語(yǔ)語(yǔ)義分析
11.1 藏語(yǔ)語(yǔ)義成分分析
11.1.1 義素分析概述
11.1.2 義素的基本概念
11.1.3 義素分析的原則
11.1.4 義素分析的方法
11.2 藏語(yǔ)語(yǔ)義特征分析
11.2.1 語(yǔ)義特征的定義
11.2.2 語(yǔ)義特征分析法的產(chǎn)生
11.2.3 義素分析與語(yǔ)義特征分析的區(qū)別
11.2.4 語(yǔ)義特征分析法
11.2.5 語(yǔ)義特征分析法的類別
11.3 配價(jià)語(yǔ)法與藏語(yǔ)語(yǔ)義分析
11.3.1 配價(jià)理論的提出
11.3.2 配價(jià)的概念及表示方法
11.3.3 配價(jià)的層次
11.3.4 配價(jià)成分的定價(jià)原則及理論內(nèi)涵
11.3.5 配價(jià)理論與藏語(yǔ)格語(yǔ)法
11.3.6 藏語(yǔ)動(dòng)詞配價(jià)
11.3.7 藏語(yǔ)形容詞配價(jià)
11.3.8 藏語(yǔ)語(yǔ)義配價(jià)
11.4 格語(yǔ)法與藏語(yǔ)格語(yǔ)義分析
11.4.1 格語(yǔ)法理論的提出
11.4.2 格的定義
11.4.3 格語(yǔ)法的理論框架
11.4.4 表層現(xiàn)象
11.4.5 藏語(yǔ)格的基本概念
11.4.6 藏語(yǔ)格的語(yǔ)法信息描述
11.4.7 藏語(yǔ)格的功能結(jié)構(gòu)分析
11.4.8 藏語(yǔ)格的語(yǔ)義信息分析
11.5 語(yǔ)義解釋與組合理論
11.5.1 組合理論
11.5.2 九表達(dá)式與語(yǔ)義解釋
11.6 帶語(yǔ)義解釋的簡(jiǎn)單語(yǔ)法和詞典
11.7 特征合一語(yǔ)義解釋1
11.8 語(yǔ)法關(guān)系與語(yǔ)義分析
11.9 語(yǔ)義語(yǔ)法與語(yǔ)義分析
第12章 藏語(yǔ)歧義消解
12.1 藏語(yǔ)語(yǔ)義關(guān)系與真歧義
12.2 語(yǔ)義網(wǎng)絡(luò)
12.3 統(tǒng)計(jì)詞義消歧
12.4 搭配與互信息
附錄
附錄1 信息處理用藏語(yǔ)詞類標(biāo)記集規(guī)范
附錄2 信息處理用現(xiàn)代藏文分詞規(guī)范
參考文獻(xiàn)