Python日語數(shù)字人文之語料庫語言學(xué)技術(shù)及其應(yīng)用
定 價(jià):78 元
- 作者:鐘勇著
- 出版時(shí)間:2023/12/1
- ISBN:9787576610499
- 出 版 社:東南大學(xué)出版社
- 中圖法分類:H36
- 頁碼:179
- 紙張:
- 版次:1
- 開本:16開
本書較為全面地梳理和研究詞表制作、N元分析、主題詞分析、索引行生成、顯著搭配提取、詞匯多樣性統(tǒng)計(jì)、平均詞長(zhǎng)統(tǒng)計(jì)、詞長(zhǎng)分布統(tǒng)計(jì)、平均句長(zhǎng)統(tǒng)計(jì)、詞類占比統(tǒng)計(jì)、詞匯密度統(tǒng)計(jì)、MVR統(tǒng)計(jì)、詞匯復(fù)雜性統(tǒng)計(jì)、句式頻次統(tǒng)計(jì)等語料庫語言學(xué)中各種適用于日語數(shù)字人文研究的數(shù)字技術(shù),詳細(xì)演示其在日語文本數(shù)據(jù)處理中的Python編程實(shí)現(xiàn),并通過一系列研究實(shí)例剖析其在日語語言研究中的具體應(yīng)用方法。本書既是一本Python編程入門書,也是一本語料庫語言學(xué)入門書,還是一本日語文本數(shù)據(jù)處理和日語數(shù)字人文研究的入門書。
鐘勇,男,1984年生,湖南人,中共黨員:博士畢業(yè)于日本九州大學(xué),現(xiàn)任南京航空航天大學(xué)外國語學(xué)院副研究員、碩士生導(dǎo)師、日語系副主任及英語系與日語系聯(lián)合黨支部書記;主要研究領(lǐng)域?yàn)槎Z習(xí)得、語言數(shù)字人文、Python數(shù)據(jù)處理等;迄今已在《目語學(xué)習(xí)與研究》、【言語文化論究】等國內(nèi)外學(xué)術(shù)期刊上發(fā)表論文30余篇,主持省部級(jí)、院校級(jí)課題項(xiàng)目等7項(xiàng),出版學(xué)術(shù)專著2部。
第一章 日語數(shù)字人文及本書內(nèi)容概要
1.1 什么是數(shù)字人文
1.2 什么是日語數(shù)字人文
1.3 本書主要內(nèi)容
參考文獻(xiàn)
第二章 Python與PyCharm
2.1 什么是Python
2.1.1 Python簡(jiǎn)介
2.1.2 Python安裝步驟
2.2 什么是PyCharm
2.2.1 PyCharm簡(jiǎn)介
2.2.2 PyCharm安裝步驟及首次啟用
2.2.3 PyCharm基本操作
參考文獻(xiàn)
第三章 語料庫語言學(xué)概述
3.1 什么是語料庫
3.1.1 語料庫的定義
3.1.2 語料庫的類別
3.2 什么是語料庫語言學(xué)
3.2.1 語料庫語言學(xué)的定義
3.2.2 語料庫語言學(xué)的技術(shù)體系
參考文獻(xiàn)
第四章 日語詞表制作技術(shù)
4.1 技術(shù)概要與編程提示
4.2 基于IPA詞典的詞表制作編程實(shí)現(xiàn)
4.2.1 所用語料與編程步驟
4.2.2 分步代碼
4.2.3 完整代碼
4.3 基于UniDic詞典的詞表制作編程實(shí)現(xiàn)
4.3.1 所用語料與編程步驟
4.3.2 分步代碼
4.3.3 完整代碼
參考文獻(xiàn)
第五章 日語N元分析技術(shù)
5.1 技術(shù)概要與編程提示
5.2 三元序列分析編程實(shí)現(xiàn)
5.2.1 所用語料與編程步驟
5.2.2 分步代碼
5.2.3 完整代碼
參考文獻(xiàn)
第六章 日語主題詞分析技術(shù)
6.1 技術(shù)概要與編程提示
6.2 主題詞分析編程實(shí)現(xiàn)
6.2.1 所用語料與編程步驟
6.2.2 分步代碼
6.2.3 完整代碼
參考文獻(xiàn)
第七章 日語索引行生成技術(shù)
7.1 技術(shù)概要與編程提示
7.2 基于指定詞匯基本形及其活用形的索引行生成編程實(shí)現(xiàn)
7.2.1 所用語料與編程步驟
7.2.2 分步代碼
7.2.3 完整代碼
7.3 基于指定詞匯素的索引行生成編程實(shí)現(xiàn)
7.3.1 所用語料與編程步驟
7.3.2 分步代碼
7.3.3 完整代碼
參考文獻(xiàn)
第八章 日語顯著搭配提取技術(shù)
8.1 技術(shù)概要與編程提示
8.2 基于指定節(jié)點(diǎn)詞和窗口跨距的二詞詞塊顯著搭配提取編程實(shí)現(xiàn)
8.2.1 所用語料與編程步驟
8.2.2 分步代碼
8.2.3 完整代碼
8.3 基于句子單位的二詞詞塊顯著搭配全額提取編程實(shí)現(xiàn)
8.3.1 所用語料與編程步驟
8.3.2 分步代碼
8.3.3 完整代碼
8.4 基于依存關(guān)系的動(dòng)賓詞塊顯著搭配提取編程實(shí)現(xiàn)
8.4.1 所用語料與編程步驟
8.4.2 分步代碼
8.4.3 完整代碼
參考文獻(xiàn)
第九章 日語語言特征統(tǒng)計(jì)技術(shù)
9.1 技術(shù)概要與編程提示
9.2 詞匯多樣性統(tǒng)計(jì)編程實(shí)現(xiàn)
9.2.1 所用語料與編程步驟
9.2.2 分步代碼
9.2.3 完整代碼
9.3 平均詞長(zhǎng)、詞長(zhǎng)分布及平均句長(zhǎng)統(tǒng)計(jì)編程實(shí)現(xiàn)
9.3.1 所用語料與編程步驟
9.3.2 分步代碼
9.3.3 完整代碼
9.4 詞類占比、詞匯密度及MVR值統(tǒng)計(jì)編程實(shí)現(xiàn)
9.4.1 所用語料與編程步驟
9.4.2 分步代碼
9.4.3 完整代碼
9.5 詞匯復(fù)雜性統(tǒng)計(jì)編程實(shí)現(xiàn)
9.5.1 所用語料與編程步驟
9.5.2 分步代碼
9.5.3 完整代碼
9.6 句式頻次統(tǒng)計(jì)編程實(shí)現(xiàn)
9.6.1 所用語料與編程步驟
9.6.2 分步代碼
9.6.3 完整代碼
參考文獻(xiàn)
第十章 日語語言研究實(shí)例
參考文獻(xiàn)