《計量文體學(xué)導(dǎo)論》通俗而且詳細(xì)介紹了開展文體計量研究所需統(tǒng)計學(xué)的基礎(chǔ)知識,并且利用統(tǒng)計學(xué)方法以及基于現(xiàn)代統(tǒng)計學(xué)理論的計算機(jī)文本挖掘技術(shù)(文本聚類和分類技術(shù))開展了以下幾方面的研究:中國古代和現(xiàn)代文學(xué)作品的文體特征的抽取、作者鑒定方法、特定作品的文體分析、作家語言使用的變異、以及計算機(jī)文體計量相關(guān)軟件工具使用等諸多方面的研究。用計量方法研究了一些歷來受到社會廣泛關(guān)注的文體學(xué)問題。語言通俗易懂,對所涉及的數(shù)學(xué)和計算機(jī)方面的知識盡量使用比較簡單方法進(jìn)行描述,具有高中知識水平的讀者既可以閱讀理解。
計量文體學(xué)的理論和方法是精確考察作品文體風(fēng)格、鑒定作品作者的有力武器,可以為司法工作提供科學(xué)的鑒定線索,可以為中國古典文獻(xiàn)的整理研究提供更為科學(xué)的手段,使國學(xué)研究進(jìn)一步科學(xué)化。
計量文體學(xué)研究在國外具有很長的歷史,也積累了豐碩的科研成果。但是總體來講和歐美、日本的這方面研究相比還存在著很大的差距,處于落后的局面。本書嘗試從日本相關(guān)技術(shù)及研究方法中借鑒,希望可以起到拋磚引玉的作用。
《計量文體學(xué)導(dǎo)論》通俗而且詳細(xì)介紹了開展文體計量研究所需的統(tǒng)計學(xué)基礎(chǔ)知識,并且利用統(tǒng)計學(xué)方法以及基于現(xiàn)代統(tǒng)計學(xué)理論的計算機(jī)文本挖掘技術(shù)(文本聚類和分類技術(shù))開展了以下幾方面的計量文體學(xué)研究:中國古代和現(xiàn)代文學(xué)作品的文體特征抽取、作者鑒定方法、特定作品的文體分析、作家語言使用的變異、以及計算機(jī)文體計量相關(guān)軟件工具使用等等。用計量方法研究了一些歷來受到社會廣泛關(guān)注的文體學(xué)問題,如作者不同文體風(fēng)格相似作品的作者區(qū)分、作者相同風(fēng)格不同的作品分析、古典名著作者的計量文體學(xué)分析等等。
施建軍,北京外國語大學(xué)教授,主要從事日文信息計算機(jī)智能處理、日語語言學(xué)、文學(xué)作品作者鑒別、漢字文化圈國家語言文字、計算機(jī)輔助外語教學(xué)等領(lǐng)域的研究。主持或承擔(dān)國家重大項目2項、國家社科項目3項以及多項省部級項目和國內(nèi)外橫向項目。
第一章 緒論
第一節(jié) 什么是計量文體學(xué) 1
第二節(jié) 國內(nèi)外計量文體學(xué)發(fā)展的歷史和現(xiàn)狀 2
第三節(jié) 文體的計量特征 5
第二章 計量文體學(xué)相關(guān)重要統(tǒng)計學(xué)概念
第一節(jié) 文體特征的頻率、概率、條件概率 31
第二節(jié) 文體特征的平均值、中位數(shù)、眾數(shù) 37
第三節(jié) 文體特征的方差、標(biāo)準(zhǔn)差 46
第四節(jié) 文體特征的相關(guān)系數(shù) 52
第五節(jié) 特征和文體的相互信息 69
第三章 文體計量研究相關(guān)重要概率分布和定理
第一節(jié) 文體特征隨機(jī)變量的分布 82
第二節(jié) 文體計量研究相關(guān)的幾個重要概率分布 88
第三節(jié) 文體分析中的大數(shù)定律和中心極限定理 99
第四章 文體計量分析中的抽樣和抽樣分布
第一節(jié) 文章的抽樣調(diào)查和抽樣方法 106
第二節(jié) 文體的統(tǒng)計量和抽樣分布 116
第五章 文體計量分析中的參數(shù)估計問題
第一節(jié) 文體特征參數(shù)的點估計 126
第二節(jié) 文體特征參數(shù)范圍的估計 131
第三節(jié) 文體特征平均值范圍的估計 135
第四節(jié) 文體特征參數(shù)范圍估計與作家風(fēng)格比較 152
第六章 文體特征差異的假設(shè)檢驗
第一節(jié) 何為假設(shè)檢驗 165
第二節(jié) 文體特征假設(shè)檢驗的一般步驟 171
第三節(jié) Z檢驗在文體分析中的應(yīng)用 175
第四節(jié) T檢驗在文體分析中的應(yīng)用 180
第五節(jié) 虛詞使用習(xí)慣的假設(shè)檢驗 190
第六節(jié) x2檢驗在文體分析中的應(yīng)用 195
第七章 文體風(fēng)格個體性差異的方差分析
第一節(jié) 文體方差分析的基本原理 202
第二節(jié) 不同作家文體特征的方差分析 209
第三節(jié) 相同作家不同作品文體特征的方差分析 220
第八章 文體特征的多變量分析
第一節(jié) 文本的聚類分析 226
第二節(jié) 文體研究中文本聚類分析的有效性 230
第三節(jié) 聚類分析和古典文學(xué)作品的作者研究 234
第四節(jié) 文體研究中文本聚類分析的局限性 241
第九章 支持向量機(jī)技術(shù)和文學(xué)作品作者鑒別
第一節(jié) 支持向量機(jī)的基本原理 248
第二節(jié) 支持向量機(jī)技術(shù)研究古典文學(xué)作品作者的有效性 249
第三節(jié) 支持向量機(jī)技術(shù)和《紅樓夢》作者研究 252
參考文獻(xiàn) 261
查看全部↓