本書主要從自然語(yǔ)言處理的角度全面地介紹情感分析這個(gè)主題先進(jìn)的研究技術(shù)和實(shí)用算法,以幫助讀者了解通常用于表達(dá)觀點(diǎn)和情感的問題和語(yǔ)言結(jié)構(gòu)的基本結(jié)構(gòu)。它涵蓋了情感分析的所有核心領(lǐng)域,包括許多新興的主題,如辯論分析、意圖挖掘、假民意檢測(cè),并提出了可用來分析和總結(jié)觀點(diǎn)的計(jì)算方法。
目 錄
Sentiment Analysis:Mining Opinions,Sentiments,and Emotions
譯者序
前言
致謝
第1章 引言1
1.1 情感分析應(yīng)用3
1.2 情感分析研究6
1.2.1 針對(duì)不同文本顆粒度的情感分析研究7
1.2.2 情感詞典及其問題8
1.2.3 辯論與評(píng)論分析9
1.2.4 意圖挖掘9
1.2.5 垃圾觀點(diǎn)檢測(cè)與評(píng)論質(zhì)量10
1.3 情感分析是個(gè)迷你自然語(yǔ)言處理任務(wù)11
1.4 本書撰寫方式11
第2章 什么是情感分析13
2.1 觀點(diǎn)定義14
2.1.1 觀點(diǎn)的定義14
2.1.2 情感對(duì)象15
2.1.3 觀點(diǎn)中的情感16
2.1.4 簡(jiǎn)化的觀點(diǎn)定義17
2.1.5 觀點(diǎn)的理由和限定條件19
2.1.6 情感分析的目標(biāo)和任務(wù)20
2.2 觀點(diǎn)摘要定義23
2.3 感情、情緒與心情24
2.3.1 心理學(xué)中的感情、情緒與心情25
2.3.2 情感分析中的感情、情緒與心情28
2.4 觀點(diǎn)的不同類型30
2.4.1 常規(guī)型觀點(diǎn)和比較型觀點(diǎn)31
2.4.2 主觀的和隱含在事實(shí)中的觀點(diǎn)31
2.4.3 第一人稱和非第一人稱觀點(diǎn)34
2.4.4 元觀點(diǎn)35
2.5 作者和讀者視角35
2.6 小結(jié)36
第3章 文檔級(jí)情感分類37
3.1 基于監(jiān)督的情感分類38
3.1.1 基于機(jī)器學(xué)習(xí)算法的情感分類38
3.1.2 使用自定義打分函數(shù)的情感分類44
3.2 基于無(wú)監(jiān)督的情感分類45
3.2.1 使用句法模板和網(wǎng)頁(yè)檢索的情感分類45
3.2.2 使用情感詞典的情感分類46
3.3 情感評(píng)分預(yù)測(cè)48
3.4 跨領(lǐng)域情感分類49
3.5 跨語(yǔ)言情感分類51
3.6 文檔的情緒分類52
3.7 小結(jié)53
第4章 句子級(jí)主客觀和情感分類54
4.1 主觀性55
4.2 句子級(jí)主客觀分類56
4.3 句子級(jí)情感分類59
4.3.1 句子級(jí)情感分類的前提假設(shè)59
4.3.2 分類方法60
4.4 處理?xiàng)l件句61
4.5 處理諷刺句62
4.6 跨語(yǔ)言主客觀分類和情感分類64
4.7 在情感分類中使用語(yǔ)篇信息65
4.8 句子級(jí)情緒分類66
4.9 討論67
第5章 屬性級(jí)情感分類68
5.1 屬性級(jí)情感分類方法69
5.1.1 基于監(jiān)督學(xué)習(xí)的方法69
5.1.2 基于詞典的方法70
5.1.3 兩種方法的優(yōu)缺點(diǎn)72
5.2 情感組合規(guī)則73
5.2.1 情感組合規(guī)則概述74
5.2.2 情感減弱和情感增強(qiáng)表達(dá)81
5.2.3 SMALL_OR_LESS和LARGE_OR_MORE表達(dá)83
5.2.4 情緒和情感強(qiáng)度86
5.2.5 情感詞的含義86
5.2.6 其他方法概述88
5.3 否定和情感89
5.3.1 否定詞89
5.3.2 never92
5.3.3 其他常用的情感轉(zhuǎn)換詞94
5.3.4 否定詞移動(dòng)現(xiàn)象94
5.3.5 否定范圍95
5.4 情態(tài)和情感96
5.5 并列連詞but100
5.6 非觀點(diǎn)內(nèi)容的情感詞102
5.7 規(guī)則表示103
5.8 詞義消歧和指代消解105
5.9 小結(jié)106
第6章 屬性和實(shí)體抽取108
6.1 基于頻率的屬性抽取109
6.2 利用句法關(guān)系110
6.2.1 利用觀點(diǎn)和觀點(diǎn)評(píng)價(jià)對(duì)象間的評(píng)價(jià)關(guān)系111
6.2.2 利用部分整體和屬性關(guān)系116
6.3 基于監(jiān)督學(xué)習(xí)的屬性抽取118
6.3.1 隱馬爾可夫模型118
6.3.2 條件隨機(jī)場(chǎng)119
6.4 隱含屬性的映射121
6.4.1 基于語(yǔ)料庫(kù)的方法121
6.4.2 基于詞典的方法122
6.5 屬性聚類124
6.6 基于主題模型的屬性抽取126
6.6.1 隱狄利克雷分配127
6.6.2 基于無(wú)監(jiān)督主題模型進(jìn)行觀點(diǎn)屬性抽取129
6.6.3 在主題模型中加入領(lǐng)域先驗(yàn)知識(shí)133
6.6.4 基于終身學(xué)習(xí)的主題模型:像人類一樣學(xué)習(xí)135
6.6.5 使用短語(yǔ)作為主題詞138
6.7 實(shí)體抽取與消解141
6.7.1 實(shí)體抽取與消解的問題定義142
6.7.2 實(shí)體抽取144
6.7.3 實(shí)體鏈接145
6.7.4 實(shí)體搜索和鏈接147
6.8 觀點(diǎn)持有者和觀點(diǎn)時(shí)間抽取147
6.9 小結(jié)148
第7章 情感詞典構(gòu)建149
7.1 基于詞典的方法149
7.2 基于語(yǔ)料庫(kù)的方法152
7.2.1 從語(yǔ)料庫(kù)中識(shí)別情感詞152
7.2.2 處理上下文相關(guān)的情感詞153
7.2.3 詞典自適應(yīng)155
7.2.4 其他相關(guān)工作156
7.3 隱含了情感信息(期望或者不期望)的事實(shí)型描述156
7.4 小結(jié)158
第8章 比較型觀點(diǎn)分析159
8.1 問題定義159
8.2 比較句識(shí)別162
8.3 比較句中的優(yōu)選實(shí)體集識(shí)別163
8.4 特殊類型的比較句164
8.4.1 非標(biāo)準(zhǔn)型比較164
8.4.2 交叉類型的比較166
8.4.3 單實(shí)體比較167
8.4.4 帶有compare和comparison的句子168
8.5 實(shí)體與屬性抽取169
8.6 小結(jié)170
第9章 觀點(diǎn)摘要和檢索172
9.1 基于屬性的觀點(diǎn)摘要172
9.2 基于屬性的觀點(diǎn)摘要進(jìn)階175
9.3 可對(duì)照的觀點(diǎn)摘要176
9.4 傳統(tǒng)摘要177
9.5 比較型觀點(diǎn)摘要177
9.6 觀點(diǎn)檢索177
9.7 現(xiàn)有觀點(diǎn)檢索技術(shù)178
9.8 小結(jié)180
第10章 辯論與評(píng)論分析181
10.1 辯論中的立場(chǎng)識(shí)別181
10.2 對(duì)辯論、討論進(jìn)行建模184
10.2.1 JTE模型185
10.2.2 JTE-R模型:對(duì)回復(fù)關(guān)系進(jìn)行建模188
10.2.3 JTE-P模型:考慮作者之間的交互關(guān)