基于文本挖掘的藥品不良反應(yīng)知識(shí)發(fā)現(xiàn)
定 價(jià):66 元
- 作者:劉婧,趙嵩正
- 出版時(shí)間:2023/6/15
- ISBN:9787513081917
- 出 版 社:知識(shí)產(chǎn)權(quán)出版社
- 中圖法分類:R961-39
- 頁(yè)碼:188
- 紙張:
- 版次:1
- 開本:16開
本書凝練了作者近七年來(lái)的研究成果,融合了國(guó)家自然科學(xué)基金項(xiàng)目和博士后科學(xué)基金面上項(xiàng)目(一等)的相關(guān)研究成果。 基于設(shè)計(jì)科學(xué)、文本挖掘、信息抽取和機(jī)器學(xué)習(xí)等理論和方法,搭建了數(shù)據(jù)驅(qū)動(dòng)的社交媒體中藥品不良反應(yīng)知識(shí)發(fā)現(xiàn)框架。在應(yīng)用層面,從非結(jié)構(gòu)化的文本數(shù)據(jù)中最終提取出潛在的(藥品-不良反應(yīng))知識(shí),首先從社會(huì)媒體平臺(tái)上海量數(shù)據(jù)中過(guò)濾掉了不包含不良反應(yīng)信息的不相關(guān)文本,然后從非結(jié)構(gòu)化文本中提取了疾病癥狀等實(shí)體,最后區(qū)分了藥品和提取的疾病癥狀等實(shí)體間的關(guān)系類型(如藥品不良反應(yīng)還是藥品適應(yīng)癥)。在方法層面,針對(duì)數(shù)據(jù)非均衡、高維、不規(guī)范、標(biāo)注難且成本高的特點(diǎn),從特征和算法兩個(gè)角度,提出了一系列改進(jìn)的文本分類、實(shí)體識(shí)別和關(guān)系抽取方法。
本書在Web 2.0和Health 2.0的背景下,基于設(shè)計(jì)科學(xué)、文本挖掘、信息抽取和機(jī)器學(xué)習(xí)等理論與方法,搭建了社會(huì)媒體中藥品不良反應(yīng)知識(shí)發(fā)現(xiàn)框架;實(shí)現(xiàn)了特征向量的提取和多種核方法,并基于集成學(xué)習(xí)和半監(jiān)督學(xué)習(xí),構(gòu)建了一系列藥品不良反應(yīng)關(guān)系抽取模型,識(shí)別了藥品實(shí)體和癥狀/疾病實(shí)體間的關(guān)系類別,減少了社會(huì)媒體上數(shù)據(jù)高維特征的影響及模型對(duì)標(biāo)注數(shù)據(jù)的依賴,提升了藥品不良反應(yīng)關(guān)系抽取模型的性能。通過(guò)本書的研究,在理論上豐富和補(bǔ)充了文本挖掘、集成學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的理論研究體系;在實(shí)踐上,有助于完善藥品的安全性信息,為相關(guān)部門提供決策支持,實(shí)現(xiàn)了數(shù)據(jù)驅(qū)動(dòng)的藥物警戒,是面向人民生命健康進(jìn)行科技創(chuàng)新的重要實(shí)踐。
劉婧,天津財(cái)經(jīng)大學(xué)管理信息系統(tǒng)系教師,西北工業(yè)大學(xué)博士,長(zhǎng)期從事數(shù)據(jù)驅(qū)動(dòng)的決策支持研究,研究方向?yàn)槲谋就诰蚝椭腔坩t(yī)療。主持國(guó)家自然科學(xué)基金青年項(xiàng)目1項(xiàng),主持中國(guó)博士后科學(xué)基金面上項(xiàng)目(一等)1項(xiàng),參與國(guó)家級(jí)及省部級(jí)研究項(xiàng)目3項(xiàng);發(fā)表高水平學(xué)術(shù)論文10余篇,參與編寫教材2部;入選天津市高!扒嗄旰髠淙瞬胖С钟(jì)劃”,入選天津市“131”創(chuàng)新型人才培養(yǎng)工程第三層次。
目 錄
第1章 緒論001
1.1 研究背景與意義 / 001
1.2 國(guó)內(nèi)外研究現(xiàn)狀 / 003
1.2.1 社會(huì)媒體環(huán)境下藥品不良反應(yīng)知識(shí)發(fā)現(xiàn)研究 / 003
1.2.2 文本挖掘相關(guān)研究 / 007
1.2.3 研究述評(píng) / 017
1.3 研究?jī)?nèi)容與創(chuàng)新點(diǎn) / 018
1.3.1 研究?jī)?nèi)容 / 018
1.3.2 創(chuàng)新性 / 021
1.4 研究方法 / 022
第2章 藥品不良反應(yīng)相關(guān)文本識(shí)別023
2.1 基于層次注意力的多文檔表征融合模型 / 023
2.1.1 基于深度學(xué)習(xí)的深層文本表征 / 025
2.1.2 考慮外部領(lǐng)域知識(shí)的特征工程 / 028
2.1.3 層次注意力機(jī)制 / 030
2.1.4 實(shí)驗(yàn)設(shè)置 / 032
2.1.5 實(shí)驗(yàn)結(jié)果與分析 / 033
2.2 基于多視圖主動(dòng)學(xué)習(xí)的藥品不良反應(yīng)相關(guān)文本識(shí)別模型 / 036
2.2.1 基于多視圖主動(dòng)學(xué)習(xí)的藥品不良反應(yīng)相關(guān)文本識(shí)別框架 / 037
2.2.2 基于多文檔表征的多視圖生成機(jī)制 / 039
2.2.3 樣本選擇策略 / 041
2.2.4 MVAL4D的偽代碼 / 044
2.2.5 實(shí)驗(yàn)設(shè)置 / 046
2.2.6 實(shí)驗(yàn)結(jié)果與分析 / 048
2.3 小結(jié) / 052
第3章 藥品不良反應(yīng)命名實(shí)體識(shí)別054
3.1 基于傳統(tǒng)CRF的藥品不良反應(yīng)實(shí)體識(shí)別模型構(gòu)建 / 054
3.1.1 條件隨機(jī)場(chǎng) / 054
3.1.2 特征提取 / 055
3.2 基于Bi-LSTM-CRF的藥品不良反應(yīng)實(shí)體識(shí)別模型構(gòu)建 / 056
3.3 實(shí)驗(yàn)設(shè)置 / 058
3.3.1 數(shù)據(jù)集 / 058
3.3.2 實(shí)驗(yàn)過(guò)程 / 059
3.3.3 評(píng)價(jià)指標(biāo) / 059
3.4 實(shí)驗(yàn)結(jié)果與分析 / 059
3.5 小結(jié) / 062
第4章 基于組合學(xué)習(xí)的藥品不良反應(yīng)關(guān)系抽取063
4.1 基于特征的藥品不良反應(yīng)關(guān)系抽取 / 063
4.1.1 特征提取 / 063
4.1.2 特征選擇 / 069
4.1.3 實(shí)驗(yàn)設(shè)置 / 071
4.1.4 實(shí)驗(yàn)結(jié)果與分析 / 074
4.2 基于核方法的藥品不良反應(yīng)關(guān)系抽取 / 078
4.2.1 典型核 / 079
4.2.2 實(shí)驗(yàn)設(shè)置 / 086
4.2.3 實(shí)驗(yàn)結(jié)果與分析 / 086
4.3 基于組合學(xué)習(xí)的藥品不良反應(yīng)關(guān)系抽取集成框架 / 088
4.3.1 基分類器融合方法 / 088
4.3.2 實(shí)驗(yàn)設(shè)置 / 092
4.3.3 實(shí)驗(yàn)結(jié)果與分析 / 093
4.4 基于詞匯語(yǔ)義相似度和詞性分析的POS-SSDP核方法 / 096
4.4.1 對(duì)基于核的關(guān)系抽取方法進(jìn)行改進(jìn)的必要性 / 096
4.4.2 詞匯語(yǔ)義相似度 / 099
4.4.3 POS-SSDP:嵌入詞匯語(yǔ)義信息和詞性分析的最短依賴路徑核 / 103
4.4.4 實(shí)驗(yàn)設(shè)置 / 104
4.4.5 實(shí)驗(yàn)結(jié)果與分析 / 106
4.5 小結(jié) / 111
第5章 基于半監(jiān)督學(xué)習(xí)和集成學(xué)習(xí)的藥品不良反應(yīng)關(guān)系抽取112
5.1 基于半監(jiān)督集成學(xué)習(xí)的藥品不良反應(yīng)關(guān)系抽取 / 112
5.1.1 半監(jiān)督學(xué)習(xí) / 112
5.1.2 集成學(xué)習(xí) / 115
5.1.3 Co-Ensemble方法 / 118
5.1.4 實(shí)驗(yàn)設(shè)置 / 121
5.1.5 實(shí)驗(yàn)結(jié)果與分析 / 123
5.2 基于改進(jìn)隨機(jī)子空間的藥品不良反應(yīng)關(guān)系抽取 / 131
5.2.1 隨機(jī)子空間相關(guān)工作 / 131
5.2.2 基于分層采樣的隨機(jī)子空間方法 / 132
5.2.3 使用的特征 / 135
5.2.4 實(shí)驗(yàn)設(shè)置 / 136
5.2.5 實(shí)驗(yàn)結(jié)果與分析 / 137
5.3 基于改進(jìn)半監(jiān)督學(xué)習(xí)的藥品不良反應(yīng)關(guān)系抽取 / 143
5.3.1 使用Lasso改進(jìn)基于分歧的半監(jiān)督學(xué)習(xí) / 144
5.3.2 實(shí)驗(yàn)結(jié)果與分析 / 147
5.4 小結(jié) / 150
參考文獻(xiàn)152