當(dāng)前,全球技術(shù)發(fā)展日新月異,大量的技術(shù)創(chuàng)新活動(dòng)為企業(yè)提供了比以往更多的技術(shù)發(fā)展機(jī)會(huì),企業(yè)必須識(shí)別和把握可能出現(xiàn)的技術(shù)發(fā)展機(jī)會(huì),才能提高企業(yè)的技術(shù)創(chuàng)新能力和國際競爭力。作為全球大的技術(shù)信息源,論文信息資源通常被用于測度基礎(chǔ)科學(xué)研究活動(dòng)的水平,而專利信息資源則被用于測度產(chǎn)業(yè)技術(shù)的創(chuàng)新水平,具有生命力和潛在商業(yè)價(jià)值的技術(shù)機(jī)會(huì)在這兩大信息源中通常會(huì)留下一定的足跡。因此,論文和專利信息資源的融合分析對(duì)于把握技術(shù)機(jī)會(huì)、理解科學(xué)和技術(shù)之間的聯(lián)系、提高技術(shù)創(chuàng)新水平具有重要意義。
技術(shù)機(jī)會(huì)發(fā)現(xiàn)是指通過對(duì)特定領(lǐng)域內(nèi)海量信息資源的深入挖掘和分析,在掌握已有技術(shù)發(fā)展趨勢及其相互關(guān)系的同時(shí),發(fā)現(xiàn)新技術(shù)動(dòng)向,推斷該領(lǐng)域可能出現(xiàn)的技術(shù)形態(tài)或技術(shù)發(fā)展點(diǎn)。通過對(duì)論文和專利信息資源的融合分析,可以反映技術(shù)發(fā)展現(xiàn)狀、挖掘研發(fā)熱點(diǎn)、預(yù)測發(fā)展趨勢、揭示競爭對(duì)手的技術(shù)實(shí)力與戰(zhàn)略布局。
本書主要以作者帶領(lǐng)團(tuán)隊(duì)所研發(fā)的大數(shù)據(jù)環(huán)境下多源信息融合的科技文獻(xiàn)智能分析服務(wù)平臺(tái)SciTeMiner為背景,系統(tǒng)闡述了該平臺(tái)中技術(shù)機(jī)會(huì)分析模塊所涉及的方法和技術(shù)。本書共分為四大部分:第一部分由第二章組成,主要涉及技術(shù)術(shù)語抽取方法研究;第二部分由第三章、第四章、第五章、第六章及第七章組成,主要研究技術(shù)術(shù)語間語義關(guān)系抽取方法;第三部分由第八章和第九章組成,主要探討技術(shù)主題抽取及技術(shù)主題關(guān)聯(lián);第四部分由第十章、第十一章和第十二章組成,主要研判技術(shù)生命周期階段及構(gòu)建技術(shù)功效圖。
本書得以順利出版,要感謝國家自然科學(xué)基金的資助,同時(shí),也要感謝作者原單位中國科學(xué)技術(shù)信息研究所,以及新單位北京工業(yè)大學(xué)各級(jí)領(lǐng)導(dǎo)和同事的大力支持。本書作者長期從事科學(xué)前沿探測、技術(shù)預(yù)見、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和大數(shù)據(jù)方面的研發(fā)工作,一直醞釀出版與技術(shù)機(jī)會(huì)發(fā)現(xiàn)方法有關(guān)的圖書,但由于種種原因,直到今天才得以實(shí)現(xiàn)。本書凝聚了許多人的心血和智慧,在此要特別感謝中國科學(xué)技術(shù)信息研究所的韓紅旗副研究員和張兆鋒博士,以及本書作者曾指導(dǎo)過的研究生張晗、王新和王政同學(xué)。
由于作者水平所限,書中難免存在不足,歡迎讀者批評(píng)指正。
目錄
第一章緒論
1.1背景及意義
1.2國內(nèi)外研究現(xiàn)狀
1.3平臺(tái)及工具研發(fā)
1.4章節(jié)結(jié)構(gòu)安排
1.5本章小節(jié)
參考文獻(xiàn)
第二章專利技術(shù)術(shù)語抽取方法
2.1引言
2.2術(shù)語的定義、分類和特征
2.3自動(dòng)術(shù)語抽取的方法
2.4中文術(shù)語抽取研究的概述
2.5專利技術(shù)術(shù)語抽取模型
2.6實(shí)驗(yàn)結(jié)構(gòu)及討論
2.7本章小節(jié)
參考文獻(xiàn)
第三章共現(xiàn)聚類分析的新方法:最大頻繁項(xiàng)集挖掘
3.1引言
3.2共現(xiàn)分析法
3.3最大頻繁項(xiàng)集挖掘
3.4實(shí)驗(yàn)結(jié)果及討論
3.5本章小結(jié)
參考文獻(xiàn)
第四章基于雙序列比對(duì)的中文術(shù)語語義相似度計(jì)算方法
4.1引言
4.2《同義詞詞林》簡介
4.3Ⅰ型問題的語義相似度計(jì)算
4.4Ⅱ型問題的語義相似度計(jì)算
4.5實(shí)驗(yàn)結(jié)果及討論
4.6本章小結(jié)
參考文獻(xiàn)
第五章僅根據(jù)Proximity數(shù)據(jù)構(gòu)建向量空間模型的方法
5.1引言
5.2基于MDS的向量空間模型構(gòu)建方法
5.3實(shí)驗(yàn)材料及數(shù)據(jù)
5.4實(shí)驗(yàn)結(jié)果及分析
5.5本章小結(jié)
參考文獻(xiàn)
第六章基于弱監(jiān)督學(xué)習(xí)的語義關(guān)系抽取方法
6.1引言
6.2國內(nèi)外研究現(xiàn)狀
6.3實(shí)體關(guān)系抽取模型
6.4實(shí)驗(yàn)結(jié)果及分析
6.5本章小結(jié)
參考文獻(xiàn)
第七章幾種敘詞表復(fù)雜邏輯錯(cuò)誤檢查算法研究
7.1引言
7.2預(yù)備知識(shí)
7.3屬/分關(guān)系中的邏輯錯(cuò)誤檢查算法
7.4參考關(guān)系中的邏輯錯(cuò)誤檢查算法
7.5本章小結(jié)
參考文獻(xiàn)
第八章融合科技文獻(xiàn)內(nèi)外部特征的主題模型發(fā)展綜述
8.1引言
8.2歷史淵源及符號(hào)表示
8.3融合科研人員特征
8.4融合時(shí)間特征
8.5融合參考文獻(xiàn)特征
8.6融合多個(gè)外部特征
8.7本章小結(jié)
參考文獻(xiàn)
第九章論文和專利資源主題關(guān)聯(lián)分析方法
9.1引言
9.2技術(shù)路線
9.3技術(shù)主題抽取
9.4詞項(xiàng)和命名實(shí)體聚類
9.5主題相似度計(jì)算
9.6技術(shù)主題關(guān)聯(lián)
9.7實(shí)驗(yàn)結(jié)果及討論
9.8本章小節(jié)
參考文獻(xiàn)
第十章基于事實(shí)型數(shù)據(jù)的技術(shù)生命周期判斷方法綜述
10.1引言
10.2技術(shù)生命周期階段劃分
10.3技術(shù)生命周期階段判斷方法
10.4本章小結(jié)
參考文獻(xiàn)
第十一章面向情報(bào)技術(shù)領(lǐng)域的Loglet分析
11.1引言
11.2增長曲線模型
11.3實(shí)驗(yàn)數(shù)據(jù)選取
11.4LogletLab簡介
11.5實(shí)驗(yàn)結(jié)果及分析
11.6本章小結(jié)
參考文獻(xiàn)
第十二章專利技術(shù)功效圖智能構(gòu)建進(jìn)展
12.1引言
12.2技術(shù)功效圖概述
12.3技術(shù)功效圖構(gòu)建模式
12.4關(guān)鍵技術(shù)研究進(jìn)展
12.5本章小結(jié)