關于我們
書單推薦
新書推薦

專利信息語義表示與深度挖掘

專利信息語義表示與深度挖掘

定  價:78 元

        

  • 作者:張金柱
  • 出版時間:2022/11/1
  • ISBN:9787518986125
  • 出 版 社:科學技術文獻出版社
  • 中圖法分類:G252.7 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
9
8
8
7
6
5
1
1
2
8
5

以專利數(shù)據(jù)語義表示為基礎,專利信息深度挖掘問題能夠得到更好的解決。本書根據(jù)專利數(shù)據(jù)分析與挖掘的一般流程,結合其中的研究重點和研究熱點,著力解決以下5個方面的問題。

①專利科學引文元數(shù)據(jù)抽取和分析。當前科學技術間的關聯(lián)研究主要通過非專利引文分析實現(xiàn),非專利引文包括期刊論文、會議論文、著作、文件等多種類型,而其中很多類型并不能作為科學知識的代表。如何借鑒和改進表示學習方法,快速準確地識別出非專利引文中的專利科學引文,進而抽取專利科學引文中的多種特征項來表示專利引用的科學知識,實現(xiàn)更準確的科學技術關聯(lián)分析,研究科學知識與技術應用間的知識轉移和流動,是專利信息深度挖掘的基礎性工作。

②無監(jiān)督跨語言專利推薦?缯Z言專利推薦可以為企業(yè)和個人遴選相關重要專利、發(fā)現(xiàn)相關技術發(fā)展趨勢、追蹤技術進展提供輔助,進而提供個性化的信息推送和決策支持服務,是有效獲取其他語言相關專利的重要途徑。當前,跨語言專利推薦多從查詢詞和文本精確翻譯的角度出發(fā),往往需要大規(guī)模特定領域的雙語詞典、雙語語料庫及高效準確的機器翻譯等方法來實現(xiàn)有監(jiān)督的跨語言查詢擴展,導致這些方法應用擴展到其他領域進行跨語言專利推薦的難度較大。與此同時,由此推薦的專利大多是相似專利,推薦的多樣性和相關性尚需進一步擴展,亟須從專利文本語義表示角度出發(fā)進行相關專利推薦,以提供更好的決策支持服務。

③技術機會預測。技術機會作為技術創(chuàng)新及市場創(chuàng)新活動的基礎,可以為企業(yè)提供可能的未來發(fā)展方向參考,是進行任何一項技術創(chuàng)新活動都要考慮的重要因素,也是決定企業(yè)能否順利開展技術創(chuàng)新活動的關鍵環(huán)節(jié)。當前研究主要側重于對已發(fā)生的技術機會進行發(fā)現(xiàn),而技術機會預測則多是通過分析大量歷史數(shù)據(jù)進行驗證。實際上,當技術機會出現(xiàn)時,一般還沒有積累大量數(shù)據(jù),特別是在技術機會尚處于萌芽階段的時候。因此,需要借助表示學習方法和類比設計方法,協(xié)同利用具有類似功能或效果的相關領域數(shù)據(jù),在尚未累積大量數(shù)據(jù)的技術萌芽期對技術機會進行預測,更好地支撐數(shù)據(jù)驅動的管理決策。

④技術融合預測。技術融合是新技術產生的重要來源,預測潛在的技術融合成為企業(yè)提高競爭能力、獲取競爭優(yōu)勢甚至是顛覆現(xiàn)有市場的有效和重要的技術手段。當前,技術融合預測的定量分析和研究主要從3個角度展開,包括基于專利引用的技術融合預測、基于專利分類號共現(xiàn)的技術融合預測及基于專利文本的技術融合預測,但還存在以下問題亟須解決:,專利引用具有一定的時間滯后性,需要一定的時間積累,因此現(xiàn)有研究多是對已有技術融合的驗證,不利于技術融合預測。第二,專利分類號共現(xiàn)不能體現(xiàn)專利分類號在序列中的位置特征和上下文語義,由此得到的專利分類語義表示可能存在信息丟失的問題。此外,現(xiàn)有研究一般平等對待專利分類序列中的每個專利分類號,進而賦予同樣的文本信息,造成不同專利分類具有大量相同文本,不利于區(qū)分專利分類。尤為重要的是,專利分類網(wǎng)絡結構和文本內容中的每一維特征的貢獻程度可能并不相同,需要針對不同領域數(shù)據(jù)進行針對性學習,自動調整特征的權重和貢獻。

⑤專利大數(shù)據(jù)處理與分析系統(tǒng)構建。全流程專利數(shù)據(jù)處理與分析的工具軟件較少,而且一般僅能實現(xiàn)專利處理與分析中的某一步驟,無法形成規(guī)范的輸入輸出,難以簡便快捷地對特定領域進行全流程分析與處理。此外,需要針對專利數(shù)據(jù)分析與挖掘,系統(tǒng)調研專利特征項,設計專利數(shù)據(jù)倉庫,研究和實現(xiàn)專利大數(shù)據(jù)獲取、解析、預處理、查詢、統(tǒng)計、分析和可視化的全流程專利處理與分析系統(tǒng),從而為專利數(shù)據(jù)深度挖掘提供更好的工具軟件支撐。

為了解決上述問題,本書引入表示學習理論與方法,研究專利信息語義表示,進而針對情報分析現(xiàn)實需要,從專利信息語義表示角度形成了一系列新方法和新技術,主要包括:從專利科學引文角度出發(fā),提出基于表示學習的專利科學引文識別、專利科學引文特征項抽取及多種專利科學引文內容深度挖掘方法;從專利推薦角度出發(fā),利用不同語種但相同語義的詞在語義空間中位置相近的原理,提出基于表示學習的無監(jiān)督跨語言專利推薦方法;從技術機會預測角度,結合表示學習和類比設計,提出基于短語語義表示和類比設計的技術機會預測方法;從技術融合預測角度,結合表示學習理論與方法,研究專利分類文本賦予及其語義表示、專利分類網(wǎng)絡結構語義表示及融合表示,形成基于專利分類語義表示的技術融合預測方法;從信息系統(tǒng)構建角度,設計專利數(shù)據(jù)倉庫,研究和實現(xiàn)專利大數(shù)據(jù)獲取、解析、預處理、查詢、統(tǒng)計、分析和可視化的全流程專利處理與分析系統(tǒng)構建。

 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內容