《Python 自然語言處理入門》是一本使用 Python 解釋在人工智能領(lǐng)域備受關(guān)注的自然語言分析方法的入門書,內(nèi)容涵蓋檢索技術(shù)實(shí)體提取關(guān)系提取語素分析和評估 / 情感 / 概念分析等自然語言處理中的常用知識,同時對傳統(tǒng)技術(shù)和引入了 AI 新技術(shù)的特點(diǎn)作了對比。全書以一線 AI工程師的實(shí)際項目經(jīng)驗(yàn)為后盾,對自然語言處理的要點(diǎn)進(jìn)行了歸納總結(jié),并介紹了使用 Python 程序、API、商業(yè)服務(wù)(IBM Watson)和 OSS(MeCab / Elasticsearch / Word2Vec)等進(jìn)行自然語言處理的實(shí)用方法,在后一章中,還介紹了 BERT 的相關(guān)內(nèi)容,特別適合想學(xué)習(xí)自然語言處理的理工科學(xué)生和人工智能工程師進(jìn)行參考和學(xué)習(xí)。
自然語言處理是計算機(jī)科學(xué)和人工智能領(lǐng)域的重要研究和應(yīng)用方向,廣泛應(yīng)用于機(jī)器翻譯、文本分析、語音識別、文字識別等。本書是IBM公司一線AI工程師以多年來的實(shí)際項目經(jīng)驗(yàn)為基礎(chǔ)編寫的自然語言處理入門書籍。對檢索技術(shù)實(shí)體提取關(guān)系提取語素分析和評估/情感/概念分析等自然語言處理中的常用知識,以及使用商用API和Word2Vec進(jìn)行文本分析的方法進(jìn)行了詳細(xì)解說。
本書涵蓋內(nèi)容:
從用戶角度和工程師角度對文本分析的相關(guān)知識進(jìn)行解說。
文本數(shù)據(jù)獲取的方法和如何進(jìn)行語素分析,這是進(jìn)行文本分析的技術(shù)前提。
利用Mecab和Elasticsearch等OSS開源項目介紹傳統(tǒng)的文本分析方法。
利用IBM公司W(wǎng)atson API的人工智能技術(shù)的文本分析方法。
Word2Vec技術(shù)及應(yīng)用。
遷移學(xué)習(xí)與BERT技術(shù)。
本書特點(diǎn):
1. 本書為有30年IBM工作經(jīng)驗(yàn)的AI工程師撰寫,實(shí)戰(zhàn)經(jīng)驗(yàn)豐富。
2. 語言通俗易懂,內(nèi)容循序漸進(jìn),簡單快速入門。
3. 對IBM Watson API進(jìn)行了詳細(xì)解說。
4. 雙色印刷,版式精美,閱讀體驗(yàn)較好。
赤石雅典
1987年入職IBM日本公司。在東京基礎(chǔ)研究所從事數(shù)學(xué)處理系統(tǒng)方面的研究和開發(fā)工作。1993年調(diào)到軟件工程部,主要負(fù)責(zé)開源系統(tǒng)的基礎(chǔ)設(shè)施設(shè)計和構(gòu)建工作。2013年調(diào)到智慧城市事業(yè)部,2016年8月調(diào)到Watson事業(yè)部至今。
目前,主要負(fù)責(zé)Watson Studio / Watson OpenScale等數(shù)據(jù)科學(xué)系列產(chǎn)品的提案及開發(fā)工作。因?yàn)閺V泛涉獵各種領(lǐng)域,從IT基礎(chǔ)設(shè)施、軟件開發(fā)、編程語言、SQL調(diào)試到Watson、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等,都積累了不少經(jīng)驗(yàn)。
金澤工業(yè)大學(xué)研究生院虎之門校區(qū)客座教授和人工智能技術(shù)特別講座講師,出版有多本機(jī)器學(xué)習(xí)和深度學(xué)習(xí)相關(guān)著作,并在雜志上發(fā)表了大量文章。
在本書中,負(fù)責(zé)第1章~第3章、第4章的一部分、第5章、附錄A~附錄C的撰寫。
江澤美保
Cresco Co., Ltd.
曾擔(dān)任面向企業(yè)的Web門戶網(wǎng)站產(chǎn)品開發(fā)、大型辦公管理的海外遷移項目開發(fā)、支付服務(wù)的現(xiàn)場工程師等職務(wù),后轉(zhuǎn)型為高科技企業(yè)技術(shù)銷售。2015年開始參與IBM Watson工作,在將Watson引入管理方面積累了很多經(jīng)驗(yàn)。2019年獲得IBM Champion稱號。目前擔(dān)任幫助企業(yè)導(dǎo)入人工智能技術(shù)的AI顧問/工程師。本書中主要負(fù)責(zé)第4章的撰寫。