本書體現(xiàn)了著名語言學(xué)家張普教授過去在應(yīng)用語言學(xué)方面的研究與思考。本書收入的文章以應(yīng)用語言學(xué)內(nèi)容為主,大體包括語言信息處理、語料庫的建立,自幼分詞、漢字編碼研究、動態(tài)語言知識更新、古籍整理的現(xiàn)代化手段等,文章來源的形式有論文、教材、調(diào)查報告、評議、書籍前言等。反映了這些領(lǐng)域研究的階段性成果,具有一定的學(xué)術(shù)性和歷史性價值,也體現(xiàn)了作者這些研究的時代性和前瞻性,對青年學(xué)者的學(xué)術(shù)研究具有很強的指導(dǎo)意義。
張普
----------------------------
北京語言大學(xué)應(yīng)用語言學(xué)研究所所長,校學(xué)術(shù)委員會委員。曾主持或參加國家自然科學(xué)基金重點項目,國家六五、七五、八五重點科技攻關(guān)項目,國家火炬計劃項目,漢語信息處理有關(guān)國家標準制定項目等重要漢語信息處理項目。主持的"普及型漢字輸入方法"等科研成果先后獲國家教委科技進步三等獎、能源部科進步二等獎、北京市高校哲學(xué)社會科學(xué)中青年優(yōu)秀科研成果獎、湖北省哲學(xué)社會科學(xué)優(yōu)秀科研成果獎等獎項。曾參加《漢語大字典》的編寫工作,主編《中華小百科全書·語言文字分卷》、《語言自動處理》等,著有《漢語信息處理研究》、《漢字編碼鍵盤輸入文集》等。近年來致力"語言知識動態(tài)更新"研究,發(fā)表了一系列文章,提出流通度理論及其基本量化方法、語感的量化及其計算機模擬、第三代的動態(tài)流通語料庫的建設(shè)等面向21世紀和網(wǎng)絡(luò)的重要語言信息處理研究新課題。
壹 語言信息處理概論 //1
一 語言研究面臨的世紀性挑戰(zhàn) //1
二 語言信息處理概說 //3
貳 語言自動處理系統(tǒng)的構(gòu)成 //7
一 語言資料庫的構(gòu)成 //7
二 語言知識庫的構(gòu)成 //10
三 背景知識庫的構(gòu)成 //12
四 語言自動處理軟件系統(tǒng)的構(gòu)成 //12
叁 語料庫的建立 //14
一 中文輸入法 //14
二 語料庫的分類 //16
三 第三代語料庫 //24
肆 語料的自動標記──自動分詞 //28
一 自動分詞原理 //28
二 語料庫的標記 //30
伍 給中國社會科學(xué)院副院長江藍生的重大課題所做的調(diào)研報告(其一)//32
陸 漢字編碼研究總論 //42
一 漢字的單字處理 //43
二 漢字編碼的字詞處理 //49
三 漢字編碼的字詞句智能處理 //54
四 漢字鍵盤輸入平臺 //64
五 漢字數(shù)字鍵盤輸入技術(shù) //71
六 漢字鍵盤輸入技術(shù)的發(fā)展展望 //76
柒 《動態(tài)語言知識更新研究》前言 //88
捌 基于動態(tài)流通語料庫的語感模擬和新詞語提取研究 //116
一 關(guān)于動態(tài)語料庫 //116
二 關(guān)于流通度 //120
三 關(guān)于語感模擬 //123
四 關(guān)于新詞語提取研究 //124
五 DCC 博士研究室關(guān)于“語”的提取研究 //129
玖 21 世紀——數(shù)字化對外漢語教學(xué)的新時期 //132
參考文獻 //149
附錄:《赤光》和《少年》在法國里昂發(fā)現(xiàn)始末 //152
跋語 //166