語料庫語言學既可以被看作是一門新興學科,又可以被看作是20世紀曾盛極一時的美國結(jié)構(gòu)主義語言學研究方法的延續(xù),是現(xiàn)代語言學的一個重要分支。《外語學術(shù)普及系列:什么是語料庫語言學》以問答的形式,介紹了語料庫及語料庫語言學的基礎(chǔ)知識和基本概念、語料庫的處理和加工、語料庫的分析方法、語料庫的研究和應用等。全書深入淺出,語言精煉,有助于初學者了解語料庫語言學的概貌,對于普及這一學科的基礎(chǔ)知識具有十分重要的價值。
據(jù)記載,公元一世紀時,羅馬人發(fā)明了玻璃,還發(fā)現(xiàn)玻璃有放大效應,后來直到13世紀,意大利人才發(fā)明了放大鏡——大約能放大6倍,可以看清跳蚤了,于是人們就把這東西叫做fleaglasses。1590年前后,一對荷蘭父子試著把鏡片放在圓筒內(nèi)壁,結(jié)果發(fā)現(xiàn)圓筒遠端的東西會被放大,于是就試著加長這個圓筒,把三個粗細不等的圓筒套接起來,套接后的圓筒可伸長也可縮短,縮短的時候能放大3倍,伸長的時候能放大9倍。我的問題是,這東西是放大鏡還是顯微鏡?
其實叫它放大鏡還是叫它顯微鏡并不重要,重要的是我們用它可以看到原來看不到的東西。一旦我們操起新式武器,仔細觀察一下本來已經(jīng)習以為常的東西,竟驚訝地發(fā)現(xiàn),我們原本習以為常的東西根本就是錯的。
這就是語料庫語言學,而語言就是我們天天習以為常的東西。語料庫語言學像是新工具,它促使我們反思許多語言問題,尤其是一些本來已經(jīng)有了定論的問題。于是,我們開始越來越不相信定論,不時地發(fā)現(xiàn)那些所謂的定論其實是錯誤的。
從我的故事里走出來,考慮一下什么是語料庫語言學。我們的第一感覺是,語料庫語言學就是工具,像放大鏡,或是顯微鏡。的確,語料庫語言學具有工具性是任何人都不能否認的,然而,正是這種工具性才使得我們得以看見原本看不見的東西,這不同于我們把筷子當做工具來吃飯夾菜(我們吃饅頭的時候還不用筷子呢。S肧inclair的話說,Language looks rather different when you look at a lot of itatonce。這里的look at a lot of itatonce就是工具,是方法,是一種工作方式。有了計算機,有了語料庫,我們就可以同時看到很多語言,看到語言中千萬次復現(xiàn)的規(guī)律。Sinclair或許是希望提醒我們,每時每刻都應該拿著那副放大鏡或顯微鏡,要讓它變成我們生活的一部分,變成我們觀察語言的唯一方法。當它變成我們觀察語言的唯一方法時,它就不僅僅是工具了,而成了一種根深蒂固的習慣,一種不變的態(tài)度。
以上我們說的是學界對語料庫語言學的兩種認識。一些學者認為語料庫語言學是工具,是方法;而另外一些學者認為語料庫語言學是新理論、新學科、新視角,預示著新發(fā)現(xiàn)。語料庫語言學中充滿了這樣的爭議。
本書試圖解釋語料庫語言學中的一些基本問題,有的可能是我們曾經(jīng)思考過的,有的則是我們從未想過的,甚至筆者在寫作之前自己也沒太想過的。
序言
(一)什么是語料庫
1.什么是語料庫?
2.為什么要使用語料庫?
3.語料庫與其他語言研究數(shù)據(jù)有什么不同?
4.什么是語料庫的代表性?
5.語料庫有哪些主要類型?
6.什么是布朗家族語料庫?
7.什么是網(wǎng)絡語料庫?
8.語料庫有什么局限?
9.什么是交叉驗證?
(二)語料庫語言學學科
10.什么是語料庫語言學?
11.語料庫語言學的哲學基礎(chǔ)是什么?
12.語料庫語言學與計算機技術(shù)之間有何關(guān)系?
13.語料庫語言學與計算語言學之間有何種關(guān)系?
14.語料庫語言學是如何發(fā)展起來的?
15.利用語料庫從事語言研究必須學會計算機編程嗎?
16.什么是語料庫驅(qū)動的研究范式?
17.什么是基于語料庫的研究范式?
18.語料庫驅(qū)動的研究范式與基于語料庫的研究范式有何不同
19.什么是擴展意義單位模型?
20.什么是搭配?
21.什么是類聯(lián)接?
22.什么是語義傾向和語義韻?
23.什么是0STI報告?
(三)語料庫的處理和加工
24.什么是文本清理?
25.什么是元信息?
26.什么是語料庫的標注?
27.什么是分詞和詞形還原?
28.什么是詞性標注?
29.什么是句法剖析?
30.什么是雙語對齊?
(四)語料庫分析方法
31.什么是詞表?
32.什么是N元分析?
33.什么是型次比?
34.什么是主題詞分析?
35.主題詞分析有何種擴展應用?
36.什么是索引分析?
37.什么是正則表達式?
38.什么是批量檢索?
39.什么是詞匯頻率概貌?
40.什么是多維度分析?
41.多維度分析的基本步驟有哪些?
42.什么是多因素分析?
(五)語料庫研究應用
43.常用的英語語料庫有哪些?
44.常用的現(xiàn)代漢語語料庫有哪些?
45.語料庫可以應用到語言研究的哪些領(lǐng)域?
46.什么是語料庫翻譯學?
47.什么是中介語對比分析?
48.中介語對比分析遇到了何種挑戰(zhàn)?
49.什么是數(shù)據(jù)驅(qū)動學習?
50.什么是微型文本?
51.什么是詞匯大綱?
52.詞匯大綱有什么不足?
53.什么是詞匯中心教學法?
54.語料庫在語言研究之外有何更廣泛的應用?
55.大數(shù)據(jù)時代的語料庫語言學會有什么新的特征?
參考文獻
術(shù)語匯覽
CLAWS詞性標注集
常用語料庫一覽
推薦書目