語(yǔ)料庫(kù)語(yǔ)言學(xué)既可以被看作是一門(mén)新興學(xué)科,又可以被看作是20世紀(jì)曾盛極一時(shí)的美國(guó)結(jié)構(gòu)主義語(yǔ)言學(xué)研究方法的延續(xù),是現(xiàn)代語(yǔ)言學(xué)的一個(gè)重要分支!锻庹Z(yǔ)學(xué)術(shù)普及系列:什么是語(yǔ)料庫(kù)語(yǔ)言學(xué)》以問(wèn)答的形式,介紹了語(yǔ)料庫(kù)及語(yǔ)料庫(kù)語(yǔ)言學(xué)的基礎(chǔ)知識(shí)和基本概念、語(yǔ)料庫(kù)的處理和加工、語(yǔ)料庫(kù)的分析方法、語(yǔ)料庫(kù)的研究和應(yīng)用等。全書(shū)深入淺出,語(yǔ)言精煉,有助于初學(xué)者了解語(yǔ)料庫(kù)語(yǔ)言學(xué)的概貌,對(duì)于普及這一學(xué)科的基礎(chǔ)知識(shí)具有十分重要的價(jià)值。
據(jù)記載,公元一世紀(jì)時(shí),羅馬人發(fā)明了玻璃,還發(fā)現(xiàn)玻璃有放大效應(yīng),后來(lái)直到13世紀(jì),意大利人才發(fā)明了放大鏡——大約能放大6倍,可以看清跳蚤了,于是人們就把這東西叫做fleaglasses。1590年前后,一對(duì)荷蘭父子試著把鏡片放在圓筒內(nèi)壁,結(jié)果發(fā)現(xiàn)圓筒遠(yuǎn)端的東西會(huì)被放大,于是就試著加長(zhǎng)這個(gè)圓筒,把三個(gè)粗細(xì)不等的圓筒套接起來(lái),套接后的圓筒可伸長(zhǎng)也可縮短,縮短的時(shí)候能放大3倍,伸長(zhǎng)的時(shí)候能放大9倍。我的問(wèn)題是,這東西是放大鏡還是顯微鏡?
其實(shí)叫它放大鏡還是叫它顯微鏡并不重要,重要的是我們用它可以看到原來(lái)看不到的東西。一旦我們操起新式武器,仔細(xì)觀察一下本來(lái)已經(jīng)習(xí)以為常的東西,竟驚訝地發(fā)現(xiàn),我們?cè)玖?xí)以為常的東西根本就是錯(cuò)的。
這就是語(yǔ)料庫(kù)語(yǔ)言學(xué),而語(yǔ)言就是我們天天習(xí)以為常的東西。語(yǔ)料庫(kù)語(yǔ)言學(xué)像是新工具,它促使我們反思許多語(yǔ)言問(wèn)題,尤其是一些本來(lái)已經(jīng)有了定論的問(wèn)題。于是,我們開(kāi)始越來(lái)越不相信定論,不時(shí)地發(fā)現(xiàn)那些所謂的定論其實(shí)是錯(cuò)誤的。
從我的故事里走出來(lái),考慮一下什么是語(yǔ)料庫(kù)語(yǔ)言學(xué)。我們的第一感覺(jué)是,語(yǔ)料庫(kù)語(yǔ)言學(xué)就是工具,像放大鏡,或是顯微鏡。的確,語(yǔ)料庫(kù)語(yǔ)言學(xué)具有工具性是任何人都不能否認(rèn)的,然而,正是這種工具性才使得我們得以看見(jiàn)原本看不見(jiàn)的東西,這不同于我們把筷子當(dāng)做工具來(lái)吃飯夾菜(我們吃饅頭的時(shí)候還不用筷子呢。。用Sinclair的話說(shuō),Language looks rather different when you look at a lot of itatonce。這里的look at a lot of itatonce就是工具,是方法,是一種工作方式。有了計(jì)算機(jī),有了語(yǔ)料庫(kù),我們就可以同時(shí)看到很多語(yǔ)言,看到語(yǔ)言中千萬(wàn)次復(fù)現(xiàn)的規(guī)律。Sinclair或許是希望提醒我們,每時(shí)每刻都應(yīng)該拿著那副放大鏡或顯微鏡,要讓它變成我們生活的一部分,變成我們觀察語(yǔ)言的唯一方法。當(dāng)它變成我們觀察語(yǔ)言的唯一方法時(shí),它就不僅僅是工具了,而成了一種根深蒂固的習(xí)慣,一種不變的態(tài)度。
以上我們說(shuō)的是學(xué)界對(duì)語(yǔ)料庫(kù)語(yǔ)言學(xué)的兩種認(rèn)識(shí)。一些學(xué)者認(rèn)為語(yǔ)料庫(kù)語(yǔ)言學(xué)是工具,是方法;而另外一些學(xué)者認(rèn)為語(yǔ)料庫(kù)語(yǔ)言學(xué)是新理論、新學(xué)科、新視角,預(yù)示著新發(fā)現(xiàn)。語(yǔ)料庫(kù)語(yǔ)言學(xué)中充滿了這樣的爭(zhēng)議。
本書(shū)試圖解釋語(yǔ)料庫(kù)語(yǔ)言學(xué)中的一些基本問(wèn)題,有的可能是我們?cè)?jīng)思考過(guò)的,有的則是我們從未想過(guò)的,甚至筆者在寫(xiě)作之前自己也沒(méi)太想過(guò)的。
序言
(一)什么是語(yǔ)料庫(kù)
1.什么是語(yǔ)料庫(kù)?
2.為什么要使用語(yǔ)料庫(kù)?
3.語(yǔ)料庫(kù)與其他語(yǔ)言研究數(shù)據(jù)有什么不同?
4.什么是語(yǔ)料庫(kù)的代表性?
5.語(yǔ)料庫(kù)有哪些主要類(lèi)型?
6.什么是布朗家族語(yǔ)料庫(kù)?
7.什么是網(wǎng)絡(luò)語(yǔ)料庫(kù)?
8.語(yǔ)料庫(kù)有什么局限?
9.什么是交叉驗(yàn)證?
(二)語(yǔ)料庫(kù)語(yǔ)言學(xué)學(xué)科
10.什么是語(yǔ)料庫(kù)語(yǔ)言學(xué)?
11.語(yǔ)料庫(kù)語(yǔ)言學(xué)的哲學(xué)基礎(chǔ)是什么?
12.語(yǔ)料庫(kù)語(yǔ)言學(xué)與計(jì)算機(jī)技術(shù)之間有何關(guān)系?
13.語(yǔ)料庫(kù)語(yǔ)言學(xué)與計(jì)算語(yǔ)言學(xué)之間有何種關(guān)系?
14.語(yǔ)料庫(kù)語(yǔ)言學(xué)是如何發(fā)展起來(lái)的?
15.利用語(yǔ)料庫(kù)從事語(yǔ)言研究必須學(xué)會(huì)計(jì)算機(jī)編程嗎?
16.什么是語(yǔ)料庫(kù)驅(qū)動(dòng)的研究范式?
17.什么是基于語(yǔ)料庫(kù)的研究范式?
18.語(yǔ)料庫(kù)驅(qū)動(dòng)的研究范式與基于語(yǔ)料庫(kù)的研究范式有何不同
19.什么是擴(kuò)展意義單位模型?
20.什么是搭配?
21.什么是類(lèi)聯(lián)接?
22.什么是語(yǔ)義傾向和語(yǔ)義韻?
23.什么是0STI報(bào)告?
(三)語(yǔ)料庫(kù)的處理和加工
24.什么是文本清理?
25.什么是元信息?
26.什么是語(yǔ)料庫(kù)的標(biāo)注?
27.什么是分詞和詞形還原?
28.什么是詞性標(biāo)注?
29.什么是句法剖析?
30.什么是雙語(yǔ)對(duì)齊?
(四)語(yǔ)料庫(kù)分析方法
31.什么是詞表?
32.什么是N元分析?
33.什么是型次比?
34.什么是主題詞分析?
35.主題詞分析有何種擴(kuò)展應(yīng)用?
36.什么是索引分析?
37.什么是正則表達(dá)式?
38.什么是批量檢索?
39.什么是詞匯頻率概貌?
40.什么是多維度分析?
41.多維度分析的基本步驟有哪些?
42.什么是多因素分析?
(五)語(yǔ)料庫(kù)研究應(yīng)用
43.常用的英語(yǔ)語(yǔ)料庫(kù)有哪些?
44.常用的現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)有哪些?
45.語(yǔ)料庫(kù)可以應(yīng)用到語(yǔ)言研究的哪些領(lǐng)域?
46.什么是語(yǔ)料庫(kù)翻譯學(xué)?
47.什么是中介語(yǔ)對(duì)比分析?
48.中介語(yǔ)對(duì)比分析遇到了何種挑戰(zhàn)?
49.什么是數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)?
50.什么是微型文本?
51.什么是詞匯大綱?
52.詞匯大綱有什么不足?
53.什么是詞匯中心教學(xué)法?
54.語(yǔ)料庫(kù)在語(yǔ)言研究之外有何更廣泛的應(yīng)用?
55.大數(shù)據(jù)時(shí)代的語(yǔ)料庫(kù)語(yǔ)言學(xué)會(huì)有什么新的特征?
參考文獻(xiàn)
術(shù)語(yǔ)匯覽
CLAWS詞性標(biāo)注集
常用語(yǔ)料庫(kù)一覽
推薦書(shū)目