HNC理論以自然語言理解為其核心探索目標,試圖為語言理解的探索開啟一條新的途徑,以語言概念空間的符號化、形式化為手段,實現(xiàn)人類語言腦的純物理模擬。
《HNC理論全書:論語言概念空間的總體結(jié)構(gòu)》圍繞“概念無限而概念基元有限、語句無限而句類有限、語境無限而語境單元有限、顯記憶無限而隱記憶有限”這4項HNC理論的基本定理,集中論述語言概念空間的概念基元、句類、語境單元和記憶四層級結(jié),并對語言信息處理中的具體問題作了深入剖析。
更多科學出版社服務,請掃碼獲取。
《HNC理論全書:論語言概念空間的總體結(jié)構(gòu)》:
第一章 概念基元總論
引言
第1節(jié) 概念基元有限性的形而上思考
。ㄕZ言概念空間基本景象的描述)
本節(jié)標題后面的括號里有一個不尋常的短語—語言概念空間基本景象的描述,這個短語可簡化成“語言概念空間的基本景象”,還可進一步簡化成“彼山基本景象”。這些短語都更適合作本章首節(jié)的標題,但考慮再三,還是選用了現(xiàn)在的標題。這不是為了保持撰寫風格的一致性,而是為了凸顯科學探索的要害所在,對于揭秘語言腦這一極為特殊的探索,這一點乃是攸關成敗的第一大事,因為,如果沒有形而上思考的足夠功力,是很難看清彼山的基本景象的。當然,彼山景象本身的描述非常重要,前文已經(jīng)用了不少篇幅,后文還會繼續(xù)這么做,本《全書》以著重描述彼山景象為己任,也有成就一部彼山專著的夢想,但畢竟孤掌難鳴,筆者將僅以披荊斬棘為滿足。描述此山景象的專著早已浩如煙海,通俗讀物也不乏精彩之作,如果將來能出現(xiàn)兼述兩山景象的專著或通俗讀物,那將是一件功德無量的事。
“概念無限而概念基元有限”是HNC 探索起步時的一個基本假定。該假定的提出受到兩件事的啟發(fā)或激勵:一是黑格爾的名言—哲學的開端就是一個假定;二是漢字的“減而不增”現(xiàn)象,《理論》里對此有符合世界知識闡釋標準的論述[*01] 。
基于“概念無限而概念基元有限”假設而得到的第一批探索成果既包括本章后續(xù)3 節(jié)所描述的內(nèi)容,也包括本編第二、第三章的內(nèi)容,那是20 世紀90 年代初期的事。當時,一些研究HNC 的朋友曾把這一初步成果比作“元素周期表”的發(fā)現(xiàn)。這個比喻一直使筆者深感不安,因為“概念無限”或許有點類似于物質(zhì)結(jié)構(gòu)和形態(tài)的無限,但“概念基元”不能等同于元素,而“概念基元有限性”更不能等同于“元素周期表”。
“概念基元”是什么?它是所謂的語義基元或概念節(jié)點么?這是本節(jié)必須回答的第一個問題。“概念基元”如何定義?“概念基元”與“基元概念”是什么關系?這是本節(jié)必須回答的第二個問題!案拍罨邢蕖笔羌僭O還是公理?公理之說的依據(jù)何在?這是本節(jié)必須回答的第三個問題。以下用3 個小節(jié)進行論述,每小節(jié)的標號方式與前兩卷相同,以達到《全書》的統(tǒng)一。
1.1.1 概念基元不是語義基元或概念節(jié)點
“語義”是當下中國的熱門詞語,國家級科技項目都高舉著“語義”的大旗。這一景象非常奇特,筆者也不明白其究竟,但有一點是清楚的,多年來主宰著計算語言學的語法派(理性主義)和語料庫派(經(jīng)驗主義)都遇到了巨大的危機,傳統(tǒng)的詞法和句法分析已經(jīng)難以有所作為了,基于語料庫的各種統(tǒng)計算法(語料庫語言學)已開始顯露出“黔驢”的本相。雙方都要尋求出路,不約而同地都求救于語義學,以為語義是一根靠得住的救命稻草。
英語詞典里并沒有“語義”這個詞語,只有“語義學”這個詞語,《現(xiàn)漢》也如法炮制,《現(xiàn)范》則反其道而行之,收錄了“語義”而未收錄“語義學”,因為《現(xiàn)范》原則上不收錄帶后綴“學”的三字詞!冬F(xiàn)范》對“語義”的解釋十分寬泛,大大超出了《現(xiàn)漢》對“語義學”的解釋范圍。
《現(xiàn)范》對“語義”的解釋[*02] 需要大力依靠“意義”這個通用詞語,還要依靠“詞匯”、“句子”、“語法”、“語用”、“語境”等專業(yè)詞語,以及其他一系列通用詞語(如“概念”、“交際”、“適應”等)。《現(xiàn)范》對“語義”的解釋在形式和內(nèi)容兩方面似乎都十分到位,但語言腦對“語義”的理解依靠這樣的解釋么?這里的“依靠”既有“能不能”的問題,又有“需要不需要”的問題。不追問這兩個問題是形而下思維或“一根筋”思維的習慣或表現(xiàn),追問下去才是形而上思維或靈巧思維的習慣或表現(xiàn),這將在下一小節(jié)細說。
下面回到本小節(jié)的主題:概念基元不是語義基元或概念節(jié)點。先說“概念基元是什么”,然后再說為什么“概念基元不是語義基元或概念節(jié)點”。
概念基元是指456 株概念樹所對應的各級延伸概念,不包括概念樹本身,更不包括居其上位的概念林(群)和概念范疇。延伸概念這個術(shù)語的提出較晚,筆者在使用這個術(shù)語之初也沒有特意強調(diào)它的極端重要性,這是HNC 探索歷程中最為遺憾的一件事;谝环N彌補最大遺憾的心情,這里特意寫下對應的英語符號:extended concept ,簡記為EC。
各級延伸概念的總和是有限的,本《全書》的前兩卷已充分揭示了這一點。所謂“概念基元的有限性”就是指“各級延伸概念總和的有限性”。理解了這一點,才算是真正理解了HNC 理論的精髓。
但真正理解這一點并非易事,這既需要向上思考,把握“概念樹-概念林-概念范疇”的有限性;又需要向下思考,把握延伸級別(縱向延伸)的有限性和同級延伸數(shù)量(橫向延伸)的有限性。上行思考和下行思考都要力行齊備性和透徹性的原則(簡稱“透齊原則”,前兩卷經(jīng)常使用這個簡稱),這確實是“一根筋”思維習慣難以適應的。
這里的“上行思考”和“下行思考”是以概念樹為參照來說的,如果以概念范疇為參照,則上述“上行思考”也變成了“下行思考”,HNC 之“概念范疇-概念林-概念樹”的最終確定是上行思考與下行思考多番交織的結(jié)果,“1200 個漢字”雖然曾是此項交織思考的基本依托,但該思考的主心骨還是康德先生所強調(diào)的理性法官[*03] ,這就是說,上行思考與下行思考要在不斷改變參照層級的過程中交織進行,而關鍵是:要善于中間切入,先上后下。一味“上而不下”者叫空想家,專注“下而不上”者叫專家,善于“中間切入,先上后下”者才是思想家。上行思考的通俗名稱叫“仰望星空”,下行思考的通俗名稱叫“俯瞰大地”。語言的“星空”叫作語言概念空間,簡稱“彼山”,描述彼山景象的東西叫原則或公理;語言的“大地”叫作自然語言空間,簡稱“此山”,描述此山景象的東西叫規(guī)則或定理。喬姆斯基先生雖然自視甚高,但并不明白這個關于原則與規(guī)則的區(qū)分依據(jù)或區(qū)別法則!耙桓睢彼季S的基本特征是:既不仰望,更不俯瞰,而是隨波逐流。一個世紀以來,語言和大腦的探索是否處于隨波逐流的可悲狀態(tài)呢?是提出這個問題的時候了。
當然,隨波逐流是一股巨大的慣性力量,是文明主體之現(xiàn)代化歷程的心理引擎之一,也是一把雙刃劍,其積極意義的一面不能抹殺。但是,許多重大的科學探索活動要力求避免隨波逐流的消極面,而這項特定的“力避”非常困難,在HNC 探索的《理論》階段,這種消極影響可謂歷歷在目,最典型的印跡就是“語義網(wǎng)絡”、“語義塊”、“語義距離”等術(shù)語的提出或使用。其中,“語義塊”這一術(shù)語最令筆者痛心疾首,因為那個“義”字不僅是多余的,而且為害極大。
語形、語義、語用之“三語”說[*04] 是符號學對20 世紀人文社會學的一項重要貢獻,但“三語”說乃是貌似體說而實為線說的典型學說,并未發(fā)展成為適用于彼山景象描述的指導理論。語形、語義、語用不過是僅供分析與歸納之用的三條線而已,不能構(gòu)成符合“綜合與分析+演繹與歸納”要求的三維度思考空間,因而也必然不能勝任對彼山景象的描述。語言學界曾應用“三語”說進行此山景象的描述,但收效不大。表面上似乎形成了語形學、語義學和語用學之間的分工與合作,實際上是形成了一幅獨特的“推卸責任”景象,把困難(矛盾)逐級上交,語形學解決不了的問題上交給語義學,語義學解決不了的問題再上交給語用學。其結(jié)果是出現(xiàn)了許多有趣的責任紛爭,這主要發(fā)生在語義學與語用學之間。但是,自然語言處理的基本責任究竟是什么?該項處理所面對的“勁敵”(根本問題或戰(zhàn)略性問題)和“流寇”(枝節(jié)問題或戰(zhàn)術(shù)性問題)[*05] 有哪些?紛爭的參與者們并不明確,甚至都沒有認真思考過。
語形學實際上是語法學的“老地盤”,千年老店,品牌價值無與倫比;語義學也有許多不俗的成績,語用學更是曾風光無限,促成了20 世紀哲學研究的著名語用學轉(zhuǎn)向。但品牌價值、不俗成績和無限風光幾乎絲毫無助于機器翻譯遭遇的半世紀尷尬[*06] 。這是一個嚴酷的現(xiàn)實,但被一些傳統(tǒng)的光環(huán)掩蓋了。當然,不能說學界有人在刻意隱瞞什么,但實際上在起著一種掩蓋作用,中國計算語言學界的表現(xiàn)尤為突出,林杏光先生的重慶遭遇[*aaa]就是一個非常值得反思的事件或證據(jù)。
這里應該明確告知讀者:HNC 探索就是從對這一嚴酷現(xiàn)實的反思起步的,其理論目標就是試圖建立一個符合“語形、語義、語用”體說要求的理論體系。當時對語義學的認識還是比較清醒的,知道它絕對沒有能力獨立承擔起降服“勁敵”和掃蕩“流寇”的重任,可是為什么《理論》竟然還是提出了“語義塊”的術(shù)語呢?現(xiàn)在回想起來,未免感到不可理喻,因為當時已非常清楚:“語義塊”不僅是語義的基元,也是語形和語用的基元,是三者的綜合基元。這個“義”字添加的失誤造成了巨大的貽害,現(xiàn)在不理解此話的讀者將來會逐步明白的。
……