打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
程工教授:词库应该是什么样的?丨语言学午餐

·1·


在当代生物语言学研究中,一个得到普遍接受的假说是:


语言是一个晚出而且突发的系统。


所谓晚出,意为人类在比较新近的时期才具备了语言能力,不会早于20万年。



来源:Marcus, G. F., & Fisher, S. E. (2003).FOXP2 in focus: what can genes tell us about speech and language?. Trends inCognitive Sciences, 7(6), 257-262.


突发则是与演化对立的概念,指语言系统不是通过对已有器官缓慢、逐渐的改造形成的,相反却起源于某个单一的、迅速的、突发的事件。


按照生物学的一般原理,晚出、突发的生理系统,极有可能由基因突变导致,并“镶嵌”于已有的某个系统中。而且,其内部结构必然是简单的,只有经历了长期演化的系统才有可能衍生出复杂的内部结构。


目前主流的、由乔姆斯基提出的最简方案在句法部分与上述事实和原理已经日臻匹配。


乔姆斯基的《最简方案》




它认为,人类早已具有一套语义(概念)系统和一套音系(感知运动)系统。语言起源的关键因素是由于基因突变而出现的合并(Merge) 操作,一种可以组合语言成分的生成性程序。




合并可以迭代运用,形成层级性、无限的、离散的表达式。它以最经济的方式与语义系统和音系系统接口,使表达式获得诠释。


在这样一个理论模型里,专属语言内部的机制只有一个,即合并,语言没有内部的推导层次,D-结构和S-结构被取消了,内部的子模块也消失了原有的语言内部原则被改造成为其与诠释系统的接口条件。


在我们看来,最简方案未必完美,但比现有其他的理论更符合语言官能晚出突发这一事实,是一种有潜力解释语言起源和演化的理论。

 


·2·

 

然而,当我们把目光转向最简方案的词库部分时,看到的却几乎是完全相反的情形


词库与日常用语里的“词典”有所不同,简单地说,它是语法理论中负责列举句法操作的原始单位(即所谓的“句法原子”)、标明其个体性特征的部门。布龙菲尔德最初引入这个概念时,它只是“语法的附录,基本个体特性的列表”,亦即语素的列表。



lexicon:词库


生成语法在诞生初期延续了这一观念,但之后不久,出于种种考虑,特别是为了最大限度地简化句法部分,控制其生成能力,不断增加词库内容,使其作用越来越凸显。


在最简方案中,词库不仅没有像句法部分那样得到简化、分解,反被赋予了更多的内容和更中心的地位,到了几乎与句法部分并驾齐驱的程度


概括起来,现有主流理论里的词库有以下特点——


首先,它是生成性的,负责把语素组合成词,并赋予语义和音系的诠释。这样,词库从一个静态的列表变成了一个动态的计算系统,成为语法体系的一个模块;



词库的生成性


其次,词库是自主性的,即它与句法相互独立、互不相同。词库规则可以改变对象的语类特征和次语类特征,而句法规则不可以。



translate(翻译)的语类特征和次语类特征都被改变了


一些特设的原则,如词汇自主律(Lexical Integrity Hypothesis)和无短语限制(No Phrase Constraint)等等,阻止了句法和词库的互动,使得句法操作不能进入并影响词的内部结构,词库操作也不能使用句法产生的结构;


第三,词库是多模块和多层次的。




内部模块除了语素列表、构词规则和诠释规则之外,还包括一个过滤器(filter),用于筛除虽合规但不被认可的词语(可能的词语),只保留被接受的部分(实际的词语)。


词库还被认为有大量的内部推导层次。例如,仅为解决重音相关问题,Siegel1974)等就为英语词库设置了4个层次——




第一层是词缀界限词缀,主要源自拉丁语,一般附着在粘着的词根上,能够触发重音迁移等形态音系变化;


第二层是词界限词缀,主要来源于本族的日耳曼语,一般附着在自由的词基上,不触发形态音系变化;


第三层是复合,能够触发重音迁移;


第四层是规则的屈折变化,不能触发重音迁移。


最后,词库另一个重要特点是具有投射性,即在很大程度上决定着句法的操作。


经过多年研究的累积,词库包含的信息越来越丰富,如词项的固有特征、次语类框架、题元栅格、各种屈折变体形式,等等。主流理论包含了各种原则,用于确保这些信息体现在句法操作之中。


著名的投射原则规定词库信息在句法的每一个层次都必须得到遵守;这个原则稍后又被扩展到题元理论,规定句法操作不得违反词库里的题元栅格信息;在最简方案中,句法操作基本依存于由词库规定的特征,并按包容条件(the condition of inclusiveness)的要求对特征不增不减,不加篡改。


正如Adger20102)所说的那样:“最简论语法可以被视为词库驱动的组合系统”。


这种由词库规定大量而又关键的信息,并且决定句法操作的理论途径被称为“投射论”,也常被形象地称为“大词库,小句法”的理论。



这种由词库规定大量而又关键的信息,并且决定句法操作的理论途径被称为“投射论”,也常被形象地称为“大词库,小句法”的理论。


综上,主流理论里的词库具有生成性、自主性、多模块和多层次、投射性等特点。从生物语言学的视角,这样的词库跟语言起源相关的证据格格不入,与上面提到的语言晚出突发的事实不相兼容。


首先,词库具有生成性,又有自主性,这蕴含着语言具备两套组合系统。考虑到基因(特别是调节基因)的稳定性和保守性,它相当于某个生命体在极短时间同时突然获得人类的视觉和蝙蝠的超声波两套定位系统,概率基本是零。


其次,词库内部的多模块和多层次性,意味着它经历了长期的演化,而不是一个晚出突发的系统。


最后,词库对句法操作的决定性,则使人感到语言出现的关键不是合并,而是词库。


Boeckx2010:7)尖锐地指出:“与最简论圈子里的言辞相反,并不是‘所有的就是合并’。


事实上,合并是附属于词库的。没有特征的驱动,合并是不能用的。”



语言学家 Cedric Boeckx


总之,最低限度,现有理论里的词库违背生物学的一般原理,与Chomsky本人倡导的生物语言学研究途径背道而驰,是完全不可能在不到二十万年这样一个演化的“瞬间”所能获得的。

 


·3·

   

假定主流理论有关词库的部分真的存在上述种种缺陷,那么它应该是什么样的呢?


怎样才能使之符合,至少基本符合语言晚出突发这一事实呢?



基于分布式形态学理论和其他宗旨相似的理论,我们认为,词库应该是非生成性的。换言之,应该把词库回归为静态的列表,把其中的构词规则移交给语法的其他部门。


特别重要的是,应该与最简方案的句法理论一样,把合并视为语言里唯一的组合机制,同时负责词和短语层级结构的生成。从生物语言学的角度,这是最理想的选择,既呼应了合并是语言起源关键因素的命题,也最吻合语言晚出突发的事实。


为了消除生成性,应该对现有理论里的词库进行如下改造——


第一,把句法推导的起点从词转移到没有内部结构、原子性的语素上来。


为此,首先必须从句法的角度,把语素认定为句法操作可以通入(access)的最小客体,或者说可以充当句法终端的客体。这同时意味着放弃从结构主义语言学到当代一直坚守的一个信条,即把语素定义为“最小的语音语义结合体”,并以意义或者语音形式为依据识别语素。多年的研究已经证明,语素既可能没有确定的意义,也不一定有固定的形式。



把语素视为句法的原子


从当下大量的研究来看,把语素视为句法的原子,让其在诠释系统确定语义和语音,这是一个行之有效的分析途径。更进一步说,语言是一个以句法为中介的音义匹配系统这个著名的断言,对于词同样是适用的。


为了消除词库的生成性,还有必要改变对词的认识和分析。


主流理论之所以设置专门、独立的构词模块,主要是因为认为词和短语有本质的差异:词由专门的规则构造,集不可预测的语法、语义和语音特性为一体,而短语由句法构建,性质是组合性的、可预测的。


然而,多年的研究证实,词不是语法、语义和语音等规则应用的共同区域,语法词和音系(韵律)词并没有同一性,词在意义上和短语也是相似的,既可能是透明的,也可能是非组合性的。


因此,认为词有特殊的结构地位,需要专门的规则乃至专门的语法模块予以构造,这在理论上承担着维持两套生成机制的负担,在经验上又违背了各种语言的事实,是不可取的。


当然,与短语相比,词确实有一些特殊的句法表现:可以独立使用和移动,不容外部成分插入,词内成分不可变动顺序,等等。


分布式形态学以语段(phase)概念对此加以派生。


简言之,词可以被看成推导过程中形成的封闭的局部区域,在此区域内它既获得确定的意义和语音,又阻止了后续推导的穿透,形成传统上所谓的孤岛效应,确保了其内部结构的稳定性。


在我们看来,语段概念的引入是词结构研究中的一次重大突破,在取消词库的模块性,统一词和短语的生成机制方面,发挥了支撑性作用。如此,语言单位的层次实际可以压缩成两种:语素和短语,词和句子只是两种特殊的短语而已。


第二,把传统上的构词规则从句法前(pre-syntactic)调整到句法后(post-syntactic)。


研究表明,在多数情形中,词和短语是同构的,词法就是句法。然而,词和短语的结构不相一致的情形也时有发生,在形态丰富的语言里甚至较为频繁。


例如,在英语里,属于句子层次的时态,其标记经常附着在结构树上较低的动词上,从而造成句法和形态的错配。


分布式形态学对此的解决方式是:在句法推导结束之后,在向音系式推导的分支上,设置一些形态操作,负责给句法终端填入音系信息,确定其线性顺序,并根据普遍语法和个别语法的要求对句法结构进行调整,以便其得到音系诠释。


这种做法的优点是:这个意义上的形态操作是在句法规则所生成的表达式的基础上实施的,只是一种有限的调整,而不是一种平行、独立的结构。形态规则也因此是诠释性的,而不是生成性的。


在经验方面,现有各种证据都表明形态操作是依存于音系相关特性的。例如刚提到的英语时态标记,它之所以附着在动词上,是因为它是词缀性的,是音系上不可独立的单位。这种附着显然是为了满足音系的需要才发生的。


另一个有说服力的例子出现在英语形容词的比较级里。我们知道,根据音节数量,比较级可能是分析式的,如more intelligent;也可能是综合式的,如smarter。其中,综合式中的程度语素“-er”是通过某种变位操作与形容词组合在一起的。在此,相关的结构取决于音节的数量,这显然是由形态规则非句法规则造成的。


由于形态操作通常涉及屈折词缀,所以把它们放在句法后,一个必要的前提是假定它们的音系特征不是自始至终存在,而是在向音系式推导过程中插入的。这种句法操作在前,音系内容在句法推导结束后才与之匹配的分析技术,称为“迟后填音”,而隐藏于此背后的是一种分离论(separationist)思想,即语素是抽象的句法单位,其音系值由一个独立的程序赋予。


这个看似新颖的思想实际有久远的渊源,在结构主义语言学时期已初现端倪。在当代,它更是得到不同流派很多学者的认可。


我们认为,生物语言学有关语音是语言的外化(externalization)而不是语言本身的思想,为分离论提供了强有力的依据。



现任教于纽约大学的语言学家Alec Marantz


Marantz2013906)指出:


“对语素的分离论理解使得形态与句法(即日常语言里的‘语法’)能够完全整合到这样一个程度:词的内部结构与短语和句子的内部结构能够以相同的句法架构和相同的句法原则得到分析。”


第三,为避免句法变成词库的附属品,还有一个必要步骤是大力压缩语素所携带的特征,把对语言事实的解释转移给句法以及与之接口的诠释系统(概念系统和感知运动系统)。


首先,消除词根语素的语类特征,既必要也可行。长期以来,不少语法学者往往一方面认为语类是句法性的,为句法服务的,另一方面又主张语类在词库里就已确定,认为词根和词一样分名词、动词、形容词等各种类别。这个观点在理论上经不起推敲,也没有坚实的事实依据。


另一个必须移出词库的是论元结构,因为它既有模块性质,又是词库特征决定句法操作的一个主要源头。标准理论历来坚持,谓词所能携带的论元的数量,以及论元所能担任的语义角色,如施事、受事等,是由词库决定的,并在推导中投射到句子结构中。


这个观点至少有两个缺陷——


第一,它没有体现句法结构对单个动词所具有的普遍性限制。例如,为什么没有携带3个内论元的动词?为什么我们所用的题元角色如此之少?


第二,它不能解释动词在携带论元方面所具有的灵活性。与投射论相反,分布式形态学提出了一个新的路径,把动词分解成词根与一个谓词性功能核心两个部分,取决于词根在结构树的位置,以及功能核心的类别,相同的词往往呈现出不同的语义和论元结构。Embick2004)是这一路径的代表,展示了句法结构对论元结构的决定性意义,可供参考。


最后,最简方案规定词项的各种屈折变体形式在词库里都要得到列举,然后由句法加以核查或消除。在我们看来,这是一个有违常规的步骤。


众所周知,对计算系统而言,只有无章可循的客体才需要列举,由规则产生的客体是无需列举的。那么,为什么不用规则派生出屈折形态的各种变体,却要通过列举这样硬性的方式确定呢?


其次,词汇形态的变化固然有不规则的部分,但毕竟只是少数,多数的变化是规则的。在词库中列举规则的变化,难道不是一种理论上的冗余吗?


另外,列举蕴含着需要记忆才能掌握。在形态丰富的语言里,一个词的各种变体往往就有十几乃至几十个,如果它们都需要记忆的话,那么儿童对这些语言的获得不就极为困难吗?


 

· 4 ·


总结上述讨论,我们认为——


从生物语言学视角,词库应该是非生成性的。它只列举没有内部结构、原子性的语素,不包括构词规则。


为此,有必要对主流的理论做出如下修正——


第一,把句法推导的起点前移到语素,为此又必须首先从句法的性质定义语素,将其意义和语音实现放到次要地位;


与此相对应,第二,放弃词是句法原子的观念,把它看成句法推导的结果而不是起点。对词的特性通过语段理论加以派生;


第三,对于词和短语的差异部分,认为是来源于句法操作之后,语言为满足音系的要求所做的有限调整;


第四,尽可能减少词库所规定的信息,包括语类信息、论元结构、屈折变体形式,等等。


只有这样,才能吻合语言晚出突发的事实,也才能与最简方案的句法部分对接,实现对语言本质特性的更好的解释。

 

 

参考文献

Adger, D. 2010. A minimalist theory of feature structure. In Features. Perspectives on a key notion in linguistics,ed. A. Kibort and G. Corbett, 185-218. Oxford: Oxford University Press.

Boeckx, C. 2010. Defeating LexicocentrismOutline of Elementary Syntactic Structures. Part A. Second draft. ICREA/UAB.

Chomsky, N. 1995. The Minimalist Program.Cambridge, MA: MIT Press.

Embick, D. 2004. On the structure ofresultative participles in English. Linguistic Inquiry 35, 355–392.

Marantz, A. 2013. No escape from morphemes in morphological processing. Language and Cognitive Processes, 28:7, 905-916.

Siegel, D. 1974. Topics in English morphology. Ph. D. Dissertation, MIT.

 

本文原标题为“词库应该是什么样的?-- 在‘第13届华东地区外语论坛(江苏南京,2016年11月12日)’上的主旨发言”,由演讲者修改后发表。


 








本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
乔姆斯基的生成语法
乔姆斯基的革命——《句法结构》
汉语国际教育专业课一(历年真题错题集280题)
语文语法知识——词法!两张图搞定所有词法
【大百科词条(稿)】语法缺失
现代汉语知识讲座33---语法
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服