论语言演化研究中的语言要素量化比较法

　　内容提要：语言演化研究离不开方法论，最基本的方法论是主要围绕语言各个要素（主要是词汇）的量化比较。最初是（人工）比较法，后来发展了词汇统计学（统计比较法）、概率模型（概率比较法）、计算机技术（工具）和生物学方法（借用），再到量化方法（量化的相似性比较法），而现代方法论已经超出了历史语言学范围，跨越到人类语言相似比的统计分析。

　　关键词：比较法；词汇统计学；概率统计方法；计算机技术；生物学方法

　　作者简介：李艳，陕西师范大学外国语学院。

　　基金项目：本文受到国家社科基金项目“历史语言学理论（1960-2010）”（16BYY001）资助。

　　历史上首次发表的量化各种语言历史关系的研究可能是Sapir（1916）。Kroeber & Chretien（1937）使用了74种形态和语音特征调查了9种印欧语言（1939年包括了赫梯语）。Swadesh（1952）使用词汇表，提出了词汇统计学方法和语言年代学方法。Embleton（1986）扩展了语言年代学方法。Dyen et al.（1992）使用词汇统计学方法展开了印欧语言大型数据库研究。但以上这些都不能算作真正的量化。后来的学者使用计算机操作，采用基于数据库的历史比较法，如20世纪90年代中期宾夕法利亚大学学者使用的20种古印欧语言数据库（Ringe et al.2002）。随着生物学领域一些软件的开发，基于谱系树模式的数据分析法应运而生。1999年8月举行了“历史语言学的时间深度”会议，讨论了许多量化方法的使用（Renfrew et al.2000）。Nakhleh et al.（2005）收集了大量可靠的语言特征，包括词汇、语音和形态特征等来比较不同方法对印欧语谱系树产生的效果。方法的可靠性还需要进行检测。语言学的评估方法一般借自生物学领域。评估方法主要根据拟态研究（simulation studies），虽然拟态在语言学领域不是主流方法论，但已经是语言学领域用于评估演化的重要方法，这就是演化语言学的量化研究。如何研究语言演化，语言要素量化比较是关键。

　　一、Jones首创比较法

　　语言分类方法很多，但有一种方法被历史语言学家奉为金科玉律，它与印欧语谱系树的建立息息相关，也用于世界上其他语系的研究。该方法已发展了100多年，它就是“比较法”。Harrison（2003：213）把它描述为“语言研究初期必不可少的方法”，“在缺乏书面语的情况下，它是决定语言同源关系的唯一工具”。比较法最初用于探究语言历史，因此包括两个不可分割的成分：阐明语言同源关系和构拟原始祖语。

　　最早使用该方法的是英国的Jones。Jones（1786）根据动词词根和语法形式的相似，宣称印欧语言存在发生学关系。他制定了一张表格，里面列出梵语、拉丁语、希腊语等语言中表示一些概念和音素的形式，表达相同意义或语法功能的音素在这些语言里形式相似。随后一个世纪，有关语言演化的研究如火如荼，相应地，比较法也飞速发展，并迎来了历史比较语言学最辉煌的时期。比较法不是简单地强调词汇相似，其特殊之处还在于强调重复出现的语音对应。20世纪下半叶出现了一种方法，与Jones的方法非常相似，即Greenberg（1993）的大规模比较法。他同时比较多种语言，如果相似即可判断为同源。不过，虽然Jones之后统计学和计算机科学有了很大发展，但Greenberg却没有提供任何检验的方法。

　　比较法获得了巨大成功，现在依然用于远距离语言比较。但其局限性也显而易见，一是并非所有语言材料都适用该方法。句法构拟比音位和形态构拟要麻烦得多，因为我们对句法变化知之甚少，构拟起来就更难。除此之外，还要排除掉一些词汇项，特别是象声词和家庭成员称呼语。二是原始语的语音实现过于理想化。构拟语言都是理想化的，不同学者会有不同结果。三是借词问题。如果谱系树和谱系树构拟没有排除掉借词，那就可能是过度构拟（over-reconstruct）。四是比较法本质上只局限于一定的时间深度（time-depth），如同Harrison（2003：230）所说，“时间是比较法的父母和敌手：随时间没有变化，就没有任何东西可比；在大量的时间里有大量的变化，就比较不出什么东西”。最后，比较法把语言关系理想化、简单化了。“比较法既不考虑母语内部存在分歧，也不考虑亲属语言间发生共同的变化，所以只能带领我们走很有限的一段路程”（布龙菲尔德1980：457）。虽然存在这些局限性，但该方法并非一无是处，局限性只是提醒语言学家们合理使用，避免一些问题的产生。

　　二、量化方法的发端：词汇统计学

　　历史比较语言学领域最早最有名的量化方法并非用于语音和形态句法的比较。虽然词汇不稳定，词义变化莫测，但是词汇统计学方法却假定有一些概念遍及所有语言，而且人人使用，不易变化。这样的词就是跨语言量化比较的最好代表。

　　第一次提出此方法的是法裔美国学者Rafinesque（1832），他比较了中美洲语言，随后Dumont d'Urville（1834）使用同样的方法比较了大洋洲语言，并假定了一种计算关系系数的方法。一个多世纪后Swadesh（1952）重拾该方法。词汇统计学就是使用标准的意义量表来测算语言之间的亲缘度，但总与语言年代学搞混。年代学只是找到子语从祖语分化的时间。Campbell（1998：177）这样写道：

　　语言年代学的目的是为了找到祖语分裂为子语的时间，而词汇统计学……是对词汇材料的统计操作（不一定与年代有关）。从这个意义上来看，词汇统计学的范围更广。然而，在实际运用中，二者几乎从来不做区分，经常混用。

　　此处使用“意义量表”而非词汇表，因为后者易引起误解。词汇统计学是创建一个大众认可的测试表，每格表示一个意义，然后比较多种语言中表示该意义的词。不过难逃主观性，而且易混入偶然相似词和借词，因此词汇的选定难上加难，“存在一些基本词汇或核心词汇，相比其他类型的词，这类词不易被替换”（同上：177-178）。因此，Swadesh（1952：455）的限数词汇统计法可以说在当时解决了一大难题，“找到一个含有200个相对稳定词汇项的表不难，主要是身体部位词、数词、表示简单自然物和简单活动等的词”，“测试表里的词语必须是普通的非文化词，即，它们必须是世界上随处可见并且人人都很熟悉的东西，不仅仅是专家或有知识的人”。

　　词汇统计学比较不是根据表面相似，假若如此，就与大规模比较法相同。它所要比较的词必须是同源词。“词汇统计学……的使用必须是在确定语言有同源关系之后，并且词语必须是同源词”（Trask 1996：362）。因此Trask坚决反对使用词汇统计学来确定同源关系。其实，可以有两种词汇统计比较法：一种是未知亲属关系情况下的统计分析；一种是已知亲属关系情况下的统计分析。

　　词汇统计学自问世以来引起了许多学者的关注。他们应用该方法研究世界各地语言，取得了不错的成绩。该方法的领军人物是Dyen。他使用词汇统计学方法对南岛语言和印欧语言进行分类。还有些学者结合其他同源判断标准。

　　跟其他方法一样，该方法也有一些不尽如人意的地方：第一，仅仅依靠词汇是否能够确定语言之间的同源关系，形态和语音证据是否更能说明问题。第二，该词汇表是否合适，如Hoijer（1956）认为，没有哪个词表是文化上中立的。第三，一个词在某种语言里有多个意义，而这种多对一的情况在跨语言里比较普遍。意义的选择就如同同义词的选择，主观性很强。因此很难找到意义完全对等的词汇。第四，某种语言中的某个词义在另一种语言里完全没有对等词。第五，一些因素如借词、传统和禁忌都可能影响语言之间的对应。鉴于此，有学者认为，Swadesh的词表不可靠。Gudschinsky（1956）甚至怀疑是否有可能找到一个全球通用的词表。Dixon（1997：35-36）这样写道：

　　Swadesh（1951）提出了一个神奇的公式来确定“同源”关系。（因此）根本没必要花上几十年去编纂语法书和词典，只要找到系统对应，然后构拟就好。如果只是从大量语言里收集一个100（或是200）的核心词汇表，然后进行比较，通过注意、观察，发现有多少词汇是同源的……这种捷径绝对行不通。它是建立在不合理的假设基础之上……在词汇统计学还没有完全名誉扫地之前100词表比较（对于某些人来说）还有一段疯狂的、幸福的时光。

　　因此，找到一个具有说服力的、合理的、科学的方法论，势在必行。

　　三、量化方法的延展：概率统计法的运用

　　前面讨论过，大规模比较法没有严格的对应，跟词汇统计学相似，皆以词汇为基础，利用词汇表进行比较。而且大规模比较法没有比较标准，而词汇统计学是两两语言间的比较。另外大规模比较法和词汇统计学在词表设定上似乎一致，只不过大规模比较法词汇数量更大，难免混入借词或偶然相似词。如果所比较的语言历史不清，更没办法确定二者是否同源。这就需要一种科学的方法，概率理论的出现似乎解决了这个问题。已出现了多种以概率为基础的模式用于评估跨语言匹配的有效性。但有一点要注意，统计学方法就是统计，是对大量词汇的检测而非判断词语是否同源。

　　Collinder（1947）为了证明乌拉尔-阿尔泰语系的存在引用了成员语言的13个相似特征。他认为，13个特征都是偶然相似的概率极小，因此语言之间极有可能存在历史联系。Hymes（1956）得出了相似论点，他把特里吉特语与阿萨巴斯坎语联系起来，计算出它们有相同动词词缀顺序的概率是1，216，189，440，000:1。Dolgoposky（1986）发现了13个不同概念词之间的相似，认为这种偶然相似的概率可能是，因此存在一个分布广阔的西伯利亚-印欧语系。Nichols（1996）使用概率证明了任何有着印欧性别系统的语言就可能是印欧语。概率分析和它所需的语言模型值得关注，但是语言学家对于主要根据概率得到的语言同源关系还是很小心谨慎的。

　　Ringe（1992）新创了一种与之稍稍不同的概率法——对应显著性检测法。当期望值在0和1之间时，使用统计值是有问题的。只有那些单元格的值超过1，如英语和德语的，才能表明语言间存在真正的发生学关系，而非偶然对应。Ringe接着发明了一种统计学方法分别检测这些频繁的匹配。他假定单元格的匹配数可当作一个二项式问题，就如同投掷10分的硬币，如果设定投中的概率与两个首音出现频率一致，就能算出100次“投掷”匹配的概率，如，在英语和德语的比较中，对应的概率可能是p=0.165×0.125=0.0206，而不匹配的概率会是（1-p）=0.9794。匹配结果是r=12，该结果在二项式分布的第99个百分位数（percentile）之外。当Ringe使用真正的语言数据比较美国英语和高地德语时，发现了99个百分位数之上的16个对应，拉丁语和英语99个百分位数之上有7个对应。另一方面，他比较了土耳其语和英语的99个百分位数，有2个对应，接近偶然相似。

　　Ringe使用二项式计算匹配的显著性受到了广泛批评，主要在于它需要假定不断匹配的概率，这个假设是不正确的。另外他的方法太严格，很难确定印欧语系同源关系的紧密性，更不要说那些还没确定的关系。Greenberg（1993：89）认为Ringe的方法把简单的事情复杂化了，难的事情变得不可能了。从某个方面来看他的说法很有道理，因为Ringe偏向于那些极端的结果，忽略了在1%水平上不显著比较的单元格，不考虑它们结合起来是否表示某种发生学关系。

　　以上讨论的概率检测很复杂，它们要么依靠可能有问题的假设背景，要么基于人工数据。基于真实语言的方法似乎遥不可及。而Oswalt（1970）首创的位移测试（shift test）或置换测试（permutation test）来自真实语言。他设置了两个标准意义列表，列表里的词相互比较，如比较A语言的词项1与B语言的词项2，A的词项2与B的词项3，以此类推直至100（即A的词项100与B的词项1）。后来Lohr（1999）、Baxter&Ramer（2000）、Kessler（2001）进一步将此法发扬光大。不过这种方法只是乌托邦式的想法，因为不可能把所有的排列都列出来。Kessler（同上：49）这样说道，“100个词需要100！个排列（几乎是）”（100！=100×99×98...×2×1）。可见任务之艰巨。

　　虽然如此，Baxter & Ramer（2000）认为，只用33词测试表的首辅音也有可能证明英语与印地语不只是偶然相似的关系。Kessler（2001）走得更远，他说只用首辅音就能证明同源和偶然相似的关系。不过他指出，那些关系可能不是由于同源，而是其他原因如借词造成的。这种相似表明有着共同历史，但是不管是在测试前还是测试后都需进一步观察来排除接触关系。

　　置换测试法的使用使得其他类型的语言比较成为可能。如Kessler（同上）假设了一个可能重复出现的指标，试图建立比较法最核心的语音循环对应。这种重采样策略（resampling strategy）可用于测试任一指标的显著性。

　　另一种方法任意测试法（arbitrariness testing）来自索绪尔的思想，即声音和意义是任意的。挑选出来的数据，先计算同行的列，Oswalt（1970）称之为“总”得分。相同的得分以相同方式计算，但是在行之间，Oswalt（同上）称之为“背景”分。不管是总得分还是背景分，本身没有意义，关键在于它们之间的关系。准确地说，所有背景分数的比例至少与总分一样高。这就构成了一种概率，即，如果两种语言的词汇没有历史关系的话，“总”得分会偶然出现。这个值通常被称为分析的“显著性水平”。有两种计算方法：

　　（一）使用循环语音对应。Ross（1950）的相依表从比较法的角度看，有可用数据，也有不可用数据，因此适于任意性测试。在表上做测试，统计数据显著性标准技术引起了分布，当表格中的大多数数字很低时它就不能给出可靠答案。Villemin（1983）试图解决这个问题，他对相依表的每个格分别进行测试，认为，如果任意表格有很低的显著性水平，语言就同源。如果在上百个测试里有一个测试给出了理想的答案，那就证明该假说成立。

　　Ringe在一系列论文里努力修正统计数据以避免产生错误的结论。他首先计算出相依表里有多少表格在选择的显著性水平上，在超几何分布上有着比期望值更高的数据，其次进行二次显著性测试，使用二项分布来看有多少统计学上显著的表格构成统计学上的显著性表，给定选择的显著性水平，作为检验的次数，如果形素随机成对，两个形素表可能就有平均数量的不同对应。Kessler（2001）使用蒙特卡罗显著性测试完全简化了该方法。计算总得分之后，词语会重新排列，那么词语就不再根据意义组成对子，而背景分也根据这个重新排列的数据计算出来。如果找到哪个分数的排列有着与总分数一样高的背景分，那个分数就是显著性水平。

　　（二）使用相似来确定语言关系。Jones和Greenberg使用相似性来判断语言关系，因为有着相似语音的不同源语言可能有较高的相似的总分数，而经历多次语音变化的语言可能表面上与亲属语很不相同。随机检测补偿了类型学方法的缺憾，因为它们被当作背景分数的一部分。Oswalt（1970）首次开发了该类型的运算法则。他使用Swadesh 100基本词汇表找到讨论中的两种语言的翻译等价词，检测数据，计算匹配次数（匹配表示两个词中预先确定的辅音数量与预先确定的发音特征数量彼此相似）。Oswalt计算了总分数后，一行一行地、系统地转换一种语言的所有翻译，以得到背景分。他为所有99个转换计算了背景分。这个过程被Baxter等人做得更直接、更精确，他们把它转换为真正的蒙特卡罗测试（Baxter & Ramer 2000）。

　　很多研究开始调整该方法的参数。Oswalt（1998）做了5次试验，运用不同的匹配标准来探讨诺斯特拉语系各语言之间可能的关系。这样做说明该方法机动灵活，却不太容易解释来自多重部分依赖性测试（multiple partially dependent test）互相矛盾的结果。在另一个变异测试中，Baxter & Ramer（2000）使用不同数据，只考虑词首辅音，当两个辅音是Dolgoposky类（Dolgoposky（1986）认为一系列辅音来自共同祖语）的相同成员时，可辨识出一个匹配。Kessler（2007）把Dolgoposky数据与其他六种语言进行比较，发现与其他语言一样可靠。Kessler & Lehtonen（2006）通过对其他几个创新进行试验，包括同时比较多种语言、使用同一种语言的多个同义词、翻译相同概念，进一步阐明了蒙特卡罗法的机动灵活性。

　　从统计学观点来看，使用任意性测试法似乎是正确的。但是在使用时总是会出现一些错误。造成错误的原因主要是借词、象声词及重叠形素的出现。

　　四、计算机技术的使用加快了量化比较法的发展

　　计算机的出现简化了运算程序，节省了人力，加速了语言演化的研究，为远距离语言比较带来了曙光，同时使当代历史语言学领域大型数据的比较更加方便可行。语言之间的比较基本上以相似为基础，从最开始的观察法，到后来的概率算法，均以词汇相似为根本。词汇（音段）统计学依然流行，只不过现阶段的研究依托计算机。Oswalt（1970）是最早以相似为基础使用计算机对语言进行分类的学者。他的方法是成对比较语言，并使用Swadesh 100词表。他把指令整合进他的计算机程序并详细说明哪个音位相似。如果一对词中的某个音位相似，这对词就相似。1960年Swadesh开发了一个词汇计算机自动比较项目。该方法把发音相关的音位转换为机读符号，以便计算机能计算出语言之间词汇相似的程度，并首次向墨西哥国立大学的学生展示，1962年又在西雅图语言学研究所展示。不过该项目从未完成。

　　Kessler（2008）利用两种以上语言的相似，使用计算机化的大规模比较法对Greenberg使用大规模比较法收集的词汇进行了严格的检测（即显著性测试）。他试图计算出第一个辅音发音位置间的距离。首先分离出两个词语的词根首辅音，然后计算出它们间的语音距离；对于全是元音的词根，就用第一个元音。从广义上来讲，根据与嘴唇前部的相对距离给每两个音位打分（唇音，0；齿音到硬腭前部音，4；硬腭音，6；软腭音，9；软腭后音，10）；有两个发音部位的音，如/w/，给两个分（0，9）。两个音位间的区别——继而两个词根间的区别——被认为是这些分数的所有交叉对间的最小绝对差别。如，/j/可得6分，当与/w/比较时｜6-9｜比｜6-0｜要小，所以/j/与/w/之间的距离是3。除此之外，如果音位彼此不同要加上半分。首音位置距离比较，旨在寻找音位的模糊近似度。

　　如果语言间有发生学关系，它们在大规模比较时可以放在一组，被当作一个单独的个体。如果超过两个语组，就采用一种类似最近邻层次聚类（nearest-neighbor hierarchical clustering）的方法论：对所有两两语组之间进行比较，看哪组有紧密发生学关系，就把它们归为一组。然后重复该过程。具体来说，对于每种语言比较，显著性在.05水平以上，首先在计算出所有匹配的相异点的基础上计算出效果强度（magnitude of the effect）（称为m），然后计算出哪个是偶然的（c），随后算出比例改善（c-m）/c。使用蒙特卡罗显著性测试可以计算出偶然相异点c：它只不过是所有数据重排的总相异点测算的平均数。

　　依靠这种聚类技术，逐步建立一个语组，它的核心是确定最有可能有发生学关系的项。对那些难以确定同源关系的偏僻地区的语言的认识逐渐变得容易起来。Kessler（2008）还评价了词汇比较的各种标准，发现印欧语系和乌拉尔语系可构拟但不可能构成超级组合语系（joint super-family）。但是根据基因分析，7000年前的远古印欧语与乌拉尔语肯定有联系。

　　还有一种与词汇统计学相似的方法是自动相似性判断程序（automated similarity judgement program，ASJP），不过相似性判断由计算机完成，后面紧跟一套连续规则（Brown et al.2008），使用标准进化方法产生（谱系）树。ASJP使用7个元音符号和34个辅音符号，有各种修饰词。如果不同词语中至少两个连续辅音相同，即可判断两个词相似，元音也考虑在内。两种语言有着相同意义的词的比例叫做词汇相似比例（lexical similarity percentage，LSP），语音相似比例（phonological similarity percentage，PSP）也计算在内。语音相似比例从词汇相似比例里减掉就得出减掉相似比例（subtracted similarity percentage，SSP）。自动相似性判断程序距离就是100-SSP。该程序几分钟之内为大量成对语言产生减掉相似比例。Brown et al.（2008）为分布全球的245种语言设计了100词汇表，运用该数据库，该程序从29，890对语言里比较了大约300万对词，产生了29，890个减掉相似比例。该项目的终极目标是比较所有语言，得出100词表。保守估计，世界上大约6，000种语言里至少有2，500种已经完整记录下来，因此此类词表立马可得。用于2，500种语言的自动相似性判断程序可能会产生3，125，000个减掉相似比例。截至目前，产生的29，890个减掉相似比例被用作计算机程序的数据库，该程序原本是为生物学家设计，基于基因数据派生系统发育树。使用减掉相似比例产生的谱系树形象地反映了语言的词汇相似性。树上相同分支的语言比不同分支的语言在词汇上更加相似。Brown et al.（同上）比较了该程序树与专业历史语言学家对著名的同源语言所做的分类，结果一致。该程序的潜在用途是发现以前没有发现或者暂时没有识别的语言关系。此外，还可对语言结构特点自动分析。该程序提供的词汇自动分析与结构特点一起，已被证明是历史语言学领域非常强大的调查工具。

　　另外一种类似的方法是Nakhleh et al.（2005）发明的，它在Ringe et al.（2002）的基础上演化而来，增加了印欧语言同源的证据。使用的运算法则采用印欧语言共同创新的发现，需要多年深入研究才能成功。与自动相似性判断程序不同的是，Nakhleh et al.（2005）的方法不适于现在普通语言分类。

　　目前自动相似性判断程序数据库里有超过4，500种语言和方言的数据（Brown et al.2008），依靠这些数据可制作世界语言谱系树，不过谱系树必须参考基因分析数据。

　　Serva & Petroni（2008）把计算机技术与生物学技术结合起来，依靠词语构建谱系树，取得了很好的效果。他们通过测算词语之间的正字法距离（orthographical distance）来判断语言关系，该方法可避免同源判断的主观性。他们使用修改过的Levenshtein距离（或编辑距离）来测算不同语言成对词之间的距离。两词间的基因距离就是被两个词中较长的字符串分开的编辑距离。由此，距离可取0和1间的值。Serva和Petroni使用词对间的距离构建成对语言间的距离，第一步就是找到要构建距离的所有语言有相同意义的词汇表，然后计算一个语言对里具有相同意义的每对词的基因距离，最后是把每对语言间的距离解释为词对间的平均距离，结果就得到0和1间的数，被认为是两种语言间的基因距离。该方法决定了需要把一个词转换成另一个词的最小操作次数，由较长词语长度决定。Serva和Petroni使用规范化的Levenshtein距离构建了1，225个词项的上三角50×50矩阵，来表示对应50种语言的成对距离。这些基因距离被译成成对语言之间的时间距离，产生了同等大小的新矩阵。然后使用简单的系统发育运算法则非加权组平均法技术构建谱系树。选择非加权对组方法，使用算术平均数的原因就是因为它与该假说（即语言谱系树是通过Kingman（1982）类型的合并过程产生的）最为一致。表面上看，该方法确实不错。但是如何选择合适的词对，特别是遇到同一意义有多种表达的情况，是一个大问题。

　　五、量化比较法的蔓延：其他领域介入

　　Kessler（2008）计算机化的大规模比较法依靠辅音、元音发音位置之间的距离来确定语言的发生学关系，与“语言学距离”（linguistic distance；Heggarty2000）相似。“语言学距离”用来表示两个语言变体之间相似/相异的程度。在语言任一领域能够量化语言距离的任一方法都可用作测算那个领域语言随时间变化的程度：该方法只用于单个语言的不同历史阶段。或者，可把该方法用于同一阶段不同的“姊妹”语，以进行自共同祖语以来同源语言的网状分裂测算。这是词汇统计学，尤其是语言年代学的任务，只是为了从词汇比较中得到基本结果——它们本身不过是简单测算词汇的语言距离。不过该方法已背离了历史语言学的研究方向，成为现代人类（对象都是现代人，不是古代人）语言发音的相似度研究。根据被比较的两个语言变体的时间深度，语音学里的语言距离有两种方法与时间有关。当用于一种语言不同的历史阶段时（“母语与子语”比较，如拉丁语与现代意大利语），结果可能被当作测量随时间变化的程度。当用于来自同一来源的共时语言变体时（“子语与子语”比较，如现代意大利语与现代西班牙语），它们可能代表对随时间分裂的测算。不过测算语言学距离时会遇到以下问题：一是两种有紧密发生学关系的语言在分化后还有不断的联系，导致借词难以辨识，测出的语言学距离比实际的要近；二是扩散到遥远地区的语言在受到外语的强烈影响后保留的同源词比实际的要少很多，测出的距离比实际的要远。

　　Nichols（2006）使用稳定的词汇场（stable lexical fields），如立场动词（stance verbs，如sit、lie、stand），研究语言演变，建立远距离发生学关系，这是基于词汇场的音义比较法。在寻找远古同源词时也考虑会聚和语义演变。目前可以见到关系模式的大致轮廓，研究结果已初现。

　　基本立场动词sit、stand和lie是比较持久的词汇，这三个词都在Swadesh100词表里，stand还出现在Lohr持久保留表里。立场动词以三种共同的语法变体出现：静止性（“站，正在站”）、目的性（“站起来；假定站的位置”）、及物性（“放在站立的位置，把某人/某物立在某一位置”）。准同源词（quasi-cognate）方法就是在这三种意义上寻找可能的同源词根。

　　Nichols（同上）根据哪种语法变体是基本的，哪种是派生的，使用下列名称来称呼三种类型的立场动词系统：基础-静态（base-static）、基础-目的（base-telic）和基础-及物（base-transitive）。印欧语立场动词词汇类型经常发生转移，有三个阶段，成S状曲线。即：逐渐形成、短期快速增长、逐渐扫尾。第一阶段，一个词语在长时间里偶尔有词汇替换，但是由于某种原因，与新的词汇类型一致的派生形态或形态句法逐渐起主导作用。新的词汇派生方法出现的地方可被认为是标记类型转换的入口或转折点。事实上，转换并非瞬间发生，而是快速增长的S曲线的中间部分。一旦新类型到位，确定了词汇相关部分的词汇信息和派生，又一轮词汇替换开始了，新的派生模式逐渐形成。即，在变化末端的扫尾期，该系统的其他地方还有无数相似的变化。

　　Nichols（同上）把准同源词初步用于立场动词词汇领域，通过辅音相似和词汇类型方面的比较，认为印欧语（不包括罗曼语）似乎应与乌拉尔语归为一组。虽然7种语言的3个准同源词还没检验，但该方法确实可行。它不仅使用准同源词而且还使用每种语言的词汇场结构、派生形态的类型学信息等。词汇都是立场动词，来自不同的语义场。该方法不仅比较准同源词，还评估权重同源概似因子，增加减少类似时间深度的因子。

　　使用语言要素（主要是词汇）相似为基础的量化比较法来研究语言演化大都出现在21世纪，面对浩如烟海的证据，概率方法的引入保证了证据和结果的可靠性，计算机的使用是方法论发生革命的关键，计算机简化了运算程序，特别是面对蜂拥而至的大规模语言数据，光靠人力是难以胜任的。后来的学者把生物学技术引入发生学关系的研究，加强了证据的可信度，这些都推动了语言演化研究，加快了历史比较语言学的发展。

　　历史语言关系研究可以距今7000年为界。此后，有语言文献（最早的距今最多5000年）的资料（包括推导），最多可上推2000年；而无任何语言文献的资料（包括推导），只有人体化石可以模拟发音状况。实际上，只有根据基因、化石和文化遗存等资料，才能勾画人类早期语言迁徙的大致路线。

　　如何勾画路线，确定语言演化路径是关键。如何确定路径，找到合适的方法是关键。本文讨论了一些以语言因素相似的量化比较法，对语言演化研究、数据分析很有效果。当然，这些方法还需进一步改进。对于词汇比较工作，则需更多词汇，更多匹配。如果把眼光投向语言演化方面就会发现，所有这些方法都会产出一些需进一步解释的数据和形式。计算机程序的使用提高了效率。在语言学的其他量化领域，如社会语言学和数据库语言学，数字的获得只是一个方面，它们的用途才是真正要考虑的。不过数字本身可说明假说的可靠性，同时也会显示肉眼看不见的区别。

　　现在历史语言学家已有了大量可自行支配的量化方法和计算机方法来处理语言分类、语言接触和语言变化。在某种程度上这些方法有助于更好地处理复杂的语言情况。在基于相似的分析中，未确定的或者误用的借词似乎提供了某种信号，据此可找到检测由接触导致变化的方法，除非不能确定是否发生过接触。换言之，不仅要探讨证明语言亲缘关系的新方法，还要探讨如何重构形成这种关系的最可能的历史的新方法。再者，当面对同一种语言的方言或有紧密发生学关系的语言时，量化方法有助于计算变体之间的相对距离，确定哪些特征造成了这种距离。

　　目前寻找合适的检测方法仍然有一大段路要走。大多数程序原本开发出来是用于其他领域的，但是现在却用于语言数据分析。已经有了好几种收集或解码数据的方法，但很少得到大众认可，而且没有哪种是无懈可击的。使用这些方法的例子越多，提供的信息就越多，也就越有说服力。数据不需要总是来自真实的语言，有时计算机模拟已足够。这些结果还可用于历史语言学与相关学科的合作，实现“新的合成”（new synthesis），语言数据还有助于了解人类历史。

　　原文参考文献：

　　[1]Baxter,W.& A.Ramer.2000.Beyond lumping and spliting:Probabilistic issues in historical linguistics[A].In C.Renfrew et al.(eds.).2000.167-188.

　　[2]Brown,C.,E.Holman,S.Wichmann & V.Velupillai.2008.Automated classification of the world's languages:A description of the method and preliminary results[J].STUF-Language Typology and Universals 61:285-308.

　　[3]Campbell,L.1998.Historical Linguistics:An Introduction[M].Cambridge,MA.:The MIT Press.

　　[4]Collinder,B.1947.La Parenté Linguistique et le Calcul de Probabilité[M].Uppsala:Almqvist & Wiksells Boktruckeri.

　　[5]Dixon,R.1997.The Rise and Fall of Languages[M].Cambridge:CUP.

　　[6]Dolgoposky,A.1986.A probabilistic hypothesis concerning the oldest relationships among the language families in northern Eurosia[A].In V.Shevoroshkin & T.Markey(eds.).Typology,Relationship,and Time[C].Ann Arbor,MI.:Karoma.27-50.

　　[7]Dumont d'Urville,J.1834.Voyage de Découveries De L'Astrolabe Exécuté par Ordre du Roi Pendant les Années 1826-1827-1828-1829[M].Paris:Ministère de la Marine.

　　[8]Dyen,I.,J.Kruskal & P.Black.1992.An Indo-european classification:A lexicostatistical experiment[J].Transactions of the American Philosophical Society 82:1-132.

　　[9]Embleton,M.1986.Statistics in Historical Linguistics[M].Bochum:Brochmeyer.

　　[10]Forster,P.& C.Renfrew(eds.).2006.Phylogenetic Methods and the Prehistory of Languages[C].Cambridge:McDonald institute for Archaeological Reseach.

　　[11]Greenberg,J.1993.Observations concerning Ringe's Calculating the Factor of Chance in Language Comparison[J].Proceeding of the American Philological Society 137:79-90.

　　[12]Gudschinsky,S.1956.Three disturbing questions concerning lexicostatistics[J].International Journal of American Linguistics 22:212-213.

　　[13]Harrison,S.2003.On the limits of the comparative method[A].In B.Joseph & R.Janda(eds.).The Handbook of Historical Linguistics[C].Oxford:Blackwell.213-243.

　　[14]Heggarty,P.2000.Quantifying change over time in phonetics[A].In C.Renfrew et al.(eds.).2000.531-562.

　　[15]Hoijer,H.1956.Lexicostatistics:A critique[J].Language 32:49-60.

　　[16]Hymes,H.1956.Review of Papers from the Symposium on American Indian Linguistics Held at Berkeley July 7,1951[J].Language 32:585-602.

　　[17]Jones,W.1786.The third anniversary discourse,delivered 2 February 1786[A].In W.Lehmann(ed.).A Reader in Nineteenth Century Historical Indo-European Linguistics[C].Bloomington,IN.:Indiana University Press.7-20.

　　[18]Kessler,B.2001.The Significance of Word Lists[M].Stanford,CA.:CSLI.

　　[19]Kessler,B.2007.Word similarity metrics and multilateral comparison[A].In J.Nerbonne,G.Kondrak & T.Ellison(eds.).Proceedings of Ninth Meeting of the ACL Special Interest Group in Computational Morphology and Phonology[C].Stroudsburg,PA.:Association for Computational Linguistics.6-14.

　　[20]Kessler,B.2008.The mathematical assessment of long-range linguistic relationships[J].Language and Linguistics Compass 2:821-839.

　　[21]Kessler,B.& A.Lehtonen.2006.Multilateral comparison and significance testing of the Indo-Uralic question[A].In P.Forster & C.Renfrew(eds.).2006.33-42.

　　[22]Kingman,J.1982.On the genealogy of large populations[J].Journal of Applied Probability 19A:27-43.

　　[23]Kroeber,A.& C.Chretien.1937.Quantitative classification of Indo-European languages[J].Language 13:83-103.

　　[24]Lohr,M.1999.Methods for the Genetic Classification of Languages[D].Ph.D.Dissertation.University of Cambridge.

　　[25]Nakhleh,L.,D.Ringe & T.Warnow.2005.Perfect phylogenetic networks:A new methodology for reconstructing the evolutionary history of natural languages[J].Language 81:382-420.

　　[26]Nichols,J.1996.The comparative method as heuristic[A].In M.Durie & M.Ross(eds.).The Comparative Method Reviewed[C].Oxford:OUP.39-71.

　　[27]Nichols,J.2006.Quasi-cognates and lexical type shifts[A].In P.Forster & C.Renfrew(eds.).2006.57-66.

　　[28]Oswalt,R.1970.The detection of remote linguistic relationships[J].Computer Studies 3:117-129.

　　[29]Oswalt,L.1998.A probabilistic evaluation of North Eurasiatic Nostratic[A].In J.Salmons & B.Joseph(eds.).Nostratic:Sifting the Evidence[C].Amsterdam:John Benjamins.199-216.

　　[30]Rafinesque,C.1832.Philology.Second letter to Mr.Champollion on the graphic systems of America,and the glyphs of Otolum or Palenque,in Central America-Elements of the glyphs[J].Atlantic Journal,and Friend of Knowledge 2:40-44.

　　[31]Renfrew,C.,A.McMahon & L.Trask(eds.).2000.Time Depth in Historical Linguistics[C].Cambridge:McDonald Institute for Archaeological Research.

　　[32]Ringe,D.1992.On Calculating the factor of chance in language comparison[J].Transactions of the American Philosophical Society 82:1-110.

　　[33]Ringe,D.,T.Warnow & A.Taylor.2002.Indo-European and computational cladistics[J].Transactions of the Philological Society 100:59-129.

　　[34]Ross,A.1950.Philological probability problems[J].Journal of the Royal Statistical Society Series B(Methodological)12:19-59.

　　[35]Sapir,E.1916.Time Perspective in Aboriginal American Culture:A Study in Method[M].Ottawa:Government Printing Bureau.

　　[36]Serva,M.& F.Petroni.2008.Indo-European language tree by Levenshtein distance[J].EuroPhysics Letters 81:68005.

　　[37]Swadesh,M.1952.Lexico-statistic dating of prehistoric ethnic contacts[J].Proceedings of the American Philosophical Society 96:452-463.

　　[38]Trask,R.1996.Historical Linguistics[M].London:Arnold.

　　[39]Villemin,F.1983.Un essai de détection des origines du japonais à partir de deux méthods statistiques[A].In B.Brainerd(ed.).Historical Linguistics[C].Bochum:Brockmeyer.116-135.

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。