重发本号旧文。
一、单词的由来
语言并不神秘。它的本质就是事件与发音之间的对应关系。在人类开口说话之前,各种各样的动物语言早就已经无处不在了。
假如有一只鸟,在面临危险时总是发出“咕咕”声,在发现食物时总是发出“啾啾”声,而在求偶时总是发出“喳喳”声。只要这种对应关系是确定的,那么在广义上,我们就可以说这是鸟儿的语言。
可能有人不同意这个定义。历来有一种观点,认为人类与动物之间存在着一条语言鸿沟。人类拥有发达的语言系统,而动物则一点儿也没有。
在这些人看来,鸟类在不同情况下的鸣叫,只是与瞳孔放大或口水分泌一样的自然发应。所以要承认它是语言,必须还要证明它有主动地把信息传递给同伴的作用。
研究证明,非洲的长尾黑鄂猴,至少可以用固定的10种声音来表达10种意思。科学家用重播录音的方法证明来其有效性。播放“鹰来了”,猴子们会下树。播放“豹来了”,猴子们会上树。播放“高级成员”,猴王及其亲属会往喇叭方向看。播放“低级成员”,其它的猴子会向喇叭方向看。
这样看来,即使按照狭义的标准,我们也不得不承认长尾黑鄂猴拥有语言。不过动物语言的发展水平到此为止。后续的发展就必须建立在人类的智慧水平上了。
现在我们可以设想一下,如果用长尾黑鄂猴的语言来表达更多的信息,其结果大致是这样的:
老虎来了,发A声。
老虎走了,发B声。
狮子来了,发C声。
狮子走了,发D声。
豹子来了,发E声。
豹子走了,发F声……
如果猛兽的种类和行为再多一些,很快发音就不够用了。当然,发音“不够用”是一个相对问题。理论上只要增加音节,发音总量是可以无限增加的。“啊呀”,“啊呀啊”,“啊啊啊呀”,“呀呀啊啊啊”……
但是,使用更长音节的代价是,语言的构造和学习更加困难,表达效率也更低下。可能你一大段话还没喊完,老虎已经扑到面前了。所以语言进化的历史,就是人类千方百计,不断提升发音表达效率的历史。
那么,现在的问题就变成了要怎样去节约发音。人类的智慧高于其它动物,所以他们能够分析这些事件的内涵联系。
他们发现“老虎来了”和“老虎走了”有一个共同点,说的都是“老虎”在做动作。而“狮子来了”和“豹子来了”也有一个共同点,说的都是一种猛兽“来了”。
把这些事件的内涵共同点提取出来,就成了单词。前一个就是名词“老虎”,后一个就是动词“来了”。
单词的发明是人类语言脱离动物语言的一大飞跃。只要命名了N种动物,以及这些动物的M种行为,就可以用N+M种发音来对应N*M种事件。
比如在上面那个例子当中,一共有“老虎”、“狮子”、“豹子”3种动物,N=3,每种动物有“来了”和“走了”2种行为,M=2,那么只需要N+M=5个单词,就可以表达N*M=6种情况,5比6节约了17%的发音。
不要小看这17%,需要表达的内容越多,使用单词带来的效率提升就越大。如果N=100,M=20,N+M=120,N*M=2000,那么单词系统对发音的节约就达到了94%。这个数字已经很惊人了吧。实际上,人类语言所能表达的事物又何止千万呢。
反过来说,如果没有那么多东西需要表达,那么N和M的数值就都很小。这时候使用单词带来的效率提高就不是很明显,也许单词系统就不会产生。
原始爱斯基摩语就是一种没有单词系统的语言。所有意思都是直接用一组超长音节来表示的。比如“我们走”就是pisuktugut,“带着狗走”就是qinmiqtuqtuq,诸如此类。
估计是北极的环境过于单调,需要表达的意思太少。所以以前的爱斯基摩人宁可直接运用复杂但是现成的句子,也不愿意去区分什么单词组合。
在语言学上,像这类没有单词系统的语言被称为“抱合语”。
二、单词的屈折
如果把语言的进化比作万里长征,那么单词的出现只是迈出了第一步。接下来的演绎又将如何呢?我们现在来看这样2个事件:
A:武松杀死了老虎。
B:武松被老虎杀死了。
首先,还是按照单词由来的逻辑,把这几个事件的内涵共同点提取出来。那么很快3个单词就出现了:“武松”、“老虎”、“死了”。
但是这里存在一个很大的问题。你想象一下,如果有一个原始人,他可不懂什么语法,就在那儿变着法儿呼喊着这3个单词:
X:“老虎”“死了”“武松”。
Y:“武松”“老虎”“死了”。
Z:“死了”“老虎”“武松”。
……
你会怎么理解?到底是武松打虎,还是虎打武松?鬼才知道。
这时候,最简单的办法就是告诉这个原始人,谁活着,谁就是“牛B”,谁死了谁就是“弱B”。然后原始人就重新开始喊了:
X:“弱B老虎”“死了”“牛B武松”。
Y:“牛B武松”“弱B老虎”“死了”。
Z:“死了”“弱B老虎”“牛B武松”。
……
这一回我们终于懂了。虽然听起来还是有点儿费力,但是意思很明确,肯定是武松打死了老虎,而不可能是反过来。
总结起来,我们就是在“武松”和“老虎”这两个单词上附加一些变化。当它处于主动地位时,就附加上“牛B”的发音。当它处于被动地位时,就附加上“弱B”的发音。前者就叫做名词的“主格”,后者就叫做名词的“宾格”。
当然,除了名词可以有格的变化,其它单词也可以有各种形态变化。在语言学上,单词的形态变化被称为“屈折”。进化到屈折这一步的语言,被称为“屈折语”。
“屈折语”家族比“抱合语”大得多。拉丁语是其中比较典型的一种。我们来看一个拉丁语的例子(灰字可略过)。
在拉丁语中,父亲实施动作时称为pater(主格),父亲接受动作时称为patrem(宾格),儿子实施动作时称为filius(主格),儿子接受动作时称为filium(宾格),动词我们这里只举一个例子amat,意思是爱。
如果把父亲的“主格”和儿子的“宾格”放在一起,3个单词任意排列组合,得到的6句话都是一个意思,即父亲爱儿子。
如果把儿子的“主格”和父亲的“宾格”放在一起,得到的6句话就都是儿子爱父亲(灰字可略过)。
父亲爱儿子 | 儿子爱父亲 |
Pater amat filium. | Filius patrem amat. |
Pater filium amat. | Filius amat patrem. |
Filium amat pater. | Patrem amat filius. |
Filium pater amat. | Patrem filius amat. |
Amat pater filium. | Amat patrem filius. |
Amat filium pater. | Amat filius patrem. |
在拉丁语中,所有的信息都通过词汇的屈折来表达。句式结构不传递任何信息。但是很明显,每个句子中的主宾结构都是对应的,父亲为“主格”等于已经说明儿子为“宾格”,反之亦然。
所以2个单词同时进行屈折的结果是,要么屈折相互匹配,则总有1条信息是冗余的,要么屈折不能相互匹配,则全句的意思无法理解。
拉丁语的这种特性是比较原始的,但也不无好处。因为拉丁语的使用环境比较混乱,前承波斯语、希腊语,后启罗曼语、日耳曼语。各种语言相互借词,拼读极易混乱。
这时候,多处屈折可以相互验证,冗余信息起到复查的作用。一旦发现屈折不匹配,读者就可以警觉起来,回头去考证这句话到底哪里出了问题,而不会轻易地误解误信。
凯撒大帝那句著名的口号“Veni!Vidi!Vici!”,意思是“我来了!我看见了!我征服了!”。
这3个单词,从外形上看极为简洁,但内涵其实相当繁复,因为每个词都采用相同的屈折,等于是把“直陈语气+主动语态+第一人称单数+过去时态……”的信息重复了3遍。
为什么这样说?请看后续的分析。
三、从屈折到黏着
人类对事件进行分析,发明了单词。人们又对单词进行分析,发明了屈折。下一步,很自然地是对屈折进行分析了。
拉丁语的屈折是极其丰富的,它有6种时态,6种人称,3种语气和3种语态。比如上面提到过的amat,它是表达“爱”这个意思的现在时形态+第三人称单数+直陈语气+主动语态。
区区4个字母,表达出这么多层意思,好像很简洁。但是这种简洁是有代价的。
我们把amat的屈折不完全列表如下(灰字可略过):
直陈式主动语态 | 现在时 | 过去进行时 | 将来时 | 现在完成时 | 过去完成时 | 将来完成时 |
第一人称单数 | amō | amabam | amabō | amī | ameram | amerō |
第二人称单数 | amas | amabās | amabis | amistī | amerās | ameris |
第三人称单数 | amat | amabat | amabit | amit | amerat | amerit |
第一人称复数 | amamus | amabāmus | amabimus | amimus | amerāmus | amerimus |
第二人称复数 | amatis | amabātis | amabitis | amaistis | amerātis | ameritis |
第三人称复数 | amant | amabant | amabunt | amērunt | amerant | amerint |
还有:
直陈式被动语态 | 现在时 | 过去进行时 | 将来时 | 现在完成时 | 过去完成时 | 将来完成时 |
第一人称单数 | amar | amabar | amabor | amatus | amatus | amatus |
第二人称单数 | amaris | amabāris | amaberis | amatus | amatus | amatus |
第三人称单数 | amatur | amabātur | amabitur | amatus | amatus | amatus |
第一人称复数 | amur | amabāmur | amabimur | amavī | amavī | amavī |
第二人称复数 | amaminī | amabāminī | amabiminī | amavī | amavī | amavī |
第三人称复数 | amantur | amabantur | amabuntur | amavī | amavī | amavī |
还有……算了。
以上洋洋洒洒,竟然还只是1个动词的变化。是不是很有点触目惊心的感觉?难怪在中世纪欧洲,凡是能够掌握拉丁语的都可以算是大学问家。拉丁语如此,其它“屈折语”也都有类似的问题。
不过一门语言存在的意义,绝不能仅仅是供少数精英秀智商之用。一方面,人类语言需要表达的意思确实越来越复杂,要求越来越精细。另一方面,人类的记忆力极限又要求词汇屈折的复杂度又不能无限增加。在这种情况下,“屈折语”已经走进了死胡同,人类语言的进化必须得另辟蹊径。
如何另辟蹊径?我们还是举一个例子来说明。为方便起见,我们只看3种时态:现在时,过去时和将来时,以及2种语态:主动和被动。
拉丁语相关的语法规则如下(灰字可略过):
规则1:动词-t结尾改为-erat结尾,表示过去时态。
规则2:动词附加后缀ur,表示被动语态。
规则3:动词-t结尾改为-bit结尾,表示将来时态。
规则4:动词附加后缀us,表示过去时+被动语态。
规则5:动词-t结尾改为-bitur结尾,表示将来时+被动语态。
结果如下表:
现在时 | 过去时 | 将来时 | |
主动 | amat | amerat | amabit |
被动 | amatur | amatus | amabitur |
对应6种不同的情况,拉丁语就指定了6种屈折,形态各自完全不同。上面那些庞大的表格就是这样产生的。作为对照,我们再来看英语是怎么处理这些时态语态的(灰字可略过):
规则1:动词附加后缀ed,表示过去时态,其中was是be的过去式。
规则2:动词之前增加will,表示将来时。
规则3:动词之前增加be动词,表示被动语态。
这样处理的结果就是:
现在时 | 过去时 | 将来时 | |
主动 | love | loved | will love |
被动 | be loved | was loved | will be loved |
英语的规则和结果都明显比拉丁语简洁。这里面关键的一点,就是英语用前后缀的方法,实现了屈折的“可叠加”。
英语的规则1和规则3的叠加,代替了拉丁语中的规则4。英语的规则2和规则3叠加,代替了拉丁语中的规则5。
在这里,N+M式的节约效应再一次出现。对应3种时态和2种语态,拉丁语设置了2*3=6种屈折。英语则设置了3种时态前后缀和2种语态前后缀。
因为前后缀之间可以相互叠加,所以这2+3=5种前后缀就可以把拉丁语的6种屈折全都表达出来。而且正如前面已经指出过的,N和M的数字越大,节约效应就越强。
把屈折的规律提取出来,设置为前后缀,运用时就像是黏着在词根上一样,还可以相互叠加。采用这种语法的语言称为“黏着语”。
用“前后缀组合”的方式表达屈折,相比于对应每一种情况分别设定,显然大大提高了效率,更有条理,从而也更容易理解。
人类语言的进化,至此又进一步。
四、英语的分析化
相比于拉丁语,英语实现了大量的黏着化,提高了效率。但是英语也保留了许多特殊的屈折方式,并没有完全进化成“黏着语”。
比如所有名词都没有主、宾格了,就剩下“你、我、他”3个代词还有。所有的动词都没有人称变化了,偏偏第三人称单数还有。
倒是像日本、土耳其这样的新兴民族国家,借着近代化的浪潮改革语言。一步到位实现了完全的黏着化。其实这也容易理解,城市里最光鲜的建筑一定是新造的,百年老店再怎么改建也不可能脱胎换骨。
我们在前面已经阐明,语言进化的动力来自N+M的节约效应。屈折形式越多,N和M的数值越大,节约效果就越明显。
拉丁语的屈折多如牛毛,实行黏着化的潜在收益很大。但是英语的名词已经基本没有格,语态只剩下2种,时态也基本黏着化了。所以英语进一步实行完全黏着化的收益并不明显。
如果英语不去朝着黏着化去发展,难道就在原地踏步吗?不太可能。近代以来,英语承载着最沉重也最精密的人类思想交流,它当然在发展。只不过它不再是利用“黏着化”来提高效率,而是走上了“分析化”的道路。
我们先来看几个英语“分析化”的例子。
还记得拉丁语那6句话1个意思的“父亲爱儿子”么?在英语里,它只有:father loves son这一种说法。谓语loves前面的就是主语,后面的就是宾语。把语句的顺序定死,主格和宾格的屈折直接就省掉了,连黏着化也用不着。
再来看猫的尾巴,古典的表达应该是cat's tail,但是在实践中直接称cat tail即可。因为只能是猫有尾巴,不可能是尾巴有猫,名词直接当形容词用,在这里属格也省了。
同理,size of the shoe,通常只说shoe size就可以了,肯定没人会理解错。
不仅英语单词的屈折可以变化,连句子成份也可以参与变化。比如let it go是个句子,但如果把it省略变成let go,就可以当动词使用。
再比如2个介词应该不能连续使用,但是go on这个词组通常被视为一个单词,于是go on to do也能够成立了。
这样的例子还能举出很多很多。甚至汉语中的“好久不见”,也被借入到英语,成了long time no see,完全无语法可言,但是简洁又形象。
我们之前所说的语言进化,都是从单词到屈折,再从屈折到黏着。而所谓“分析化”,说白了,就是跳出这条进化路径。
既不要黏着,也不要屈折,直接把单词“拼接”在一起。不讲究什么语法逻辑。只要大家都认,就行。
英语的“分析化”,其实是英国国势变迁的一个结果。随着英国成为日不落帝国,英语成为了国际通用语言,越来越多的外国人,在世界的各个角落里,使用着带有他们母语风格的或者干脆是临时创造的英语。
这个过程极大地丰富了英语的表达方法。而这些“创造”中能够留存下来,得到大家公认的,通常就是那些最简洁的表达。
所以“分析化”的本质就是用经验代替规则。而它的根本追求就是一条:更高的效率。
在印欧语系的各种语言中,英语的“分析化”程度是最高的,语法特例也是最多的。曾经有一个语言学的笑话,说的是欧洲大陆的各国语言群起而挖苦英语。
西班牙语嘲笑英语读音乱。因为西语的发音与拼写一一对应,单词本身就是音标。德语嘲笑英语拼写乱。因为德语的拼写非常规则,每个音节都很清楚。法语嘲笑英语语法乱,因为法语的语法既精确又严密,绝不允许擅越雷池半步。
不过,无论欧陆语言笑得多么开心。稳坐世界通用语宝座的语言始终是英语,而不是它们。
因为英语“分析化”背后的思路就是允许习惯大于语法,依赖实践经验而不是顶层设计。只要不影响理解,又可以提高效率,任何改进都可以接受。也只有这样,才能够达到“兼收并蓄,海纳百川”的境界。也只有这样,才能与它世界通用语的地位相匹配。
在宏观上,“分析化”的思路与英美法系的判例法思想是相通的。英语国家自下而上地积累判例,欧陆国家自上而下地推行法典。
前者处在科技、社会、文化的领先位置,最优先的追求是灵活和创造。后者始终处在追赶者的位置,有机会去总结和学习,因而可以追求逻辑上的精美。
五、大道至简
“黏着化”,从屈折发展而来,自上而下,逻辑一脉相承,就是有点儿“不接地气”。
“分析化”,建立在使用者的经验和共识之上,自上而上,简洁有效率,但是又显得缺乏章法。
这两者到底哪一种才是人类语言进化的最终方向?千百年来,语言学的研究汗牛充栋,却没争出个所以然来。下面我们换个视角,看看IT技术的发展能不能给我们一点儿启发。
现代科学家们曾经长期致力于机器翻译领域,希望能够让电脑“读懂”人类语言。一开始他们尝试以单词为砖头,语法为图纸,像建造大楼一样,一砖一瓦地去建立理解。但是很快他们发现这种运算的复杂度接近无穷大。
因为语言的理解,首先是建立在对现实世界的理解上的。就像前面那个“猫有尾巴”还是“尾巴有猫”的例子。用不着在语法里作相关规定,作者在说话的时候,已经假设读者具备关于现实世界的基本常识。
其次,理解也是建立在语篇和语境上的。比如一长段话最后来一句“怎么样”,跟先来一句“怎么样”后面接一长段话,完全是两个效果。也可能某句话单独拿出来的话,缺主语缺谓语,完全不能理解。但是跟其它句子放在一起就又能理解了。
最后,理解还是建立阅读者的体验上的。同样的一个“好”字,只说1遍是这个意思,但是连续重复3遍可能就成了另一个意思了。
一大群世界顶尖的科学家们前前后后努力了几十年,最后终于认输投降,承认从语法出发,“顶层设计”一套机器翻译算法是不可能的。那么后来他们是怎么解决问题的呢?
他们运用统计方法。或者直白地说,用“猜”的办法。先收集海量已经翻译好的文本,比如文件、记录、书籍,等等。然后让电脑做统计分析。
比如某一句话,在过去出现过的2000次翻译中,有1200次被翻译成A,只有300次被翻译成B,500次翻译成其它各种内容。那么电脑就会把它翻译成A。
事实证明,人类的语言太过丰富,试图用一套语法规则去构建它,无异于用水斗测量大海。倒是根据经验“猜”意思的办法,反而更接近人类语言的真相。
凭借经验,突破规则,直接把意思拼接在一起,只要能理解就好。这些不正是“分析化”的特征吗?
那么,是否存在一种语言,完全没有语法,纯粹凭借经验,彻底地“分析化”呢?
当今世界,完全没有语法的语言恐怕没有。不过倒真有一种语言,曾经被20世纪初的某些欧洲语言学家断言为 “没有语法”。那就是我们的汉语。
把任何一篇用汉语写成的文章拿出来,只要瞥一眼那些方块字,就知道汉语不包含任何单词的屈折。再仔细一看,汉语简直是语法特例大全。
英语的“it is raining”,汉语说“下雨了”,主语被省掉了。英语的“today is Monday”,汉语说“今天星期一”,谓语被省掉了。英语的“regard it as”,汉语说“视为”,宾语被省掉了。其它如“唯马首是瞻”、“大胜敌军,大败敌军”之类的奇葩表达,更是层出不穷。
在语言学分类上,爱斯基摩语被称为“抱合语”。拉丁语被称为“屈折语”。土耳其语被称为“黏着语”。英语介于“屈折语”和“黏着语”之间,并且有一定“分析化”。而汉语则被称为“分析语”。
要评判一门语言的优劣很难,因为涉及太多主观因素。但要是说简洁,那么汉语可谓当仁不让。
联合国的标准文件,汉译本总是最薄的。国际会议的多语同声传译,汉语总是最先结束的。就连背诵九九乘法表,中国儿童也占尽优势。
现代IT技术采用统一的数学算法,对语言文本进行压缩。结果发现在世界主要语言中,汉语的压缩效果是最差的。
最难压缩,换句话说,就是冗余最少。如果以“熵”来表示压缩的难度,法语大约是3.98,西班牙语4.01,英语4.03,而中文高达9.65。
六、输入法
在前智能机时代,中国人对手机短信的酷爱是出了名的。2002年,美国全国手机用户发送短信息的总数为81亿条。2004年中国的手机保有量与美国2002年的数字相去不远。但是仅在当年春节7天长假期间,中国人就发送了70亿条短信。
关于中国人爱发短信的解释有很多,从技术到文化,不一而足。我们在这里暂且不做深究。但是在1980到90年代,“汉语无法进入电脑时代”的断言曾经一度甚嚣尘上。这是怎么回事呢?
电脑键盘是为英语设计的,理论上其它任何语言要输入电脑,都需要输入法。但是对于大多数的字母语言来说,这不是难事。只要把自己的字母和英语字母对应起来就行。
近代以来,每个汉字都有了对应的拼音。拼音可以很方便地输入电脑。考虑到汉语原本就简洁,所以即使每个汉字用一串2-6个字符来表示,其效率也还可以接受。
汉语输入法的真正困难,在于处理大量的同音异义字。输入完一串拼音字符,还要再从几个甚至十几个备选字中挑出那个你想要的。多出来的这一步工作,既费时,又费眼,还打断思路。这个困难对当时的汉语输入法来说,简直是泰山压顶。各种悲观绝望的论调,大多由此而来。
汉语输入法的最终破局,还是依赖于前文提到过的统计方法,也就是用历史经验“猜”内容的“联想”输入技术。
编写输入法软件的程序员首先收集海量的文本,然后统计出某一个发音对应哪个字是最常见的,某几个发音对应哪个词组是最常见的,甚至一个词汇输入之后,后面最可能跟上的是哪个词。然后程序员就根据这些统计结果,去设定“联想输入”的规则。越是常见的字或词,在选择界面里的排名就越靠前。
大家可能都有这样的经验。在输入不常见的人名或者地名,或者其它任何不能“联想”的内容时,汉语输入效率非常低。但如果输入的是常见内容,那就可以利用“联想”功能,按词、按词组输入,于是效率大大提高。而如果输入的是成语、歇后语和常用对话定式时,几个字符就能“联想”出一长段文字,简直是吐字如飞。
其实字母语言的输入法,也有一些已经具备了“联想输入”的功能。但是这些语言的运用,不是把意思直接“拼接”在一起就可以了,而是要受到许多语法“条条框框”的约束。
比如英语里,在句子起首输入一个单词it,那么按照“经验”,后面紧跟一个be动词的可能性极大。但是软件不知道你这句话是什么时态,于是得把is,was,will be全都列出来供你选择,这无疑就降低了效率。
与30年前相比,汉语输入效率的提高,简直像火箭发射一般迅速。而字母语言的输入效率,基本上还在原地踏步。今天,或许只有在输入个别单词时,字母语言还能占到一些优势。一旦进行词组、整句的输入,恐怕没有一种语言的输入效率能够望汉语之项背。
从过去30年汉语输入法的发展历程,我们或许可以窥视一个典型的语言进化过程。
为什么当年汉语输入法的效率那么低?因为汉语没有语法的约束,好像一个字后面跟任何一个字都是可以的。什么都有可能,什么可能性都要考虑,效率自然下来了。
为什么汉语输入法的效率能够提高?凭借“经验”。所有的“经验”,包括上下文、现实约束、习惯、语境等一切要素,都可以帮助排除冗余的可能性,提高效率。而且直到今天,汉语的输入效率还在持续不断的提高当中。
为什么汉语输入法的效率今天已经能够超过字母语言?原因可能有不少,但是至少有一条。因为没有语法的约束,所以“联想”功能可以独当大局,让“经验”的威力可以不受限制地充分发挥。
对于“屈折-黏着”语来说,在语言发展的低级阶段,语法可以起到规范和支撑语言发展的作用。但是在语言发展的高级阶段,语法又会成为提高表达效率的障碍。可谓成也语法,败也语法。
但是对于“分析语”来说,正因为从一开始就不依赖语法,自然后来也会不为其所缚。《道德经》有云:“大象无形,大音希声”,莫不与此意暗合?
七、得失相依
在语法不断进化的同时,词汇也在进化。
人类喉咙的构造决定了,发音是一种有限的资源,尤其是简短和响亮的发音。前者方便使用,后者方便识别。
为了保持语言的效率,优质的发音必须被用来表达那些重要的内容。所以词汇的进化,实际上就是对发音资源的优化分配。
近代以来,人类语言中的大量新生内容都产自英语。我们就先来看看它是怎样平衡发音资源的。
比如board这个发音,它的原意是甲板,使用频率不算高,但它又被引申为董事会,成了一个重要的当代词汇。
再比如tank这个发音,它的原意是水槽,比较生僻,但它的另一个意思:坦克,则是个热门词汇。
以上两个例子,一个是潜移默化,一个是有意为之。但结果都是一样的,优质发音被赋予了新的含义,从而延续了它的活力。
随着科技文化的爆炸式发展,词汇的进化也有加速的趋势,比如web(渔网、网络),hedge(篱笆、对冲),cloud(云彩、计算云)等等。这些发音都很简短响亮,但也正因为如此,它们早早就被原意“占用”了。
可以设想,如果没有一种腾笼换鸟式的进化,只是按部就班地去构词。那么这些人类文化中的“后来者”,它们的发音要么很长,要么很怪,肯定无法与它们的重要性相匹配。
旧词新用虽然提高了效率,但是单词的新旧意思之间就有可能出现冲突。到底是哪个意思,必须结合上下文去理解。
这时如果能有一套表意符号,标示这个是科技新词,那个是金融新词,但是又不影响发音,是不是更加完美呢?
截止目前,英语里还没有出现这种情形。不过汉语里的形声字早已存在几千年了。
在汉语中,词汇的进化特别充分。汉字中80%都是形声字,几乎每一个发音资源都被反复使用,极度“榨取”其价值。因此同音异义字的情况极为普遍。说到这里,奇文《施氏食狮史》不得不提,请看如下:
石室诗士施氏,嗜狮,誓食十狮。施氏时时适市视狮。十时,适十狮适市。是时,适施氏适市。氏视是十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,氏使侍拭石室。石室拭,氏始试食是十狮。食时,始识是十狮,实十石狮尸。试释是事。
虽然不好读,但是这样的文章能写出来。放眼世界,唯有汉语。不过这种奇文也只是特例,还算不得汉语特征的真正代表。要说对发音运用的最高境界,应该是那数以十万计的古典诗词。
这里我们不讨论情感优美,描写细腻之类的主观感受。只需要看一下古典诗词最基本的格式要求。
五言绝句必须是4句,每句5个音节。七言律诗必须是8句,每句7个音节。多1个音节少1个音节都不行。能用这样严格的格式来表达大量复杂的意思,又是汉语一项独步全球的“绝技”。
不过,这一切并非没有成本。充分“压榨”发音资源的背后,是汉语把一个发音掰成4瓣用。这使得汉语语意的理解,极其依赖声调。声调一变,意思就会完全不同。
在日常对话中,保证声调标准还不算一件难事。但是在歌曲中,为了配合曲调,声调有时不得不变。比如在中国国歌中,“前进,前进”就必须唱成“浅金,浅金”。在流行歌曲中,耳熟能详却不解其意的例子就更多了。
古代中国人很早就意识到了这个问题。所以当时的歌曲都是与词牌相对应的。每个词牌都对字数和声调有严格的规定。只有这样,才能既配合整首曲调,又配合每个字的声调。结果就是古代歌曲填词的难度,远高于现代歌曲作词。两者就像苏东坡和周杰伦之间的区别。
汉语的现代诗词和现代歌曲,体裁格式都是从欧洲语言那里学来的。从汉语本身来看,从古典诗词到现代诗词,做诗和读诗的难度都下降了。但是从词牌歌曲到现代歌曲,作词的难度下降了,理解歌词的难度却提高了。
诗词的发达,是汉语的一得。歌曲的逊色,是汉语的一失。得失相依,安知非福?
(全文完)
联系客服