打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
“小学生活好还是初中生活好”,为什么你断不对句?

(Revolucion、文)现在是纯洁度测试时间。请阅读以下句子并回答问题:


宝鸡巴士公司真诚欢迎来自江阴毛纺厂和江阴道路管理局及上海虹口交警支队的保持党员先进性爱国主义教育小组的领导们!下午将参观模拟开放性交互式的全新网络,在此期间各色饮品由X牛酸酸乳房山分销点提供!


问:在读这个句子的过程中,你被坑了几次?


当然如果你是个敏感词监测AI,现在估计已经死机几十次了。但就算是人类,也时不时会被坑一下,就像昨天这个“小学生活好还是初中生活好”的无辜(?)问题一样……



好啦不要自责了,并不是因为你比较污,而是因为我们大脑就是这么处理语言的——对待短语和句子的时候,大脑采用“深度优先”,会抓住它看到的第一个讲得通的意思,而不会把所有意思都想到了之后再抛弃掉多余的。



读个句子而已,有什么难的?


还真挺难。


所有的人类语言,看起来都是一个字接一个字接一个字,这么写下去。但其实根本不是这样。比如这个句子:


他说他给了在他广州拜访父母的十天期间遇见的穿连衣裙的女孩一块糖。


这是个很糟糕的句子,没错,但是个合乎语法的句子。你在读的时候会发现自己不得不在各个成分之间跳来跳去,直到理清全句的关系。实际上当你读懂它时,它在你的脑海里已经不是简单的一堆词排成一列,而是变成了一棵层层嵌套的树:他说 ( 他给了 ( ( 在他广州拜访父母的十天期间遇见的 ) (穿连衣裙的 ) ) 女孩一块糖 )。


假如你真的去学相关的领域,那么你会每天和下面这样的树打交道:



把句子变成树,就要面对歧义——比如分词


但一个句子变成树有很多种变法儿,很容易出岔子。汉语就有一种常见的出岔子方式:分词。


请大家做如下练习:

我们中出了一个叛徒

治疗性生活方式改善

从小便养成阅读习惯

二十四口交换机

我的头像牛逼吗



(理论 上 讲, 汉语 的 分词 问题 可以 通过 所谓 “词式 书写”来 解决,就 像 上 图 这样。但是 首先 词 的 定义 就 不 明确,而 分词 对于 弥补 口语 和 书面语 的 鸿沟 也 是 杯水车薪,何况 人民 群众 的 脑补 你 想 拦 也 拦 不住,因此 这 基本 还 停留 在 理论 探讨。)


这么多种可能性,怎么区分哪一种是对的呢?


假如我设计一个程序去做,那么有两种做法。一种是,每到一个歧义点,就记住它,然后按照两种歧义分别解释。下一个歧义点再分开。到最后把所有可能解释都列出来,比较优劣。


另一种是,到了一个歧义点,先蒙一个看起来像的,下一个点再蒙一个看起来像的,走通了就走通了,走不通的时候再重来。


用程序员的话,第一种叫“广度优先”,第二种叫“深度优先”。




面对句子,人脑是深度优先的


处理词的时候,人会立刻联想到它的所有或者至少大部分含义,然后再挑选,这就是典型的广度优先。比如有这么一个著名的实验:


“传说政府大楼多年来一直饱受问题困扰,所以他发现屋角有蜘蛛、蟑螂和别的bugs的时候没有丝毫惊讶。”


bugs是个多义词,可以指虫子,也可以指窃听器,还有软件的错误。你读的时候可能没有意识到这个词的多义性,但是内隐联想测试发现,你读完这句话后对“蚂蚁”和“间谍”这两个字的反应都变快了。间谍和虫子无关,和窃听器有关,说明你的大脑一定是想到了窃听器的含义,但综合比较之后,抛弃了。


但是人处理句子却是深度优先。我最喜欢的一类句子,被称为“花园小径句”。读读这个:


The horse raced past the barn fell.


你一开始读的时候,一切正常:“马跑过了谷仓……”。到最后一个词,哎呀?不通了。赶紧回去重来。哦,原来是“那匹跑过了谷仓的马摔倒了”。或者如果你没能反应过来,就会觉得这个句子的结尾多了一个词。


这就是一个典型的被坑了的例子。这篇文章的标题也是一样,如果你一开始读“对”了,那也无妨;但如果一开始就分成了“小学生 活好”,而不是“小学 生活 好”……你就不会像对待词那样,想到第二种解答,比较哪个好,抛弃掉不好的那个。你会直接意识到那个不好的意思。你个臭牛忙。



什么时候会被拐跑?


为什么人处理句子不能也广度优先呢?


一个可能的原因是,句子的可能性太多,人脑塞不下所有场景,所以逮着一个是一个。理论上讲我们可以构筑出很多合乎“语法”的句子,但实际上我们除了死的语法,还有活的使用规范,这些规范帮助我们在日常生活中避免了大部分的歧义句。所以采取深度优先,大多数时候都没有损失,反而大大提高了效率。


但这些规范是什么?我们不完全清楚,但可以肯定的是,“相配”的字词在其中起了重要的作用。比如下面这个句子:


The cotton clothing is usually made of grows in Mississipi.


来个内心独白的话,大概是这样的:


“棉衣通常是用生长做的……啥?不对不对,生长——生长在密西西比?哦,是棉花生长在密西西比,衣服通常是用这些棉花做的。‘通常用来做衣服的棉花生长在密西西比。’这样才对。”


这个句子坑人就坑在“棉花衣服”是个常见搭配。同样,“小学生活好还是初中生活好”里面,“活好”对于,咳咳,某些人来说也是常见搭配……如果像,咳咳,人家这样都没怎么见过这个词的,虽然这是一个符合语法的表述,但也是绝对不会在第一眼就想到那个意思的!人家才、才不是那样的人呢!对吧?对吧。


所以结论:还是你太污了啦。(编辑:窗敲雨)


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
小学到初中最全语文基础知识及答题技巧
浅谈对提高识字效率的思考·人教版小学语文教材·人教版小学语文教学·课程教学研究·人民教育出...
我的录音稿III. 19. 病句及修改基本知识
小学与初中英语的不同之处,这样学习有目的
病句辨析200例详析详解(二)
特殊类型病句辨析技巧
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服