这两天,我跟新浪博客的违禁词干上了。
新浪博友都应该遇到过,发博文时经常出现一个讨厌的提示:“博文存在敏感词,请修改后提交!”
明明是记录生活的文章,明明没有“自由发言”,为啥就发不出去?
更讨厌的是,新浪博客并不像别的平台那样给出具体提示。
哪个词违禁了?你告诉我一声不好么?那样我也好有针对性的去处理啊,大不了我删了那个词。这不是折腾人么?对待用户就这态度?
有耐心的朋友会一边骂娘一边逐字审查,如果文章较长,比如从几千字里找一两个违禁词那可是太麻烦了,弄不好要耗费半天的精力。
盯着屏幕就会感觉文字不美好了,人生不美好了,整个世界都特么的可疑、可恨!
没耐心的朋友索性把键盘、手机一摔,感叹一声:麻烦死了,劳资不发了!
哎……
您猜我是哪种人?
我是第三种人。
我就喜欢挖出这些敏感词来!这跟我的职业经历有关系,我原本是程序猿。
程序猿的代码总是有错误,那些错误称之为bug或虫子,程序猿最痴迷的事儿就是“捉虫”。
呃……这貌似是强迫症吧。
这几天,一直在帮博友们捉违禁词,我从中发现了很多经验、规律,甚至乐趣。
比如给某位博友“找茬”的经历就很有意思。
他发我的文字较长,我用了各种方法才抓到那个违禁字,竟然是“八”字。
这个“八”不能和“字”连在一起用。
我的查找过程堪称魔幻!充满玄学!
我首先想到的是排除法,这是我从抓电台的电视剧里学到的思路,具体应用就是先发文章的一半,如果成功就排除了这部分文字,然后去发后一半。如此循环,直到最终锁定罪魁祸首的某个词。
这个理论没问题吧。我就这样去做了,结果是我怀疑人生了。下面是具体过程截图,咱们可以一起来看看有没有逻辑。
1、发全文,提示有违禁词。
2、截取一半文字来发,成功。
3、发余下的文字,一定失败,对吧?
竟然成功了!!成功了!!
我却成功的懵逼了!我要这成功有啥用?
排除法被这样被颠覆了!我需要冷静冷静。
此路不通了,我换个思路,逐字逐句去找,遇到可疑的敏感的字词就换成xx,最后这篇文章变成了下面的样子:
一次次的尝试后,最终找到了那个神秘的词汇——“八字”。
这个八字敏感词有时候能发出,有时候不能发出,当我观察的时候就会变得异常诡异,我怀疑这是薛定谔的八字。
量子力学领域已经超出了我的研究范畴。对不起了各位,我实在搞不懂其中原因,只能用玄学来解释了。
另一个典型案例是下面的朋友提供的,抓到的结果令我深感意外。我再次怀疑了人生。
新浪博友不妨试试,随意发个博文,内容只写四个字:“往事如烟”。
点发表,成功,没问题,意料之中。
好,接下来我们来个“好玩儿的”。
编辑刚才的博文,或者另行发一个新博文也行,在“往事”和“如烟”之间加入“并不”两个字。
点发表,嗯?——看到没?
——博文存在敏感词,请修改后提交!
意不意外?气不气人?有木有道理?
怎么就违禁了?咋还不让人怀旧了?
我盯着这六个字陷入了沉思。
如果让我端着显微镜从鸡蛋里愣是挑骨头的话,我只能挑这个“烟”字了。
黄了么?——我这烟不是烟花柳巷的烟啊。咱可别乱联想。
俗了么?——电梯里贴着“禁止吸烟”咋不违禁呢?我这也不是抽烟的烟啊,我是烟雾的烟。
涉毒么?——这都2022年了啊,咱得与时俱进啊,要放在1840年你说我违禁我也认了。
那,逼得我没法,我只能把排除法再搬上来试试了,说不定这次就显灵了呢。
排除了前面的原因,还剩啥?
——是这句话有问题,不是某个字的事儿!
——既然不涉及黄dd,那只能是涉Z了。
对不起啊语文老师,我只能用科学发帖法把敏感词和谐了。
对不起啊各位读者,咱们意会精神就得了。
问题来了?这句话到底肿么了呢?
我猜,这是某篇文章的标题又或是某个书名,被某部门点名拉黑禁止再传播了。
到底是啥呢?
我的研究到此结束。
我可没说让你们去搜啊。
联系客服