打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
汉语文本指难针:智能技术助力国际汉语教学

这组漫画说出了留学生的心声——汉语,难学!

老师也会碰到同样的烦恼,比如课本上的课文、文章太难。听克爷爷(Krashen)的话,说好的“i 1”呢?这样的课文、文章,难教!

对外汉语“老司机们”不会发愁,兵来将挡、“文来我改”,我改还不行吗?

“老司机”的做法是正确的打开方式。可是,万一我不是老司机,既想省时省力,又要确保改编得准确,光靠教师们人工修改是难以实现的。

金檀博士和李百川博士主持研发的“汉语文本指难针”,运用语言数据智能技术,以“国际汉语教材语料库”为数据基准,专门为国际汉语文本改编提供文本定级改编反馈字词档案等多重功能。帮助教师摆脱教学素材与学生水平不匹配、人工文本改编与期望难度不对等的困扰。让我们一起学习如何使用“汉语文本指难针”吧!

功能1

文本定级

第一大功能就是给输入进来的文本先进行一番“评价”!自古以来,“评价”这回事儿,公说公有理,婆说婆有理。所以,还得先确定“评价”背后的标尺。

标尺1:

参考中华人民共和国教育部、国家语言文字工作委员会编制的《汉语国际教育用音节汉字词汇等级划分》

标尺2:

   参考孔子学院总部、国家汉办编制的《国际汉语教材通用课程大纲》

有这两件权威标尺,快打开“汉语文本指难针”主页面,输入文本吧!

(网址:http://www.languagedata.net/editor/)

在“文章”的方框内输入文本,迅速填完屏幕下方的验证码,点击蓝色按钮“开始分析”,马上看结果!

我们输入一篇文本后,得到了这些结果:文本的难度值(用“LD”表示)、文本等级、平均句长、最长句长、文本长度等。

刚才已经聊过“定级”的标尺,现在来说说有了标尺以后,“汉语文本指难针”是怎么做到的。

“汉语文本指难针”根据汉字等级、词语等级、句长等特征,建立计算模型,经过机器学习训练,模拟出对所有国际汉语文本的定级算法,最终用LD值来表示。

       LD取值范围是1-4:

                     “1”代表难度最低,

                     “4”代表难度最高。

以上术语翻译出来的意思就是:LD值是一个相对值,从1到4,共分6级,和《汉语国际教育用音节汉字词汇等级划分》里边的6级一样。对外汉语“老司机”们,很快就联想到HSK考试的6个等级。没错儿,有点儿相似。再拉近一些,LD值和《国际汉语教材通用课程大纲》也能划等号。

另外,除了数字型的LD值,工具还提供坐标图,把LD值和两个权威大纲里的等级水平匹配起来。

温馨提示

分析结果里出现的“平均句长、最长句长、文本长度”都是用汉字作为计量单位的,比如“平均句长=25.12”,表示平均句长有25.12个汉字那么长。

功能2

改编反馈

改编反馈,是一项人机互动工程。

那么这其中机器做了什么?

  • 自动分词:文本里的词和词自动空格分开。

  • 自动标词:标注词语的等级(用绿等标涂,简称“彩虹词”);

  • 自动划句:最长的一句用下划线标明;

  • 自动计频:右上角标显示所有超纲词在国际汉语教材语料库中的频次;

  • 自动链接教材库:所有被切分开的词语,点击后,可自动链接到国际汉语教材语料库,查看该词语在教材语料库里的例句。

(文末有彩蛋!)

机器做了这么多,人还要做什么呢?

人只需要做三件事:

  • 勾一勾:在“彩虹词”一栏勾选想要显示的词语,可以全部勾选,也可以只选超纲词或者高级词。

  • 看一看:点击想要查看的词语,系统自动链接教材语料库,查看该词语在教材语料库的用法、例句。

  • 改一改:页面下方,显示一个类似word的操作框,如果觉得哪个词不好,可以人工替换,比如把“忍俊不禁”改成“忍不住大笑起来”。

改完词语或句子,想要看看人工修改提高还是降低了难度,还可以点击word操作框右下角的蓝色按钮“文本定级”,将重新计算一遍修改后的难度。

功能3

字词档案

返回LD值坐标图页面,点击坐标图下方右侧的“字词档案”,可展示出第三大功能来。

因为 “汉语文本指难针”以汉字、词语等作为主要特征,所以第三大功能主要显示“汉字档案”和“词语档案”。档案里,总结出来的种类有:初级字/词、中级字/词、高级字/词、更高级字/词、专有名词、超纲字/词。统计的角度是字/词数、字/词种数、字/词分布百分比、累积分布百分比。

这些统计是针对文本全篇的,如果想要查看某个字/词的具体统计,还可以点击字词档案页面下方的“汉字列表”或“词语列表”。列表以逐字逐词的方式呈现出来。

看了上面三大功能,对你来说,

汉语文本指难针”就不再陌生了。

当然,系统还有隐藏的

 “黑科技”

举个栗子,比如彩虹词,红色词表示超纲词,可有的老师认为,这个词不算超纲吧?难道是系统有bug吗?别担心,红色词右上角已经标好了数字,老师们可以比较“巴西人”和“可乐”的上角标数字大小(数字表示使用的次数),虽然同是超纲词,但哪一个更生僻,就一目了然。

再举个栗(cǎi)子(dàn),刚才介绍的第二大功能“改编反馈”,除了展示缤纷的彩虹词,还可以自动链接到国际汉语教材语料库。


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
汉语中最常用的100字是哪些知道吗?打印这个电子字帖练起来
汉字够用吗?为什么几乎没有再发明新的汉字了?
一直把陶华碧念成陶碧华的不止我一个!
中文词汇材料库合集
汉语盘点:2017十大网络用语发布
专家访谈 | 沈国威教授访谈3:词汇史研究方法
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服