打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
考试背后

本文为麦可思专稿。


为了挤过高考那根独木桥,我从小经历过学校里大大小小的测验,参加过市里组织的各种名义的竞赛。后来学了教育学的我知道,这些考试有一个专有名词,叫“评价”。


随着高考升学选拔方式的多元化,经济水平上升所伴随的海外留学人数的增加,以及不再以上大学作为人生唯一选择的价值观的转变,现在的孩子似乎不用去挤独木桥了。但是要学的东西比以前更多,如钢琴、舞蹈、书法等,考试(评价)方式也变得多元,压力也更大。


知其然更要知其所以然。接下来就让我们看看这些考试(评价)背后的机理及深意。


直接评价与间接评价


日本学者山田礼子把评价分为“直接评价”和“间接评价”。所谓直接评价,就是通过让学生对自己掌握了的知识以及技能的表达,对学生的学习成果进行的直接评价。比如,大学教育中常用的“考试”这种形式,或者根据学生交的论文报告来给成绩等,都属于直接评价。与直接评价有关的日本的大学教育改革是“GPA”(Grade Point Average)制度的普及。


所谓间接评价,指的是通过让学生回答与学习行动及自我认知有关的题目,对学生的学习成果进行评价。比如,“你最近一周学习多长时间?”借助学生的自我申报把握他们的学习状况。这类评价大多数是以集体为对象,以问卷调查的形式进行。


比如国内大学教育界人士熟知的美国印第安纳大学开发的NSSE、加州大学洛杉机分校开发的CIRP、CSS,以及日本的“全国大学生调查”(原东京大学教授金子元久现率领团队进行的调查)和“大学生的职业意识调查”等。


日本文部省一些关于大学教育改革的政策就是基于“全国大学生调查”的结果而制定的,如2008年发表的中央审议会答申就在资料中直接引用和参照了全国大学生调查的数据。


近些年,因为IR(Institutional Research,即把校内的调查数据用于管理决策)的兴起,包括京都大学在内的部分大学纷纷成立IR室(除了作为研究机构的高等教育研究开发推进中心的教育测量部门以外,在校长下面设立了IR推进室),又增加了人们对间接评价的关注度。


评价背后的两种范式


区分直接评价和间接评价之后,为进一步更好地把握评价,我们来了解一下评价背后的机理。一般来讲,评价可以分为基于心理测量学范式的评价和与之相对的替代性评价范式。这里所说的替代性评价,不是单纯字面意义上的对标准化测试的替代,而是可以理解为除标准化测试以外评价方法的代称。


两种评价范式的不同见下表。



接着看评价目的,心理测量学范式的评价多是实现说明责任为目的的评价,主要目的不在于发现及解决问题,而是尽量让问题点显得不那么扎眼,尽量让评价结果显得好看。比如大学进行的评估,多是为了应对检查,实现对社会、对公众的“说明责任”(虽然政府要求的本意在于促进大学的教学改善)。


替代性评价范式,多以改善、技能提高或学生成长为目的,会尽量把问题点(明确)摆出来,以便后面进行改善。比如医学领域有OSCE(Objective Structured Clinical Examination)这样测试实际临床技能的考试,在日本是医学院的学生去医院实习前的一个必经阶段,包括锻炼实际的听诊等技能。


由于心理测量学范式是为了实现说明责任或者进行质量保证,多以集体为对象,而后者的替代性评价范式多是为了进行教育教学的改善,帮助学生成长或者指导学生,所以多以个人为对象。


在评价机能方面,心理测量学范式多属于总结性评价,而替代性评价范式多属于形成性评价。在评价数据使用方面,心理测量学多用定量数据,比如问卷调查,而替代性评价则多使用质

性数据。


在评价所使用的场景中,前者多是脱情境的,而后者多嵌合于一定的情境。比如,学生调查可以让学生在教室里以纸质形式回答,也可以让他们在寝室通过网络回答,问题设置方面也多与具体情境不相关。


而前面提到的OSCE测试,则会有一个病人来看病这样一个虚拟情境在。在评价主体方面,前者多是评价专家开发出来,多被政策制定者使用,而后者多是一线的教育实践者在使用。具体的评价方法,前者有标准测试、学生调查等,而后者则有真实性评价、档案袋评价、表现性评价等。


最后需要注意的是,这两种范式属于知识理念型,在实际运用中,很多不能单纯地进行区分,多是混合的形式。比如,大学生调查中也会有访谈等质性数据的使用,比如在教育改善及指导中,也可能会使用问卷调查(定量数据)先了解学生的学习兴趣。


替代性评价的方法


关于替代性评价,上表主要列举了表现性评价、档案袋评价和真实性评价。其中,表现性评价是在某个特定的情境中,对学生使用各种各样的知识和技能所进行的作品和表现直接评价的方法。


比如,钢琴比赛中,选手弹一首曲子,评委老师进行评价,这是表现性评价。大学教育中,学期末不是通过笔试,而是对学生提交的报告进行评价,这是表现性评价。毕业时,对学生的毕业论文或毕业设计进行评价,准予学生毕业,这属于表现性评价。


在此过程中,老师的主观性比较强,如果使用量规对学生的论文或作品进行评价,这时又可以称之为量规评价。除了可以用于评价论文外,量规评价还可以被用到课程改革中,比如原来曾介绍过日本关西国际大学全校导入量规评价的例子。


注:


量规是含有评价视点的一种评价工具。打个比方,比如对论文进行评价时,可以从逻辑性、文章构造、错别字三个角度,进行高、中、低的层级评判,这样组合起来的一个评价工具就是一个量规。


档案袋评价是依据档案袋中收集的资料,对学习者的成长过程进行评价的方法。比如日本的金泽工业大学运用电子档案袋,对学生大学四年的学习生活进行评价和支援。


真实性评价是以真实的任务为基础的评价。比如在某个课堂设计工作坊中,几个同学组成小组一起去设计一堂课,对所设计的这堂课施行的评价就是真实性评价。或者在使用PBL(Problem/Project-Based Learning)的教学法中,对最后学生完成情况的评价就属于真实性评价。


还有前面提到的OSCE测试,蓝野大学(培养复健师的大学)就将OSCE测试和小组反馈结合起来,形成了“OSCE-R”(reflection)。具体来讲,在OSCE测试中,由学生对模拟患者进行诊断练习,旁边有教师进行评分,此过程会以录像形式被记录下来,接着在小组反馈环节,小组成员互相对录像里各自的表现进行评价的同时,提出问题和改善方法。


关于这三种评价方法的区别,从概念上来看,区别只在于“评价的焦点在哪里”。比如,表现性评价,聚焦于某情境中的表现及结果。档案袋评价,聚焦于档案袋中所收集的一定时期的成长过程,可以是一个学期、一年或者大学四年。真实性评价,焦点在于评价情境和评价课题的真实性。


在实际生活中,这三者往往是相互交叉的。比如,在表现性评价里,如果使用的是真实评价任务,可以算作真实性评价。在大多数情况下,真实性评价采用的是作品或者实际表演的形式。此外,在档案袋中,既会有客观测试的答案及分数,也会有作品或者演出资料。


上述关于评价的分类及范式可以归结为下图。



小结


以上是对评价的范式和方法的一个理念型的归类,主要来自日本高等教育学者松下佳代的整理归纳,其实现实中的评价更复杂。介绍这些,我想可以帮我们更好地理解自己(大学管理者)所实施的或者所经历的评价(学生),至少知道任何一种评价方法都不可能完美或者涵盖所有。


主要参考文献:

[1] 松下佳代 . 通过表现性评价所进行的学习质量评价——基于学习评价的构图的分析 [J]. 京都大学高等教育研究,2012(18):75-114.

[2] 松下佳代 . 作为学习成果的能力及其评价——使用量规进行评价的可能性及课题 [J]. 名古屋高等教育研究,2014(14):235-255.


如何让教评的作用最大化? 丨 灼见

这所大学踏出了教学创新的第一步,结果却有些意外

学生也来支持教师发展?

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
表现性评价(Performance As...
《课堂教学评价》
形成性评价的类型
什么是表现性评价?
真实性学习 | 对学生表现给出评价,就是表现性评价吗?这个研究中心给出的答案是……
以表现性评价培养“家国情怀”
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服