打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
基于学情数据的精准教学——在腾讯精准备教学论坛上的发言
基于学情数据的精准教学
——在腾讯精准教学论坛上的发言

各位教育界同仁:

一、一个老教师的自我追问

 
在座的有大中小学的教师,有教学研究人员,还有腾讯教育这样的为教育提供服务的企业,在我看来也算是教育人,所以我称各位为教育界同仁。
我向大家汇报的是北京市教育规划重点课题“认知数据支持下的个性化、自适应学习的案例研究”和北京市教委信息化双百示范课题“大数据与人工智能支持下的语文个性化学习”的部分研究成果。
我是一个语文教师,这几年我一直致力于语文教学的科学化,一直致力于信息技术与语文学科的融合。
我深知,对于信息技术,语文教学界有不少人是有疑虑的。诚然,语文学习与教学规律都有机器或技术无法融入的一部分,意会性、想象力是语文学习独有的魅力。但我们却不得不面对这样的尴尬,那就是语文教学内容和语文素养成长的不确定性。比如说,当家长和学生问我们语文应该怎样学时,我们除了说“多读多写”还能提出什么建议呢?
教育改革大潮风起云涌,“变教为学”成为主流看法。“从关注教到关注学”“以学定教”这些观念逐渐成为教育改革的共同追求。但理念提出来容易,真正落实却难找路径。
很多时候,我们应该追问自己:
1.我们能说清楚有哪些学生的哪一部分知识没有掌握吗?
2.我们能说清楚一堂课上下来,学生掌握了多少内容吗?
3.我们能说清楚影响学生会某个知识或不会某个知识的因素或对某个问题的认知程度吗?
4.我们能说清楚自己学生的思维特质吗?谁更敏捷一些,谁更沉稳一些?谁反应慢一点?谁必须要多讲几遍才能会吗?
5.我们能说清楚对待不同的学生要采用何种讲授策略,提供何种训练内容吗?
6.我们能说清楚学生的某种学习行为或学习特征的意义吗?
7.我们能否有针对性地对学习行为或学习特征做出相应的分析?
如果都能清晰准确回答这些问题,相信我们对学生的了解就很深入,我们的教学亦会有成效。但不得不遗憾地说,这些问题并不是那么容易回答的。


二、回应追问要靠精准把握学情
 



其根本原因,还在于我们缺少对于学情的精准把握。
不可否认,优秀的教师经过多年积累,对学生状况有相当敏锐的感知能力;但这种感知能力往往缺少确定性,并且这种经验也很难传承与复制。因此,把优秀教师的经验精确化,是教学走向科学的重要一步。
因而,对于认知数据的采集和分析就变得尤为重要。
什么是认知数据,以我一个一线教师朴素的认识,认知数据指的是学生在学习过程中体现学习特点的数据,包括认知内容数据和认知行为数据。
其中认知内容数据可以分为认知过程数据和认知结果数据,前者指学习过程中的问答、讨论、笔记、演算、练习等学习内容,后者指学习过程结束后的作业、作文、练习题解题成果等。而认知行为数据则指学习过程中外显的一些动作,比如落笔轨迹、用时节奏和各种微表情。
我们研究的课题名为“认知数据支持下的个性化、自适应学习案例研究”。所谓“认知数据支持”,是指我们所有的教学设计不是仅凭或者只凭教师认知,而是要将对认知数据的分析作为依据。
我们这些语文老师非常看重语文教学的意会性的一面,事实上,语文学科的确有大量意会的、模糊的内容,但不等于我们不去追求确定、不去追求准确——有时候我们的一些语文老师还以我们这个学科“只可意会不可言传”为荣。
如果这种状况持续下去,我们的语文教学就永远不可能科学化,语文教学的低效亦将长期在。
事实上,学生的语文能力到底是怎么成长的,学生做某一道语文题何以做对,我们并不是很能说清楚。同时,这个学生为什么要采用这种学习方式,那个学生应该学习何种内容,我们也很难一一明晰:归根到底,我们的语文教学缺少确定与精准。有效的个性化教学一定是精准与确定的,而要想确定与精准,则必须有认知数据来支持。
在这里,我想提一个提法,就是认知数据学科化:数据应该在一定学科情境下描述。数据不仅仅是数字,数字要在学科情境中描述学生在学科学习中的特点。
三、语文教学的精准化

 
具体到语文学科,语文教学和语文学习的精准化大体可分成三维度:学习目标的层级化、学习内容的个性化和学习方式的适宜性。
先说学习目标的层级化。
一直以来,各个学科似乎都有分层教学,唯有语文学科很难进行分层教学,因为分层的依据不明显。其他学科按分数分层就可以,讲的内容难度很好控制。而语文就很难确定分层教学的内容——低分的就一定要讲字词,高分的就一定要讲阅读写作?还真不一定。或者即使分层了,真正教起来,教师往往教的是同质化的东西,看不出层次来。
那么语文学习目标的层次应该如何划分呢? 这就涉及精准教学,涉及对认知数据的分析了。
比如两部分学生,同做一篇阅读,平均分有差异,那他们的分数到底差在哪里?两个班学生的讲评内容和训练巩固内容是否一样?
过一会儿,我会给大家举一篇模拟测试中文言文阅读的例子,我们可以从数据中看出两个班在教学上应有的不同。
再说学习内容的个性化。
语文教学内容的确定一直是教学难点。更多时候,我们对于教学内容的选择都是基于“教师觉得”,往往是教师认为什么重要就教什么,甚至是教师喜欢什么就教什么,几乎很少思考学生对所教的内容是不是能接受。
事实上,无论是目标还是内容,教师在教学时都要有合理的起点。而合理起点的确定,必须基于教师对于学生认知的了解,也就是认知数据的把握。理论上每个学生的认知水平和认知特点不一样,每个学生的学习起点也应该不同。
再有就是学习方式的适宜性。
没有哪一种学习方式先天具有不可动摇的地位或者就优于别的学习方式,学习方式要和学生的认知特点紧密匹配。
所以说,所谓精准教学,要有精准的目标、精准的内容、精准的方式,归根到底,要针对精准的对象。
四、基于认知数据选择精准教学内容
 

今天,因为时间关系,我重点谈谈基于认知数据选择精准教学内容的问题。
提到教学问题,我们不妨对于语文学科发出一个灵魂拷问:刷题有用吗?再进一步问,我们平时所讲的语文答题模板有用吗?如果没有用,那语文能力,也就是语文分数是怎么上去的?如果没有用,我们语文课上特别是语文复习课上应该教什么内容?
我的学生曾经为我写过一篇文章,题目是“何老师的不为”。所谓不为,就是我不在课上教所谓答题技巧,并因此为一些同学不理解,作者很为我抱不平。确实,有不少学生想在语文课上得到所谓的答题模板,也有不少语文老师迷信这些模板。其实,这些模板根本没有用,但问题是如果不讲这些模板,我们又如何带着学生复习呢?
比如这学期我们一次月考考了一篇文言阅读《公默先生传》,四道选择题一道简答题,我们对比一下年级中的普通班(A班)和文科实验班(B班),其中两道选择题两个班平均分相差无几,另外两道选择题满分3分,平均分相差了1分,简答题6分满分,两个班相差了2分多。但这些数字是不是真能反映两个班学生在文言理解方面的学习特点呢?是不是能反映出这两个班应该各采用何种教学内容和教学方式呢?
只看这些数据很难做到。
众所周知,文言文阅读主要考查对于文言文本语句含义的理解。但几个选择题并不能反映出学生是不是已经掌握了考查篇目的所有语句,也不能反映出学生是否理解考查篇目的意思。如果只是满足于把题目答案弄明白而不是致力将整个文言文段弄懂,学生就不可能在一次测试中有更多收获,从而也无从提升文言阅读能力。
五、精准内容的获取途径——拆解

于是我想到了一个词“拆解”。
中考和高考都是学段的终极测试,它给学生一个评价结果。而这个结果是由一个个学习过程累积的,因而我们需要大量的形成性测试来诊断甄别我们的教学效果。
祝智庭先生在介绍精准教学理论曾指出,精准教学最大的价值在于能够精准地针对学生在学习某一知识或技能的具体问题进行教学。 然而,学生表现出来的问题,并不一定是要解决的问题,而可能是由于其子问题造成的。在子知识或技能方面只有更多的实践并获得流畅的学习表现才能使学生“突破天花板”,实现更高级表现的流畅度。
具体到语文学习,学生某个阅读题无法答对,往往是由于影响阅读题理解的某些因素导致,因此,对于获得正确答案的思维过程应该做出拆解,拆解题或者是针对学生可能产生的思维障碍通过题目做提示,或者是诊断学生在做题过程中的思维障碍,总之就是通过拆解的方式使学生的思维过程得以外显,从而精准确定教学目标和教学内容。
比如我们可以出下面一道题:
例:对曰:“捐弃骨肉,佯狂而去,令世人不复顾忌。此策之次者,先生能用之乎?”
A.放弃;疯癫狂妄
B.抛弃;假装疯狂
C.放弃;假装疯狂
D.抛弃;疯癫狂妄
这道题将语句中的关键词提出,如果学生没有答对,则说明学生对这一语句理解不到位,同时,至少说明学生对一些关键性词语没有掌握,在教学时,就应该重点讲授相关词句。
总之,我们希望通过拆解题——这篇文章主要是拆解文言词语和语句,来达到以下目的:
1.精准定位知识弱点
2.精准定位训练对象
3.精准反馈教学效果
这类拆解练习一般做两遍。第一遍在于诊断,根据诊断结果确定教学内容;第二遍在教学之后再做巩固,借以反馈教学效果。
通过拆解主要获得以下数据并有相应的用途:
1.知识内容数据,测试学生掌握了什么,即明确教学内容;
2.能力水平数据,测试学生的认知层次,即明确教学目标;
3.完成用时数据,测试学生的熟练程度,以优化教学节奏。
六、利用腾讯作业获取的拆解题数据分析案例
 

在测试中,我们采集了每个学生每道题的成绩,每个学生每道题的用时,全班学生每道题的平均成绩,全班学生每道题的平均用时,全班学生的总成绩和总平均用时。
利用腾讯公司墨水屏中的作业君平台,我们特别提取做题用时这个数据,对于学生的思维敏捷性,做题的熟悉程度,进而对学生的学习风格与特点得以管窥。
下面我们先看一组对比。
这是一组A班(普通班)和B班(文科实验班)的平均成绩与用时对比。
首先是平均成绩与平时用时对比:
学校: 北师大二附中
任课老师: 老师1
布置对象: A班
起止时间: 2022/03/29 22:32 - 2022/04/02 23:59
完成人数: 37/38
已批人数: 37/37
平均分: 51.7
最高分: 69
最低分: 15
平均正确率: 56%
平均用时: 17分钟


学校: 北师大二附中
任课老师: 老师1
布置对象: B班
起止时间: 2022/03/27 21:09 - 2022/03/29 23:59
完成人数: 32/38
已批人数: 32/32
平均分: 57.4
最高分: 69
最低分: 42
平均正确率: 62%
平均用时: 12分钟

A班的平均分51.7分,B班的平均分是57.4分,A班的平均用时17分钟,B班的平均用时是12分钟,可见在本篇文言文阅读中,文科实验班成绩与做题效率都高于普通班。如果再将两个班每道题的平均用时做一个对比,我们发现9班第1题快于13班,两班本题正确率差不多,说明13班进入学习状态稍慢。但后来因为基础稍好,逐渐速度越来越快。
这是两个班各题平均用时对照表
题号
A班用时
B班用时
1
39
46
2
35
32
3
24
15
4
15
11
5
20
13
6
22
16
7
37
20
8
25
16
9
15
10
10
19
17
11
17
14
12
30
24
13
90
62
14
57
55
15
28
21
16
25
16
17
42
21
18
52
34
19
25
12
20
21
10
21
30
14
22
17
16
23
90
52
24
58
37
25
36
19
26
20
16
27
20
27
28
20
9
29
27
16
30
38
24
31
59
31

再细致分析各题用时,我们发现两个班用时差距最大的是这道题,

25题:闻非,反背复憎,诋笑纵横。
A.表面上在别人那里有好的口碑,实际上别人都在背地里非议,反复咒骂、憎恨,甚至肆意诋毁、讥笑。
B.听到别人的好话表面上奉承,暗地里非议,转过身又变成憎恨,对别人肆意地诋毁、讥笑。   
C.在别人口中听到一些善言善语可曾想别人只是表面上称赞,背地里非议,反复咒骂、憎恨,甚至肆意诋毁、讥笑。      
D.听说某人是善良的,表面赞扬他,背地里数落他的缺点,憎恨他甚至肆意地诋毁、讥笑他。
这道题A班用时90秒,B班用时 60秒;并且我们发现文言语句翻译类的题A班用时比B班用时的差距都更大一些。但这类题的正确率却并没有体现B班有多大的优势。由此似乎可以得出结论,阅读速度B班明显快于A班,因为B作为文科班,相关阅读任务明显多于A班,而平时A班学生对于文言语句细读、翻译关注得不够,因而快速度读句,快速建构语义结构的能力就稍显得差一些。B班的在本次阅读测试中的敏捷性高于A班。可见学生阅读的敏捷性与学生的积累水平正相关。
更有意思的对比是同一个班在教学《公默先生传》前后同题测试的对比,这个对比主要在于反馈教学效果(第二次测试在讲课后两天进行)。
两次成绩综合比较如下:
第一次
学校: 北师大二附中
任课老师: 老师1
布置对象: B班
起止时间: 2022/03/27 21:09 - 2022/03/29 23:59
完成人数: 32/38
已批人数: 32/32
平均分: 57.4
最高分: 69
最低分: 42
平均正确率: 62%
平均用时: 12分钟

第二次

学校: 北师大二附中
任课老师: 老师1
布置对象: B班
起止时间: 2022/04/01 07:46 - 2022/04/03 23:59
完成人数: 36/38
已批人数: 36/36
平均分: 68.3
最高等第: A
最低等第: D
平均正确率: 73%
平均用时: 7分钟
综合对比显示,第二分数明显增长,用时明显减少。说明此文教学已产生效果,学生听课状态不错。
这是针对全班整体而言的。如果深入到个体,则可以发现很多值得关注的地方。
首先关注以下表格:

通过这个表格我们发现,多数同学成绩提升、用时减少。其中36号同学第一次诊断时,其得分是54分,而之后得分就达到84分,其用时由9分钟变成了2分钟,可见其听课效果非常好,并且牢牢记住了,对于本文有了更多正确领悟,如果多次在类似测试中获得此种成绩则说明这个同学的学习潜力是很大的。
但我们也会发现有些同学没有进步,甚至有退步。
比如25号同学,2、6、11、14、17五个题在第二次测试中都不正确,甚至有两道题是在前次测试正确的情况下,第二次又错了。
而25号同学的用时却大大减少。可见其听课效果极其不好,而第二次做练习又有一种急切心态,也没有认真思考。对照她平时的表现,这个结论是可靠的。


用时
2
6
11
14
17
25号
27
0
0
3
0
3
25号
7
0
0
0
0
0

应该说,多数学生在第二次测试中用时减少,正确率提高。而17号同学用时并没有变化,但成绩却大幅提高,可见17号同学听课效果很好,而两次用时都比较短,说明她两次学习都保持着高度专注与相同节奏,并没有因为掌握新知识后有意提升速度。对照平时对她的观察,我们可知她是一个语文基础好,学习稳定踏实的学生。
总之,通过对次练习得分与用时对比,我们可以发现一些需要或可以关注的特殊学生。这些学生的听课效率、知识疏漏和学习特点,都可以两次数据对比得到提示。

更值得关注的现象是同样一道题,一些题目在二次测试时成绩不进反退,这引起我们对自身教学的反思。
比如下面B班两次对比的表格:

我们发现第2题,第6题,第21、22、23题等题的第一次测试答对人数都没有过半,但第二次测试都有大幅提高,说明对这些语句的教学取得了成效。需要引起关注的是这些题目仍然做错的学生,是因为听课不专注,还是听课没落实或者是其他什么原因导致再次犯错?这就需要做相应的调研。这些数据至少提示我们二次出错学生的学习效果并不理想,在后续教学中要有相应的关注,对这些学生也要有不同于其他学生的指导。
再有值得关注的是与第一次测试相比大面积出错的题。其中最明显的是25题:
对曰:“捐弃骨肉,佯狂而去,令世人不复顾忌。此策之次者,先生能用之乎?”
A.放弃;疯癫狂妄
B.抛弃;假装疯狂
C.放弃;假装疯狂
D.抛弃;疯癫狂妄
这道题正确答案是B,如果选了A或D,则可能是“佯狂”一词不理解,“佯”是“假装”的意思,这是属于文言实词积累方面的问题。如果选了C则可能是“捐弃”一词不理解,“捐”是“弃”的意思,解释为“放弃”或“抛弃”都可以,但在这个语境中,“放弃骨肉亲人”显然不如“抛弃骨肉亲人”更符合语用习惯,这属于词语运用层面的问题,也就是属于现代汉语语用能力的问题。不同选择的学生所要加强的训练内容肯定应该是不同的。而这道题之所以第二遍测试甚至不如第一遍测试,显然与我在教学中对以上内容强调得不够有关。
还有一道23题很说明问题,这是一道语句翻译类选择题:
例:闻非,反背复憎,诋笑纵横。
A.表面上在别人那里有好的口碑,实际上别人都在背地里非议,反复咒骂、憎恨,甚至肆意诋毁、讥笑。
B.听到别人的好话表面上奉承,暗地里非议,转过身又变成憎恨,对别人肆意地诋毁、讥笑。   
C.在别人口中听到一些善言善语可曾想别人只是表面上称赞,背地里非议,反复咒骂、憎恨,甚至肆意诋毁、讥笑。      
D.听说某人是善良的,表面赞扬他,背地里数落他的缺点,憎恨他甚至肆意地诋毁、讥笑他。
这道题我所教的文科实验班(B班)和理科实验班(C班)在两次测试中有明显的变化。
一般来说,我教的C班语文基础与学习习惯要好于B班。在第一次测试中23题C班的正确率是31%,用时是63秒,B班的正确率是19%,用时是52秒,从正确率上看符合两个班实际的学习情况。
在实际教学中,C班先教此文,当时因为一些原因对这句话没有关注,所以学生并没有理解这句话。虽然也有个别同学经过自己揣摩对此句理解有所进益,但整体正确率进步不大,为34%(能够不经老师讲解自己改正的学生也需要特别关注),用时则大大减少31%,说明C班在文言语句理解方面没有大进步,但因为同样的现代汉语选项又读了一遍,速度明显加快。而B班教学时,我已意识到了本句教学的疏漏,讲解了此句,B班第二次测试正确率达到53%,也就是一半以上做对了,时间降到了31秒。这说明对本句的教学起到了一定成效——而另外一半学生没有做对,则说明本题的信息较多,当时的教学或学生课后的落实消化在这些错的同学身上还有欠缺,需要我进一步补救。
两个班一对比,则发现两班教学内容的不同导致了课后反馈数据的明显差异,我针对两个班所做的教学优化内容就应该是不同的。
七、案例分析小结
 

综上所述,我们对于这两次拆解训练的数据主要关注以下维度:题目显示出的学习内容,测试题目的正误率,题目完成的用时,完成题目的具体被测学生。
我们认为,学情数据不仅仅限于测试分数,所有数据必须放在学科情境中来理解,用学科语言来描述。数据放在学科语境中,数据的意义才能彰显,数据产生的原因才能更显豁;而反过来说,学科语境中有了数据,学科教学的分寸才好把握,学科教学才更加精准与确定。
同时,学情数据必须与具体的人来结合,要结合教师对学生长期的观察和教师的教学经验来判断,也就是既有定量,也有定性。只有结合了人来判断,数据才是鲜活而有生命的,而具体对象有了数据标显,对于学生的积极干预才有据可依。
在这次测试中,我们特别关注了做题用时这个数据。事实上,教学用时和学习用时一直是衡量教学效益的重要指标,也是衡量一个学生思维敏捷性、知识熟练程度的重要指标。影响教学用时或学习用时的因素很多,教学用时与学习用时在不同情境下的教与学意义也不一样。但对于用时的这一数据,实践中教师们重视得并不够。
这次我们在数据分析着重关注了教学用时,有赖于腾讯作业君对于作题用时的精准记录,为后续有关教学用时与学习用时的研究提供了基础。
八、本课题组对学生认知数据的关注维度

四年来,我们课题组对于认知数据的研究花费了不少功夫。今天时间关系,我们向大家只汇报其中一小部分。
总体而言,对于认知数据我们主要关注以下两大维度。
(一)认知内容数据
认知内容必须基于学科内容。而关注认知内容意在关注学生的知识结构及稳固程度,关注学生的认识层级,由此确定教学内容。
比如下面一道七年级的语文词语题。
鲁迅先生刚一睡下,太阳就高起来了。太阳照着隔院子的人家,明亮亮的,照着鲁迅先生花园的夹竹桃,明亮亮的。
鲁迅先生的书桌整整齐齐的,写好的文章压在书下边,毛笔在烧瓷的小龟背上站着。
一双拖鞋停在床下,鲁迅先生在枕头上边睡着了。
根据上段材料,能够写出鲁迅书桌整齐,表现其一丝不苟的工作习惯的选项是(
A.整整齐齐89%   B. 压  73%    C.站  47%   D.停  34%
【答案】
A、B、C
我们的分析是,没有选A和B的同学基本的词语积累需要加强,或者是做题不够专注细致。没有选C的则只会关注直接信息,意识不到书桌整齐应该包括书桌各种要素,也意识不到这里为什么用“站”而不用别的词语。
如果选了A而没有选这个选项,则说明这些学生的思维全面性要加强,概括能力需要提升,要加强对每句话的写作意图与表达效果正确理解与分析的训练。
如果选D,则说明学生对于题干理解有偏差,对于一段话中不同语句的表达意图不理解,做题也不够专注细致。要加强基本语句的理解训练,扩大词汇积累,特别是加强对每句话的写作意图与表达效果正确理解与分析的训练。
此题A、B、C三个选项都选出的同学,则说明这些同学做题专注认真,能够理解每句话的表达意图,有读懂不同侧面描写同一品质语句的能力,说明语句理解和揣摩能力不错,概括能力强。建议在本文的写作特点、写作风格,鲁迅与萧红的内心世界方面加强引导,使学生的能力获得更大提升。
(二)认知行为数据
这类数据包括以下内容:
1.落笔轨迹
2.完成用时
3.表情动作
我们通过可以通过学生这些外显的学习动作,推断学生的学习状态、认知风格。我们用墨水屏的腾讯作业君提取一些数据,形成了一些数据,在以下PPT中,供大家参考。
 


九、未来我们的研究方向及我们的研究初衷
 

未来,我们希望能够建立语文认知水准测评题库,分解课标中的语文质量标准,并与技术人员合作,设计语文学情测评平台。
我们之所以做这项工作,是希望为未来人工智能为语文教学赋能做好前期工作。
现在人工智能发展日新月异,语文学科不应该回避技术的发展而应该主动融合技术为自己赋能。当然,人工智能的技术现在还处于初级阶段,诸如智能评阅这类的技术还处于概念阶段,无法真正赋能教学。
除了技术之外,语文学科认知规律,特别是认知数据分析理论和分析体系也都处于初级阶段。我们希望能为这个学科的长远发展做一小点微薄的基础性工作,等到未来技术成熟了,我们能够也同时奉献出有价值的学科认知原理。
我们的力量还很微小,我们的能力也很有限,做这件事,我们也有无数困难。但我们愿意去尝试,有什么条件就做什么条件的事,没有条件,我们也力争创造条件去做。
功成不必在我,只要我们一点一点去,未来语文教学的科学化,一定会有巨大的发展。
感谢腾讯教育,感谢在座各位专家对我们的指导,感谢所有在场的教育界同仁。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
闲聊大语文
基于随班就读学生个性发展需求,构建立体式绘本阅读课程
学科带头人评选活动总结
2017中考评价
基于“表达型”阅读教学的设计
期末考试成绩分析 (案例)
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服