原文信息:
Yawen Cheng, Dongmin Kong, (2023). Are female teachers more likely to practice grade inflation? Evidence from China, China Economic Review, Volume 80, 101987.
图片来源:
自摄
一、问题提出
成绩是教学评估的最客观和直接的指标,应该能够准确地反映学生的表现和教师的质量。但是,近几十年出现了学生成绩越来越高的现象。在过去的50年中,美国大多数大学的平均成绩显著提高,从1960年的大约2.5分提升到2006年的4分制中的3.1分;在加拿大、法国和瑞典等许多其他国家也观察到了类似的现象。然而大多数教育工作者认为成绩提高并不是由于教学质量或学习技能的提高所致(Chowdhury, 2018)。在学生学习质量没有提高的情况下,学生的获得的平均成绩却上升的现象被称为分数膨胀。
关于分数膨胀的成因尚未得到充分研究,目前的研究多为描述性统计,且主要集中在高等教育层面的分数膨胀上。目前研究中导致分数膨胀的原因主要有:(1)不同课程的差别:有些课程的教师不愿意花太多时间在教学上也不愿意揪着低分学生不放,因此通通高分通过,皆大欢喜;(2)为了学生心理健康:有些教师觉得现在学生面临的学业压力和社会压力很大,给高分可以使学生的心理感受良好;(3)为了教师工作表现评估:学生的分数当然由教师决定,但是教师的工作表现情况在很大程度上取决于学生的打分。也就是说,教师可能出于工作原因(如工作稳定性和经济回报)而实行分数膨胀。这种情况在女性教师中更为突出,因为女性在劳动力市场中会面临歧视和更大的不确定性(Jewell & McPherson, 2012)。例如,与男性同事相比,女性在学生评价中得到的教学评价显著较低;女性教师成员获得终身教职、高级职称、行政地位的可能性更小(如附录图1)。
附录图1
已有很多研究表明教师性别会对学生成绩产生影响,但是鲜有研究关注教师性别与分数膨胀之间的关系。这篇文章使用中国教育追踪调查数据,在中等教育层面检验教师性别与分数膨胀之间的关系。研究发现:女性教师比男性教师给出的成绩要高1.57分,这并不是因为学生学到了更多的知识,而是分数膨胀的结果;在女性学生、能力较低的学生和高年级学生中出现分数膨胀的现象更明显;女性教师导致分数膨胀的原因主要是由于工作中存在潜在的歧视和不确定性,并不是出于课程性质或安抚学生心理;获得分数膨胀后的学生在第二年的努力程度降低。
二、数据和变量
文章主要使用了中国教育追踪调查(CEPS)数据。CFPS是由中国人民大学中国调查与数据中心(NSRC)设计与实施的大型追踪调查项目,在全国范围内抽取112所学校、438个班级、约2万名学生作为调查样本,调查对象包括学生、家长、教师及校领导。2013年的基线调查涵盖了7至9年级的学生,并包括了五种不同的问卷,分别针对学生、家长、核心科目教师、班主任和学校校长。学生问卷包括考试成绩、人口特征和学习习惯等问题;家长问卷包括家长教育和家庭经济状况等问题。教师问卷收集教师的个人信息、教学理念和日常工作等。在基线调查的112所学校中,83%的学校声明在初中一年级时教师和学生班级分配是随机的,而且教师和学生初中三年都留在同一个班级。这些数据比较理想地满足了研究需求。核心变量的描述性统计如下:
表中分别呈现了19,006个(78%)女性教师-学生对和5,382个(22%)男性教师-学生对的描述性统计结果。由女性教师所教学生的表现(平均分70.79)略优于男性教师的学生(平均分70.26)。就学生特征而言,两组学生的性别分布相似。在女性教师的分组中,学生的父亲和母亲的受教育年数分别为10.56年和9.93年,而在男性教师的组中分别为9.97年和9.04年。关于教师特征,87%的女性教师和84%的男性教师属于事业编制。结果显示,与男性教师相比,女性教师平均获得高级职称和行政职务的可能性较低。
三、模型
这篇文章使用如下模型进行估计:
被解释变量Y表示2013年秋季学期期中考试中,学校j的年级g中,教师k给学生i的科目s的标准化成绩。gender表示教师k的性别(1=女性,0=男性)。Xi包括一系列学生特征,如学生的性别、户籍、是否是独生子女、学生父母的受教育年数、学生家庭经济状况(1=非常贫穷,2=贫穷,3=中等,4=富裕,5=非常富裕)以及班级规模(学生i所在班级的学生人数)。根据Griffith和Sovero(2021)的方法,Xk代表教师k的特征,如教师是否获得编制(1=获得编制,0=否)、教师同时负责的其他班级的数量、教师职称的虚拟变量(0=无,1=三级教师,2=二级教师,3=一级教师,4=副高级教师,5=高级教师)、以及表示教师行政职务的虚拟变量(0=无,1=7年级或9年级的班主任,2=教研室主任,3=学术院长/副院长,4=副校长,5=校长)。模型还控制了学校-年级-科目的固定效应。考虑到同一班级内样本可能存在的相关性,所有回归中的标准误差都在班级层面上聚类。
四、基本回归结果
表4汇报了基本回归结果,Tgender的系数表明与由男性教师教授的学生相比,由女性教师教授的学生的成绩高出1.57分,相当于平均分数的2.27%(1.6 / 70.6)。在中国教育竞争激烈的情况下,1-2分的差距也非常关键。
但是,这种分数的提高可能是由女性教师教授的学生能力提高带来的,也有可能是女性教师的分数膨胀行为导致,文章进行一系列检验以说明作用渠道。
(1)使用增值模型:如果女性教师的高分仅反映了分数膨胀,而没有反映学生能力增加,那么与男性教师相比,女性教师不会给学生的成绩带来额外的提高。文章在方程(1)的右侧添加学生之前的成绩表现,如下:
表5的Panel A第(4)列表明,当加入学生上学年的成绩之后,β*不显著,这说明女性教师并没有显著提高学生的学业表现。
(2)考虑整体影响:如果成绩的提高仅仅反映了分数膨胀,那么由女性教师教授的整个班级的成绩都会较高。在这种假设下,控制班级平均成绩后教师性别对成绩的影响应该减少甚至消失。表5的Panel B的面板显示,在控制了班级成绩的平均值和方差后,由女性教师教授的学生的成绩高出0.37分,与基准回归(1.57)相比减少了近80%。这表明,女性教师可能会给整个班级高分。
(3)用认知分数替换成绩。考虑到教师可能会对学生在校期间的成绩进行操纵,文章使用CEPS项目统一进行的认知测试的分数替换考试成绩。如果女性教师提高了学生的成就,那么这种积极影响也应该反映在认知能力上。然而,表5的Panel C表明,女性教师对学生的认知能力的分数没有影响。
(4)控制学生早期能力。文章还考虑了学生早期能力对中学成绩的潜在影响,如成绩排名、学习难度和小学时期的学习勤奋程度。文章对这部分变量进行控制,表5中Panel D的结果仍然表明女性教师倾向于给更高的分数。
因此,文章验证了女性教师给出的高分来自分数膨胀,而非来自于学生进步。
五、异质性分析
1. 学生性别异质性:文章检验了分数膨胀是否具有性别异质性。表6中的Panel A显示,女性教师不仅给女生更高的成绩,也给男生更高的成绩。与男性教师相比,女性教师给男生和女生的成绩要分别高1.12分和1.80分。
2. 学生能力异质性:用认知分数代表学生的能力分组后重新估计,发现教师性别对影响在两组中都存在,其中低能力组的学生受到的影响更大。(表6中的Panel B)
3. 年级异质性:文章发现高年级的学生受到分数膨胀的影响更大,7年级高出1.64分,9年级高出1.86分。(表6中的Panel C)
六、机制分析
如前分析,女性教师可能是出于课程性质、学生心理或劳动市场的潜在歧视的原因进行分数膨胀。这部分对给高分背后的机制进行检验。
(1)课程性质。班级规模和学科差异有可能会导致给的成绩更高。文章在主回归中已经控制了班级规模和教师负责的班级数量,这部分进一步对学科差异进行检验。表7表明在不同学科中女性教师的分数膨胀现象都存在,说明课程性质并不是主要影响机制。
(2)关心学生心理。与男性教师相比,女性教师可能出于考虑学生心理的目的而实行分数膨胀。具体来说,CEPS在学生问卷中设置了问题“在过去七天内你有以下感觉吗——沮丧、抑郁、不快乐、生活无意义、悲伤”。相应的选项是“1 = 从不,2 = 很少,3 = 有时,4 = 经常,5 = 总是”。通过这个问题,可以将学生分为消极情绪的一组和非消极情绪的一组。表8结果表明,女性教师并没有给情绪消极的学生高分,而是给非消极情绪的一组更高的分数,表明分数膨胀不是由女性教师更关心学生心理造成的。
(3)劳动市场的潜在歧视。女性教师可能面临更大的压力,并通过给学生更高的成绩来对抗潜在的或实际的歧视,增加工作安全感。在这种情况下,教师性别的影响应该在更有压力的教师一组中更为显著,特别是在学生表现不佳的组别中。文章使用问题“你通常在以下方面有很大压力吗?——学生的差成绩”,并将在学生成绩方面承受相对巨大压力的教师分为一组,其余为另一组。表9中的Panel A表明,教师性别的影响只出现在对学生成绩有巨大压力的组中。与男性教师相比,有压力的女性教师的平均给分高出2.23分。
此外,如果女性教师出于工作原因进行了分数膨胀,那么可能只在那些认为学生成绩与教师工资和学校管理有关的教师中观察到。文章根据教师问卷,将样本按照是否认为学生成绩与教师薪资和学校管理有关分为两组。表9中的Panel B面板表明,分数膨胀只在认为学生成绩与教师薪资和学有关一组中观察到。
七、分数膨胀的后果
反对分数膨胀的学者认为,分数膨胀可能会使学生认为高分是理所当然的,并且之后不会认真学习。然而,一些学者也发现实行分数膨胀在某些情况下有好处,因为高分可能会增强学生的信心。文章对分数膨胀的直接后果进行探究。具体而言,CEPS在学生问卷中涉及 “你对未来有信心吗?”,在家长问卷中涉及 “总的来说,你的孩子对学习的态度如何?”。这些问题在两个调查批次中都被提到。文章使用在两次调查中学生信心的差异和家长认为学生学习态度的差异来代表学生的变化。表10的结果表明,女性教师使学生的学习积极性下降,也没有增强他们对未来的信心。
Abstract
Grade inflation has become a global phenomenon that raises concerns in the academia and the public. This study examines whether high grades accompanying with the growth of female teachers arise from student improvement or grade inflation. We use randomly assigned samples from the China Education Panel Survey and obtain the following results. (1) Students taught by female teachers obtain 1.57 grades point higher compared with those taught by male teachers. High grades do not result from student progress but from grade inflation. (2) Female teachers practice grade inflation for different students, and the effect is more pronounced among female students, low-ability students, and students in senior grades. (3) Female teachers may adopt a high-grades practice due to potential pressures under discrimination and uncertainty rather than for the sake of course or students. (4) Last, high grades brought by female teachers lead to less effort for students in the second year. This paper not only provides data support for understanding the increasing grade inflation, but also offers clear implications for the improvement of evaluation systems.
推文作者:李季
电子邮箱:lijijsx@foxmail.com
声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点。
0
推荐