托福加试的必要性
在toefl考试的阅读和听力部分中,有的考生可能会面临出现多一篇文章的情况,中国大陆将该情况称之为托福加试。在ets的众多已发表文献中,我们已经可以探索出"加试"的目的。
加试部分的官方名字叫做"normalizing part",其目的是为了normalize the test。toefl采用的是norm-referenced 而不是criterion-referenced 评分标准,gre也是如此,也就意味着每次的考试成绩分布应该如(b)图所示,简单来说,toefl是典型的high-stake standardized test,多次考试的成绩应保持一致。
举例来说,2013年9月1日和9月7日的中国大陆平均成绩应保持一致,因为如果没有证据显示样本能力有显著提升,短期之内总样本量的平均成绩应该没有太大变化。可是事实上,每一次考试的数据都会有所变化,成绩分布有可能出现(a)情况-即大多数考生成绩过高(并不意味着试题难度简单),也有可能出现(c)情况-即大多数考生成绩过低(并不意味着试题过于困难)。
toefl考试需要保持其construct reliability 需要其每一次考试都将整体考试的数据进行normalize,其采用的是item response theory (irt) framework,每次考试的主体题目不同,只有加试部分一致,因此加试相当于一个 "anchor block"来equating整体考试的成绩。
因此,toefl考试你会得到一个raw score,你的这个成绩会放在整体数据图表中形成一个curve, 整个curve会slightly skewed,根据加试的anchor,所有考生会被normalize, 以得到一个最后的scaled score。a考生在9月1日的100分和9月7日的100分并不意味着做对了同等数量的题目。加试的目的只在于保证多次考试之间的 reliability,并不对个人考生有所影响。
normalization的过程主要和统计学相关,也就说加试和个人的成绩并无任何关系,即使不做也是不算分的,然而考生的个人加试成绩会影响总体的数值,对所有考生的成绩同时产生影响。最后3点启示:
1.当你报考的考试日里大部分人都看到了命中的机经,整个成绩会negatively skewed, 你的成绩会比raw score要低,当你报考的考试日出现了没有看过的题目,大部分人的成绩可能不够好,整个成绩会positively skewed,你的成绩会比raw score要高。
2.托福加试部分的特点是多次重复并已经被分析过,中国的"经典加试"就是normalizing的部分,并不存在所谓的"不知道哪一部分是加试"的说法。
3.ets明确表示equating cannot adjust scores correctly for every individual test-taker,也就意味着该过程对总体负责,但对个人成绩可能有所偏差。