高考命题评说

马长冰

  内容简介 本文从统计分析高考成绩得出“高考及格率和高分率偏低”的结论,认为高考命题的这些实际效果无助于高校选拔人才,亦无助于素质教育,因此必须改革高考命题的指导思想,并且主张高考命题应该接受公众考评。为此对高考及格率给出等级划分的标准及其属性,纠正考生分布曲线判定的误解,排出了《2006年高考命题实效排行榜》。

  关键词:高考命题 指导思想 及格率高分率 实效排行榜

高考命题应该接受公众考评

  考试,当然是老师考学生。考试的对象、目的,考试的范围和要求都是特定的。根据特定的需要进行命题,出一套好的题目是一门艺术。事实上,命题既是考学生的,其本身也接受考生的“考试”,同时还接受公众的评价。前些年,某地高校对入学新生进行测试,出了一道选择题,让学生从四个城市中选择首都,据说有许多大学新生选择错误。有人以此作为中小学生政治常识贫乏的例证。其实,也不乏一部分大学新生质疑用幼儿园题目考他们的命题者。这也是命题既考学生也考命题者的例证。因此,“考”也是双向的。

  每年关系数百万人前程的高考命题倍受社会关注,这是必然的。被普遍认可的高考命题工作的指导思想应该是,“有助于高等学校选拔人才、有助于中学实施素质教育、有助于高校扩大办学自主权”的原则(“三个有助于”),也就成为命题工作和评价高考命题的依据。高考命题具有选拔人才的重要功能,因此命题应该是精心组织、精心策划、遴选试题、精心创作的一种科研成果。因此,许多题目都成为中小学教学的经典内容。

  但是试卷的题目好跟一套试卷好坏不完全是一回事。一套试卷是根据高考的需要而作的,试卷出的好或不好,命题的水平高下,它使用的结果是否符合“三个有助于”的原则,是否切合特定考生群体的实际,却是要在考试之后,对高考命题的实际效果进行评价后才能做出评判的。这就是说,要用高考的实际效果来评判命题的水平。同时,高考命题的考试实效,也要接受公众考评。

  以往对命题的实效性评价主要由命题的组织者和组织命题者进行自我评价。往往命题人员对自己的工作成果总是满意的,甚至欣赏不已,不然他(她)们还会精心完善之。这些往往在命题完成而尚未考试的时候,就做了良好的评价,考试一旦结束,立马发表,给命题以充分的肯定。这种自我评价固然重要,多数也是可信的。但是,多少欠缺客观,有时会有失偏颇。因此,我们以为需要建立一个独立于命题机构的高考命题的评价机制,而不宜只由命题者及其组织者说了算。对命题水平高的予以肯定,对命题水平低、质量差的要有问责制,以此对广大考生和全社会负责。不能够因为是精英研制就全盘肯定。

  对高考命题的实效评价大致可以分为三类:一,主要是从宏观上对命题进行总体评价,即对考试结果进行总体评价,如及格率,考生分布情况,录取分数线,等等;二是对考试学科进行实效评价,如学科及格率,知识结构,考生掌握知识、能力、技能的情况;三是对学科的试题进行分析和评价。第二与第三项主要是由专业人员进行研究,它对于改进教学提高学科教育质量是难得的。

  对于大众而言,所需要的主要是第一项以及学科及格率。对于第一项,现在我们能够进行的,只能粗略分析,其直接的原因是缺少数据。比如今年,只有14个省市区在网络上提供高考得总分分数段,其中有每一分得考生数的详细数据,但是不多,有的是5分段、10分段、还有高分分数段。普遍公开的就是逐步公布的各批次录取分数线。

  据此,目前我们的高考命题实效评价,宜粗不宜细,同时呼吁各省市区考试部门公开总分和各学科的分数段(一分一段或5分段),让全社会共享成果,参与评价。

  宜粗不宜细的高考命题实效评价,可以做三件事:
  一是给高考总分的及格率给出等级评价标准,让大家自己去对号入座;
  二是用以录取分数线为主,对各省市高考命题实效进行排队,列排行榜;
  三是对考生分布、高分率进行探讨,并结合对部分省市高考命题实效进行比较评说。
  我们现以有限资源,评说2006年高考命题实效性,虽是不自量力,但为抛砖引玉。以期同仁们共同参与,一道评说。

高考及格率的等级划分及其属性

  莘莘学子,十二年学业,三年苦读,迎来人生第一关的重大考验——高考。对大多数考生来说,遇上什么样的考题,都会给他们终生留下难忘的记忆。

  遇上现实的合理科学的命题,能考出自己的真实水平,量身选择自己称意的大学和专业,或者带着无憾的心情走向社会,那是幸运的。如果遇上倒霉的命题,绝大多数人的分数都不理想,有的人即便上了本科第一批或第二批的大学,也是以较低分数甚至不及格的成绩入学,相比而言在同学中没法声明说“我们那地方考题特别难”。

  考生与考题结缘,是不得不聚首的一对“冤家”,有的是喜结良缘,“天仙配”,有的却是不幸的“拉郞配”,命题的水平主宰了这份因缘。许多时候不是考生(都是指的群体)考不好,主要问题在于命题是不是现实的合理的科学的。
  
  所以,对高考命题要在考试之后,给予客观的评价。评价可以很细致,很复杂,那是专家、专业的要求。一般人不求太复杂,宜粗不宜细。比如只用及格率来判断也是一种标准,或者加上本科录取线,等等。

  我们没有采用近来评价试卷质量常用的难度系数、区分度的统计方法。一方面,及格率是比较大众化的概念,参加考试的全部考生达到及格的百分比有多少,或者说全体考生中合格地通过考试的考生占多少百分比?所以也有称及格率为通过率的,及格率或通过率比较通俗易懂。另一方面,根据难度系数,计算需要详细的考试成绩资料和大量计算,其结果又是比较专业的。再次,及格率是“以人为本”来计算的。至于试卷的内容效度、覆盖率、区分度等等,主要由学科专家进行分析研究。

  活了98岁高龄的国学大师张中行老先生认为,世间的一切事物都可以分等级,婚姻也是如此。他把婚姻分为可意,可过,可忍,不可忍四个等级。(廖保平:《国学大师张中行的"可过"》,科技日报,2006年03月03日)

  考生同某一套高考命题结缘,高考及格率也可以借用“四可”来评价考生同命题的关系。

  我们不妨将高考总分及格率分成甲、乙、丙、丁四个等级,其属性依次是可意,可过,可忍,不可忍。可意,可过(过得去),可忍(可以忍受),均贴切。只是“不可忍”需要琢磨。“不可忍”者,在现代人的婚姻中,“不可忍”者,则是断然分手的。但是,考生与考题却是不能,也无法分手的。即使复读考生也是不会重新遇上同一套命题。因此将“不可忍”改用“可悲”。一则是一旦结缘,既成事实,虽不可忍却不能分手,只得认命,此一悲也;二则,考试实效公布悲声一片,相信命题者也是会难过内疚自责的,此二悲也;考试效果差,国家关于高考命题的“三个有助于”原则变成“三个无助于”,进一步加重了中小学学生课业负担,此为三悲也。所以改“不可忍”为“可悲”是合适的。

  现在命题普遍偏难,以至及格率偏低,好像不难的命题没“水平”似的,习惯成了自然。北京有家长质疑北京市今年命题是不是简单了,就是实例。所以根据目前及格率普遍较低的情况,加上“特等”作为鼓励,是谓“可喜”,变成五级。过度一段时间以后,再采用四级。现阶段高考命题等级标准和属性如下:
  及格率在60%以上者,为特等,“可喜”;
  及格率在50~59%者,为甲等,“可意”;
  及格率在40~49%者为乙等,“可过”,可以过得去吧;
  及格率在30~39%者为丙等,“可忍”,忍受着吧;
  及格率在30%以下者,为丁等,“可悲”。

  今后,逐步将“可悲”的百分比提高到40%,列表如次:

    

  单纯以总分及格率作为唯一标准,也有不足之处,有的地方高考总分及格率等级还比较高,但是某一两门学科单科及格率很低,属于丁级,可悲的。应该考虑就低列等。

  将现有了解的数据,对部分省市区的高考及格率各自的归属列表如下,其他各省市区自行对号入座。
  
    

  云南省的文理及格率都是51%,为什么文史类列入丁等?光看总分及格率是可意的。但是,文史类数学及格率8.27%,可悲。理工类数学及格率28.49%,接近丙等。2006年云南省高考成绩如下表:

    

  共三页☆   ☆下一页
  



华林教苑Copyright(c)2001-2002 联系信箱:linhr@peolemail.com.cn