我的书城网

字:
关灯护眼
我的书城网 > 即将消逝的乡村 > 浙江大学论述公平:转阅二六

浙江大学论述公平:转阅二六

{详见:GB/T 7714

边新灿.我国评价选拔制度的螺旋式演进和高考公平效益问题的历史观照*[J].浙江社会科学, 2018,(5):86-96,159.

MLA

边新灿.“我国评价选拔制度的螺旋式演进和高考公平效益问题的历史观照*.“浙江社会科学 5(2018):86-96,159.

APA

边新灿.(2018).我国评价选拔制度的螺旋式演进和高考公平效益问题的历史观照*.浙江社会科学(5), 86-96,159.}

我国评价选拔制度的螺旋式演进和高考公平效益问题的历史观照*

□边新灿

内容提要?本文在考察中国古代评价选拔从综合评价转型为统考评价(分数评价),高考招生则探索从统考评价(分数评价)向综合评价回归的螺旋式演进历程的基础上,探究驱动和制约评价制度演进的政治、经济、教育、文化和技术因素,并聚焦公平和效益范畴进行分析。文章引入信度和效度的概念,并将效益分为“操作效益、质量效益、制度效益”和“直接效益、扩展效益、溢出效益”进行深度讨论。本文的主要观点是:综合评价不是舶来品,我国古已有之;公平和效益在某些环节、某些具体问题上是相互矛盾、相互制约的,在本质上是相通的;察举等综合评价模式在理论上具有很高的效益,但是无法保证起点公平和程序公平,最终是低效益甚至非效益的;从综合评价做减法转型为统考评价(分数评价),主要是扩展效益起作用:中央集权统一国家体制的骨骼、以“仁治”为核心的儒家学派的灵魂和科学选官制度的血液兼信息系统的“三位一体”,完成了国家建构;统考评价(分数评价)在直接效益上是一种无奈的差强人意的选择,但它通过起点公平和程序公平,沟通了朝廷与下层知识分子和民意的联系,产生了非常显著的扩展效益,在历史上的某些阶段达成了公平和效益的协调;但法久生弊,对公平的极至诉求绑架了评价选拔制度的设计,形成了对统考评价(分数评价)的依赖并形成文化惯性,从而在溢出效益上出现了弊端。对中国古代评价选拔制度演变的驱动和制约因素的分析,有助于对高考制度演变规律的深层次认识。高考招生模式的多元化、综合评价的推进和扩大、综合评价招生模式和统考统招、注册入学等多种入学模式的并存是发展趋势,但在改革发展过程中必须统筹协调公平和效益的辩证关系,稳中求进、两翼齐飞。

关键词:科举,综合评价,分数评价高考,公平与效益,

本文的写作缘于三个方面:(1)笔者1998年在《浙江社会科学》发表《平等与效益:教育决策的两难选择》,讨论了教育的公平与效益问题,本文则聚焦高考改革进一步深入讨论这一两难问题。(2)2014年由浙江、上海先行试点的新高考改革,针对“唯分数论”、“一考定终身”等老大难问题,从“一体四面”(以促进学生健康成长为本体,文理融通、综合评价、过程评价、扩大选择)全方位推进改革,内涵丰富,理念先进,初见成效。但是先进的改革理念和理想的改革目标也受到了传统考试文化和应试教育强大惯性的制约,笔者经深入分析,发现最核心的制约因素还是公平与效益的关系,与此相关的还有科学性和可行性的关系。高考改革要取得成功,必须妥善处理这两对关系,以实现“两翼齐飞”。(3)新高考改革的一项重要内容是综合评价,应该承认这项改革举措借鉴了欧美的做法。但综合评价其实不是舶来品,我国古已有之。人类社会最早采用的评价模式是朴素的不完备的综合评价,在现存上古史书的记载中,唐、虞、夏三代部落联盟首领的推荐产生就是基于综合评价的人才选拔;汉代的察举已经是比较完备的综合评价;科举制度从综合评价转型为统考评价(分数评价),是中华民族的伟大创造。中国古代的评价模式和评价制度为何从综合评价转变为科举取士的统考评价(分数评价),为什么科举制度最终被取消?新中国的高校招生在反复探索后选择了统考统招模式,为什么在进入新世纪后又在探索综合评价招生改革?决定评价模式螺旋式更迭演进的因素是什么?本文试图回答这些问题。

本文首先从政治、经济、文化、教育、技术等方面简要分析驱动和制约社会评价选拔制度演进的因素,然后聚焦公平和效益这一决定和制约评价选拔模式和制度演进的核心要素,揭示评价选拔模式和制度演进的内在逻辑,为高考改革辩证处理公平和效益、科学性和可行性的关系提供历史参照。

一、评价选拔制度更迭演变背后的政治、经济、教育、文化因素分析

社会是一个复杂的系统,它由政治、经济、文化(含教育、技术)等子系统构成。任何一种社会行为、社会活动,都属于社会大系统,其产生、演变都会受到政治、经济和文化等各个方面因素的驱动和制约。评价活动作为一种社会活动,也必然受到这些因素的影响。从汉代的察举,经由魏晋南北朝的九品中正制,最终转型为科举,其驱动因素最直接的是政治因素,深层次上与文化因素有关,而经济因素的作用并不显著(与生产力水平和文明形态变化迟缓有关)。新中国成立以后,在高考招生制度的演变过程中,政治因素仍然发挥非常强大的、显著的作用,经济因素的作用越来越突出,文化因素则在深层次上影响、制约着高考招生改革。此外,无论是古代还是现当代,操作管理因素(制度设计是否简明、操作管理是否简便易行)在评价和选拔模式、制度的设计、选定中,起着非常重要的作用,与此相关的技术手段因素长期扮演配角,但在当下则显示出越来越重要的迹象,未来将上升为决定性因素。

(一)从汉代察举到科举,从综合评价到统考评价(分数评价),政治因素起主要作用。

经春秋战国的群雄割据后,秦国一统寰宇,确立了中国社会的政治体制基本格局:中央集权的大一统的国家。但是由于没有找到合适的治理国家的基本学说,实行高压残暴的统治政策,“二世而亡”。汉朝确立了“仁者爱人”、宽严相济的儒学作为治国学说,为中央集权的骨骼找到了灵魂。但是儒家学说要靠人去推行去实施。汉朝实行察举,地方推荐和中央考试相结合,一开始地方官员能认真推荐,“选贤与能”,但法久生弊,地方官员在推荐过程中营私舞弊,举“亲”而不举“贤”。至魏晋南北朝的“九品中正制”,最终为世家大族把持垄断,异化为“上品无寒门,下品无世族”,造成社会阶层的严重固化和全社会的不思进取,朝廷的权威被架空。经过长期的军事和政治斗争的实践检验,至南北朝后期和隋唐,君王从选拔实用人才的需要出发,终于通过对综合评价多种要素的去芜存菁、做减法,发明了“科举”制度,为国家机器的骨骼输入了新鲜血液,沟通了朝廷和各级官员之间的信息交流,实现了最高管理阶层对官员队伍建设的绝对领导。中央集权统一国家体制的骨骼、以“仁治”为核心的儒家学说的灵魂和既开放又客观的科举选官制度的血液兼信息系统的“三位一体”,构成了完整的国家制度,最终完成了国家建构。

(二)科举最终被废止,教育和文化因素是重要原因。

文化的最深层次是精神文化,精神文化的核心是价值观念和思维方式;教育既是知识和技能的传授过程,也是价值观念和思维方式的传承、改进过程.科举考试制度对中国古代文化和教育的正面、积极影响是显而易见的。表现为三个方面:(1)民主、平等的精神。科举在人类历史上第一次建立了人才、官员评价的单一、刚性和客观的标准,排除了家族、血统、财富、官阶、地位等非本人素质因素的前提性限制和人情请托等主观因素、犯规舞弊等非常因素的干扰,体现了知识和能力至上的人才评价观,分数面前人人平等的公平观,政府取士大门向社会开放、机会均等、英雄不问出身的民主选拔观,展示了海纳百川的政治气度。(2)国家意识。科举考试标准的统一、时间的统一、考试组织形式的统一,在客观上强化了社会的向心力、凝聚力,有利于国家意识和爱国主义精神的养成。(3)尊重知识尊重人才的风尚:通过显性育德和隐性育德的多种途径,在客观上促进社会形成“唯才是举”“努力付出总有回报”的理念,形成尊重知识尊重人才、好学重教向善的良好氛围。同时,科举选官制度总体上产生了“以考促学”功能,促进了学校教育和自学教育的发展。

与此同时,科举考试对教育和文化的负面作用也客观存在:(1)压抑创新精神。科举考试的内容高度统一、一致,一切以四书五经为圭臬,死记硬背,士人不敢越雷池半步,习惯于我注六经,不敢六经注我,形成了对经典的依赖,在强化求同思维的同时压抑了士人的求异思维、创新思维能力的形成,不利于个性发展。(2)远离生活实践。科举考试因为是选官考试,故以政治性科目为主要(隋唐宋)甚至唯一(明清)的科目。由于在科目设置和考试方式上重道轻术、重书本轻实践,客观上引导士人从书本到书本,远离生活实践,失去了创新精神的动力和源泉。(3)引发应试投机行为。由于科举考试的性质是选拔官员(或侯补官员),“朝为田舍郎,暮登天子党”的瞬间逆袭效应和高利害性,引发士人的功利性追逐,也引发了民间的培训逐利行为,形成了应试教育的惯性。针对社会上猜题押宝、坊间刻抄复习资料泛滥等应试教育倾向愈演愈烈、严重损害考试公平的情况,组织者不断提升试题的难度、不断创新题型,以此提升区分度以至于在明清期间发展出八股文这种专门用于考试的奇葩文体。由于八股文过于追求形式上的难度,内容严重脱离现实,把莘莘学子的大好年华消耗在毫无意义的形式的追求中,走火入魔,造成了严重的低效率。(4)异化考试和教育的关系。科举考试作为选官考试具有强大的政治功能,从而使它凌驾于教育之上,在促进士人勤奋读书从而促进教育的同时,也造成了学校教育的异化。学校教育成为科举考试的助学教育,成为考试的附庸。应试成为学校教育最主要甚至压倒一切的任务。在西方各国经文艺复兴、工业革命后自然科学技术开始腾飞的时候,清朝的学校教育仍然以科举考试的经学科目为教育内容。这是导致中国清代古代科学技术严重落后的重要原因,也是科举自身被废的最重要原因。

(三)在高考招生制度的演变过程中,政治、经济、教育、技术、文化等各种因素都发挥作用,教育、文化和技术因素的作用凸显出来。

建国以后,高校招生模式最终定型为统一考试招生,这里有这种高度统一的选拔模式和我国统一的国家管理制度相适应的政治因素,有1300余年科举统一考试形式在民族文化、民族心理里积淀的因素,有文化基因文化惯性的因素,也有统一招生设计简明、操作简便、高效快捷的操作管理因素。

经济因素对高考招生制度设计和改革的影响主要表现为:高校招生的科目设置、专业设置和人数安排与经济建设的需要密切相关;定向招生和委托培养招生模式的出现与经济建设的需求有关;以国家投入和个人缴纳学费为主的多渠道筹措教育经费体制的确立与经济体制的改革密切相关;此外产业结构转型迫切需要提高劳动者的素质特别是对创新型人才的需求激增,这是对高校培养创新型人才从而也是对高考突出创新素质考核的强大推动力。

与古代察举、科举沿革的主要因素是政治因素不同,教育因素成为恢复高考后驱动高考改革的主要因素。新中国成立后高考一方面承担为国家建设选拔后备干部(学生毕业后即成为国家干部)的责任,一方面是为高等教育选拔新生的制度,是教育的一个组成部分,因此高考既是政治行为也是教育行为。恢复高考后随着收费入学的实施和就业制度的改革,随着公务员考试制度的实施,高考的教育属性越来越突出。因此在一系列改革中,更强调贯彻全面发展的教育方针,扭转应试教育倾向,更强调尊重教育自身规律,教育因素成为高考改革决策的重要依据,有利于推进中学实施素质教育成为高考改革的一项重要原则。扩大高校的选择权、发挥中学在评价中的作用、在统一招生外开辟多元选拔途径等改革举措,都是为了调谐考试规律和教学规律的关系,使高考为全面发展、为素质教育服务。

但高考终归不只是一种教育行为,它是一种复杂的社会行为。对考试和教育的关系、对应试教育的成因、对素质教育的实施条件的深入研究表明,考试和应试教育的关系非常复杂。高等教育作为一种准公共产品的属性、由科举制度所强化的考试公平理念的积淀,使社会公众对高考公平的诉求非常强烈。建国以后包括恢复高考制度以后,高考试图改变单一统考招生形式,朝着综合评价、全面发展的方向所采取的一系列改革举措为什么会中止、取消,就是因为受到了公众对这些改革举措能否保证公平公正的担心的影响;与此同时,面对日益强烈的国际竞争,面对科技的日新月异,单一统考对青年学生价值观念、思维方式的负面影响,对创新能力的压抑,越来越为有识之士和决策层所意识,“钱学森之问”进一步强化了对这个问题的深入思考。因此,突破教育的范围,深入文化的内核—价值观、思维方式层面来认识高考制度、驱动高考改革,成为新世纪高考改革的重要特征。

技术因素在高考改革中的作用呈现从后台慢慢走到前台的趋势:光电阅读器的使用促成了客观题的大量使用;网上阅卷提升了主观题评阅的准确性;计算机网络远程录取系统的使用,既大幅度节约了招生工作的成本,也有利于排除主观因素对招生工作的干扰;高考远程监控系统、高校面试过程全程录音录像技术的普遍使用,有效保证了大规模考试和小范围面试的公正公平。这些因素对高考改革的作用往往是隐性的,同时也是巨大的。不远的将来,网络技术和人工智能技术的进一步成熟将推动网络考试形式的采用,从而使自适应考试、多次考试、学校和学生一对一的考试等成为现实,进而对评价选拔方式和制度带来革命性的变化。

二、聚焦公平与效益探究驱动与制约评价选拔制度改革的因素

在分析驱动、制约评价选拔制度演进、改革的政治、经济、文化等因素的过程中,笔者发现存在一种超越社会形态、国家制度,贯穿政治、经济和文化因素的神奇力量,或者说一对关系范畴,这就是公平与效益(效率)。

(一)公平和效益(效率)、信度与效度的概念

1.公平和效益(效率)的概念

就独立使用的概念而言,公平的概念古已有之;效益、效率作为经济学、管理学的术语使用,则为时较晚;而把公平(平等)与效益(效率)作为一对范畴来对举使用更晚。但是,公平(平等)与效益(效率)在实质上所反映的是一种既相互对立、矛盾、制约又相互依存、辩证统一的关系,则是长期困扰人类社会,特别是社会决策者、管理者的一个非常普遍的问题。一方面,它是决定人类社会运行方向的普遍规律,古今中外概莫能外;另一方面它在实际上形成了哲学上的范畴,超越社会制度形态和意识形态,贯穿政治、经济、文化、教育等领域,是考察和分析社会问题的一个思想坐标,具有方法论上的意义。人类社会在进行制度设计和行动决策时总会自觉不自觉地受到公平与效益(效率)的坐标的制约,形成钟摆现象。

公平是一个非常古老的概念。就高考招生制度而言,公平有以下内涵:(1)起点公平:考试机会均等(意味着受教育权利平等);(2)过程公平:包括①评价标准的一致性、客观性和刚性,分数面前人人平等,标准公平;②考试和招生过程的规范性,程序公平;③考试和招生信息公开透明,信息对称;(3)补偿性公平:鉴于教育资源的城乡差异和地区差异实施补偿、照顾性措施。

效益和效率是经济学、管理学术语。当效益(效率)和公平对举使用时,已经超越了经济学、管理学的狭义,而具有广泛的意义。学术界既有采用“效率”概念的,也有采用“效益”概念的。笔者在1998年发表的《平等与效益:教育决策的两难选择》采用“效益”的概念,认为“当我们在评价一种社会活动的效益时,其实同时蕴含着对效率的要求。”①在与“公平”作为一对范畴使用时,“效益”的内涵有两个核心要素,一是投入产出之间的增益功能;二是资源配置的合理和优化程度。一个国家、一个社会有效益的问题,一个系统一个领域也有效益的问题。教育的效益有两个核心问题:一是有限的教育资源面向学校和受教育对象是集中使用还是平均分散配置;二是有限的教育机会按什么标准分配给受教育对象。其中高等教育机会的配置方式就是高考制度要研究的问题。

2.操作效益、质量效益和制度效益

对察举、科举和高考所代表的评价选拔制度的效益可以从三个层次进行理解。第一层次是“操作效益(工作效益、成本效益)”,其中包含操作、管理的复杂程度、人财物的投入多少、工作效率等因素;第二层次是“质量效益”,指评价选拔出来的人才(产品)的素质高低及其与选拔主体要求的符合程度;第三层次是“制度效益”,指的是评价选拔模式、制度的设计对本系统、外系统和整个社会的运行产生什么样的影响。

操作效益实际上关注的是投入的问题,质量效益实际上关注的是产出的问题(产出既有数量的因素又有质量的因素),而制度效益则与资源的配置方式密切相关,与政治性、公平性密切相关。

3.运用“信度、效度”的概念有助于更准确地理解“公平、效益”

信度和效度是心理与教育测量学的专用术语。信度指测验的可靠性,“指同一个测验对同一组被试者重复测验所得结果的一致性程度,或者等值性的两个测验对同一组被试者施测所得结果的一致性程度”。②笔者认为对信度可以更通俗地表述为:信度是测验结果反映被试者相对于“试题”的真实水平的程度。测验过程中排除了无关因素(包括考生生理与心理因素、考场客观环境因素和犯规舞弊等非正常因素)的干扰,测验结果准确地反映出被试者相对于试题的真实水平,其信度高;反之则信度低。效度指测验结果的有效性或者正确性程度,“所谓有效性,是指一种测验能够正确地测量出它所要测量的特性或功能的程度”③“它反映的是测验预期目的的达成度。”④通俗地说:考试目的是要测试被试某方面的特质,考试结果是否测试到了这些特质,其实现程度就是考试的效度。信度是效度的前提和基础,高信度是高效度的必要但不是充足条件,信度低效度一定也低,但信度高效度不一定高。

把“信度、效度”和“公平、效益”结合起来分析,信度反映了评价选拔的过程是否规范,它与程序公平、形式公平密切相关;效度则与评价选拔的效益密切相关乃至高度吻合。

4.本文提出“直接效益”、“扩展效益”和“溢出效益”的概念

为了更深入地运用公平和效益的坐标探究评价制度的演进逻辑,本文提出评价选拔的“直接效益”、“扩展效益”和“溢出效益”三个概念。直接效益指的是评价是否准确体现了评价组织者的目的,选拔出来的人才的质量是否符合组织者的要求,它既包括量的因素,也包括质的因素;扩展效益指的是采用或改进评价选拔方式、制度,是否有利于社会管理系统的运行,是否有利于增强社会治理的有效性和质量;溢出效益指的是采用或改进评价选拔方式、制度,对国民的价值观念、思维方式,对社会的精神文化,产生了什么样的长期而深刻的影响和塑造作用。

从评价组织者的主观意图分析,直接效益是其明确意识到的工作目标;扩展效益可能是组织者一开始就意识到,也可能是组织者起先并未意识到后来才意识到的作用和影响;溢出效益则是组织者事先没有意识到,即使意识到了也不是作为主要目标,是由社会诸因素客观上决定,不以组织者主观意志为转移的作用和影响。从效益显示的时间看,直接效益能在较短时间内显现出来,扩展效益稍长,溢出效益则需经过数十年、数百年的时间才能显现。

“直接效益”、“扩展效益”、“溢出效益”和前文所述“操作效益”、“质量效益”、“制度效益”的关系如图。

(二)从公平和“直接效益”、“扩展效益”、“溢出效益”的多维度探究驱动和制约评价选拔制度改革的复杂因素

1.从察举转为科举,评价信度、程序公平是决定性因素

(1)察举在理论上具有较高的效度和效益,但其对评价信度、程序公平的难以保证最终影响其效度。察举既有平时的考察,又有专门的考试,是很完备的综合评价制度,从理论上说在效度上很占优势。但是由于先举后考,推荐决定了一个社会成员是否有参加考试的资格,在推荐的过程中容易受主观因素的干扰。在察举实行前期,推荐者大多能出以公心,因此效度较高,同时也不影响公平。到了后期,由于地方官员的考察水平的欠缺和主观上的“私心”“偏心”,所推荐的不是最优秀的,而且被推荐者往往把对制度的感激之情投射在地方官员身上,世家大族把持朝政后更容易因此而形成利益集团,最终影响中央政府对国家的治理能力。因此其信度容易受多种因素干扰而趋低甚至很低,从而最终影响其效度。

?

(2)科举考试对起点公平和程序公平的贡献无与伦比。科举考试对公平的贡献主要体现在:(1)科举的“只试不荐”最大限度地实现了机会均等、起点公平。理论上,察举和科举都可以体现起点公平、机会均等。但是由于察举是“先举后试”,士人不管多优秀如果未获推荐,就没有参加考试的资格,如果举荐者出以私心,所举非才,就严重损害了机会均等。而科举参加考试的门槛很低,除了极少数特殊人员,绝大部分社会人员都有参加考试的权利和机会,真正体现了机会均等的理念。(2)科举考试把评价信度和程序公平推到极至。从汉代察举的综合评价转型为隋唐明清科举的统考(分数)评价,最突出的贡献是:建立了人类历史上最客观、最刚性、最统一的评价标准和评价程序,有效地排除了犯规舞弊等主观因素对评价的干扰,把评价选拔的信度提升到空前的高度。

2.科举得以长期实施,除了公平性上的优点,扩展效益高是主要原因;科举最终被废,则是溢出效益上出了大问题

科举考试在公平维度上的优点是显而易见、人所共知的,科举考试的效益如何,这是一个非常复杂的问题。本文为此专门把效益区分为直接效益、扩展效益、溢出效益来进行深入分析。

(1)科举考试的直接效益差强人意,是一种无奈的选择。但学习过程中的能力迁移规律有利于克服统考的片面评价缺陷,及第者的凤毛麟角保证了进士的总体素质。

科举考试考核结果侧重于某一方面,是一种片面的考核,难以反映应试者的综合素质,因此其直接效度差强人意,是统治阶层不得已而采取的评价选拔方式,是“最不坏”同时也是有点“无奈”的选择。明代朱元璋的停罢科举是最典型的例子。朱元璋在登基伊始就开科取士,但他很快就失望了,通过科举选拔的士子并不符合他的要求:“朕以实心求贤,而天下以虚文应朕,甚非所以称朕意也。其暂罢天下科举。”⑤由此停止科举制度,转而借用汉代察举制度,用荐举代替。但是施行若干年后发现荐举的弊端更多、更严重,因此9年后又恢复了科举取士制度。可见科举是他不得已而采取的“最不坏的”制度。

对科举考试的直接效益,可以从以下两个方面进行更深入的讨论:①学习和能力、素质的迁移规律保证了及第进士的较优(不是最优)素质。人的学习过程是人的知识、能力和素质养成的过程。学习迁移是普遍规律,人的不同能力之间存在迁移的可能性。科举考试在内容上以经学为主(特别是明清时期),在形式上是书面考试。其测试的能力特质,除了记忆、理解外,也有分析概括能力。有的试题的解答要得到高分,除了阐述圣贤的既有观点外,也要联系生活实际,要对治国理政的方略提出自己的见解。因此,通过考试也能在一定程度上反映出举子的生活阅历、政治主张等等。对问题进行分析概括,并联系实际提出自己的观点,这样的能力可以通过学习得到增进。这样的能力具有可迁移性,可以应用于所有的工作和生活场景。②单一的闭卷笔试形式不能保证及第举子是综合素质最优的,但是因为及第进士数量稀少,属于精英选拔,总体上能符合要求。分析举子的素质结构,至少有三种类型:一类是综合素质全面型,既有较强的理论学习能力,也有较强的实践能力(含管理能力,下同);第二类是强于理论学习能力而弱于实践能力;第三类强于实践能力而弱于理论学习能力。笔试考核选拔了前两类,而淘汰了第三类。相对于国家管理的某些岗位,第三类中完全有可能比第二类更适合的。但是由于第二类中的大部分已经能胜任国家管理的岗位,因此对第三类的“无奈”淘汰不足以影响大局。

『加入书签,方便阅读』
热门推荐
魂穿废柴:我在蓝星做大圣他的神豪系统会卖萌梦魔游戏外卖小哥的神秘钓箱都市猛男,我有九阳指成为大佬,从重生02开始重生在东北松花江上修武高手在都市穿越之乐坛风云高武:妈呀!原来杀猪也能成圣