长沙期货配资 破除“唯论文”,科研评价改革探索|他山之石

发布日期:2025-02-18 01:20    点击次数:166

长沙期货配资 破除“唯论文”,科研评价改革探索|他山之石

‍长沙期货配资

导读:近年来,我国出台了一系列关于破除“唯论文”的科研评价改革文件。如何将政策文件中倡导的多元评价、分类评价等评价导向在高校的科研评价实践中落实,是当前亟待解决的重要问题。科研评价改革走在前列的英国、德国、法国、意大利、荷兰和挪威等国通过各自的高校评价改革实践,在兼顾多元评价主体、细化影响力评价体系、推行代表作评价制度、实行学科分类评价方法、结合定量与定性评价等方面发展出了值得借鉴的国际经验与有效做法,能够为我国这方面的探索提供启示。结合我国的科研评价实际及改革发展方向,对各国高校科研评价的实践进行比较分析可以看到,未来倡导诊断性评价、建立分类评价与多元评价体系、注重定性与定量方法相结合、建立国家级科研信息系统等做法,可以进一步为我国高校破除“唯论文”后的科研评价改革探索提供全球视野与国际借鉴。

· 摘 编·

近年来,我国致力于破除 “唯论文” 的科研评价体系,出台多项改革政策,聚焦多元评价、分类评价等重点问题,但在高校科研评价实践中仍面临诸多挑战,如影响力评价、定量定性结合评价、学科分类评价的具体实施等。英国、德国、法国、意大利、荷兰和挪威等国在科研评价改革方面先行一步,其经验可为我国提供借鉴。

展开剩余96%

英国构建卓越框架体系,采用代表作评价,实行学科分类评价,评估结果影响经费分配;德国高校评价以州级自主为主,采用分类评价,结果作为经费资助参考;法国强调高校自主性,采取内外部结合的评价模式;意大利注重学科分类评价和代表作评价,评价结果与经费分配挂钩;荷兰采用诊断性评价模式,聚焦科研质量提升;挪威建立国家级科研信息系统,科研评价与经费分配系统独立。

这些国家在科研评价方面呈现出诸多特征:兼顾多元评价主体,协调多方利益;细化影响力评价指标,区分学术与社会影响力;推行代表作评价,丰富成果提交形式;实行学科分类评价,依据学科特点选择方法;定量与定性评价相结合,发挥两者优势。

基于国际经验,我国高校科研评价改革可从多方面着手:倡导诊断性评价,根据不同目的设计评价机制;推行分类与多元评价,考虑高校和学科差异,平衡多元利益;注重定量与定性方法结合,依据评价对象层级选择合适方法;建立国家级科研评价信息系统,提供信息支撑,减轻评价负担,促进信息共享;重视评价结果应用与反思,实现以评促建;平衡高校科研与其他职能,合理设置科研评价比重,推动高校全面发展。

以下是文章全文——

01

引言

科研能力是一个国家科技创新与发展的核心驱动力,而高校作为高等人才聚集和培养的重要场所,对国家的科技发展具有重要推动作用。如何使用好科研评价这个“指挥棒”,使其更好地服务于我国科技进步和学术研究是高校科研评价工作的主要目标。进入21世纪,伴随着国民经济的飞速发展,我国的科研投入不断增加,高等教育规模日益扩大,高校的科研职能更加凸显。为有效发挥科研职能,高校不断加强科研管理与评价工作,“科研评价热”愈演愈烈,导致论文指标在高校评价中的用途不断扩展甚至出现异化。21世纪初,我国的科研评价政策更偏向于“量”的评价,评价指标依赖于科研产出的数量,“论文数”是高校科研评价中的重要指标。近年来,在偏重定量评价的政策导向下,我国论文数量在较短时间内实现了大幅提升——据美国国家科学基金会(US National Science Foundation, NSF)统计,2018年我国在科学出版物总数上首次超过美国,跃居世界第一。但成绩背后也存在负面效应,强化定量考核的科研评价政策使得我国科研成果存在着“重数量轻质量、重形式轻内容、重短期轻长远”的现象,部分科研人员甚至出现“灌水论文”“造假论文”“代写买卖论文”或其他科研不端行为。这不仅违背了高校科研评价政策制定的根本目标,也不利于我国学术健康发展与科研水平长期持续提升,因此需要对高校科研评价制度进行改革,改变和优化浮夸浮躁、急功近利的科研环境,为我国科研水平的不断提高与科技长期发展注入科学精神与新的活力。

近年来,我国出台了一系列改革措施。2020年2月,科技部印发《关于破除科技评价中“唯论文”不良导向的若干措施(试行)》的通知,强调推行分类评价,改变“唯论文”的不良导向。同期,教育部和科技部印发《关于规范高等学校SCI论文相关指标使用树立正确评价导向的若干意见》的通知,明确提出要准确理解SCI论文及相关指标,建立健全分类评价体系,注重标志性成果的质量、贡献和影响,强化代表作同行评议等要求。2020年10月,中共中央、国务院印发《深化新时代教育评价改革总体方案》,强调要改进高等学校评价,突出质量导向,要根据不同学科、不同岗位特点,坚持分类评价,推行代表性成果评价,探索长周期评价,完善同行专家评议机制,发挥评价的指导引领作用。2020年12月,教育部印发《关于破除高校哲学社会科学研究评价中“唯论文”不良导向的若干意见》的通知,要求优化评价方式,坚持分类评价,探索多元评价,推行代表性成果评价,突出同行专家在科研评价中的主导地位。从以上政策文件的内容可以看出,目前我国的科研评价改革正在聚焦于多元评价、分类评价、影响力评价、代表作评价、定量信息支持的同行评议等重点问题。

但截至目前,以上科研评价政策与改革导向在高校评价实践过程中仍存在着如何进行影响力评价、如何在评价中有效结合定量定性方法、如何实行学科分类评价等一系列具体实践问题。这些实践问题并非中国特有,关于科研评价改革的反思与讨论在国外也屡见不鲜。近十年来,国际上出台了一系列倡议,致力于不断推进科研评价改革,例如2013年的《旧金山科研评价宣言》(San Francisco Declaration on Research Assessment, DORA)倡导负责任地使用科研评价指标;2015年的《莱顿宣言》(The Leiden Manifesto for Research Metrics)提出了合理利用科学评价指标的10条原则;2020年欧盟推出的《负责任的研究与创新政策》(Responsible Research and Innovation)强调了科研创新工作的社会贡献;等等。由此可见,一些国家和地区较早地注意到了先前科研评价指标在应用于评价实践中存在的问题,并积极进行了改革探索,这为我国当下高校科研评价改革提供了丰富案例和实践经验。欧洲是评价改革的先驱,欧洲各国之间展开了丰富的国际交流合作,在科研评价的许多问题上达成了一定共识。同时,这些国家的评价模式又各具特色,形成了多个知名评价体系,得到学者、政策制定者与媒体舆论的广泛关注。鉴于此,本文选取英国、德国、法国、意大利、荷兰和挪威6个代表性国家,以其国家层面针对高校的科研评价实践作为研究案例进行比较分析。这6个国家在影响力评价、学科分类评价、多元评价体系、代表作评价方法、诊断性评价模式和数据平台支持等方面各具特色,能够为我国科研评价的改革和发展提供一定的借鉴意义。

02

国际实践与对比分析

一个国家的科研文化背景与历史沿革对其当下的评价体系具有重要影响。因此,本部分对各国高校科研评价背景与实践情况进行概述,以勾勒不同国家高校科研评价实践的基本面貌,之后分别从评价体系、评价目的、推动主体、评价周期、评价方法及是否影响资源分配等维度对英国、德国、法国、意大利、荷兰、挪威6个国家进行横向比较,总结国际高校科研评价的主要特征。

(一)国际实践 ‍‍‍‍‍‍‍‍‍‍‍

英国、德国、法国、意大利、荷兰和挪威的高校科研评价实践根植于本土评价环境,形成了具有鲜明国家特色的高校科研评价体系。英国构建了“卓越框架体系”,倡导多元评价;德国高校评价工作由各州独立组织并进行灵活调整;法国兼顾多维评价目的,采用内外部结合的评价模式;意大利注重分类评价,依据学科领域特点,侧重不同的评价方法;荷兰采用诊断性评价,着重评估科研质量和社会影响;挪威建立国家科研信息系统,实现全景信息监测与支撑。以下将分别介绍各个国家高校科研评价的历史沿革和实践特色。

1.英国:多元评价体系

近十年来,英国在高校科研评价方面进行了一系列卓有成效的改革,对提升英国整体的科研竞争力起到了非常重要的促进作用。从高校评价体系构建角度看,英国政府依据多元评价思想,先后将高校的科研、人才培养及社会服务活动纳入评价范围,不断向精细化的方向扩展评价维度,形成了卓越研究框架(Research Excellence Framework, REF)、卓越教学框架(Teaching Excellence Framework,TEF)和知识交换框架(Knowledge Exchange Framework,KEF)并举,同时覆盖高校三大职能的高校评价体系——卓越框架体系。卓越研究框架是2014年英国政府在传统科研评估实践(Research Assessment Exercise,RAE)基础上做出重大调整的全新评估制度,是目前英国最主要的高校科研评价体系。该制度采用代表作评价方法,致力于优化英国高校的科研管理,提升高校科研质量和效率,其评估结果直接影响高校经费分配。卓越研究框架实行学科分类评价,根据学科特点将34个子学科划分为4个大类后分别进行评估。评估专家由资助机构任命,其中包括一定比例的国际专家和来自医药、工业、能源与环境等领域的用户成员,以保证评价结果的全面客观。卓越研究框架的主要评估维度包括科研产出、科研影响及科研环境三个方面,占比分别为60%、25%和15%。

在新一轮的高校评价中,英国政府委托高等教育基金委员会于2020年7月出台《卓越研究框架2021修正草案》,此方案将作为英国本轮高等教育科研拨款及高校排名的权威依据,评估结果已于2022年5月12日发布。这一结果将有利于英国高校进行国内及国际定位,并帮助高校进行战略决策。总体而言,英国高校科研评价的覆盖范围在不断增加,评价维度不断完善,逐步将科研的社会影响纳入科研评价过程中,并以同行评议案例材料作为主要的评价方法。

2.德国:州级自主评价

德国高校科研评价主要体现了州级自主、灵活调整的特征,在地方级评价组织和分类评价方法方面对我国有借鉴意义。德国的高校科研评价工作由政府机构和第三方组织(德国科学委员会、德国研究协会、大学发展中心、洪堡基金会等)共同推进,并遴选同行专家成立具有学科特色的专家委员会。专家委员会从各学科的科研绩效出发,设置相应的评价指标体系。评价范围涉及整个高等教育系统,包括大学、研究机构、研究协会等。评价的主要目的是为高校和研究机构的研究质量提升提供支持和保障,并促进良性竞争。评价的结果不直接影响经费分配,但会作为联邦政府和州政府资助活动的参考指标。德国在国家层面制定了主要的评价标准、评价方法及评价程序,但没有国家统一组织的全国高校科研评价,相关的评价工作主要由各州政府或高校独立组织,具体实施细节可由各州灵活调整。在最新一轮的评价文件中,德国正式将国际同行评议和分类评价纳入高校科研评价体系中。

具体而言,德国科学人文委员会(German Council of Science and Humanities)基于国内外前沿评价方法制定评级标准,要求综合同行评议、定量数据和背景信息的方法进行评价。评估的主要维度包括研究的质量、社会关切度及有效实用性。在评价程序上,评价活动由指导小组和评估小组共同推进。指导小组负责领导管理整体的评价流程,评估小组负责详细说明评价的标准,并与指导小组协商确定评价量表,各项标准将由同行评议数据或定量数据进行支撑。德国州级的高校评价在不同州之间存在较大差异,具有代表性的是萨克森大学学术顾问委员会(Wissenschaftliche Kommission Niedersachsen,WKN)实施的对该地区高校科研的系统评估。萨克森大学学术顾问委员会是独立的评价专家委员会,负责组织实施评价,评价结果将同时提交给评价对象和州政府。此外,萨克森大学学术顾问委员会还为评价对象提供未来发展建议。德国评价实践最突出的特点是州级独立性,各州在服从整体评价流程的基础上有灵活调整的权利,例如以工业作为支柱产业的州可以在评价中偏重科研产出的工业转化率。这一特色使评价实践更符合本州特色,体现了科学研究对社会需求的呼应。

3.法国:内外部结合评价模式

法国高校科研评价的突出特点是强调高校自主性,重视大学内部评价。法国高校科研评价主要由独立的公共机构高等教育研究评估高级委员会(Agence d’évaluation de la recherche et de l enseignement supérieur)推动。法国高等教育体制的特点是多种类型的机构并存,包括大学、公共机构、行政事业单位、私立高等教育机构等。因此,高等教育科研评估方案中也涉及多种类别机构的评估工作。法国高等教育评价不仅依赖外部评估,同时注重内部评估。根据高校自主原则,高等教育质量管理的第一责任落在大学(或研究机构)本身,大学(或研究机构)内部评估是法国高等教育质量框架的基础。在法国高等教育研究评估高级委员会的指导和敦促下,各高等教育机构参照其所在区域的评价文件(如Livre des références, LDR)启动内部评估程序,将评估结果公开。在进行外部评价时,委员会将法国划分为5个主要区域,每年只针对性地评价一个区域内的高校。5个区域都有其特定的评价标准,所有区域评价一轮的周期为5年。2021年11月,法国高等教育研究评估高级委员会提出了2022—2023年评价改革的指导方针:将为评估对象提供更科学有效的指标、管理工具、评价体系及培训课程,以简化评估流程,提高效率。

法国高校科研评价更好地发挥了高校的自主性,采取了内外部结合的评价方式。作为被评价对象的高校得以对自身科研情况、具有的优势及存在的劣势有更为深入的了解,自我评价能更好地反映被评高校的情况,为外部同行评议提供信息支撑。将自我评价融入评价系统也是未来我国科研评价改革的方向之一。

4.意大利:分类评价方法

意大利的高校科研评价注重学科分类评价思想和代表作评价方法,与我国目前的评价改革导向不谋而合。意大利为适应国家高等教育经费制度改革,于21世纪初在全国范围内开展的科研评价改革。2011年,意大利国家高校及科研机构评估署(Agenzia nazionale di valutazione del sistema universitario e della ricercar, ANVUR)正式开展全国性的科研质量评价(Valutazione della Qualità della Ricerca,VQR)。这一评价体系是由3年期科研评估(Valutazione triennale della ricerca,VTR)变革而来,每4年一个周期,其评价范围很广,对象包括全国范围内的大学、研究机构及其所属部门、从事研究活动的其他私人机构等。该评价体系的主要特点是采用代表作制度,评价结果直接影响高校经费分配。同时意大利全国性的科研质量评价还十分注重分类评价思想,根据学科领域的不同特色,采取不同的评价方法,进而分配同行评议与定量指标所占的比重,进行有针对性的评价。意大利根据不同学科特色,采用结合定性与定量的复合评价方法开展评价,这一实践可为我国开展高校学科分类评价提供借鉴。

5.荷兰:诊断性评价模式

荷兰高校科研评价以《战略评估协议》(Strategy Evaluation Protocol,SEP)闻名,SEP也是诊断性评价模式的先驱。荷兰每6年组织一次全国科研评价,评价对象包括荷兰的大学和科研机构。荷兰的国家科研评价体系与科研经费分配体系各自独立运行,科研评价的目的主要在于分析优势劣势、诊断问题、提出建议,最终达到提升科研质量的目的,评价结果并不对科研经费分配体系产生直接影响。荷兰公共知识机构于2019年11月发布《为每个人的才能创造空间》(Make Room for Everyone’s Talent)倡议。在此倡议的推动下,2021年9月荷兰政府组织国内外专家研究制定了新的《战略评估协议》,新的评价方案着重强调了社会关切度、研究质量及可行性。荷兰政府要求研究机构通过提交自我评估文件以及实地考察两种方式对以下4个维度进行评价:质量、科研产出、社会关切度、活力与可行性。除此之外,荷兰还会评价科研成果的社会价值、社会影响及社会应用性,并对高校进行SWOT分析,给出相应建议。荷兰战略评估协议以同行评价和自我评价为主,其评估结果和政府拨款之间没有直接的联系,但教育部会基于该评价结果对科研业绩较差的单位进行警告,督促其整改。荷兰评价体系中的诊断性评价模式在欧洲广受好评,具有一定的借鉴意义。与总结性评价相比,诊断性评价更侧重于对未来发展的建议,能更好地反映以“评”促“建”的评价初衷。

6.挪威:国家级科研信息系统

北欧国家在全球创新排名中名列前茅,且十分重视高校的科研竞争力,自20世纪90年代以来便实施了一系列卓越计划以提高北欧整体科研水平。在北欧国家中,挪威的高校科研评价体系颇具特色,在北欧乃至欧洲都具有比较广泛的影响力。挪威教育质量保障机构是挪威教育研究部下属的独立专家机构,致力于促进挪威高等教育(包含高等职业教育和外国同等学历教育)的发展,是开展高校评估及发布评估报告的主要组织机构。

挪威高校的科研评价和经费分配分属两个系统,这两个系统彼此独立、互不影响。在挪威,高校科研评价是全国科研评价的组成部分,全国性科研评价文件由挪威研究委员会产生,主要侧重于获取有关被评大学或机构绩效及其影响因素的信息,帮助评价对象不断提升科研表现、扩大学术及社会影响,属于典型的诊断性评价。在高校的经费分配方面,挪威自2005年起正式采用基于科学计量指标的科研经费分配方案,是最早开拓和应用科学计量指标进行经费分配的国家之一。挪威具体的科研经费分配规则和指标体系通常被称为“挪威模型”,这一模型被芬兰、丹麦、比利时等多个欧洲国家推广和应用。挪威模型具体分为三个组成部分:综合全面的国家科研信息系统作为数据来源,具有不同权重的科学计量指标对科研成果计分,计量结果纳入国家科研经费分配体系。除此之外,挪威还设立了“卓越中心计划”,以支持具有国际水平的长期研究。挪威高校评价的突出特色是建立了国家级科研信息系统,实现了多源且多元的信息整合与共享,适用于各层次的机构评价与个人评价,为学术评价的顺利推行提供了科研数据基础。

(二)对比分析

高校科研评价改革在全球范围内备受关注,许多问题具有明显的国际共性。因此,追踪代表性国家高校科研评价改革的新举措,对我国借鉴国际经验、落实科研评价改革政策具有积极意义。上文主要从评价目的、推动主体、评价方法等方面对英国、德国、法国、意大利、荷兰、挪威6个国家的高校科研评价实践情况进行梳理分析。为更加直观地展示各国的评价体系,笔者将对各国评价实践进行比较。

各国的评价体系各具特色。其中,德国和法国允许各州/区域根据本地情况对评价指标等进行调整,在评价体系设置上体现出更多的灵活自主性;其余各国均采取全国统一的评价体系。在评价目的上,各国均以提高本国的科研水平为目标,其中法国、挪威和荷兰更加强调诊断性评价。在推动主体方面,各国大多由国家机构下设的相关部门进行推进。评价周期的长短在评价活动中也是重要的维度,过短的评价周期容易使被评对象出现结果导向的短视行为,所以评价周期从4年到7年不等。在评价结果的应用层面,各国有显著差异,德国、法国、荷兰和挪威的评价结果更多服务于高校的建设与发展,不影响高校资助经费的分配,而英国65%的经费与评价结果挂钩,意大利的评价结果会直接影响高校经费分配。在评价方法方面,代表作评价被广泛应用,同时内部评价与定量指标也常常作为支撑信息,或直接作为评价体系的一个指标维度。

03

国外高校科研评价的主要特征

鉴于国外高校科研评价各具特色,这一部分以我国科研评价改革政策文件中梳理归纳出的重点问题为线索,主要聚焦于多元评价、影响力评价、代表作评价、分类评价、定量与定性相结合评价等几个问题,对国外高校科研评价的主要特征进行综合分析。

(一)兼顾多元评价主体 ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

评价主体是指评价活动的实施者,不同的评价主体具有不同的学术背景和认知能力,在评价过程中也具有不同的倾向性。根据评价目的,吸纳多元主体参与到评价过程中有利于评价结果的合理有效性。从国际实践看,英国政府注重多元评价,具体体现在利益多元和主体多元两方面:利益多元是指评价体系中涉及科学研究、人才培养、社会服务等多方利益;主体多元是指在评价过程中多方主体参与对多方利益的协调。英国卓越研究框架专家小组成员由英格兰研究院(Research England)、苏格兰资助委员会(Scottish Funding Council)、威尔士高等教育资助委员会(Higher Education Funding Council for Wales)、北爱尔兰经济部(Department for the Economy, Northern Ireland)4个资助机构任命,体现了多元主体的评价理念。另外,评价过程还要接受政府、学校、学会组织及4个高等教育资助机构等多方代表组成的指导小组的指导与监管。与此同时,来自全球各地、具有不同专业知识背景的专家组成国际顾问团,为评价工作提供建议,这更进一步显示了评价主体的多元化特征。

(二)细化影响力评价指标

影响力作为科研质量的相关指标之一,逐渐被纳入各国高校科研评价体系,并进一步细分为学术影响力和社会影响力等维度。在学术影响力方面,需考虑到不同指标的适用范围,谨慎使用期刊影响因子、论文被引频次等定量指标作为学术影响力的度量标准,并在使用时考虑到计量评价方法的适用范围和局限性。而社会影响力主要是指科学研究对经济、社会、文化、公共政策服务、健康、生活环境质量等学术之外的领域所带来的影响和改变。有学者提出将Altmetrics指标、内容分析法、社会网络分析法等指标或方法应用于社会影响力的评价。但以上方法是否能够有效表征社会影响力还有待进一步考证,因此笔者以最早将社会影响力引入评价体系的英国卓越研究框架为例,对其实践情况进行归纳与分析。

英国卓越研究框架是最早将科学研究的“社会影响”正式纳入高校评价体系的国家。这里的社会影响力评价从“广度”(reach)和“意义”(significance)两个方面进行,强调科研在文化、经济、环境、教育、政策制定、公共服务等各个方面造成的影响,并由专家对高校提交的社会影响力评价支撑案例进行同行评议。卓越研究框架评价体系中案例研究与同行评议相结合的方法值得借鉴。由高校提供社会影响力评价的支撑案例既发挥了高校的主体地位,也能使各个类型、不同特色的高校保持差异。相关领域的专家进行定性评价能够更好地说明该案例的重要性与有效性,从而实现对高校科研社会影响力的科学评价。此外,在影响力评价方面,还需合理结合自我评价和外部评价:一方面需要由高校自主汇总评价相关的案例资料,体现高校在评价中的主体地位和办学特色;另一方面需要通过同行评议等外部评价方法提高评价水平,确保评价质量。

(三)推行代表作评价方法

代表作是指能够体现和衡量科研人员学术水平的代表性成果,针对在国内引发广泛讨论的代表作评价制度,笔者选取英国与意大利作为主要案例进行比较分析。英国卓越研究框架与意大利全国性科研质量评价在高校科研评价中都实行了代表作评价制度,但出于不同的评价目的,英、意两国在推行该制度时有不同的实践,大体包括针对部分的代表作评价和针对整体的代表作评价两种做法。具体而言,英国卓越研究框架在材料提交阶段要求每个高校公开选择研究人员,被选择的每位科研人员需提供4项代表性科研成果,成果形式包含著作、论文、书中章节、工作报告、会议论文、教材、设计与展品、媒体作品等。成果评价主要采用专家评价,同时参考Scopus引文数据库的文献计量数据作为背景信息。考虑到文献引用数据会因论文发表时间、学科背景、负面引用、出版语言等因素而存在差异,这一指标只作参考。与英国以科研机构为单位提交代表作的形式不同,意大利全国性科研质量评价采用的代表作评价制度以科研人员为提交单位,要求大学或研究机构中每位科研人员均提供两项代表性科研成果用于评价,提交成果包括专著、期刊论文、会议论文、建筑项目、设计作品、表演、影音资料、心理测试等多种形式。

在破除“唯论文”科研评价改革的当下,英国和意大利两个评价体系针对不同学科的特点而丰富科研成果提交形式的做法值得学习借鉴。需要指出的是,英国与意大利科研评价过程中采取的两种代表作模式各有利弊,不同模式背后是科研评价目的的考量:英国卓越研究框架更加鼓励少数精英科研人员的发展,因此仅需要机构层面提供代表作;而意大利全国性科研质量评价则鼓励全体科研人员共同进步,需要对每一位科研人员的代表作都进行评价。对我国而言,代表作评价模式的选择应考虑到评价场景、评价目的、评价时间的紧迫性及资金预算等多种因素。

(四)实行学科分类评价

由于不同学科在科研产出、科研影响、发展模式等诸多方面都存在差异,“一把尺子量到底”的评价模式无法适应多样的学科类型,笔者将对意大利和德国在学科分类评价中的具体做法进行梳理比较与参考借鉴。

意大利全国性科研质量评价注重分类评价,主要根据学科领域特点选择评价方法,将评估对象划分为16个学科领域,并为每个学科领域组建评价专家小组,评价专家包括本学科小组专家和外国评审专家。然后,将16个学科进一步划分为科学、技术、工程与数学(Science,Technology,Engineering,Mathematics,STEM),人文与社会科学(Humanities and Social Sciences, HSS)和经济学(Economics)三个领域,并对这三个领域采用差异化评价方法及指标进行评价。例如,人文与社会科学领域只采用“知情同行评议”(Informed Peer Review)的方式,但科学、技术、工程与数学领域以及经济学领域采用的则是知情同行评议和文献计量相结合的评价方法,科研产出的文献计量学指标也对最终评价结果产生影响(文献计量指标所占比重依具体学科而定)。此外,不同学科领域评价的外国专家占比也有所区别,法律专业外国专家占比最低,仅为3%;而工程专业占比最高,达到了68%。

2000年至2008年,德国萨克森大学学术顾问委员会对高校所有学科进行评价,并在初步评价后的第三或第四年对评价建议的执行情况再次进行评估。从2015年开始,萨克森大学学术顾问委员会不再定期评估所有学科,而是采用需求驱动的方法,主要关注特定学科。评审专家组依据不同的学科特点确定评价的标准及实施方法。按照国家级评估标准程序的要求,高校需提交自我评价报告,并由专家组进行实地考察,给出最终评价结果。

意大利和德国分别从不同侧面为我国高校科研评价中的学科分类评价实践提供了借鉴。意大利全国性科研质量评价将不同学科划分到学科大类中,按照学科大类的特点设置专家比例及评审方式。德国萨克森大学学术顾问委员会则将对全部学科的评价转化为对有特殊需求的特定学科的评价,体现了科研评价与需求的结合。

(五)定量评价与定性评价相结合

定性方法与定量方法各有优劣,互为补充。有关定性方法与定量方法的讨论在很多论文中均有涉及,笔者将以在评价中最常用到的同行评议与科学计量分别作为定性方法与定量方法的代表展开讨论。

同行评议作为定性评价的典型方法,主要通过同行专家对科研成果的规范性、科学性和创新性进行评价,兼具专业性和科学性的优点,但同时同行评议过程中也会因出现新兴领域或交叉学科成果难以找到完全合适的评审专家、难以避免人情问题及利益冲突等问题,因而更适用于微观层级评价实践。科学计量作为定量方法的代表,以客观数据作为基础,探寻科学活动的内在规律和特征,并在不断发展的过程中逐渐承担起科研评价的功能。由于科学计量方法评价结果来自对客观数据的定量表示,天然具有客观性和真实性,因而更适用于宏观层级评价实践。

在国际实践中,英国主要采用定量数据支撑的定性评价。在材料提交阶段,高校在提供产出信息的同时,也提供引文数据作为支撑同行评议的背景信息。专家将根据学科差异来选择是否使用定量数据以及如何使用定量数据。对于需要使用定量数据的学科,一般是通过相关引文数据库获取标准化后的引文数据,为专家评价提供参考并保证评价过程的客观透明。德国的科研评价体系综合了同行评议、定量数据和背景信息,评估的主要标准包括研究成果的质量、社会关切度及有效实用性。德国在高校科研评价过程中会采用一些定量指标,但主要评价工作仍由同行评议完成。除此之外,德国有专门的权威机构制定相对完善的辅助性说明,帮助评价专家了解不同定量指标的优劣及其适用范围,为定性评议提供支撑。在挪威,科学计量和同行评议两种方法有机结合在一起,学科领域专家参与到具体指标的权重设计和高级别出版物的认定等关键环节。荷兰则主要采用同行评议方法,以科学计量的数据和指标为同行评议专家提供必要的信息参考,但最终的评价结果由同行评议专家决定。意大利主要采用知情同行评议和文献计量两种方法,根据学科领域不同,采取的方法有所侧重。评价小组利用外部评审专家、评价指标等所有可用信息,通过知情同行评议决定分数,最终得分均由评价小组负责。如果专家评价结果与文献计量结果存在较大偏差,则需要给出充足的理由,最终结果由评价小组主席审查决定。

综合以上国际实践,定量评价与定性评价相结合,可以对高校科研评价过程起到支撑和规范作用,从而优化评价流程,节省评价时间,达到更好的评价效果。在具体的国外应用场景中,科学计量和同行评议在高校科研评价的前期、中期和后期发挥着不同的作用:前期可使用科学计量方法进行数据调研,掌握不同学科的科研人员发展、成果产出与影响扩散的特点和规律,并以此为依据对评价体系进行科学调整;中期可以将科学计量方法与同行评议有机结合——同行评议方法作为科研质量评价的主要手段,科学计量提供辅助筛选及信息支撑,以减轻同行评议专家的负担;后期可以通过科学计量指标对整个评审结果进行审核、复盘与反馈。

04

从国际经验到中国启示

随着我国一系列评价改革政策的出台,各地高校纷纷响应,对相关评价与管理规定进行改革与调整。但高校评价改革的实践仍未打通政策落地的“最后一公里”。在破除“唯论文”的政策背景下,科研管理与评价工作者对“不能以论文、学历、职称、奖项等作为评价的唯一指标”这一认识是清晰的,但如何更加科学地完善科研评价体系,如何对科研成果的质量、绩效、贡献进行全面准确的评价仍缺乏清晰、统一的认知。本文通过梳理部分国家高校科研评价的国际经验,从评价主体、评价方法、数据支撑等多个角度对各国特色进行归纳总结与对比分析,并结合我国评价改革政策导向,提出倡导诊断性评价、分类评价和多元评价,注重定量方法与定性方法相结合的科学有效性,进而提出建立国家级科研评价信息系统并注重评价结果的应用反馈和系统优化等建议。

第一,根据不同评价目的设计对应评价机制,倡导诊断性评价。高校科研评价具有不同的目的和功能,需依据不同的评价目的,确定适合的评价主体(中央政府、地方政府、高校或第三方独立机构等)及评价对象(代表作的选取范围、数量、遴选标准等),进而设计与之相匹配的评价逻辑和评价机制。此外,我国高校目前的科研评价模式更偏重于总结性评价,即关注过去表现,检验成果是否达到目标或期望,评价的结果为统计、决策或资源分配服务。而诊断性评价则通过调查等形式列举高校内部具有的优势、存在的劣势以及外部的机会和威胁,注重为各层次的评价对象提供有益建议,从而为高校的战略发展服务。诊断性评价已被德国、荷兰、挪威等多国作为主要的评价模式,由总结性评价向诊断性评价转变是当前中国高校科研评价改革可参考的转型模式之一。

第二,倡导分类评价和多元评价模式。破除原有的“五唯”评价标准后,需要倡导分类评价并建立多元评价模式。对不同类型、不同区域和处于不同发展阶段的高校明确分类评价原则,不能设置“一刀切”的评价标准。在评价指标体系的设置与评价方法的选择方面,也需要充分考虑不同学科领域的科研模式与发文特征,进行差异化处理。同时高校科研评价应更加科学地引导高校多元发展,注重平衡多元利益主体关系,考虑引入多元主体参与评价过程,推动大学与政府、企业、社会的深度合作,重视科学研究对经济和社会发展的影响与贡献,丰富影响力评价的维度,更加有效地满足社会多元利益需求。

第三,注重定量方法与定性方法相结合的科学有效性。在高校科研评价的实践过程中,要依据不同评价场景,探索适合的科学计量与同行评议相结合的路径。当面对不同层级的评价对象时,国际学界的普遍共识为:越偏向宏观层级的评价对象,计量评价的可靠性越高,权重越大;越偏向微观层级的评价对象,同行评议方法的可靠性越高,权重越大;在中观层级,例如当评价对象为大学和研究机构时,计量评价和同行评议的结合是最科学有效的方法。此外,还需要合理使用科学计量指标,充分发挥其优势作用。在实践中,使定量指标更好地支撑评价需要“计量智慧”(Metric-wiseness),未来可以进一步深入探索“基于充分信息支撑的同行评议”和“基于专家研判的计量方法设计”这两种深度融合模式,真正实现计量方法精准高效性和同行评议专业诊断性的有效结合。

第四,建立国家级科研评价信息系统,为评价活动提供可靠全面的高质量信息支撑。以挪威为代表的国家级科研信息系统为我国提供了可借鉴的丰富实践经验。首先,国家级科研信息系统可以为同行专家提供全面丰富的信息支撑,帮助专家在相对有限的时间内做出科学有效的判断。其次,国家级科研信息系统可以减轻评价对象负担。在评价工作开展时,仅需根据具体评价目的,从系统中查找抽取相关数据信息,不需要反复填写、上报、审核,减少高校教职员工及管理部门在提交、审核评价材料方面花费的时间精力。同时,有利于形成动态监测与反馈机制,引导周期性评价向常态化监测过渡。再次,服务多元对象和场景。全面丰富的科研信息系统不仅可以服务于政府组织的评价工作,还可以解决各个高校的“信息孤岛”问题,帮助各高校集成和共享高质量的信息,促进科学的战略规划、内部诊断和外部交流合作,为实现系统性以评促建打好基础。

第五,注重评价结果的应用和反思,真正实现以评促建。高校科研评价是一个系统性、长期性和耗费大量人力物力的工作,如何更科学有效地应用评价结果,使评价结果不仅仅是提供“一纸榜单”和支撑资源分配,而是能更有效地服务于多元利益主体,实现评价效能的最大化,是当前需要解决的重要问题。建议综合考虑评价结果对中央政府、地方政府、高等学校、社会组织和企业、教师与学生等多元主体的“有用性”,尤其注重高校自身通过评价获得的真正收益和成长提升,促使高校从被动接受评价到主动积极参与评价的转型,真正实现以评促建。

第六,应注意到高校评价所具有的复杂性特征,发展科研只是高校众多职能中的一部分,除此之外,高校职能还包括培养人才、服务社会等等。因此,在注重高校科研评价的同时,也应保证高校各职能间的平衡,不能以偏概全,过分夸大发展科学职能而轻视人才培养职能,从而在整体高校评价中对科研评价设置合理的比重。

原文刊载于《世界社会科学》2023年第3期,原题为《破除“唯论文”后的科研评价改革探索——国外高校科研评价的实践与启示》。

声明:推文基于更好更多传递信息之目的,不代表一读EDU观点和立场,如有疏漏及不足之处,请随时指正。若有来源标注错误或侵犯了您的合法权益,请后台留言,我们将及时更正、删除!

好消息

如果您希望获取更多教育报告,请使用电脑复制以下链接至浏览器,注册登录 "方略教育研究与院校治理工作台"长沙期货配资,免费下载近 300份教育报告、专家ppt(需使用电脑)