[摘要]基于文献的评价往往无法针对特定年龄阶段的科研人员进行,因为文献著录项目中没有年龄这一字段。笔者所在课题组利用SCOPUS文摘与引文数据库,以机构为单位计算三个指标:该机构40岁以下科学家发表论文的篇均被引次数,篇均被引次数越多分越高;40岁以下科学家发表论文的被引次数进入本领域前5%的人的数量,人越多分越高;该机构所有这些40岁以下科学家的平均年龄,年龄越低分越高。对上述指标进行归一化,并根据指标权重对研究机构进行排名,评价中国主要科教机构在青年科学家培养方面的表现。 [关键词]青年科研人才 评估 年龄 计量分析 [分类号]G350 1 概要 青年科研人才是一个国家科技发展的重要支柱,少年强则国强,青年科研人才的科研水平从根本上决定了这个国家科研能力的基础。美国之所以能够科技崛起,并能在世界科技界保持领先地位,与其在第二次世界大战后推出一系列极具影响的科技政策并实施“成功的移民政策”和“根本的教育改革”,从而吸引和培养了一批批国际优秀科学人才密不可分,而美国大量吸引的正是各个国家优秀的青年人才。时至今日,虽然中国的高等教育改革成效卓越,吸引海外高端人才的计划层出不穷,但深入分析,我们忽略了一个重要的人群,即30―40岁左右最具创造力的青年科学家。 早在上世纪70年代,赵红州就通过计算得出20世纪上半叶,杰出科学家科学发现最佳年龄为37岁左右,并提出“科学创造最佳年龄区”,把杰出科学家作出重大贡献的最佳年龄界定在25―45岁之间。经过对16世纪到20世纪30年代各国重大科技成果科研人员的年龄进行统计,更得出各国31岁到40岁科研人员为人类做出重大科技发明的比例最高,成果最多。陈其荣也经过计算得出诺贝尔自然科学奖获得者做出世界一流科学成果的最佳年龄区在28―48岁之间,最佳峰值年龄为39岁左右。由此可见,在进行机构的科研水平评价时,把青年科研人员作为一个群体进行成果评估有着重要意义。 本研究正是以高被引论文中40岁以下青年科研人员的成果作为基础,探索评价机构的青年人才培养工作。笔者定义1970年1月1日(含)以后出生的科学家为符合40岁以下的条件,后文同此。 2 评价方法及指标 以往基于年龄的研究样本多是已知被研究对象年龄的样本,而本研究中,笔者利用SCOPUS二次文献数据库采集的样本无法获得受分析对象的年龄,只能通过人工途径获得年龄并保证样本量能够达到统计意义。通过咨询专家,笔者构建了调研方法和评价指标体系。 2.1 计量步骤 第一步:检索信息科学、环境科学、生命科学和纳米科学4个科学领域2004―2008年每年的高被引论文中的前1 200篇。 以全球最大的文摘与英文数据库SCOPUS为数据源,利用Citation Tracker功能,下载4个领域2004―2008年中每年被引频次排名前1 200的论文(去除通讯地址机构均为外国机构的记录),即每个领域6000篇论文,4个领域共24 000篇。 在SCOPUS中的具体操作步骤为:首先在SCOPUS的高级检索框中输入各个领域的检索式,然后将检索结果按被引频次降序排列,最后保存被引频次排名前1200的论文。 第二步:抽取论文中的通讯作者信息。 通讯作者信息主要包括:作者名称(英文)、机构名称(英文)与email地址。通过上述信息,获取通讯作者发表文章时的年龄。具体操作步骤为:对于每篇核心论文,首先抽取Correspondence Address(通讯作者地址)字段中的国别信息,如果有不是China的,将该文删除;然后将Correspondence Address字段按顺序排列,并进行数据清洗。对于不重复的通讯作者,通过搜索引擎、发送email与电话询问等方式得到该作者的出生年份,据此推断其发文时(即文章见刊的时间)的年龄;如果发文年龄超过40岁(即作者在1970年1月1日(不含)之前出生),则删除该条论文记录,否则保留该记录以便进一步的分析。 第三步:抽取论文的机构信息。 对于剩余的核心论文,从Correspondence Address字段中抽取各篇论文的机构名称,规范化后生成数据透视表,得到候选的机构列表0。 第四步:机构分值的计算。 通过专家咨询,对于0中的每个机构x每年的检索结果,采用如下流程进行测评: 数量指标:x机构发表的所有论文的篇均被引次数,进行归一化,权重为30%; 质量指标:统计x机构的核心论文作者,人均进入中国国家引用指数前5%高被引论文之列的篇数,进行归一化,权重为35%; 统计x机构的发文作者的平均年龄,进行归一化(越大的越接近于0),权重为35%。 2.2 分析结果:以信息科学为例 通过在SCOPUS数据库中检索并根据上述步骤进行年龄核实与数据清洗,2004-2008年,我国信息科学领域上述6 000篇高被引论文中,可确认发文时通讯作者年龄在40岁以下者共1 005名。下述所有图表中提及的论文均为40岁以下通讯作者所发。 通过分析图1和图2可以得出2004―2008年间,信息科学领域不同年龄青年科研人员发表论文的篇数分布情况。可见在信息领域,相对高产的年龄阶段集中在27―32岁之间。这一点与学科有着密切的关系。比较而言,纳米科学、环境科学和生命科学领域的作者年龄与发文数量呈高度的线性正相关关系。 将5年的数据累积计算,可以得到图3中的排名。 为了排除学科之间的差异,课题组引入了一个相对指标“国家引用指数”:用于测算某领域内的某篇论文被引次数在该领域发文被引情况中的相对排名。在本课题中选择的评价标准是5%,即考查某机构中40岁以下青年科研人才在某领域发表的论文被引次数能够进入该领域前5%的数量。如图4所示: 从图4中可以看出,信息科学领域,中国国家引用指数标准随着时间增长在不断提高。特别是在计算机科学和工程领域增长较为明显,材料领域也有所增长。 在获得信息科学领域2004―2008年机构中40岁以下青年科研人员发表高被引论文的大学排名之后,课题组计算了: 40岁以下通讯作者发文总量前10名机构的篇均被引次数(见表1)。 另据中国科学技术信息研究所对2008年被引用次数高于所在学科的篇均被引次数世界平均值的表现不俗文章统计,东南大学表现不俗论文占机构论文总数比例位列第二。2008年表现不俗论文高校前10名和40岁以下通讯作者发文总量前10名机构相同的高校包括东南大学、哈尔滨工业大学、复旦大学、清华大学、上海交通大学。 40岁以下通讯作者发文总量前10名机构的发文平均年龄(见表2)。 最终,通过归一化计算,获得根据本指标体系得出的排名情况,如表3所示: 3 结论 本研究尝试通过确定论文作者发文当时的年龄,对40岁以下青年科研人员的成果进行评价,虽然样本量有限、在方法上也还需要改进,但分析的结果是有意义的。 通过分析信息科学领域的结果,可以看到,评价40岁以下青年科研人员以论文形式发布的成果所得出的结论与对大学该学科科研水平的整体评价没有完全一致的对应关系,这反映出机构的科研水平并不能反映出该机构中40岁以下青年科研人员的水平。同时也表明40岁以下青年科研人员作为科研机构中最具创新活力的人群,尚未成为机构、甚至整个社会关注的核心人群。学科带头人、顶尖人才受到的关注掩盖了这些在团队中贡献智慧和力量的青年学者所应得到的肯定和支持。 我们希望通过本研究为机构人才评估工作提供一个范例。建议将40岁以下青年科研人员的评估列入机构科技评估的重要部分。也呼吁科技管理相关部门加大对这个人群的支持和关注。 参考文献: [1]段志光,卢祖洵,王爱珍,等.诺贝尔奖级生物医学科学家的成长规律研究[J].中国软科学,2006(增):29―31,36 [2]赵红州.关于科学家社会年龄问题的研究[J].自然辩证法通讯,1979(4):29―44 [3]赵红州,梁立明,王元.重大科技成果威布尔分布的普遍性[J].科学学与科学技术管理,1992,13(3):5―12 [4]陈其荣.诺贝尔自然科学奖获得者的创造峰值研究[J].河池学院学报,2009(6):1―7
[摘要]基于文献的评价往往无法针对特定年龄阶段的科研人员进行,因为文献著录项目中没有年龄这一字段。笔者所在课题组利用SCOPUS文摘与引文数据库,以机构为单位计算三个指标:该机构40岁以下科学家发表论文的篇均被引次数,篇均被引次数越多分越高;40岁以下科学家发表论文的被引次数进入本领域前5%的人的数量,人越多分越高;该机构所有这些40岁以下科学家的平均年龄,年龄越低分越高。对上述指标进行归一化,并根据指标权重对研究机构进行排名,评价中国主要科教机构在青年科学家培养方面的表现。 [关键词]青年科研人才 评估 年龄 计量分析 [分类号]G350 1 概要 青年科研人才是一个国家科技发展的重要支柱,少年强则国强,青年科研人才的科研水平从根本上决定了这个国家科研能力的基础。美国之所以能够科技崛起,并能在世界科技界保持领先地位,与其在第二次世界大战后推出一系列极具影响的科技政策并实施“成功的移民政策”和“根本的教育改革”,从而吸引和培养了一批批国际优秀科学人才密不可分,而美国大量吸引的正是各个国家优秀的青年人才。时至今日,虽然中国的高等教育改革成效卓越,吸引海外高端人才的计划层出不穷,但深入分析,我们忽略了一个重要的人群,即30―40岁左右最具创造力的青年科学家。 早在上世纪70年代,赵红州就通过计算得出20世纪上半叶,杰出科学家科学发现最佳年龄为37岁左右,并提出“科学创造最佳年龄区”,把杰出科学家作出重大贡献的最佳年龄界定在25―45岁之间。经过对16世纪到20世纪30年代各国重大科技成果科研人员的年龄进行统计,更得出各国31岁到40岁科研人员为人类做出重大科技发明的比例最高,成果最多。陈其荣也经过计算得出诺贝尔自然科学奖获得者做出世界一流科学成果的最佳年龄区在28―48岁之间,最佳峰值年龄为39岁左右。由此可见,在进行机构的科研水平评价时,把青年科研人员作为一个群体进行成果评估有着重要意义。 本研究正是以高被引论文中40岁以下青年科研人员的成果作为基础,探索评价机构的青年人才培养工作。笔者定义1970年1月1日(含)以后出生的科学家为符合40岁以下的条件,后文同此。 2 评价方法及指标 以往基于年龄的研究样本多是已知被研究对象年龄的样本,而本研究中,笔者利用SCOPUS二次文献数据库采集的样本无法获得受分析对象的年龄,只能通过人工途径获得年龄并保证样本量能够达到统计意义。通过咨询专家,笔者构建了调研方法和评价指标体系。 2.1 计量步骤 第一步:检索信息科学、环境科学、生命科学和纳米科学4个科学领域2004―2008年每年的高被引论文中的前1 200篇。 以全球最大的文摘与英文数据库SCOPUS为数据源,利用Citation Tracker功能,下载4个领域2004―2008年中每年被引频次排名前1 200的论文(去除通讯地址机构均为外国机构的记录),即每个领域6000篇论文,4个领域共24 000篇。 在SCOPUS中的具体操作步骤为:首先在SCOPUS的高级检索框中输入各个领域的检索式,然后将检索结果按被引频次降序排列,最后保存被引频次排名前1200的论文。 第二步:抽取论文中的通讯作者信息。 通讯作者信息主要包括:作者名称(英文)、机构名称(英文)与email地址。通过上述信息,获取通讯作者发表文章时的年龄。具体操作步骤为:对于每篇核心论文,首先抽取Correspondence Address(通讯作者地址)字段中的国别信息,如果有不是China的,将该文删除;然后将Correspondence Address字段按顺序排列,并进行数据清洗。对于不重复的通讯作者,通过搜索引擎、发送email与电话询问等方式得到该作者的出生年份,据此推断其发文时(即文章见刊的时间)的年龄;如果发文年龄超过40岁(即作者在1970年1月1日(不含)之前出生),则删除该条论文记录,否则保留该记录以便进一步的分析。 第三步:抽取论文的机构信息。 对于剩余的核心论文,从Correspondence Address字段中抽取各篇论文的机构名称,规范化后生成数据透视表,得到候选的机构列表0。 第四步:机构分值的计算。 通过专家咨询,对于0中的每个机构x每年的检索结果,采用如下流程进行测评: 数量指标:x机构发表的所有论文的篇均被引次数,进行归一化,权重为30%; 质量指标:统计x机构的核心论文作者,人均进入中国国家引用指数前5%高被引论文之列的篇数,进行归一化,权重为35%; 统计x机构的发文作者的平均年龄,进行归一化(越大的越接近于0),权重为35%。 2.2 分析结果:以信息科学为例 通过在SCOPUS数据库中检索并根据上述步骤进行年龄核实与数据清洗,2004-2008年,我国信息科学领域上述6 000篇高被引论文中,可确认发文时通讯作者年龄在40岁以下者共1 005名。下述所有图表中提及的论文均为40岁以下通讯作者所发。 通过分析图1和图2可以得出2004―2008年间,信息科学领域不同年龄青年科研人员发表论文的篇数分布情况。可见在信息领域,相对高产的年龄阶段集中在27―32岁之间。这一点与学科有着密切的关系。比较而言,纳米科学、环境科学和生命科学领域的作者年龄与发文数量呈高度的线性正相关关系。 将5年的数据累积计算,可以得到图3中的排名。 为了排除学科之间的差异,课题组引入了一个相对指标“国家引用指数”:用于测算某领域内的某篇论文被引次数在该领域发文被引情况中的相对排名。在本课题中选择的评价标准是5%,即考查某机构中40岁以下青年科研人才在某领域发表的论文被引次数能够进入该领域前5%的数量。如图4所示: 从图4中可以看出,信息科学领域,中国国家引用指数标准随着时间增长在不断提高。特别是在计算机科学和工程领域增长较为明显,材料领域也有所增长。 在获得信息科学领域2004―2008年机构中40岁以下青年科研人员发表高被引论文的大学排名之后,课题组计算了: 40岁以下通讯作者发文总量前10名机构的篇均被引次数(见表1)。 另据中国科学技术信息研究所对2008年被引用次数高于所在学科的篇均被引次数世界平均值的表现不俗文章统计,东南大学表现不俗论文占机构论文总数比例位列第二。2008年表现不俗论文高校前10名和40岁以下通讯作者发文总量前10名机构相同的高校包括东南大学、哈尔滨工业大学、复旦大学、清华大学、上海交通大学。 40岁以下通讯作者发文总量前10名机构的发文平均年龄(见表2)。 最终,通过归一化计算,获得根据本指标体系得出的排名情况,如表3所示: 3 结论 本研究尝试通过确定论文作者发文当时的年龄,对40岁以下青年科研人员的成果进行评价,虽然样本量有限、在方法上也还需要改进,但分析的结果是有意义的。 通过分析信息科学领域的结果,可以看到,评价40岁以下青年科研人员以论文形式发布的成果所得出的结论与对大学该学科科研水平的整体评价没有完全一致的对应关系,这反映出机构的科研水平并不能反映出该机构中40岁以下青年科研人员的水平。同时也表明40岁以下青年科研人员作为科研机构中最具创新活力的人群,尚未成为机构、甚至整个社会关注的核心人群。学科带头人、顶尖人才受到的关注掩盖了这些在团队中贡献智慧和力量的青年学者所应得到的肯定和支持。 我们希望通过本研究为机构人才评估工作提供一个范例。建议将40岁以下青年科研人员的评估列入机构科技评估的重要部分。也呼吁科技管理相关部门加大对这个人群的支持和关注。 参考文献: [1]段志光,卢祖洵,王爱珍,等.诺贝尔奖级生物医学科学家的成长规律研究[J].中国软科学,2006(增):29―31,36 [2]赵红州.关于科学家社会年龄问题的研究[J].自然辩证法通讯,1979(4):29―44 [3]赵红州,梁立明,王元.重大科技成果威布尔分布的普遍性[J].科学学与科学技术管理,1992,13(3):5―12 [4]陈其荣.诺贝尔自然科学奖获得者的创造峰值研究[J].河池学院学报,2009(6):1―7