理论教育测评合集12篇

时间:2023-08-29 09:20:20

理论教育测评

理论教育测评篇1

非认知测验理论的新进展——概化等级展开模型概述吴志勇,范晓玲

教育评价中的技术主义倾向及其超越谢燕

我国农村地区中小学教师的工作满意度及其与组织承诺的关系教育测量与评价(理论版) 柴江,赵志纯

走出教师评价的两难困境徐文祥

文化协商反思视域中的信息技术课程评价标准的构建钱旭升

换位教学应"渡"中有"度"刘海娟

我们该追求怎样的语文课堂解自忠

中学生心理健康家长评价量表的编制刘视湘,郑日昌,高翔

国有民办中学初一新生心理健康状况调查蒋湘祁,肖艳平

我国高考改革应走出一元价值取向刘五驹

中国高考需松绑——慎言高考造成学生课业负担过重王瑞珍,黄光扬

高考作文命题三十年之审思李新

中国与新加坡大学入学考试制度之比较李木洲

美国数学评估"测验项目和测验设计"中存在的问题及思考邢丽丽

全国教育与心理统计测量学术年会暨第八届海峡两岸心理与教育测验学术研讨会综述王彩霞

作文教学应树立三个观念——由一则作文评改案例引发的思考成军

教学管理评价的伦理学视角尹月

考试改革是实施素质教育的突破口侯晓玲,齐美利

中小学校长道德素养的测评维度宋燕

项目反应理论(IRT)在小学数学成就测验中的应用李映红,张绍军

师德评价结构系统的元研究林宇

绍兴市学生成长档案袋评价实施情况的考察徐志伟

农村义务教育的"离农"倾向:表现、危害与思考袁潇

基于反思性教学的反思罗永勤

文化资本视角下农村小学生语文教材适应性探析金本能,王守恒

由课堂"异类"现象引发的思考叶梅,孙贞锴

中学生心理健康自评量表的编制高翔,郑日昌,刘视湘

高中生物理学习兴趣与自我效能感、成就目标定向的关系研究高光珍,胡象岭,王德才,彭军生

高考作文命题与评分的新思路——以交际信息学为视角赵年秀

我国高考公平的价值及实现路径张和生

2008年五课改实验区高考化学试卷评析及启示曾兵芳,陆余平,彭仁伟

浅析美国基础教育课程评价的类型与特点刘丽群,林洁

中法高中毕业会考制度的比较与借鉴教育测量与评价(理论版) 陈园园

评课——不妨先让学生说话何秀凤

需要警惕的三种课堂评价欧阳锡龙

由一道试题想到的姜军

没有"问题"的课最有问题王树云

德育评价:从"以评促管"出发李香民

心理健康测评和全人教育模型郑日昌,高翔,刘视湘

我国基础教育评价的回顾与反思刘尧

深圳市新安中学学生评教的调查与分析郭凯

中小学名校长的评价问题探析王磊

温州市中小学教师发展性评价的行动研究董加选

课改三议山子

"预、探、点、做、思"五环节主体探究型课堂教学模式述评于义良

小学语文课堂理答的多维视角及应对策略彭永帆

论德育评价中的人文关怀叶飞

亲子分离对留守儿童安全感发展的影响研究曹中平,杨元花HtTp://

"从考试到评价"的实例分析张警鹏,郑启跃

我国百年作文命题的考究与求索刘光成

小学语文学业水平考试命题走向例谈帅晓梅

中美教育考试分数的报告与使用之简要比较杨志明

区分性教师评价制度及其对我国教师评价改革的启示刘兰英

考试的起源(上)杨学为

评课:让课堂回归阳光生态代保民

"尺子"论黄玲,任胜

测评:从教育理想出发邓书云

构建促进理解力的学业评价郝京华

把握方向,贴近实际,积极稳妥地推进湖南新课改高考命题工作陈最华

PISA评价中性别表现差异的特点分析赖小琴,刘秋生

构建概化理论分析思路的新框架黎光明

中小学教师工作满意度及其激励策略陈虎强,杨思

教师评价:由奖惩依据到促进专业发展——以浙江省瑞安市安阳实验中学为例翁庆双

高中语文模块学习过程性评价的实施策略及反思——以浙江省温州市第十九中学为例刘胜文

一年级小学生的汉字书写质量测查赵冬臣

中学校本课程开况的调查及思考——以江苏省无锡市三所中学校本课程开发为例环蓉,樊小杰

不同社会支持对留守儿童心理健康的影响研究教育测量与评价(理论版) 雷芳,贾艳杰,徐黎玲,周林霞

初中生班级归属感的调查与思考——以浙江省象山县为例江丽丽

1978~2008:高考语文试卷研究报告黄俊

美国华盛顿州中小学学生学习评定及启示范晓婧

学生发展:课堂教学的终极追求陈瑞生

别让问题学生的教育成为问题教育李飞鸿

课堂教学应着眼于学生后续学习能力的发展王奎生

让"连问"成为开启学生思考的金钥匙钱忠娟

以共同愿景助推学校发展李霞

课堂语言要有针对性严丽仙

教育行政组织绩效评估指标体系的构建胡伶

唐海县开展初级中学教学管理评价的实践与思考桑德宝

新课改背景下中学生综合素质评价的成效及问题审视吴熙龙

甘肃省农村中小学教师职业压力调查研究赵志纯

长沙市开福区中小学艺术课程实施现状的调查与评析教育测量与评价(理论版) 罗炜

《湖南地方文化常识课程标准(修订稿)》述评周小青

淄博市淄川区高中生物理学习自我效能感调查彭军生,胡象岭,王杰,王德才

中学生主观幸福感与家庭因素的相关研究童玲玲,谢敏芳,李黎

我国十省(市)新课改高考方案述评刘丽群,刘一砖

关于应用回归分析监控教学质量与预测高考的思考温涵

再谈"巧用回归分析监控教学质量与预测高考"韩裕娜

英、德教育督导制度的比较研究及其启示石灯明

正视课堂教学中的不和谐"音符"雷群东

理论教育测评篇2

        (1)学校转型的“冈徒困境”与路径选择 程晋宽

        考试与招生

        (4)综合评价体系构建中的高考改革探析 朱华山

        (12)高中课程与高考改革:文理分合抑或专业分化 冯生尧

        学校管理与发展

        (23)义务教育阶段留级制度之审思 陈惠英

        (28)关于教育督导督政问题的分析及建议 孙世杰

        小讲坛

        (32)教育评价的clpp模式 无

        学校管理与发展

        (33)县域中小学及幼儿教师教育科研水平的调查研究——以桂林市六个县为例 覃泽宇 文泽鸿 席广涛 苏玫

        课程与教学

        (38)小学生学习过程评价的人学基础 丁念金

        小讲坛

        (42)教育评价的应答模式 无

        课程与教学

        (43)上海市浦东新区初一学生科学探究能力的现状与改进建议 姚霞

        品德与心理

        (48)中学生的学业自我与人格特质的关系 赵小云 郭成

        (53)高中生时间洞察力与自我同一性的关系研究 宋婧

        随笔与感情

        (60)“放心去跳"——课堂教学需要开阔的空问 姚小霞

        (62)教师成长的路径——专业化与“去专业化" 唐小青 杨骐文

理论教育测评篇3

教育评估、教育评价是20世纪30年代在美国兴起,60 年代兴盛于西方世界并传入我国。这些学科虽然在我国大力发展已有20余年,但理论

研究的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有考试院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的社会意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的问题上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和理论约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极总结实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

参考文献

[1] [5]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页、第167页

[2] 参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3] 见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页

[4] 参见许茂祖编著·《高等教育评估理论与方法》·中国铁道出版社·1997年版·第16--27页

理论教育测评篇4

提要 本文针对教育评价相关关系不清的总是从多角度对此进行了辨析,并对教育评价学科群的建设,提出了许多有益的建议。

关键词 教育测验 教育测量 教育评价

作者 刘尧 浙江师范大学教科所副研究员(金华 321004)

教育评估、教育评价是20世纪30年代在美国兴起,60 年代兴盛于西方世界并传入我国。这些学科虽然在我国大力发展已有20余年,但理论

研究的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有考试院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生学习的潜在能力、发展倾向,如音乐能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理,准确地掌握教育

情况,为制定教育方针、政策提供科学依据,为开展教育科学研究,探索教育规律,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育问题的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要内容包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的历史、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有参考价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的社会意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的分析可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的问题上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群研究的建议

教育评价学经过几十年的发展已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把考试学、教育统计学、教育测量学的内容纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和理论约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极总结实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育科学界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

理论教育测评篇5

[中图分类号]G645 [文献标识码]A [文章编号]1005-5843(2013)05-0059-04

[作者简介]李丽菊,红河学院数学学院助理研究员(云南蒙自661100)

一、教师知识结构浅析

教师知识是指教师在处理某个特定事件中的知识整体,是构成教师实践行为的所有知识和洞察力。关于教师知识结构的认识,以舒曼尔(Shulman)为代表的学科取向观点认为,教师为使教学获得成功,需懂得该如何把现已掌握的知识转化为学生可理解或接受的表征形式。它从普通教学法知识出发,关注师生之间的交流,是教师所特有的教学内容和教学法的有机混合体,包括教师有关具体学科的特殊观念和学习难点的知识以及有关该学科的教学方式和教学策略的知识两个重要部分。在这种教师知识的共有特征基础上,舒尔曼将教师知识具体分为学科知识、一般教学法知识、课程知识、学科教学知识、学习者及其特点知识、教育背景知识、教育目标和价值观及其哲学和历史背景的知识等七类。另外,从教师教育视角看,我国师范教育普遍采纳“学科知识、教育科学知识和普通文化知识”三类课程知识模式,其基本的理论预设是“任何具有足够学科知识的人只要懂得普通教育理论和原则,就能够将这些理论和原则自觉运用到具体学科知识点和情境的教学中,提高教学实效”。然而,作为教育教学的行动基础,教师知识显然远远超越这种学术研究领域和教育实践领域的知识分类范畴。从实践教学质量看,如何保障有效性教学的知识应当是教师知识结构的核心构件。

“有效教学”论题是一个历久弥新的问题域,传统的有效教学模式认为,教学的有效性主要表现为:(1)在单位时间内,没有偏离地按照教学设计完成预定的教学方案,采取“课前准备-复习旧知-新授知识-随堂练习-布置作业”的程序化课堂教学模式;(2)在有限的学期内,粗放式地增加教学和学习投入,反复历练得分技能;(3)教学活动被简化为“刺激-反应”的机械模式,其中教师是课堂教学的独白者和教学刺激给予者,学生是教学知识的机械接受者和反应者;(4)考试分数是教育教学有效的质量标准和评价准则,课堂内教得多、学得快、考得好就是有效的教学;(5)学生作为教学产品被塑造的,可以按照同一规格批量生产。显然,这种传统模式是将有效教学简化为教学投入与产出的比率关系,并坚信只要教学效果(产出)满足社会期望,取得好的升学率,那么师生的任何繁杂投入都是值得的。这些运作模式使教师变成了传输知识的工具和工匠,学生成了无头脑的知识储备器。朱文辉针对上述传统线性有效教学模式进行了反思和批驳,指出有效教学的应然追求:课堂教学是在教学行为与教学境遇的各种复杂关系的互动中展开的,教师应该依据学生的学习心理过程来创造各种教育契机,通过主体间交互活动,对课堂中出现的问题、疑难、困惑等生成性资源进行创造性重组,并在资源的生成和利用中推进学生经验的建构和知识的生成;教学的根本使命应是基于具体知识的理解、生成及效用,激发学生学习的内在需要和兴趣,提升他们主动探索的欲望和能力,使知识学习的过程同时成为培养学生主体意识、创新精神和实践能力的过程;知识具有亲历性,教学应自觉弱化知识传递的旁观者逻辑,知识只有内化为学生自身的价值、态度、信念和技能,才能成为衡量学习效果的尺度。

综上所述,就实践价值而言,虽然教师知识分类为教师教育课程设置提供了理论基础,但这些知识的传授和掌握并不等于教学的有效实施。从有效教学的评判标准看,传统的有效教学强调教师完成教学任务,实现教学目标,学生取得好的考试成绩,学校升学率高,这些都达到了便为教学有效。而有效教学的应然追求论强调教学相长,知识共生,成功挖掘学生内在的学习潜力才是有效的,与前者相比其进步之处在于,强调有效教学是师生主体间的互动模态,应促进学生将知识生命化和个性化。二者共同之处均认为,有效教学应是教和学均有效,那么在教学实践中如何才能真正保证教学和学习有效呢?从教师要素看,教师测评知识是保障有效性教学的重要部分,起着教学监测和质量反馈的作用,它是教师职业化和专业化的根本标志,是有效教学的重要保障。

教师测评知识是教师对学校情境中的教育现象及其属性进行计量分析与价值判断中的知识整体。在教育教学活动的设计与实施中,如何科学地测量教育事项,公正地考评教育教学活动结果,以促进学生全面发展,改进教师教学行为,是监控教学过程及其效果评定的主要内容,也是保障有效教学的重要手段。只有使教育教学建立在科学测评程序上,及时诊断出教学实践中存在的差误,才能有效地调整教学策略,改进学习行为,提高教学和学习效率。因此,教师测评知识理应成为教师教育课程设置中的重要组成部分,就教育测评过程及其知识结构而言,教育测量知识与教育评价知识是教师测评知识整体的核心要素,也是教师必备的教育教学技能元素。鉴于此,本文尝试对教师测评知识的内涵进行探讨,期望为我国教师教育的课程设置与教学提供一些参考和启示。

二、教师测评知识解读

(一)教育测量知识

教育测量知识是关于教育现象及其属性进行计量分析和事实判断的知识整体,包括教育测量的基本理论知识和计量统计技术两个主要部分。从操作性定义看,教育测量知识是开展教育教学测量活动所需的一切相关知识,包括测什么的知识、怎么测的知识和如何分析的知识三个方面。从测量行为看,教育测量是根据一定的原理和法则,针对学校教育影响下学生各方面的发展,从量的规定性上予以确定和描述的过程。

教育测量的基本理论知识是开展教育测量的理论基础和行动准则,包括教育测量的基本原理、资料收集、标准制定、质量评定、统计分析、结果运用等知识模块。首先,教育测量的基本原理主要包括测量目标制定、资料收集方法、测量标准构建、数据分析原理、结果解释原则等。其中制定测量目标及其标准的基本准绳是教学目标和学习目标的分解,教师职前教育课程中应通过课程媒介将设置科学的教学目标和学习目标的原理与方法有效地传递给学生。资料收集方法是教育测量的重要环节,教育资料可以大致区分为定性和定量两类,收集不同类型的资料在程序设计、计量测算、保存应用等方面存在较大差别。测量标准是计量分析的理论依据,是教育测量的具体行为准则和计量单元,教育测量总是将某些教育现象或观念化整为零,在具体的、客观的水平上进行分解和描述,使其变得可操作、可计量。数据分析原理是对收集的各种教育资料进行数理统计的技术和方法,以寻找教育现象之间的内在联系和统计联系,为教育评价服务,如测算考试题目的效度、难度、信度、区分度的方法与技术;结果解释原则主要是针对计量分析的结果进行意义解读和教育效果推论,其基本要求是客观而符合事实,不以偏概全。总体而言,教育测量的基本理论知识涉及确定合理参照点、制定科学测量单位、研制有效测量工具三方面的知识,只有这些知识同时具备,测量工作才能顺利开展,进而对教育现象及其属性进行量的规定和描述。

教育计量的技术与方法是教育测量的重要手段,是教师考评学生成绩、评判教学效果的必备工具。从教学过程看,它包括教学目标设定、学习准备状态探测、课程作业设计、学业测验编制和试卷质量分析、学习和教学效果测定等方面的技术和方法。从控制教育测量误差看,测验编制、试卷质量评定、测量数据分析等方面涉及的原理技术和统计方法是教育测量中的重要工具。测验编制属于研制有效测量工具的内容,是测量学生学习效果的重要媒介,编制测验是教师的一项重要教学能力,不可随意应付。好的测验编制应有考核目标、知识内容、分值比例、题型设计、参考答案、评分标准等内容,只有在这些方面作了标准处理,才能保证测验的有效性。试卷质量评定主要是测算试卷的效度、信度、难度、区分度,这些不同的质量指标有其独特的使用条件和计算办法,只有这些指标同时满足了测量学的要求,才能准确测出学生的学习水平。数据统计分析是技术性较强的工作,包括统计分析原理、分值计算方法、软件操作技术、结果分析描述等内容。因此,凡能通过计量分析的教育事项,均需要掌握有关的数据处理技术与方法,只有统计方法使用恰当,才能有效地对各种教育现象及其属性进行测量。

(二)教育评价知识

教育评价知识是指基于教育测量的结果,对各种教育现象及其属性进行价值判断的知识整体。它包括评价的理论基础、组织与实施程序、设计评价方案、结果的分析整合、心理调控技能、统计决断与推论等方面的知识,可以将这些知识概括为教育评价的基本原理和结果评判两大类别。从操作定义看,教育评价是指按照一定的教育目标,对所实施的教育活动的效果及其活动本身进行价值判断的过程,其实质是寻求教育活动的意义与作用。教育评价的理论基础主要是指教育评价中所倚重的指导思想和教育观念,其中国家的教育方针及其相应的教育规划纲要是教育评价的宏观指导思想和行动指南,各种教育教学理论是教育评价的具体行为准则,如王景英和梁红梅(2002)基于后现代主义强调教育评价的方法论中,要倡导反思、批判的思维模式;重新审视定性研究和模糊评判;要倡导多视角、多元化的方法论;要强调评价者与被评价者之间的对话;要淡化鉴定、分等功能,强调评价的研究和促进的功能。又如建构主义知识观的教育评价启示意义在于,强调“评价标准的多元化、评价目标和内容的多维性、评价过程的动态化、评价方法要定性与定量相结合、强调评价的真实性与情境性”。诸如此类论说无疑是教育评价的重要理论依据和方法指南,为此,在教育评价设计中,应在国家教育方针指导下,析取各种教育教学理论的合理因素作为行动依托。

此外,在教育评价活动中,组织与实施是教育评价的准备环节,包括人力、物力、财力和时间计划等方面的准备活动知识。评价方案的设计是教育评价的操作模式,决定着教育评价的质量和功能发挥,主要涉及指标体系构建技术、评价标准分解、确定指标权重方法等知识内容。结果的分析整合是在统计学原理的指导下,借助数学分析技术对测评结果进行计量和分数整合,在总体水平上理解某个分数量值的实际意义,评判教育活动的育人效果,以深入揭示教育结果的价值蕴涵。心理调控技能是关涉评价结果有效传达的知识,该技能的掌握有助于发挥教育评价的导向功能、激励功能和管理功能。统计决断与推论是对教育评价结果的数学分析和统计处理,将评定的教育事实进行意义解读和价值概化,如在教育行动研究或者教育实验中,对某些教育策略或者学习的效果检验及其外在效度判定,它属于教育评价的重要计量技术。总之,教育评价是一项复杂的系统工程,从确定评价的目的、分解既定教育培养目标、设计评价内容及其指标体系、采集和分析评价数据,到解释统计数据事实、利用评价结果等都是教育评价工作不可缺少的环节,完整的教育评价还应该包括反馈和相应的政策调整、教学方法改进措施以及元评价等,这些环节中的相关知识与技能均是教育评价知识的重要组成部分。其中数理计量技术和统计方法是教育测量与教育评价的共同知识成分,它们是目标导向式教育测评的核心知识内容,是教育测评的重要工具。

三、教师测评知识的实践价值

(一)有助于有效掌握学生的学习行为特性

任何教学设计都是以学生的学习准备状态为基础的,当然教育测评并非是掌握学生学习状态及其行为特性的唯一手段,但却是最为科学有效的途径。传统教学设计起始于教师的人生经验和学科知识,是一种“自上而下”式的教学观念和经验的反映,没有考虑学生的学习需求和接受能力,本着“没有教不好的学生,只有教不好的老师”的职业信念实施教学方案,认为传道、授业、解惑就是教师的应然角色,学生就是教学的雕琢品,是知识的容器。为了使教学高效,教师和学生必须在单位时间内完成更多教学任务和学习活动,是一种机械主义的课程教学模式。为扭转这种“高压低效、高分低能”的简单量化教育模式,教师必须具备教育测评的知识和技能。实践表明,有效的教学活动必须以学生的学习心理和行为为基础,而科学合理的教育测评则是了解学生学习心理和学习行为特性的有效手段。

理论教育测评篇6

复杂性科学兴起于上世纪80年代,是综合了系统理论、耗散结构理论、自组织理论、协同理论而构成的理论体系,“将事物整体看做是一个由众多非线性联系的要素所构成的开放系统,因此,整体论、系统开放性、非线性以及自组织等观点便成为复杂性理论的基本观点”。复杂性是相对于简单性思维而言的,旨在把分离的东西联系起来,揭示“认识对象与它的背景之间、各部分与整体之间、整体与各部分之间、各部分彼此之间”的作用,强调社会环境、多元主体、现实问题、政策改进等因素之间的联系与互动,改变影响因素与结果之间一一对应的线性因果关系的认识局限及其实践路径。复杂性理论在教育领域研究中的应用,目前不仅涉及教育研究范式、教育规律、教育决策、教育政策执行、学校道德教育、课程教学改革、教师专业发展以及教育技术学等,而且在教育评估中尝试应用,揭示评估中隐藏的矛盾、真实性,提供一种新的思维和分析工具,更为深入的诊断、检测影响教育过程与结果的各种因素及其复杂关系。

2.复杂性理论在基础教育公共服务满意度测评中的方法论意义

基础教育公共服务满意度测评,是基础教育公共服务绩效评估的重要维度,包含多个方面的结构变量和观测变量并构成测评模型,关注学生及其家长对基础教育公共服务成效的感知。根据实证主义的观点,人们可以感知世界、洞悉事实,这些事实被认为是与现实一一对应的。而复杂性理论是与实证主义相对的一种新范式,反对简单的还原,以超越还原论为方法论特征,在基础教育公共服务满意度测评中具有重要的方法论意义。

(1)把握基础教育公共服务的统一性与多样性。从需求来看,人民群众对平等接受优质教育的需求越来越强烈,但同时又存在区域之间、个体之间的差异,不同群体受观念认识、自身经历、获取资源可能性等因素的影响而表现出对基础教育公共服务需求的差异,尤其是在发达地区、大城市,人口结构的多元化更使得多样性特征表现得更为明显。从供给来看,政府尽管承担基础教育公共服务供给的责任,但政府不一定直接承担而可以购买服务,这使得基础教育公共服务供给的形式表现出多样性,不仅有公办学校、民办学校,民办学校中又包含政府购买服务的学校,比如上海为了解决农民工随迁子女接受义务教育需求而出现的纳入民办教育管理的学校就是一个典型形式。这种供给与需求的统一性与多样性,正是基础教育公共服务的复杂性表征,并对满意度测评提出全面系统又细分群体、抓住主要矛盾并突出重点的要求。

(2)反思社会转型背景下基础教育公共服务接受者的两种文化。学生和家长均属于基础教育公共服务的接受者。但两者分别代表化和儿童文化两种不同的文化,而且在社会转型背景下两种文化存在着反差。受社会功利化、家长经验和认知水平的局限,未必每一个学生的家长都具有学生健康第一、学生终身发展的理念并予以实践,“不让孩子输在起跑线上”的认识误区仍在影响着家长对于基础教育公共服务的判断。学生喜欢、满意的学校学习生活,未必能够得到家长的一致认同和支持。来自于家长的安排、要求已成为学生参加校外各种兴趣班、竞赛班的重要原因。而无视教育规律、简单迎合家长需求的教育实践行为在一些学校也存在。两种文化的差异要求我们必须正视功利化现实问题的同时,在满意度测评中不能夸大家长的理性判断能力,而必须坚持正确的评估取向,寻求证据之间的互证。

(3)合理推断基础教育公共服务满意度测评中的相关关系。相关关系是教育评估中的核心论题,基础教育公共服务满意度测评也不例外。“相关关系则是指自然条件下事件或对象之间的共变现象”。由于基础教育公共服务满意度测评的复杂性,相关关系的合理推断更具有意义。基础教育公共服务满意度测评涉及的因素比较多、容易建立相关关系,但也正因此需要避免把复杂的事情简单化,不能仅仅基于简单的描述性统计数据来进行,而需要认识到满意度测评中一果多因、一因多果的存在,基于稳定连续的数据,通过探索假设、多次验证,找到相关因素之间的中介变量、关系机制。这样一个过程不仅仅是对基础教育公共服务满意度测评模型、数据质量、专门统计分析工具运用的要求,更为重要的是强化证据意识、基于证据及其科学分析的方法论。

二、基础教育公共服务满意度测评中的问题分析

随着教育公平、教育质量日益受到社会的关注并赋予新的内涵,以及政府职能转变的加快、教育公共服务改革的深化,基础教育公共服务满意度测评在我国逐渐兴起并发展。尤其是东部发达地区基础教育满意度测评实践颇有进展,如北京市、上海市、天津市等,开展了大规模样本的调查研究,并探索分析影响因素,为政府教育决策提出建议。而复杂性科学视野下审视当前的满意度测评实践,存在诸多背离复杂性要求的地方,其成因也是多方面的。

1.测评实践中存在的主要问题

在测评内容上,目前基础教育公共服务满意度测评借鉴了企业顾客满意度模型,围绕基础教育公共服务的特点构建测评指标体系,按照服务提供主体涉及对政府的满意度、对学校的满意度、对教师的满意度,但缺乏针对校际之间的差异进行的分类测评,从而很难回答哪些学校的改革以及改革中的哪些方面对提升公众满意度起到了积极作用;而按照服务提供内容涉及教育政策、教育设施和环境、教育教学、师资队伍、学校管理以及教育信息公开等,但这些方面的检测点主要是模糊性、结果性的信息,而缺乏对具体细节、过程性信息的关注,但这些信息反而能深入揭示基础教育公共服务改革的内涵及其公众的满意状况。在测评对象上,主要是测评学生家长对基础教育公共服务的满意度,并对学生家长按照家庭经济地位(SES)和户籍身份进行细分,而忽视对学生这一基础教育公共服务接受者的测评,更提不上把学生家长和学生对基础教育公共服务的满意度进行比较。仅仅测评学生家长,能够全面而系统地反映基础教育公共服务的满意度吗?如果增加学生对学习生活的满意度测评,又会给基础教育公共服务满意度测评带来什么新的信息或者印证的证据?这些问题尚需要进一步的研究和实践。在相关关系推断上,有关家庭经济社会地位(SES)对基础教育公共服务满意度影响的分析比较多,并存在不同的结论。一种结论认为家长SES越高,则期望值越高,满意度反而比较低;而另一种观点在修正完善了测评方法后得出家长SES越高,满意度也越高。这种测评方法、结论上的探讨,有利于合理地推断满意度中的因果关系。但总体上看,基础教育公共服务满意度测评中多方面因素之间的关系及其对结果的影响机制还缺乏深入、有信服力的研究。

2.问题成因的分析

首先,基础教育公共服务满意度测评尚缺乏明晰的测评价值。满意度测评在基础教育公共服务绩效评估中的价值到底是什么?仅仅把满意度测评作为静态收集公众意见乃至抱怨的途径,是一种狭隘化的认识,并导致满意度测评拘泥于指标体系,而很难超越指标体系和数据,上升到更高的制度层面,形成改进基础教育公共服务的机制。基础教育公共服务满意度测评价值研究的缺乏,是测评实践中种种问题表现背后的重要成因。同时,基础教育公共服务满意度测评技术还比较滞后。尽管商业领域的顾客满意度测评技术不断发展,已从第1展到第10代,但针对基础教育公共服务的满意度测评技术的研究显得滞后,尽管有学者和机构探索建立测评模型,但实际应用中主要测评显性、易量化的基础教育公共服务内容,在注重使用量化统计分析软件的同时忽视基础教育公共服务的分析,忽视定性的评估,以至于对基础教育公共服务中因果关系的探讨尚不深入。

三、基于复杂性理论的基础教育公共服务满意度测评方法改进

基础教育公共服务满意度测评的改进是一个体系,包括测评机构及其专门人才的建设、测评工具及其分析的科学化、连续测评机制的建立健全以及社会舆论氛围的改善等,其中方法的改进是关键,而方法改进的重要理论基础是复杂性科学,实践基础是当前基础教育转型发展和公共服务的改革。1.基本价值取向

确立适恰的价值取向是科学评估的前提。那么,在基础教育公共服务改革和绩效提升中,满意度测评具有怎样的价值?作为衡量改革成绩、政策达成目标的证明,还是作为开展行风建设、了解社情民意、倾听学生和家长期望感受的途径,抑或建立基础教育公共服务接受者和提供者之间的合作协商机制,构建推进基础教育公共服务改革、共同治理的制度环境?这些不同的价值取向对于满意度测评方法的选择和实施具有直接的影响。当前我国基础教育改革已步入深水区,社会对教育的需求日益多样化,各种各样的矛盾以及违背教育复杂性、教育规律的行为大量存在。在此背景下,协商基础上的共同治理成为推进基本公共教育服务均等化、完善教育公共服务体系的重要策略选择。基础教育公共服务改革的最终目的是关注每一个学生的发展,办好每一所学校。为此,基础教育公共服务满意度测评不能仅仅作为单向的从家长或学生那里获取信息的评估活动,就数据论数据,单纯提高数据质量,而必须超越数据,对满意度测评中发现的问题予以深入研究,构建关注问题、推进创新、改进服务质量的制度环境。

2.核心指标选取

在指标体系的构造上,基于基础教育公共服务满意度测评的复杂性,把握基础教育公共服务改革中的主要矛盾和问题,坚持促进学生健康发展、终身发展的教育理念,回应社会关注的重点难点问题,把教育公平作为重点关注的类指标。教育公平是一个内涵非常丰富的指标,包含教育机会、教育资源配置、教育服务过程和教育服务结果等四个不同的层面,共同反映和解释基础教育公共服务的水平。以往的基础教育公共服务满意度测评在教育机会、教育资源配置方面形成了比较具体的测评内容,比如义务教育阶段学生就近入学、农民工随迁子女公平接受教育、家庭经济困难学生资助、教师队伍建设水平等,而对于服务过程和服务结果的测评内容有待进一步具体化,比如针对学生多元发展需求的课程开发、学校师生关系、学生发展指导、学生素质评价以及家长参与学校管理制度建设等等。这些不仅是家长所关心的,也是关注每一个学生发展,促进基本公共教育服务均等化的重要方面。

3.数据收集及挖掘分析

按照前述的价值取向和核心指标选择,基础教育公共服务满意度测评数据收集并非单单通过学生家长调查问卷可以完成,还需要针对学生对基础教育公共服务感知的特点,对学生问卷的编制进行研究,并基于学生和父母两类接受者的数据进行挖掘分析。同时,根据基础教育公共服务提供主体学校的多样性,满意度测评数据收集和分析不仅有必要对学校按照办学类别或地理位置进行细分,开展比较分析,而且有必要选取具有先进改革经验的学校或参与某类改革项目的学校进行数据的深入挖掘,并结合改革背景和其它数据对影响满意度的因素进行实证分析。2012年上海市基础教育满意度调查中对上海市正在推进的新优质学校家长的满意度进行数据收集和挖掘分析,正是出于这样的考虑而进行的测评改进。另外,为了实现对区域、学校的激励,反映满意度提升、基础教育公共服务改革进步程度,在收集满意度水平信息的同时,要加强对满意度改进信息的收集分析,为此建立连续性的满意度测评也变得非常重要。此外,基础教育公共服务满意度测评在收集分析量化数据的同时,有必要增加定性资料如半开放式访谈信息、与满意度相关的热点新闻事件资料的收集分析,丰富证据类型,实现定性与定量的有机结合。

4.测评结果的科学使用

指向促进基础教育公共服务改革、促进每一个学生发展的满意度测评,结果的呈现与使用至关重要。根据国内外社会发展类的监测评价经验,完善教育政策、接受社会监督和实施问题预警和是测评结果科学使用的重点。提供舆情信息参考。目前基础教育公共服务满意度测评结果逐渐受到学术研究者的关注,围绕相关因素展开讨论,但如何作为反映舆情的证据、反映区域和学校改革因素的证据,作用于教育决策过程,尚有待加强使用。近年来基础教育公共服务改革尽管取得一系列进展和显著成效,但政策执行过程中依然存在薄弱环节,同时面临新情况新问题,区域之间、学校类型之间也存在差异,因而基于满意度测评结果来完善基础教育公共服务政策,发挥满意度测评结果对改进程度高的区域和学校类型的激励作用,具有非常现实的价值。向社会并接受舆论监督。面向家长和学生的满意度测评,不是单向的数据收集,而应有反馈机制。利用新闻媒介,选择合适的形式,将基础教育公共服务满意度测评结果向社会,主动通报政策执行的成效和有待改进的领域,宣传满意度进步程度或努力程度高的区域及其学校经验,有助于让社会了解、参与和支持,把办人民满意的教育变成全社会的事,并通过社会舆论监督促进相关责任部门、各类型学校深化改革和积极创新。实施问题预警。教育是社会民生问题。基础教育公共服务满意度测评结果非常低的内容、方面,有必要实施预警。预警的目的在于发现基础教育转型发展过程中比较突出、严重的民生问题,避免问题扩大化致使教育改革进程受阻或公众满意度持续下降。基础教育公共服务满意度测评中的民生问题,主要是事关学生基本权利、教育公平的问题,诸如就近入学、随迁子女教育政策、教育资源均衡配置等,这些人民群众广泛关注、影响公众对教育满意度的敏感指标一旦低于临界值或持续偏低,不仅对总体满意度产生影响,而且从一个侧面反映基础教育改革和发展中存在的矛盾,对于社会和谐稳定、基础教育转型发展具有不可忽视的影响。

理论教育测评篇7

改革开放以来,我国基础教育取得了辉煌成就,基础教育课程建设也取得了显著的成效,但是由于社会的发展,科技的进步,原有的基础教育课程已不能适应时展的需要,所以国家教育部决定,大力推进基础教育课程改革,调整和改革基础教育的课程体系、结构、内容,构建符合素质教育课程体系。但是在《义务教育物理课程标准》的学生学习评价实施意见中提出了建立发展性的评价体系的理念,对于学生学习的具体评价仅仅提出了一些原则性的建议,在评价的形式和具体操作上还是缺乏明晰、可借鉴的操作方法,本文着重从新课程理念下改革测评模式为切入点,试图为当前新课程的评价研究提供参考。

一、新课程理念下测评的目的与内容的变化

(一)测评目的的改变

(1)由为选拔服务发展到为学生成长与发展服务,即从为选拔尖子学生到为学生创造最好的教育;(2)从分等级鉴定发展到质量提升,帮助学生提高自身的能力,学会学习、学会创造、学会自我发展;(3)从重视测评结果发展到重视考查学生的潜能;(4)从重视考查知识发展到重视考查学生的全面素质。

(二)测评内容的变化

(1)改变脱离生产生活实际,加强与社会科学技术的联系;(2)改变单纯考察概念、原理、结合具体问题考查学生对基本概念和原理的理解;(3)改变单纯考查概念、规律,强调考查运用所学知识分析解决简单问题的能力;(4)改变理论脱离实际,切实加强与实验有关内容的考查;(5)改变从统一性答案到多样性答案,适当增加开放性题目;(6)改变考查单一学科知识到注意渗透各学科知识的考查。

二、测评手段要多样化

传统的测评是一份试卷定优劣,学生对测评望而生畏,对学生每一次测评就如一次筛选,多次达不到某一期望目标,就意味着被这一目标所淘汰,由此意志消沉、丧失信心,导致教育的失败。因此,传统的测评存在“四个单一性”的弊端,即:测评目的单一;测评内容单一;测评形式单一;测评效果单一;根据新的课程标准的要求和意图,九年义务教育不是精英教育,是基础教育,改变测评过分强调甄别与选拔的功能,发挥评价促进学生的发展,教师提高和改进教学实践的功能。如何在教学中实现新课标提出的“三维目标”使学生乐于测评,并在测评中各方面得到提高,这就需要测评方法的多样性。

(一)合作测评

把学生分成若干组(5~6人),然后教师把试卷分发给各组,由各组合作讨论得出答案,然后各组交叉评卷;把各组获得的分数记人小组测评成绩中,并加以公布,每学期统计一次,并加以公布,根据统计结果,奖励优胜小组,且只奖不罚,这样既增强了学生的合作精神,使学生在测评中得到提高,又培养了学生的集体主义思想。

(二)制作测评

物理学科具有使学生动手动脑的特点,有些内容的测试不一定非用试题测评不可,学习相关知识后,要求学生制作一些学具,如学习了平面镜、透镜的知识后,要求学生制作潜望镜和放大镜等,在这种动手动脑的测评中,一些成绩不理想的学生也能制作出精美的学具,取得高分,享受到成功的乐趣。

(三)辩论测评

用物理知识解决实际生活中的问题,要求学生以知识、方法为基础,知道怎样做,用何种方法,怎样才能实施等。例如:学校要安装一根由街上到学校的闭路电视线,有三种选择:一是沿空中盲线架设到校内;二是沿下水道接人校内;三是沿街道空中架设到校内,选用哪种方法合适呢?这不仅要考虑到线路的长度、安装费用等经济问题,还要考虑到群众、政府的态度、市容市貌以及今后维修等问题,选用哪种方法更合理呢?对此,把学生分成5~6人一组,让他们亲临现场进行考察,收集有关材料,精心计算,然后通过分组讨论答辩找出一种理想的方案,这种测评不但考查了学生应用物理知识解决实际问题的能力,同时也培养了学生的观察能力、分析能力和语言表达能力,使学生在辩论中达成共识,增长才干。

(四)撰写科技论文

写论文主要是考查学生的语言组织能力、表达能力、想象能力、应用物理知识的能力,写作的内容要贴近学生生活实际,具有趣味性、社会性。

(五)探究实验测评

科学探究被纳入课程标准,充分体现了新课程的创新教育理念,强调过程与学习的方式、方法的重要性,这种测评给出物理问题,要求学生提出问题、猜想与假设,设计实验、进行实验与收集证据、分析和论证、最后得出结论。

总之,测评的多样性要有的放矢,各有侧重,使测评具有针对性地面向全体学生,充分发挥学生的潜能,形成人人爱物理、人人学物理的良好氛围。

三、测评要有综合性

测评的改革关键是建立较全面的素质教育和评价体系,现行的测评成绩,只反映了学生对书本知识的掌握程度,有碍学生综合素质的提高和养成教育,有碍于学生创新能力的培养。无论采用何种测评,都应该是对学生学习物理知识的检测,又是对学生养成教育的过程,既是学生应用物理知识的检测,又是学生个体特长的发挥,因此测评的评价要有综合性。

(一)对实验测评

探究实验测评不能只看实验制作的步骤、结果和分析,对同样达到目的,能另辟途径的学生要有加分奖励;同时要把是否乱丢实验仪器、相互配合等养成教育过程也纳入测评评分范围。

(二)对自制作品

学生自制学具的评价,不仅要正确反映物理原理,还要看外观设计,是否因材就宜、创新意识等相关因素,使美育、勤俭教育和创新能力的培养渗透于物理的实践教育过程。

(三)对辩论测评

在辩论的测评中,除了要求学生语言流畅、措辞得体、运用物理知识及原理正确外,还要有必胜的信心、大胆的发言、反应敏捷、谦虚的态度等反映学生心理品质的因素纳入测评评分的范围。

理论教育测评篇8

随着基础教育改革的不断深入,对学生学业成就的测评工作已经取得很大进展,但我们仍然无法忽视其中存在的问题:一是现行的学业成就测评仍然摆脱不了对学生进行排队的嫌疑,通过测评所挖掘的学生的信息仍然不够深,从而导致对学生的能力不能很好地诊断和指导[2];二是囿于测评技术的发展局限,现行的学业成就测评还是主要考查学生对知识的掌握程度,对学生能力的掌握还不够深;三是学业成就测量与评价的非标准化,导致了测评内容缺乏客观性。尽管我们打破了传统的材一统天下的局面,制定了一个共同的课程标准,但现行的考试制度还是抹不去学业成就测验内容选择的主观色彩;四是学科专家和心理测量学专家之间的联系不够紧密,导致学科专家在成就测评的实施过程中,缺乏心理测量学的理论指导,而心理测量学专家对学科知识和课程标准也吃不透;五是在我国现状下,大规模的学业成就测评的形式非常单一,主要采取纸笔的形式,这也导致人们对测评的客观性和公正性存有质疑。综合上述五个问题的出现,分析其根本原因,主要原因还是心理测量学的基本理论还没有完全融入到学业成就测量与评价的实践中去,所以,要解决学业成就测评面临的问题,还得从心理测量学的理论与技术的实施中寻找答案,加强心理测量学专家与学科专家之间的联系与交流,从而做到学业成就测评的客观、公正与公平,促进学生能力的发展。

二、学业成就测评的经典测量学基础

经典测量理论(Classical test theory,CTT)起始于20世纪中叶之前,其主要特点是以真值理论为基础,以信度、效度、难度和区分度为指标,它的基本假设是考生的分数并不是一个绝对的值,而是其真实能力或技能的反映与测量误差的和,所以称为真值理论。根据经典测量理论,人们逐步建立并完善了测验发展的标准化程序,通过标准化的程序提高所编制的测验的信度和效度。

自2001年国家教育部提出课程改革以来,教育心理学工作者和学科专家在新课程下学业成就测评工具的研发上,下了不少工夫。经典测量理论在学业成就测评中也得到了一定的应用。某地区初中数学成就测验在编制过程中,首先是依据初中数学课程标准,确定初中数学涉及4个领域的内容:数与代数、空间与图形、统计与概率以及综合应用。同时结合美国教育学家B.S.Bloom的教育目标分类法,选择记忆能力、理解能力、运算能力、推理能力、综合应用能力为教育目标,确定测量目标。根据教学内容和教学目标,制定了双向细目表,之后对该区的数学教学专家进行了访谈,确定了项目以及项目所占的权重,然后组成两套平行题本。根据题本通过小样本预试,用难度、区分度的指标来筛选题目,最后确定正式施测题本。采取分层整群抽样,进行施测收集数据,分析数据,从而根据数据分析的结果来评价学生学会了什么,对什么是了解、知道、理解、应用[3]。

在大规模的学业测评中,试题往往要全面覆盖基础教育的各个学科,测试题目非常多,如果要将这些题目让全部学生作答,测试的时间会大大超过学生所能承受的限度,这也是不可能实现的,矩阵取样技术化解了这个难题。将覆盖多个学科的所有题目按照一定原则分配到多套测验中,学生随机分配,每个学生只需完成一套测验中的试题,这样的设计叫做完全矩阵取样设计。采用这种设计解决了测验时长的问题,但是不同学生测试结果的比较又成了新的问题。针对这一问题,发展出不完全矩阵取样设计,就是每一个题本中都有一部分共同题,利用学生在共同题部分作答的情况,将学生在整个题本中的作答结构等值到同一个量尺上,就可以解决个体之间的比较问题。

即便如此,经典测量理论下的学业成就测验,采用总分指标来评价能力,对个体在总体中的相对位置进行排序,不能指出被试具体掌握了哪些内容,更无法诊断其题目作答错误的原因,仍然摆脱不了还只是对学生知识点考查的怪圈,在注重能力培养的素质教育背景下,它缺乏对学生能力的掌握;用难度与区分度的指标来分析学生的反应,保留了一些反映学生能力的题目;在实际的教学过程中,教师一般也都是自出题目,对题目的难度和区分度只做一个主观的估计,同时,它也缺乏避免曝光的理论技术指导,从而造成学业成就测验的标准化程度很低;另外,如果涉及到语文成就测验时,主观题目的设计以及结果的分析又会面临统计学的难题。

三、学业成就测评的现代测量学指导

基于经典测量理论下成就测验只能测查知识点的致命缺点,教育与心理学工作者围绕经典测量理论的一些问题展开了讨论,促进了测量理论的新发展,注重表现学生能力的项目反应理论(Itemresponse theory,IRT)产生了,该理论起始于20世纪60年代,其特点是:采用严格的数学模型来反映不同能力水平的测试者对测试题目的反应模式。项目反应理论相对于经典测量理论来说取得了巨大的进步,但也并非没有缺点[4],它的3个基本假设非常严格——(1)单一维度假设,即假定测验的所有题目只测查同一种能力或潜在特质。但实际上,很少有测验只测查单一的能力或特质。(2)局部独立性假设,即当控制所测量的能力或特质之后,被试在不同题目上的反应是相互独立的。换一句话讲,就是被试对题目的反应只受该题目所测的能力的影响。(3)单调递增假设,即被试对题目正确反应的概率随其能力水平的增加而单调递增。这3条非常严格的假设,使其应用受到很大的限制。

从20世纪90年代至今,围绕项目反应理论产生了很多新的研究和新的动向,如:多维项目反应理论(Multi-dimensional IRT,MIRT)、非参数项目反应理论(Non-parametric IRT,NIRT)等。多维项目反应理论为成就测验中所涉及的每个维度引入能力和项目区分度参数,进而模拟测验题目和被试之间的交互作用,它是一个非线性的用来表征题目参数、被试的多维潜在能力以及其正确作答概率之间关系的数学函数,通过这个模型,我们可以对被试的多个特质进行分别推断。换一句话说,利用多维项目反应模型能同时估计被试在多个维度上的能力参数,并且考虑各能力维度之间的关系,因此,如果测验数据是多维的,则多维模型就能更有效地估计被试及项目参数。这使我们能更深入地了解被试,结合多方面的信息,为对被试的评估或诊断提供帮助。在实际应用中,一个总的学业成就测验可以分为多个子测验,如果子测验测量了不同的内容领域或认知技能,则这些项目就有可能代表了不同的维度,这时,对每个项目能够正确作答所需要的内容领域或认知技能进行分析是非常必要的,在传统测验中一个知识点的考查可能涉及到对多个能力的考查,用经典测量理论的假设,一个题目对应一个能力,这显然是有很大的误差。另外,多维项目反应理论能够提供项目在每个能力维度上的区分度参数,可以据此来选择对多维能力差异具有敏感性的项目。在教育中,课堂上学科教师给学生出的小测验比比皆是,这种测验不仅题目少,而且受测的对象也仅仅是本班的学生,即样本小,这时,非参数项目反应理论就给我们提供了模型,这至少削弱了我们对经典测验中样本分布正态和在参数项目反应理论中关于特质分布正态假设的依赖。

四、学业成就测评的认知诊断技术前沿

认知诊断理论(Cognitively diagnostic theory)非常值得我们关注。随着认知心理学的发展,关于知识与技能的认知理论为我们研发成就测验工具提供了理论基础。认知诊断理论就是以现代测量学为基础,结合认知科学对学习理论的研究与发现,采用更精致的数学模型,来研究如下问题,(1)学生在答题时,经历哪些认知过程?(2)这些认知过程如何发展?以及能力高的学生与能力低的学生在这些方面有哪些差异?认知诊断可以通过学生对试题的作答反应,推论出其认知过程与知识结构的可能状态。

在学业成就测评中,经典测量理论和项目反应理论,都是根据理论中的一些指标来筛选题目,将学生按顺序排列在特定能力(或特质)的连续体上。这并不能给学生或教师有用的诊断信息,不能帮助学生或教师理解需要学习或教学的知识与技能。而运用认知诊断理论,我们能更深入地理解隐含在考生总分背后其认知技能之间的差异。这为我们深入挖掘受测者信息提供了一个有力的工具。

认知诊断理论中比较有代表性的有Mislevy的以概率为基础的推理(the probability based inference)、Corbett和Anderson等人的学生思维模拟(student modeling)、Britton和Tidwell的认知结构诊断(cognitive structure testing)以及Tatsuoka的规则空间模型(rule space model)[5]。Tatsuoka的规则空间模型最初是用来诊断小学生在解决四则运算问题时答对或者答错的原因,进而发现学生使用错误的规则来解题,因此会产生系统化的错误,这种系统化的错误,他们称之为“失误”。该模型的方法包括两个阶段[6]:第一阶段是抽取某个领域的认知特征并根据这些认知特征确定潜在的知识结构;第二个阶段是把学生的反应模式划分到所确定的各个知识结构中去,并且计算被试的属性掌握概率。在构建规则空间的过程中使用了项目反应理论中参数估计的方法,所以严格来讲,规则空间模型的建构方法是项目反应理论的继承与发展。用规则空间模型的方法编制成就测验时,通过可达到矩阵的距离来澄清各属性之间的关系,使得矩阵中的项目属性关系清晰且符合逻辑。同时,由于属性间的逻辑关系很清晰,所以在项目的反应上就能很清楚地知道学生掌握了哪些属性,或者未掌握哪些属性,或者是因为失误而造成的反应错误,这样就能给教师和学生提供更深层的信息,从而进行补救性的教学[7]。

在实际工作中开展认知诊断测评,需要进行一系列的系统化工作:(1)确定诊断目标。必须明确要诊断的具体学科内容,如小学数学分数诊断,中学语文句法诊断等。(2)确定诊断目标所涉及的认知属性及属性间的阶层关系。这项工作需要认知心理学家、学科专家和教育测量学专家共同完成。(3)根据已经确定的属性和属性层级关系选择适当的模型,如规则空间模型就是一种。(4)预测验与正式测验,获取模型参数。(5)诊断结果报告和有针对性的补救教学措施的制作。

认知诊断测评技术的发展使形成性评价的实施得以可能。在课程改革的背景下,教育的主题是关心人的发展,全面提高人的素养,同样,学业测评的功能也就从过去关注结果的评价逐渐转向注重过程的评价,强调通过评价改进教学活动,促进学生发展。“为了学习的评价”(Assessment for Learning,AFL)理念就应运而生,其核心目的是促进学生的学习,同时,该理念还提出了教育政策制定者过于强调大尺度教育评价对教育的影响而忽视了课堂上的评价。事实上,过程性评价是课堂上应该选择的最有效的评价方式,因为,在课堂教学活动过程中,为了促进教学活动而不是鉴定学生能力,教师和学生需要共同对学习过程进行监控和评价。这样,教学活动得到及时反馈,教师可以根据评价结果来调整教学;同时,学生得到学业评价的反馈,也提高了学业监控能力。

五、学业测评技术的理论发展与反思

通过心理测量理论的历史发展这条主线,对其在学业成就测评中的应用进行回顾,体现了测量理论在学业成就测评中的意义与价值,同时,这也体现了学业成就测评的测量学取向。从经典测量理论下学业成就测验对知识的测查,到项目反应理论下学业成就测验对能力的静态刻画,再到认知诊断理论下学业成就测验对能力的动态诊断,从而使教育者从反应行为的面纱下揭开能力的形成过程,对学生能力能进行更好的诊断、评价以及实施补救性的个性化教学。从学业成就测评的测量学取向的发展来看,随着认知科学、教学研究和心理统计学的发展,以认知理论为基础的新的测量方法和测验设计方法也会得到进一步发展,从而更好地指导学业成就的测评工作。

在对测评理论发展趋势的展望下,我们也应该有所反思。传统的学业测评中,更多地强调对学生学业水平和能力的衡量,但是认知诊断技术的发展趋势告诉我们,对学业的测评不仅仅是为了对学生进行考量,更应该是对教师改进教学质量提供信息,为教育质量的提高提供信息。另外,增值性评价的提出,提倡学生本身的纵向比较,更关注学生个体的发展与提高,使教育更人性化。这也更顺应了《基础教育课程改革纲要(试行)》中指出的,改革课程评价过分强调甄别和选拔的功能,发挥评价促进学生发展、教师提高和改进教学实践的功能。

参考文献

[1] Lewis R Aiken.心理测验与考试——能力和行为表现的测量.张厚粲,译.北京:中国工业出版社,2002.

[2] 辛涛.新课程背景下的学业评价:测量理论的价值.北京师范大学学报(社科版),2006.

[3] 柴彩霞.7~9年级数学成就测验的初步编制.湖南师范大学,2005.

[4] 辛涛.项目反应理论研究的新进展.中国考试,2005(7).

理论教育测评篇9

*本文系2012年广东省软科学研究重点项目“广东省科技创新型人才素质结构与评价标准研究”(项目编号2012B070300050)资助成果。摘要:教育评价效度的主要问题是将教育测量的效度概念框架系统照搬至教育评价的效度概念系统,适合于教育评价理论与实践需要的效度概念系统尚未真正建立。本文依据教育评价自身的内在属性特征建构了8个教育评价的效度概念:目的效度、建构效度、内容效度、交叉效度、主体效度、过程效度、功能效度、结果效度,并对其依据及其内涵进行了阐述。

关键词:教育评价;效度;构建 一、问题的提出

教育评价是根据一定的教育价值或教育目标,运用可行的科学手段,通过系统地搜集信息、分析解释,对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据的过程。[1]在教育评价实践中,一般要考察教育评价的结果多大程度上实现了既定的教育价值或目标;在具体评价时要考察教育评价指标反映教育目的的实现程度;在搜集各类教育评价信息时,特别是在运用评价工具和评价方法时要考察其能在多大程度上有效实现了对教育对象的测评;在实施某一评价活动时,如何控制影响评价结果有效性的各种误差变量,进而保证评价的内在效度;做教育决策时多大程度上可以将教育评价的结果推广至更大的被评价对象的情境、范围和领域,从而保证教育评价的外在效度等等诸如此类问题。从根本上说,一切教育评价活动的实现程度都必须通过教育评价的效度(validity)来进行评估和检验,并以此来判断教育价值或教育目标的实现程度。

二、教育评价效度的问题概述

(一)将教育测量的效度概念系统照搬至教育评价的效度概念系统

教育测量是对教育中的各种客体在某个或者多个属性上的特征的描述。其独特性在于测量是一种量化的描述,即运用数字系统对教育对象的属性的量加以刻画。在教育测量学的概念系统中,效度(validity)的经典定义是“指人们测量到了所想测量的东西的程度”[2]。因此,研究者在考察教育客体的效度类型时通常非常强调四种效度:结构效度(construct validity)、内部效度(internal validity)、统计结论效度(statistical conclusion validity)、外部效度(external validity)。概括而言,结构效度表示的是实际测量到的结构与预设的理论或构念(construct)相吻合的程度;内部效度表示的是变量与变量之间的确定性关系的程度;统计结论效度意指结论能够被解释并反映事物属性的程度;外部效度意指测量的结果能够被推广到其他情境的程度。

而教育评价是在某种标准(目标)之下对教育对象的价值或者特征的评判。价值在教育评价中不仅可以成为评价的对象,如考察某个教育对象的价值,还可以成为教育评价的标准,如评价标准的选择和确定。因此,从这一点而言,教育评价在评价中具有一定的主观性,是主观估计与客观测量的统一,而且教育评价活动往往比教育测量活动要复杂得多,从教育评价构成的系统要素而言,一项评价活动包括了价值目标和标准、组织机构和人员、评价方法与技术、评价对象与评价人员的心理调控等。从教育评价的客体(教育对象)以及关注的评价内容要素而言,教育评价远比教育测量关注的内容维度、评价方法、判断依据、价值判断等方面要丰富和复杂得多。因此,在考察教育评价的效度评价时我们不能忽略了教育评价与教育测量两者的联系,但同时更应当看到两者之间的区别,在实际应用时不能将教育测量中的效度概念移用至教育评价的效度概念体系当中。另一方面,应根据教育评价的研究对象及自身属性特征来确立其内涵及其概念,并建立教育评价特有的效度概念体系。

(二)适合于教育评价理论与实践需要的效度概念系统尚未真正建立

建立教育评价的效度概念系统是教育评价理论和实践发展的需要。在国内,少有研究者对教育评价的效度理论进行专门系统性的研究,较有代表性的研究有顾志跃[3],他从提高教育评价质量的角度出发,详细考察并分析了影响中小学教育评价质量的三个效度因素:外在效度,表现为评价结果与目的分离;内在效度,主要表现是信息与事实的之间存在偏差;结构效度,主要表现为指标体系与评价对象的非同构现象。这些效度概念仍然是建立在教育测量学的概念体系范畴之内,并未对教育评价的效度概念和体系做出更大程度上的拓展和建构。某种程度上而言,对教育评价的效度概念关注的甚少影响制约着我国教育评价理论朝着纵深方向发展。

而国外尤其是美国的研究者对效度理论的研究非常丰富,在教育测量与评价领域内,现代意义上的效度理论已经完全不同于传统的效度理论,如:(1)现代效度理论被定义为不是测量工具本身的属性,而是对测验分数进行解释和使用的支持程度。(2)Messick[4](1989)在对教育考试的效度研究中提出了“效度整体观”(the unified conception of validity)的概念,并为效度验证(validation,简称效验,以下同)提出了具体的指导。(3)效验被认为是一个评价的过程。效验需要使用定量和定性的方法搜集足够多的证据来支持基于测试分数做出的推断。(4)传统效度理论中信度与效度的概念不同。在现代效度理论中,信度作为效度的证据来源也是效度的一个不可或缺的重要组成部分。在现代效度理论下,效验要求对测验从编制到解释、再到使用后果的整个程序进行拷问,因为“每个环节都是效度证据的重要来源”[5]。教育评价是否真实有效,需要“搜集证据”来验证是否达到了既定的教育目的或目标。因此,从教育评价理论发展的实际需要和国外现代效度理论发展的实际来看,需要根据教育评价本身的特点和属性来构建其概念系统。

·教育管理· 论教育评价的效度及其构建 三、教育评价效度概念的建构

由于教育评价所涉多个价值标准,因此较难依据一种价值标准来判断教育评价的效果,应从多个维度对教育评价的效度进行拓展并构建。

本文以构成教育评价系统的要素作为逻辑基点,分别考察评价过程中的目标、体系、内容、标准、方法、功能、主体、过程、结果等要素特征的有效性来论述建构教育评价的效度概念体系。

(一)目标效度,即某种教育评价目标以及教育理念的实现程度

目标效度即教育评价达到了某个既定的教育目标或价值的程度,这是教育评价最根本的价值体现,因为效度本身就是以“目的或目标”的实现程度来进行考察的。因此,目标效度是以针对“教育目标、教育目的”的实现为判断依据的。如果某项教育评价结果在实践中有证据表明达到既定的目标,实现并完成了最初所设定的教育目标价值,那么即认为评价项目具有一定的目标效度。从根本上说,目标效度所要考察的是教育评价的总目标以及总目标下的各个评价维度的子目标的实现程度,反映了教育评价的根本目的和价值要求。

(二)建构效度,即评价体系的目标和教育对象之间的一致性程度

Messick[6]认为现代效度理论中最核心的效度是建构效度,并不存在几种不同的效度,如内容、实证、结构、概括化、外部和结果。我们认为将所有的效度类型都归结为一个建构效度显然太过于笼统,不利于对各种使用目的不同的效度做出区分,也不太符合教育评价的实际情况。因此,在教育评价领域中,建构效度不同于教育测量学的建构效度的含义,它通常是以设定的某个评价体系和编制的评价量表(测验工具)来表征和反映被评价对象。比如抽象的概念如创造力、智能;评价对象所在的水平状态如教育质量水平以及所包含的各要素的实现程度。建构效度所关注的是评价体系中的各个行为指标、要素特征、评价维度是否真实反映了评价的客体对象,最终要表达的是教育评价体系中的目标和教育对象之间的一致性程度。

因此,建构效度不仅是要关注理论或构念系统(有时可能并不需要某个构念系统,如依据一项结果是否达到教育政策的要求来给予评价),更要关注评价体系是否真实反映了评价客体的心理状态、行为取向、能力水平各方面的变化。同时一个具有良好建构效度的教育评价工具还可以准确地将一组被试和另一组被试区分开来。比如,一个评价工具要检测学生面向社会收集信息的能力,在检验这一评价结果时,如果所设计的评价项目能够将收集信息能力强与能力弱的学生分别开来,那么这个评价工具就有了建构效度。反之,如果评价的体系、维度不能反映学生在收集信息方面真实存在的能力差别,这个评价工具就没有建构效度。

(三)内容效度,即教育评价需要考察的内容或行为样本的适当程度

教育评价在实际操作时,需要对教育评价的总目标进行分解,总目标又具体分解为具体的教育子目标,而子目标又规定了哪些内容需要被考察以及相应的权重大小如何。因此,内容效度是对于要考察的内容或者行为样本的适当程度。在实际的评价过程中,内容效度是通过对评价目标以及具体的可操作的内容维度目标来进行检验的:一是反映总目标的维度内容的充分代表性,即维度目标是否被覆盖了所要考察的全域范围中的总目标要求;二是要评价的项目应是已界定好内容范围的代表性样本;三是要对每个项目所要评价的具体行为(如知识与技能)与上一级评价目标应保持一致,同时各子目标要相互独立,不能重叠,要力图反映总目标的要求。考察内容效度可采用复本法、再测法或者经验判断法。

(四)交叉效度,即各种教育评价方法相互检验和验证的一致性程度

实际评价中,多元性评价标准给评价带来了一定的困难。有时候,评价者在操作层面上将不同的标准加以融合是出于某一实用的动机,但往往忽略了“程序或技术的方法”与“逻辑证明的方法”之间的区别,对自己使用的方法背后的方法论缺乏自觉和反省。[7]结果,专家群体则很难对他们的研究进行质量评价。由于标准不同,这时在评估教育评价的效度时需要充分考查各种评价方法和标准的交叉效度。三角互证法可以用来检验不同的证据来源或不同的资料收集方法,其目的是为了在不同的标准之间进行相互证实。因此,可将此方法用作评估检验交叉效度的一种方法。

在教育评价中一般有两种基本评价方法:量的评价方法(亦称量化评价方法)和质的评价方法(亦称质性评价方法)。由于这两种方法采用不同的研究范式,因此,在研究方法、路径和步骤等方面具有很大的差异,评价效度的类型也有本质差异。如表1所示归纳了两种不同研究范式下的代表性方法以及据此建立的评价效度类型。

有必要指出的是,当两种方法整合在一起使用,这时如何考察评价方法的效度?其总的原则是在讨论量的评价结果时,则应考虑按数学概率的规则。将研究的结果推广到从中抽样的总体当中的适当性。在讨论质的评价结果时,则要根据质的研究目的、研究方法和策略以及研究步骤采用不同的效度评价标准及效度类型。如表1所示。无论是量的评价方法还是质的评价方法都需要从多方面寻找“效标证据”,同时考虑效度的测量指标的易获取性和可能性等因素。

(五)评价主体效度,即各种评价主体对评价客体评价结果的正确性和公平性

现代教育评价实践中,往往存在多个评价主体和多个利益相关者。因此,不同评价主体的评价目的不同,评价观念、评价标准、评价方法、评价工具的使用都可能带来很大的差异甚至相反,从而使评价失去效度。从本质上说,评价效度是针对于目的而言,不同评价主体由于评价目的、价值观、立场、标准不同,其评价效度可解释的范围、目的、价值性以及评价本身的意义都会不一样。因此,我们在对某项教育活动进行评价时,保证评价主体的一致性对于保证同一目的效度的评价就很重要。当然,即使是同一评价主体,其主体成员之间也存在着个体间的差异,在对某项教育目标评价时也可能因为个体之间对评价标准把握的不一致性从而带来评价者信度较低的可能,进而影响到评价的整体效度。

因此,在教育评价活动结束后,要考察教育评价的主体效度,对于评价主体效度要一分为二的来看待。

一方面,当存在多个评价主体时,此时就存在着多个评价主体效度,不同主体的评价效度之间还可以作为相互补充,便于教育决策者可以在多个效度之间合理筛选和评价,也便于集思广益,从而有利于教育决策者获得更多的教育评价信息,广开言路。

另一方面,由于存在多个评价主体,这会给效度评价带来一定的困难,使教育评价结果及解释存在着较大模糊性和不确定性,因而带来不同教育评价结果。尤其涉及到评价利益关系时,更会影响到教育评价活动的公平和公正,进而影响评价结果的有效性。因此,在重视评价主体效度的多元性对教育评价结果的促进作用的同时,还要根据教育评价使用的目的来对教育评价主体效度进行区分、比较和鉴别,选择评价结果效度较高的评价主体。

(六)过程效度,即教育评价收集各种评价信息和资料过程的有效性

教育评价的过程是由评价者组织实施,综合运用多种评价方法和工具,收集评价数据和信息的过程。评价活动的过程还是一个不断累积式、动态化评价的过程。因此,评价过程的效度关注的焦点是被评价者的“动态发展过程”,更加注重的是被评价者在既定评价目标下成长发生的经历,以及在整个教育活动中的历史和现实的绩效总和。如利用档案袋评价方法收集学生的优秀作品进行的表现性评价,再如对学校的发展性评价采用的增值性评价方法等。另一方面,教育评价的过程是整个教育评价活动开展的重要的评价步骤和实施依据,评价过程中的任何一个环节和关键评价要素,如对评价指标把握的宽严、对同一指标评价时产生的误差等都可能会影响到整体评价效度。又如在收集资料时,是采用问卷调查还是结构访谈的方法?是采用量的分析方法还是质的研究方法?一旦使用了不同的方法,那么评价的策略和重点就不相同。因此,在评价过程中需要综合运用多项效度指标。

过程效度如何考察需要综合来看。当收集被评价者的评价信息时,更多的则要关注资料的内部效度。当构建指标时,要充分考虑指标的科学性、完备性、独立性的同时还要考虑指标的区分效度以及各测量指标是否反映了总体目标程度的内容效度。要考察现有测量工具的预测效果时,则要考察某个工具的即时效度。当使用测评工具如某个心理量表时,则要关注测评工具的构念(construct)效度。当要对学生进行学业能力水平的形成性评价时,则要用到认知诊断评价工具,还要更多关注模型与方法的统计结果效度。因此,对于评价过程的效度评价而言,则是在各种综合效度都比较高的情况下作出的整体综合性的效度评价,有必要对评价过程当中使用到的方法、工具进行再评价,再检验(亦称为元评价),以确保评价的过程效度。

(七)功能效度,即实现教育评价目标既有功能的程度

教育评价具有选拔、鉴别、遴选、判断优劣、排序等功能,因此我们要考察教育评价的功能效度。功能效度是指实现了教育评价的既有功能的程度,体现的是教育评价的效用性(utility)。功能效度评价的内容具体主要表现为要体现教育评价增量性的指标,且要体现可行性、容易理解也便于操作。因此,功能效度关注的焦点是与教育评价功能直接相关的“结果性指标”效度。比如高考的评价功能是选拔,那么功能效度则具体表现为高考的入取率、重点大学入取率等功能性的可考察指标,这些指标可以作为效度评价的最重要依据。事实上,教育评价的功能效度直接体现了教育评价目标的实现。持有何种教育目的实际上决定了评价者使用何种评价功能,也因此决定了评价的功能效度。

(八)结果效度,即教育评价结果的实现程度

功能效度和目的效度以及最终表现的结果效度都是一脉相承的,即评价结果在多大程度上实现了预期评价目的、评价目标,体现出评价者使用意图以及教育目标价值,同时也能更好反映被评价者的评价需求,并能在实践中取得成效。因此,概括起来,结果效度可以从以下四个方面进行考察。

第一,结果效度要反映评价者使用评价的目的,即满足目的的需要。

第二,评价信息的反馈要反映被评价者的各种需求,特别是教育评价的结果要让被评价者得到认同,这样才能达到教育评价的最初设想和目的,也才能更好的发挥教育评价的督导作用。

第三,评价的结果要能在实践中得到验证和应用,并最终取得一定的教育成效,即效用(utility)。

第四,教育评价结果可推广到的目标团体和范围。

因此,结果效度的内容包括:满足评价目的,得到被评价者的认同需求,有教育成效,可推广性。

综上所述,教育评价的效度概念的内涵是非常丰富的。因此,构建效度评价的指标应当是多维的、多视角来综合考量的。与教育测量的效度概念相比,教育评价的效度概念被赋予的内涵远比测量的效度要深刻丰富得多。通过以上分析论述,教育评价的效度可概括为以下八个基本方面:(1)目标效度——某种教育评价目标以及教育理念的实现程度。(2)建构效度——评价体系的目标和教育对象之间的一致性程度。(3)内容效度——教育评价需要考察的内容或行为样本的适当程度。(4)交叉效度——教育评价方法、标准相互检验和验证的一致性程度。(5)评价主体效度——各种评价主体对评价客体评价结果的正确性和公平性。(6)过程效度——教育评价收集各种评价信息和资料的过程的有效性。(7)功能效度——实现了教育评价目标既有功能的程度。(8)结果效度——具体表现为教育评价最终的价值实现程度和满足主客体的价值实现程度,具体评价的维度又可分解为目的效度、需求效度、成效效度以及外在效度。

四、结语

以上仅从教育评价本身的属性特点建构了教育评价的效度概念,并试图拓展和构建了教育评价效度的内容及其评价的方法。实际上,由于教育评价活动本身的丰富性、复杂性和多元性,决定了教育评价效度的评价方法也存在着多元化,正如巴顿在《效用为本的评价》中所提到的那样,“要确保评价具有效用、可行性、理性和准确性,就必须具有情境的敏感性、方法的灵活性,评价者角色的多元化、良好的政治修养和创新”[9]。为此,我们还要在实践中不断寻找出具有可实际操作性和可考量性的效标评价依据。

注释:

①表1中有关效度概念的分类是由Maxwell(2002)在定义“定性研究中的效度”时提出来的。描述性效度指的是准确性(研究者间的一致性,对于物理和行为事件存在的认同的一致性,如频数)。解释效度指的是从参与者的角度揭示行为或行动的意义。理论效度针对的是研究者的构念,包括独立构念和构念之间的因果关系。推广效度指的是将结论推广至本社区的人、组织或者机构。评价效度从价值观的角度评价行为或者事件的适合性。

参考文献:

[1]胡中锋主编.教育测量与评价[M].第2版.广州:广东高等教育出版社,2006.11.

[2]胡中锋,莫雷.心理与教育测量中效度理论的重建[J].华南师范大学学报(社会科学版),2007(12):82-90.

[3]顾志跃.对我国中小学教育评价的质量分析[J].上海教育科研,1992(6):19-23.

[4][6]Messick S.Validity[M].In:R.L.L.inn (Ed.). Educational measurement.New York: American Council on Education / Macmillan publishing Co.(3rd ed.),1989:13-103.

[5]Downing S.Twelve steps for effective test development[M].In: S.Downing & T.Haladyma (Eds.).Handbook of Test Development.Mahwah,NJ:Lawrence Erlbaum Associates,2006:3-25.

理论教育测评篇10

[8]教育部等九部门.关于进一步推进社区教育发展的意见[EB/OL].(教育部网站).

[9]徐魁鸿.我国社区教育的发展:历史、问题及对策[J].职教论坛,2012(4):44-46.

理论教育测评篇11

关键词 体育课程 体育教学 发展性评价 教学目标

所谓“发展性评价”是针对传统评价存在的弊端并为解决这些弊端而提出的,是课程改革实施过程中出现的一种新的评价方式。发展性学生评价,是贯彻“以学生为本的思想关注学生个体的处境和需要,尊重和体现学生的差异,激发学生的主体精神,以促使每个学生最大可能地实现其自身价值,并为学生的终身发展服务的贯穿于学校教学活动每一个环节的一种持续的教育过程。”发展性学生评价是促进学生的发展为根本目的的新的评价理念和方法。它的本质是以人为本,以学生为中心,以师生之间的互动和理解建构为基础。

一、时代背景

为促进学生的全面健康发展,使当代大学生成为社会主义事业的建设者和接班人,教育部提出了“健康第一”的思想和颁布了新一轮《全国普通高等学校体育课程教学指导纲要》(以下简称《纲要》),为新时期我国大学体育课程的改革发展明确了目标。《纲要》指出:“学生的学习评价应是对学习效果和过程的评价,主要包括体能与运动技能、认知、学习态度与行为、交往与合作精神、情意表现等,通过学生自评、互评和教师评定等方式进行。评价中应淡化甄别、选拔功能,强化激励、发展功能,把学生的进步幅度纳入评价内容。”目前高校的体育课程学习评价都不同程度地存在与课程改革不相适应的诸多问题,本文认为发展性评价是新时期体育教学中学生体育学习评价的好标尺。

二、传统体育教学评价的弊端

传统的体育教学,在评价内容上重视体能和运动技能的评定,忽视学生的心理因素,很少提到学生的学习态度、习惯、情感、合作等方面的评定;评价工具和方法单一,评价工具仅是书面测验、体能和运动技能的测验,且以统一的标准衡量所有的学生,忽视学生的个体差异性和被评价者的进步状况和努力程度;在评价主体上,以教师评价为主,学生处于被评价地位,忽视家长、同伴及自身的作用;评价功能单一,只重书本知识、局部智能和最终学习结果,忽视评价在其教育、改进、反馈、激励等的综合功能,使学生在学习时常表现出无精打采、热情不高、注意力不集中,并出现畏难情绪,从而学习被动,厌恶体育,更无创造性可言,对学生身心发展极为不利。久而久之,不仅伤害了学生的自尊心和自信心,还使他们失去了对体育课的兴趣,甚至会扼杀他们参与终身体育的愿望。

三、发展性评价的理论依据

(一)多元智能理论

多元智能理论,认为一个人至少拥有8种相对独立的智力,这8种智力分别是:语言智力、逻辑数理智力、视觉空间智力、音乐节奏智力、身体动觉智力、人际交流智力、自知自省智力、自然观察者智力等。根据智能多元理论,评价应从标准的智力测验和学生学科成绩考核为重点的评价方式中解放出来,注重对不同人的不同智能的培养,采用多元化的评价方式,以发现每个学生区别于他人的智能特征,使学生发现自我价值,充分了解和认识学生的不同潜能特征。

(二)差异发展观理论

差异发展观理论,是以马斯洛的“人本主义心理学习理论”为依据,在教育教学中以学生为中心,确定个体差异性,发挥个体主体性,突出个体全面发展性。它倡导“教师为学生而教,学校为学生而设”,“重视人的内在价值,重视个人潜能的成长”的理念,并以此为出发点“以学生为本,以学生的发展为本”,强调由于先天的生理因素和后天的环境因素的影响,学生在其学习过程中呈现出各种差异性,是差异发展中的人,学生的差异和差异发展是必须正视的客观事实。

在体育教学中,学生之间的个体差异是客观存在的,体育教师要根据学生的个体差异,因材施教,采取针对性的教学策略,使每个学生在原有的基础上取得进步和发展。学生的个体差异不仅体现在体能和运动技能方面,还体现在运动能力、智力因素以及动机、兴趣、态度、个性心理等非智力因素等方面。只有重视这些个体差异性及其教学,才有助于激发学生兴趣,调动其积极性,从而促进学生的全面发展。

四、体育教学中实施发展性评价的有效途径和方法

(一)对体育认知水平的测评方法

理论教育测评篇12

中图分类号:K06文献标识码:A文章编号:1006-4117(2012)03-0077-02

体育测量与评价作为教育测量与评价的分支学科,很多方法和原理都是教育测量与评价和人体科学的综合发展的过程中提炼和优化发展的,随着母学科的发展,体育测量与评价在同时发展的过程中也形成了自身独有的科学发展体系。体育测量与评价就其学科特点包括了自然科学和社会科学两大门类,是两大学科门类的桥梁学科,由此可以推断体育测量与评价是人和社会在体育领域内的工具学科,属于科学方法论的范畴,为体育运动实践、体育理论知识结构构建和人的全面发展提供了基本理论依据和方法,本研究主要对体育测量与评价学科的发展历程进行梳理回顾,结合现状提出自己的一些浅识,与大家共勉,不当之处敬请指正批评。

一、体育测量与评价的历史回顾

孙庆祝、刘星亮、罗飞虹等在体育测量与评价教材中提出早在公元前3500-前两千年就有了相似于人体测量方面的研究,如古埃及、古印度、古希腊等国家,当时研究者的主要出发点就是了解人体各环节的比例,对身体部位进行测量(当然工具简单,与当时的实际水平相关)试图发现用人体的某一部位作为身体整体测量的计算单位,如掷枪人[1]。我国在2000多年前已有关于人体测量方面的记载,如医学经典著作《内径.灵枢》中的《骨度篇》已有关于一些人体测量方法的经典论述[2]。关于人体测量方面的研究从19世纪中后叶蓬勃发展,主要以身体的左右对称和身体的各部位的比例为内容进行研究,1880年前后随着研究者的深入,逐渐转入肌力方面的测量,从肌肉形状的大小转向肌肉机能方面这也说明了学科科学发展中,深层探索的需要。20世纪初,随着社会科学的发展,体育测量与评价学科逐渐转向实际运动能力的研究,涵盖了速度、耐力、力量等领域,更加注重测量方法和手段的综合性。

总之,体育测量与评价的发展大致经历了人体测量、肌力测量、身体机能整体测量和运动能力综合测量等阶段,其实这些发展阶段并不是绝对划分的只是受当时思维方式和科学探索能力的限制,没能全方位多角度的发现问题和解决问题,不过我们也应该认识到测量工具和科学技术手段在体育测量与评价中的地位和作用,这些也是限制早期体育测量与评价学科发展的关键因素。

二、体育测量与评价的学科发展现状

(一)体育测量与评价方法的标准化发展

近年来,体育测量与评价学科发展比较早的地区和国家,在测量仪器、测量内容和方法等方面都达到了较高的水平[3]出现了大量的测量方法手段和工具,同时测量涉及的面广,如身体形态、身体机能、身体素质等测量。在体育测量与评价学科的发展过程中,规范化和标准化成为学科发展的趋势,国内外都制定了相当的测量标准,主要表现在测量方法手段和测量工具方面。很大程度上加速了体育测量与评价学科的发展,大批量的科研组织和团队进行深入研究为学科的标准化发展提供强大精神动力和智力支持。

(二)不同区域文化和人种特征和测量方法的科学化程度对体育测量与评价提出新的要求。

在马克思主义经典著作里我们也可以看到世界上没有一片完全相同的树叶的论断,其实在测量方法和测量工具标准化发展的过程中,人么也会不断的思考,有没有统一的尺度和标准对所有人都实用,测量结果是否一致,实践证明不同的区域文化和人种特征其测量与评价的结果是不同的。叶国雄,邱卓英在不同人种和文化背景下的体育与评价研究中列出了不同人种的基本差异和不同区域文化背景下人的心理特征的差异指出,在测量工具和方法的标准化和科学化的前提下测量出不同区域文化和人种背景下的个体特征差异和群体特征差异是体育测量与评价学科本土化发展的必然选择[4]杨继星,赵先卿,利剑在体育测量信度估价研究的现状与问题分析中指出在测量方法方面应注重测量信度和效度的应根据实际情况进行分析研究和科学检验,测量方法和理论必须追求科学性和实用性[5]。

(三)体育测量与评价学科与其他学科交相发展

体育测量与评价是教育评价的分支学科,既有教育评价系统的最基本的特征也有其自身处于突出地位的自身学科特征,所以来自教育评价系统的相关学科和来自体育测量与评价系统的相关学科形成立体的互相影响和促进的学科群,在体育测量与评价学科体系中,体育测量与评价起到整体促进体育领域协调科学发展的中流抵住作用。袁尽州在体育测量与评价学科发展中存在的问题及对策中指出,体育测量与评价是一门交叉的综合学科,同其他学科有着密切的关系如测量评价理论与统计学、计算机的关系;形态测量与人类学、运动保健、人体解剖学的关系;生理机能测量与生理学、生物化学的关系;身体素质和运动技术的测量与运动生物力学及其他术科的关系;心理素质测量与心理学的关系;知识测验、体育教育评价和教育测量学的关系等。如何处理好这些关系对体育测量评价学科的发展有着举足轻重的作用[7]

(四)中外体育测量与评价的研究成果相互借鉴发展

前面的论断我们基本清楚了一点,体育测量与评价学科的发展与科学技术的进步程度是分不开的,西方发达国家在体育测量与评价方面的成果和学科体系建设要明显高于我们的发展水平,以美国为例他们已经有上百年的历史了,学科的发展基本达到非常完善的地步,在竞技体育、学校体育、社会体育等评价体系方面都有了十足的发展,形成了科学完善的科学测量方法和评价体系。仇建生在中美体育测量发展比较研究中指出美国在体育测量方法手段、体育测量研究范围、体育测量制度等方面都有很强的优势[8]。

三、体育测量与评价学科的发展展望

(一)体育测量与评价学科的三观发展态势

体育测量与评价学科涵盖了自然科学和社会学科的相关研究范畴,经历了人体、群体、区域、体育系统领域的测量评价发展过程。其自身也在测量方法手段,测量的科学性等方面不断提高和完善,随着测量领域的扩大和测量评价的科学性发展,现代体育测量与评价体系呈现宏观、中观和微观的协调互助发展的态势。在宏观方面涉及到体育领域的各个方面如社会体育、竞技体育和学校体育以及体育理论学科的相关评价体系。在微观方面如单个的技术动作和个人的身体机能和组织器官都有了较系统的评价指标和测量量表。

(二)体育测量与评价学科的不断分化发展趋势

体育测量与评价涵盖了身体形态的测量与评价、心肺功能的测量与评价、身体素质的测量与评价、心理健康与社会适应能力的测量与评价、体质综合测量与评价、运动技术水平的测量与评价、学校体育评价等领域。但从一门学科的发展来说面临的问题太多,笔者认为可以分成几个子学科采用向群理论将相项目之间关系密切的问题形成子系统分类研究,这样会让人感到知识的清晰系统和知识体系的完整性,这一点只是自己的一些看法,不敢赘述太多。

(三)科技引领下的体育测量与评价向人们大众的普遍应用发展趋势

随着科学技术的发展,体育测量评价方法和手段逐渐社会化和先进仪器设备程序化,只要被测者按程序要求操作就能很快看到测试结果。同时科学技术的设备产品从原来的实验设备逐渐转变为生活常备的家用工具,人们随时随地都能了解身体的变化情况和运动机能水平的改善情况,虽然有些设备很多人还不具备购买能力但是在一些科研单位和体育健康保健中心、健身中心、社区活动中心都能免费或者收取少量费用进行测试,了解自身的发展情况。在社会经济发展的过程中我国体育事业逐步进入大众化的发展趋势,人们对健康和体育运动会有全新的认识,同时全民的运动产与也给体育测量与评价学科体系的发展带来了挑战和机遇,不断增加的运动参与者和不断出现的运动领域的一些现象(如运动疾病,运动障碍等)要不断的充实和完善体育测量与评价体系,以适应社会发展和满足人们的需要。

结束语:体育测量与评价是随着社会的发展和科学的进步,活跃在体育领域的一门科学方法和应用学科,学科发展的宗旨是更好的为社会为人们的健康发展服务,具有了生产力的功能,就其学科发展的本位功能来说,要不断的更新和完善测量方法和体系,不断的适应体育领域内人类社会和环境的一切变化形式,要不断更新测量标准量表和制定切实可行的区域阶段普适性量表为学科的发展不断注入新的活力。未来体育的发展,将会建立在更加完善和科学的测量评价基础之上。

作者单位:商丘师范学院

作者简介:董倩玲(1956- )女,河南商丘人,商丘师范学院体育教学部副教授,研究方向:体育理论与实践

参考文献

[1]孙庆祝.体育测量与评价[M].北京:高等教育出版社,2006

[2][3]刘星亮,罗飞虹,张金春,周蔷等著.体育测量与评价[M].北京:北京体育大学出版社,2006

[4]叶国雄,邱卓英.不同人种和文化背景下的体育测量与评价研究[J].武汉体育学院学报,1994(4)

[5]杨继星,赵先卿,利剑.体育测量信度估价研究的现状与问题分析[J].首都体育学院学报,2005(2)