统计学的数据分析合集12篇

时间:2023-07-27 09:29:38

统计学的数据分析

统计学的数据分析篇1

【关键词】大数据 高中统计 数据分析 内容数据链

大数据的价值性,快速性,大量性,多样性,和预测功为教育提供了一种可能目前教育的形式多种多样,慕课、微课、网络公开课等等。大数据时代下的教育是怎样的呢?是基于个性化学习,是量化的,自我组织学习内容的教育,不仅要了解学生“心声”,认知水平和学习兴趣,而且要师生互动、合作探讨学习内容,将传统课程、教学、教材的内容数据化,利用可视化技术,提高学习兴趣。提升内容吸引力。高中统计内容必须系统化、过程方法直观化,这对高中的统计内容提出了挑战。使专题块和课程案例集以数据知识链为核心,使教育在大数据时代下的“量化”。

一、高中统计内容的新契机是大数据

使教育由数字支撑变化到数据支撑。高中统计教学场景布置,统计内容设计,学习场景的变革等等过去靠“敲脑袋”或者“理念灵感加经验”的东西,在背景为物联网、云计算、大数据下,变成一种由数据支撑的“行为科学”.用数据分析的方法对高中统计内容进行分析、挖掘,利用大数据更改高中统计内容,建立主线为“统计知识链”、目标为培养“数据分析能力”首尾呼应内容数据链,使高中统计内容的系统更加优化。

由于各种原因使高中统计内容,没有得到较好的发展.直到国家教育部颁布了各种政策,统计才得以发展.然而各种问题的存在仍然困扰着我国统计教学发展。大数据关注每一位学生的个性化需求与发展,关注学生的自我意识,分析群体心理,让教师关注学生的兴趣爱好,选择适合学生的方法,让学生自主的、创新的学习。

正如教育家张韫所说:“大数据时代的到来,让社会科学领域的发展和研究从宏观群体逐渐走向微观个体,让追踪每一个人的数据成为可能,从而让研究每一个个体成为可能.对于教育研究者来说,我们将比任何时候都更接近发现真正的学生。”大数据在充分了解学生各种需求,目前处于的状态的情况下合理运用各种统计内容,各种现代化的教学方式,不拘泥于传统化教学方式,利用各种资源形成螺旋式上升的统计内容数据链。使每一位学生都乐于学习,其个性化学习需求成为可能。

二、高中统计内容数据链在大数据视域下的内涵

数据高中统计内容的核心研究对象,数据分析是重点,统计学习是在初中的基础上,进一步学习数据统计方面的各种方法;用各种操作培养学生的归纳推断能力、统计思维、数据分析素养,提升学生在数据分析方面的能力,统计内容数据链为学生统计能力的提升提供了研究平台。把课程目标,学生需求、与大数据算法,数据链式结构有机结合起来是大数据视域下的统计内容数据链核心思想,利用大数据,将统计内容数据化,增强内容的可读性,衔接性、合理性、连贯性,织成统计知识,形成统计内容数据链。例如:具体环节为:链宿是“样本估计总体、”等数据分析方法,链源是“系统抽样,等距抽样、分层抽样”,链节是的数据描述、统计图形.通过统计知识的实际应用使“统计知识链”为统计内容数据链的内化,“统计能力链”为其外化,“统计能力链”,“统计素养链”为其发展,成为对学生产生重大影响的“统计思想链”所以,利用大数据的科学方法可使统计内容体系最终形成的统计思想体系;数据结构的链式模型,将促进学生创新思维,增强学生的参与积极性,使高中统计集“知识链、能力链、素养链、思想链”于一体。

三、高中统计内容大数据视域下下的数据链设计

(一)高中数学统计内容知识结构

各种版本的高中数学统计内容都介绍了基本的获取样本数据的获取,提取方法,就是我们常说的用样本推断总体,部分推断整体.统计知识注重培B学生数据分析的能力,利用实例讲解数据的各种思想,方法结合在一起,提高学生的综合能力。例如:结合具体问题情境,学习如何进行数据收集,分析,如何思维理解其含义。

(二)高中数学统计内容的教学要求

课标充分重视高中数学统计内容,并采取了有效的改进和创新措施。教学过程中,注重学生自我特长的发展,创新教学方式,不拘泥于传统的书本知识,强调以人为本,面向未来,让学生有数据意识,学会用数据说话,将统计知识运用于实践。

(三)高中统计内容在大数据视域下数据链设计

量化教育是大数据时代的可行教育,通过数据了解学生的个性化需求,促进学生的个性发展,注重创新式培养。结合教材利用现代化信息技术设计出学生乐于接受的教学方式。从“数据读心”,到“抓心入心”,再到“知心交心”,最终形成“数据育心”的培养链是统计内容数据链的设计原则。例如:分层抽样内容数据链的设计.首先,将分层抽样知识系统化。其次,将分层抽样的过程方法直观化。最后,依据统计内容数据链的设计原则和学生个性化学习需求,动态生成分层抽样内容数据链。把具体问题数据化。使分层抽样内容数据链成为满足自我发展需要的“知识链、方法链、素材链”。

四、结语

综上所述,对统计内容数据我们应该就地取材,因地制宜,开创多种方式的教学方式,注重学生的个性化需求,不要拘泥于传统的教材,注重培养学生的创新思维和自主参与能力,要让学生发挥主观能动性,积极主动的自己去思索,发展自己的特长,学会将具体的事情数据化不用数据的思想去思考问题,去看世界,老师也要探索更好的教学方法。将现代化的科学技术与传统枯燥的教材相结合创造出一种能够发挥学生潜能,特长的教学方式,要循循善诱,引导学生。总之,统计内容数据链能更好地使学生不断提升自己的数据分析“能力链”使学生学会用统计思想、统计方法、统计思维、统计观念、统计意识来认识世界,改造世界。

参考文献:

统计学的数据分析篇2

场景1:有教师在课堂上出示用左耳或右耳接听电话的人数统计,要求学生计算相应的比例。这种数据于学生而言缺乏实际意义,统计的结果也不涉及相关处理问题,反映出教师对数据的理解不到位。

场景2:教学中,教师给出一些商品的单价,要求学生统计单价超过5元的商品。统计的缘由没有给出,不过是单纯的筛选技能训练,没有体现统计的必要性及其意义,反映出教师对统计概念的理解不到位。

场景3:教师提供多种饮料,如绿茶、红茶、奶茶、可乐等,要求学生从中选择自己最喜欢喝的三种,再根据全班的选择情况整理数据,列出最受班级欢迎的三种饮料。最后,教师给出专家建议“健康的饮品包括水、纯果汁、奶”,要求学生结合课堂统计的数据结果,在调查报告中表达自己对中学生选择饮料问题的看法和观点。由于此三种饮品没有完全出现在此前供学生选择的范围内,自然没有一个学生的选择与专家建议的健康饮品吻合,于是,学生回答,“不管喝什么,只要健康就好”。数据统计的目的就是为分析、决策提供数据支持,而该场景中数据分析部分与前面的统计结果相互脱节、没有关联,或者联系不够紧密,反映出教师对分析的理解不到位。

上述场景反映出的根本问题是,教师对数据统计与分析的内涵或者核心指向理解不足。“数据统计与分析”属于“信息加工与表达”中表格信息加工与表达部分的教学内容,与数据管理部分的内容具有相似的核心指向,即关注“关系”的挖掘与表达,而关系是隐藏在数据之中的,需要通过相关的操作,如借助公式与函数的计算、排序、筛选等,将数据间的关系挖掘出来,可以借助图表的形式进行直观表达,即通过可视化方式清晰展示。

关于数据统计与分析,信息技术课程教学纲要或者课程标准中都有针对性的要求,譬如,2012年中国教育技术协会信息技术教育专业委员会研制的《基础教育信息技术课程标准2012版》中,初中学段在“模块二:信息加工与表达”中对表格部分的要求如下。

1.能列举1~2种常见表格编辑软件,尝试简单编辑操作,理解二维表格的共同特征。

2.根据需求能在文档中绘制或套用表格,并对其属性能按要求进行调整和设置。

3.能应用电子表格进行简单数据的统计、处理,科学地借助折线图、直方图、饼图等直观表达数据。

4.从不同的角度和立场出发,通过对相同数据做不同的加工,表达不同的观点,或对相同数据做不同的解读,感悟信息加工和利用的选择性、多元性和复杂性特征。

上述4条描述涉及表格中数据的统计、表达、分析,关注到数据间的关系挖掘。

“数据统计与分析”涉及对数据的加工、处理,从中获取信息并加以解读。因此,可以从DIKW金字塔模型获得直接的借鉴。

解决之策:DIKW金字塔的启示

DIKW金字塔是关于数据、信息、知识及智慧的体系,如图1所示。

图1 DIKW金字塔

数据(Data):可以是数字、文字、图像、声音、符号等,属于事实的记录,表达的是没有指定背景和意义的描述。

信息(Information):是经过相关处理的数据,强调的是数据与数据之间的关系。

知识(Knowledge):是有意义的信息,表现为信息和信息之间的关系。由信息到知识的转变过程,是一个对信息判断和确认的过程,需要结合经验、上下文联系、诠释和反省。

智慧(Wisdom):是富有洞察力的知识,是运用知识分析和解决问题的能力,可以简单归纳为正确判断和决定的能力。

显然,DIKW体系同样关注关系的挖掘,即数据之间的关系、信息之间的关系,因而可以用来指导“数据统计与分析”部分的教学。

从问题解答的角度观察,信息层回答的是“是何”的问题,知识层解决的是“如何”的问题,智慧层则涉及“为何”的问题。早期研究中有学者曾指出,信息技术中的技术包含三层内涵:(1)动手做的技术,即基本技能;(2)如何做的技术,即设计和规划的技术;(3)为何做的技术,即技术的思想和价值。[1]三层内涵的观点涉及技术是何、如何、为何的问题,与DIKW模型具有共通之处,这为DIKW模型在数据统计与分析中的应用提供了佐证。

从DIKW的视角来看,数据统计与分析的过程也是追求实现“数据—信息—知识—智慧”持续变化的过程。即从数据开始,以形成智慧为最终目的。具体过程是:借助相关操作对数据进行处理、加工,明确数据之间的关系,提取出有意义的信息,进而将信息组织成知识,促进学生明确“如何去使用”,再进一步,当学生明确应该何时使用及为什么要使用时,便形成了智慧。据此,数据统计与分析中的几个关键词,即数据、统计、分析,都需要有专门的指向,符合内在的规定性,且数据、统计、分析应当做到前面环节为后续环节奠定基础,后续环节又必须在前面环节的基础上展开。具体来说,数据需要为统计服务,统计是建立在数据提供的基础上;统计的结果是为了进行分析,分析必须依赖于统计结果;分析的目的是为了提供决策的依据。这些关系必须在教学中予以体现,方能体现数据统计与分析的要义。

实践之道:基于DIKW的教学思路

从DIKW的视角,数据统计与分析教学需要经过三个过程:“数据信息”、“信息知识”、“知识智慧”。从关系发掘的角度,即隐性关系显性化、显性关系知识化、知识运用自动化,下文展开具体阐述。

1. 隐性关系显性化

隐性关系显性化,即从数据到信息的过程。数据可以是教师为学生提供的原始资料,或者是收集来自学生的资料。因为需要借此学习相关技能操作,如公式与函数的使用、排序、筛选、图表表示等,因此数据主要是数字形式,如考试成绩、购物费用等,根据需要也可以适当包含文字,如学生的血型、爱好等。

为了从数据中提取有意义的信息进而展开分析,数据需要符合一定的要求:其一,数据最好能够贴近学生,具有真实性。小至与学生个体相关的数据,大至与学校、社区、城市、国家相关的数据。贴近学生生活经验或学习经验的真实数据才能激发学生的兴趣,促进学生通过操作发掘数据之间的关系,形成有意义的信息。从教学实践来看,课堂或者课前收集来自学生的鲜活数据相对容易调动学生的积极性。其二,数据需要具有潜在的意义,即有统计价值,场景1中接听电话用左耳还是右耳的例子之所以失败,就是因为数据不具有统计价值,从数据中无法提取出有意义的信息。其三,数据要具有统计的必要,即数据要达到足够的量,少量数据往往无法体现出用计算机统计的优势。在数据量足够的情况下,可以通过人工计算与计算机统计的对比凸显计算机统计的优势和价值。

在数据有效的基础上,统计承担着从数据中提取信息的功能。为了保证将来从信息到知识的转变,统计所得信息当存在分析的可能、必要及价值,否则统计本身就没有意义。譬如,场景2中让学生统计购买的商品中单价超过5元的商品,数据本身没有问题,但这种统计的结果似乎没有分析的意义及价值,因而统计本身就失去了意义。

从数据到信息的转变需要学生借助一定的技术操作来实现,这个阶段涉及的技术属于动手做的技术,即技术的底层。例如,统计过程可能涉及计算、筛选、排序,统计结果的呈现涉及各种图表的使用。

2. 显性关系知识化

显性关系知识化,是指由信息到知识的转变。美国佛罗里达国际大学豪恩斯坦认为,信息是别人内化的知识,知识是自己内化的信息。[2]所以,如果信息是输入,知识在某种意义上便是输出。这意味着从信息到知识的转变需要学生在认知层面形成理解。这一阶段涉及的技术属于无形的技术。

此阶段是对数据统计结果进行分析的过程。譬如,统计全班学生血型,根据四种血型的统计结果,引导学生明确血型的相关知识。又如,统计不同品牌货物销售情况,从不同角度(商场、品牌负责人、顾客)去分析,得出不同的结论。若收集的数据与学生个人或家庭相关,则分析的结果最好能够凸显因人而异,从而促进学生在体验到分析意义的基础上,树立利用数据统计与分析为自己的学习、生活服务的意识。

譬如,《Excel中数据的处理》[3]中,教师要求学生将自己家庭衣、食、住、行、用等数据输入到碳排放计算工作表中,完成相关计算,并根据数据回答问题:

1.我们家( )方面碳排放最高,( )方面碳排放最低。

2.我们家年人均碳排放( )kg,和全球人均目标碳足迹2000kg比较,我们家是(高碳/低碳)生活。

3.为了应对气候变化,我们家应该从以下方面减少碳的排放。

每个学生获取的数据不同,结论自然就不同。这种差异性体现了一种真实,也帮助学生理解统计与分析的实际意义。

分析在统计与决策之间发挥着承先启后的作用,“承先”是指,分析必须依据统计所得结果来进行,体现两者的紧密联系,以保证分析的价值及统计的意义;“启后”是指,分析需要为后面的选择、决策提供依据与基础,因此需要恰当设计分析的内容,以保证决策得以进行。

譬如,《Excel中数据的处理》中1、2两个问题的分析必须建立在前面数据计算的基础之上,3题的回答又依赖于1、2分析的结果,充分体现出统计分析为决策提供数据支持的功能,促进学生对数据统计分析加深认识与理解。

3. 知识运用自动化

知识运用自动化,即从知识向智慧的转变过程,是指在学生掌握知识之后,借助一定量的知识应用练习,熟悉了知识的应用环境及方法之后,在不需要专门选择知识的情况下无意识地运用知识,达到自动化效果的过程。这一过程显然不是一蹴而就的,需要经历几个状态:在知识应用练习之前,处于“无意识的不用”状态;经过知识应用训练,基本掌握了知识应用场合及方法,但还不够熟练,遇到问题时,需要有意识地思考选择相应的知识,该阶段可以称为“有意识的应用”状态;经过足够的知识应用练习之后,学生对知识的应用形成更深的感悟,可以在无意识中,即自动选择某种知识应用于问题解决中,此时就进入了“无意识的应用”状态,达到此状态,即完成了由掌握知识到生成智慧的转变。

具体到数据统计与分析的教学中,就是根据分析结果进行选择或决策的过程。智慧指向正确判断和决定的能力,因而在数据统计与分析后期,需要引导学生依据分析的结果进行选择、决策。智慧倾向关心未来,含有暗示及滞后影响的意味,与此类似,课堂上的选择抑或决策只能更多发生于认知层面,形成的是决策时的心理倾向,但追求的是持续影响学生并实现将来在现实情境中的外显行为的变化。因而,知识运用自动化在一次课内未必能够实现。

同数据分析类似,决策可以因人而异。譬如,《Excel中数据的处理》中的问题3。教学中需要引导学生根据实际做出符合需求的决策。譬如,《Excel综合运用》[4]案例中,教师课前安排学生对自己居住小区的人居环境从自然、人文、社会、建筑和支持网络几个方面进行评价,课堂上则围绕用Excel软件对若干个小区的人居环境状况作系统的分析,涉及Excel数据加工技术的综合应用,如排序、筛选、分类汇总等,然后得出结论,哪个区的人居环境综合比较好。最后环节是引导学生的实际应用:

是不是××区的人居环境比较好,我们都要住在那个区?在选购住所的时候,首先应该考虑自己的需求,根据实际需要确定自己的选择。

(1)假如你是一名在南京一中读高一的学生。

需考虑因素:你的父母希望你上学路途中花费的时间比较少,小区居民的整体文化素质比较高。

(2)假如你的爷爷奶奶退休了,考虑给他们选择一处房屋。

需考虑因素:空气新鲜,小区休闲设施齐全,邻里关系和睦,靠近你家现在的住处,方便照顾老人。

该案例是在对真实数据进行统计的基础上,通过分析引导学生明确如何选择、为什么要如此选择,关注学生在掌握知识的前提下生成智慧。学会选择,这就是智慧,影响着将来的选择行为,即根据实际需求进行选择,其实不仅是小区的选择,也包括人生中的其他选择。

知识运用自动化阶段的教学要求:其一,必须为学生提供需要决策的情境,以促进学生在类似情境下的顺利迁移。这一点需要在数据呈现的同时即提供给学生,以促进学生明确数据处理的根本目的。其二,决策需要根据分析的结果来进行,让学生充分体会到分析的目的及价值,即为决策提供依据。

按照上述隐性关系显性化—显性关系知识化—知识运用自动化的思路,教学中引领学生经历数据的收集、整理—处理、加工—分析、表达—选择、决策这一完整过程,促进学生对数据处理形成整体感知与理解。

数据统计与分析的完整过程是从数据收集与录入开始,经过表格规划与修饰、数据处理与统计、图表与分析等,因此,未必在一节课内完成,但整个部分的教学经历完整过程即可。也可以在综合应用或者复习课上,带领学生经历此完整过程,为了在一节课内实现,可以简化部分细节,如使用半成品策略,以凸显整个流程。

结束语

从DIKW金字塔模型的视角观察“数据统计与分析”的教学,意义在于:明确数据统计与分析的教学不能止步于简单的数据收集、整理、加工,其意义主要体现于在此基础上的分析及进一步的决策。即教学中在由数据到信息的转化基础上,关注显性关系的知识化并追求知识运用的自动化。

显然,DIKW模型也适用于信息技术课程中的其他内容,譬如DIKW体系经常应用于信息科学,因此可以应用于搜索技巧及数据挖掘。

注:本文为江苏省教育科学“十二五”规划课题“信息技术课程思想及其应用研究”(B-b/2013/01/039)的研究成果。

参考文献

[1]李艺.高中课改实验进行时[J].中小学信息技术教育,2005(1).

[2]盛群力.21世纪教育目标新分类[M].杭州:浙江教育出版社,2008:67.

统计学的数据分析篇3

——黄冈名师基层巡回讲学数学听课体会

5月26日有幸听了万贵秋、程来魁两位教师关于复式折线统计图同课异构课和吴文涛名师关于折线统计图的展示课,我也曾教过这一单元,然而我的教学重统计图的绘制轻数据分析,三位教师与我截然不同的教学思路让我感悟颇深。统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。分析数据是统计的核心,也是本单元的重难点之一。如何在课堂教学中突破这一重难点我有以下看法:

一、感知数据

《新课程标准》指出:在"统计与概率"中,帮助学生逐渐建立起数据分析的观念是重要的。数据分析包括:了解在现实生活中有许多问题应当先做调查研究、收集数据,通过分析作出判断,体会数据中是蕴涵着信息的。数据分析的第一步要调查研究收集数据,在这一过程中感知数据不再是简单的数字,它的背后蕴藏着数学信息。在课堂教学中采取的是:

(一)选取贴近学生生活素材,加强学生对数据的感知。本次课堂上万贵秋教师调查学校趣味数学魔方选拔赛郭宇和徐伟的成绩,吴文涛教师调查学校足球队方瑶投篮的成绩,这两个发生在学生生活中的问题进行调查,既增加了学生对收集数据的亲切感,又激发了学生挖掘的数据背后隐藏的数学信息的欲望。

(二)选取具有统计意义的真实的生活素材,加强学生对数据的.感知。程来魁教师选取的是调查全国人口老龄化这一具有统计意义的事情。首先让学生了解到抽样调查是统计中常见的调查方法,调查全国人口老龄化,只需抽样调查上海老龄化情况。而每年出生人口数和死亡人口数是连续性变量,非常适合用复式折线统计图来表示其变化。学生从视频中看到这一令人震惊的事实,激发其探究的欲望,同时在真实的死亡人口数与出生人口数中,增加学生对数据的感知,无形之中会将两者进行比较。

二、数据读取

学生会从收集的数据感知一些大略的信息,第二步就要整理数据了,整理数据的方式一般就是统计表,统计图等。在以往我的教学中我通常会教授学生绘制统计图,再读统计图中的数据。一节课大部分时间用在画图,特别是横轴和纵轴的填写,而读图时间会过少。这样的教学往往导致学生会成为画图的高手,读图的哑巴。此次三位教师都是通过读图来画图,万贵秋和程来魁教师都是通过读两个折现统计图来画复式折现统计图,吴文涛教师是通过读条形统计图来画折现统计图,从学生已有的作图起点出发不仅让学生自主的探究统计图的制法及注意事项也为后面的读数,数据分析大大节省了时间。读懂统计表中的数据为后面的数据分析做铺垫。

(一)读显性数据

显性数据就是统计图中直观的信息。读图标,图例,横轴、纵轴、以及点的信息。这部分内容很直观,加之有以前学习条形统计图的经验,学生较易掌握。

(二)读隐性数据

隐性数据即是通过显性数据得出的统计量。在运用统计量时一定要注意其统计意义。比如平均数、中位数、众数。平均数是一个虚拟的数,它能反应一组数据的总体水平。中位数是个半虚拟的数,它则能反应一组数据的中等水平。一般而言,平均数作为数据代表相对可靠和稳定,但遇到极端数据时它则不能反应这组数据的基本情况。在万老师执教的这一课里面有同学提出了用平均数来反应两名同学玩魔方的总体水平,从而决定由谁参加决赛,这个结果与我们从统计图数据变化趋势分析的结果大相径庭。造成两种不同的结论的原因在于这个同学没有看到极端数据对平均数的影响,一次失误能拉下一个学生比赛的平均分,但是这时的平均分并不能代表这个同学的整体水平了。

三、数据比较

读懂数据,了解数据所蕴含的信息,我们还要更深层次的挖掘数据的隐藏信息。这一部分的数据分析是通过数据比较来完成的。

(一)横向比较

在折线统计图中了解了点所代表的信息,再引导学生横向观察折线统计图,相邻的两个点之间的线段的方向代表数据的增减;线段的陡平代表数据增长的快慢,整条折线有代表数据的发展趋势,由部分到整体挖掘数据隐含信息。在吴老师的教学中这一细节做的非常的到位,从点,(fanwen.chazidian.com)线段,折线三个方面深挖信息,并通过整条折线的趋势做了预测,预测方瑶的后两次成绩。万老师执教的这一课也从整体折线趋势预测两个同学的下次成绩,从而得出决策。

(二)纵向比较

数据之间纵向比较主要体现在复式折线统计图里,两个量之间的差距是同一纵轴上两点间的距离,也是复式折现统计图中蕴含的一个重要信息。比如万老师的这节课通过比较两个同学每次成绩相差多少,判断两个同学成绩的变化。又比如程老师执教的调查人口老龄化,其中自然增长数等于出生人口数减去死亡人口数,就是比较两个量间的差距变化从而判断人口是呈正增长还是负增长,以及增长的幅度来判断人口老龄化的情况。

统计学的数据分析篇4

5月26日有幸听了万贵秋、程来魁两位教师关于复式折线统计图同课异构课和吴文涛名师关于折线统计图的展示课,我也曾教过这一单元,然而我的教学重统计图的绘制轻数据分析,三位教师与我截然不同的教学思路让我感悟颇深。统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。分析数据是统计的核心,也是本单元的重难点之一。如何在课堂教学中突破这一重难点我有以下看法:

一、感知数据

《新课程标准》指出:在"统计与概率"中,帮助学生逐渐建立起数据分析的观念是重要的。数据分析包括:了解在现实生活中有许多问题应当先做调查研究、收集数据,通过分析作出判断,体会数据中是蕴涵着信息的。数据分析的第一步要调查研究收集数据,在这一过程中感知数据不再是简单的数字,它的背后蕴藏着数学信息。在课堂教学中采取的是:

(一)选取贴近学生生活素材,加强学生对数据的感知。本次课堂上万贵秋教师调查学校趣味数学魔方选拔赛郭宇和徐伟的成绩,吴文涛教师调查学校足球队方瑶投篮的成绩,这两个发生在学生生活中的问题进行调查,既增加了学生对收集数据的亲切感,又激发了学生挖掘的数据背后隐藏的数学信息的欲望。

(二)选取具有统计意义的真实的生活素材,加强学生对数据的感知。程来魁教师选取的是调查全国人口老龄化这一具有统计意义的事情。首先让学生了解到抽样调查是统计中常见的调查方法,调查全国人口老龄化,只需抽样调查上海老龄化情况。而每年出生人口数和死亡人口数是连续性变量,非常适合用复式折线统计图来表示其变化。学生从视频中看到这一令人震惊的事实,激发其探究的欲望,同时在真实的死亡人口数与出生人口数中,增加学生对数据的感知,无形之中会将两者进行比较。

二、数据读取

学生会从收集的数据感知一些大略的信息,第二步就要整理数据了,整理数据的方式一般就是统计表,统计图等。在以往我的教学中我通常会教授学生绘制统计图,再读统计图中的数据。一节课大部分时间用在画图,特别是横轴和纵轴的填写,而读图时间会过少。这样的教学往往导致学生会成为画图的高手,读图的哑巴。此次三位教师都是通过读图来画图,万贵秋和程来魁教师都是通过读两个折现统计图来画复式折现统计图,吴文涛教师是通过读条形统计图来画折现统计图,从学生已有的作图起点出发不仅让学生自主的探究统计图的制法及注意事项也为后面的读数,数据分析大大节省了时间。读懂统计表中的数据为后面的数据分析做铺垫。

(一)读显性数据

显性数据就是统计图中直观的信息。读图标,图例,横轴、纵轴、以及点的信息。这部分内容很直观,加之有以前学习条形统计图的经验,学生较易掌握。

(二)读隐性数据

隐性数据即是通过显性数据得出的统计量。在运用统计量时一定要注意其统计意义。比如平均数、中位数、众数。平均数是一个虚拟的数,它能反应一组数据的总体水平。中位数是个半虚拟的数,它则能反应一组数据的中等水平。一般而言,平均数作为数据代表相对可靠和稳定,但遇到极端数据时它则不能反应这组数据的基本情况。在万老师执教的这一课里面有同学提出了用平均数来反应两名同学玩魔方的总体水平,从而决定由谁参加决赛,这个结果与我们从统计图数据变化趋势分析的结果大相径庭。造成两种不同的结论的原因在于这个同学没有看到极端数据对平均数的影响,一次失误能拉下一个学生比赛的平均分,但是这时的平均分并不能代表这个同学的整体水平了。

三、数据比较

读懂数据,了解数据所蕴含的信息,我们还要更深层次的挖掘数据的隐藏信息。这一部分的数据分析是通过数据比较来完成的。

(一)横向比较

在折线统计图中了解了点所代表的信息,再引导学生横向观察折线统计图,相邻的两个点之间的线段的方向代表数据的增减;线段的陡平代表数据增长的快慢,整条折线有代表数据的发展趋势,由部分到整体挖掘数据隐含信息。在吴老师的教学中这一细节做的非常的到位,从点,()线段,折线三个方面深挖信息,并通过整条折线的趋势做了预测,预测方瑶的后两次成绩。万老师执教的这一课也从整体折线趋势预测两个同学的下次成绩,从而得出决策。

(二)纵向比较

数据之间纵向比较主要体现在复式折线统计图里,两个量之间的差距是同一纵轴上两点间的距离,也是复式折现统计图中蕴含的一个重要信息。比如万老师的这节课通过比较两个同学每次成绩相差多少,判断两个同学成绩的变化。又比如程老师执教的调查人口老龄化,其中自然增长数等于出生人口数减去死亡人口数,就是比较两个量间的差距变化从而判断人口是呈正增长还是负增长,以及增长的幅度来判断人口老龄化的情况。

统计学的数据分析篇5

1.要让学生感受需要用数据来说话。

统计教学与其他数学内容一样,首先要激发学习的需求:为什么要统计?与其他数学内容所不同的是,统计是用“数据来说话”。

在《复式折线统计图》教学中,结合生活实际以及折线统计图的特点,我们创设了“常州气温是否变暖”问题。通过师生谈话聊出“气候变暖”话题,提出问题:怎样说明常州气温是在变暖?在现实且有意义的问题驱动下,让学生充分感受“数据”是说明问题有力的“证据”,以此认识到数据分析的重要性。

情境只是载体,想到需用“数据”说明问题是活动目的。随着一次次经验的积累,学生也就逐渐体会到“数据”能说明问题,说明问题需要统计数据,统计能帮助人们了解事情并做出判断,也就逐渐建立了统计意识。

2.要让学生明白用怎样的数据来说话。

在《复式折线统计图》教学中,为使学生感受怎样的数据才能科学地说明常州气温变暖问题,师生间进行了如下对话:

师:你们觉得要收集怎样的数据呢?

生:收集今天的气温。

师:单单收集现在的气温能说明这个问题吗?

生:不能,要现在的和以前的,这样才可以对比。

师:对比,是一种好方法!只是,气温有最高气温,有最低气温,还有平均气温,你们觉得这里用哪个气温比较合适?为什么?

生:平均气温。因为平均气温在中间,既不是最高的也不是最低的,比较公平。

师:是啊,在新闻中经常会出现在哪一年或哪一个月出现极端气温。为了避免这种极端数据影响我们的判断,所以要用“平均气温”来比更合适。但气温的变化很微妙,如果用今年和去年气温比,很接近,很难发现问题。怎么办?

生:相隔时间久一些。

生:调查年份多一些。

师:其实,气象工作者和你们的想法一样,一般用现在月平均气温与前几十年的月平均气温作比较。(出示在常州气象局查阅的常州1949年-2000年的50年月平均气温和常州2010年各月平均气温)

……

《课程标准》(修订稿)对统计教学明确提出:要会根据实际问题设计简单的调查表,能选择适当的方法(如调查、试验、测量)收集数据。很显然,如何收集数据、搜集怎样的数据是要求学生达成的能力要求,那么,数据的科学性教育也就显得尤为重要了。

二、“数据”是分析问题的“依据”

1.要让学生读懂数据表达的信息。

在《复式折线统计图》教学中我们设计了这么一道练习:下面两幅统计图,只有一副是真的,请同学们猜一猜那副是真的。

这道题是根据苏教版小学数学教材中的练习改编而成。改编后的练习不仅丰富了统计内涵,更重要的是通过游戏的形式使学生产生对数据的亲近感,让学生感觉数据并不枯燥乏味,数据分析也不仅仅是计算,数据是蕴含信息的,数据是能表达生活实际,每幅统计图其实就是告诉我们一个生活故事。

2.要让学生体悟数据有助于分析问题。

发展统计意识、培养学生的数据分析观最有效的途径就是让学生体会统计的价值。数据是能表达信息的,数据所表达的信息是能够帮助人们做出决策的。

在《复式折线统计图》教学中,为使学生认识到统计对决策的作用,设计这样的题目:完成某地区7-15岁男女生平均身高统计图。

(1)给出7、8、9岁男女生平均身高的相关数据,要求学生独立描点、连线完成部分统计图,并交流绘制的过程。

(2)进行分析和推测。

看着7-9岁的身高图,先猜一猜9-15岁男女生的两条折线会有怎样的发展趋势。然后出示9-15岁的折线统计图,说一说男女生7-15岁身高有怎样的变化。再想一想,如果接着画下去,男女生的两条折线还会怎么样?

统计学的数据分析篇6

人口增长数据的统计与分析课题: 一次方程组的应用 年级: 初中一年级 目的: 1. 会列出二元一次方程组解简单的应用题,使学生使用代数中的方程去反映现实世界的相等关系,体会代数方法的优越性。2. 渗透把未知转化为已知的辩证思想,培养学生分析问题、解决问题的能力。3. 通过统计数字和计算,了解人口增长的情况和控制人口增长的意义。准备: 复印学生页,纸、笔。 步骤: 1. 统计数据。到当地统计部门搜集以下统计数据:本地20年前、现在、计划20年后的城镇人口和农村人口,计划农村人口增长率,城镇人口增长率。2. 编制习题。利用统计数据编制问题。3. 解决问题。列出方程组,解方程组,得到这个问题的解。4. 再利用统计数据编制其他类似问题并求解。5.交流、讨论。引导学生讨论以下问题: 我国现在的人口数量多吗?为什么我国现在人口数量如此之多?你认为是哪些原因造成的? 人口过快增长会给人们生活、工作造成什么影响? 我国已经采取了哪些措施来控制人口增长?你认为还应采取哪些措施?

统计学的数据分析篇7

一、SPSS统计软件特性分析

(一)SPSS统计软件应用范围

SPSS(Statistical Product and Service Solutions),是一种“统计产品与服务解决方案”软件。开始时它的全称为“社会科学统计软件包”,但最后被命名为“统计产品与服务解决方案”。它最初用于统计学分析运算、数据挖掘、预测分析和决策支持任务,有Windows和Mac OS X等版本。后来随着SPSS公司对这款软件的更新与改进,它的应用范围也逐渐扩大起来,它在自然科学、技术科学和社会科学等方面都有涉及,并且都收到使用者的好评。世界上许多著名的杂志报刊都对SPSS统计软件的各方面功能做出了很高的评价。

(二)运用SPSS统计软件的实例分析

某高校要对大学生党员素质进行评价,以便于对发展和培养当代大学生的工作实践。他们首先选取了“道德品行”“政治素养”“学习能力”“工作能力”“心理素养”这五个方面对大学生党员素质进行评价,然后要求被调查者根据自己对党员的要求来判断学生党员是否能做到其中一点。其中1表示“非常不同意”、2表示“不同意”、3表示“不能确定”、4表示“同意”、5表示“非常同意”。从发出的300份卷中筛选出有效的188份,然后用SPPS统计软件对分卷信度用克隆巴赫系数测量,该系数表示的是问卷调查结果总变异中由不同被调查者导致的比例占多少,整个问卷和各个子问卷的克隆巴赫系数如下表所示:

为了验证所获得数据的有效性,该试验还进行了Bartlett’s Test和KMO指标验证。Bartlett’s Test检验的sig为0.000说明参与分析的数据来自正态分布的总整体,而KMO的取值在0到1之间,所得到的值越接近1,表明这些变量对因子分析的效果越好,这些因素很好的解释了大学生优秀党员应当从什么地方开始培养,而SPSS统计软件则是验证了这些因素的有效性和可信度,为大学生党员的培养工作提供科学依据。

二、大学生职业素质评价模型构建

(一)大学生素质评价模型研究背景

随着时代的前进和科学技术的发展,现代年轻人的思维也追上了时代的最前端。步入大学殿堂的“90后”一代年轻人,他们追求自我和个性的特点越来越显著,教育工作者对大学生职业素质的培养与分析也遇到了挑战。如何根据大学生的特点来构建素质评价模型是新一代教育工作者需要考虑的问题。

(二)SPSS统计软件对大学生职业素质评价模型构建的作用

对大学生职业素质评价要从学习能力、工作能力、政治思想、心理素质四个因素考虑,这四个因素涵盖了大学生的外在处事能力和内部思想,是对一个人的综合职业素质比较全面的评价。大学生的职业素质评价模型由这四个因素构成。运用SPSS统计软件对这几个因素进行分析,可以看出这些因素对职业素质评价所占比重的大小,然后根据各个因素所占的比重构建大学生职业素质评价模型,得出科学的评价方法和评价重点。

(三)SPSS软件对大学生职业素质评价情况分析

运用SPSS统计软件对大学生职业素质进行数据统计分析,可以了解到我国当代大学生需要培养的职业素质,也可以看出在校大学生对自身优秀职业素质的期盼和要求。大学生的职业素质涵盖了学习、工作、政治、心理等四大方面,以大学的具体生活为基础,由校园小范围扩大到社会这个大范围,具有很强的现实指导意义。运用SPSS统计软件,可以得出大学生职业素质评价的重点,让大学生充分了解到自己达标和不达标的地方,加以改正。

三、结论

对大学生的职业素质进行评价是大学生发展阶段中的必要条件。大学教育的目的在于让大学生成长和发展,让他们掌握更多的知识技能,认清自己与社会外界的关系,有助于自己以后的工作和生活。而在SPSS统计软件的分析下,可以看到大学生的职业道德素质由多种原因共同决定,因此我们可以知道,只有多方面的对大学生进行教育,才能使大学生形成良好的职业道德素质,做一个对社会、对国家有用的人。

统计学的数据分析篇8

摘要:通过中国知网,从年量等七个方面,对咸阳职业技术学院(以下简称咸阳职院)自升格高职以来发表的期刊论文进行了

>> 基于Web of science数据库竞争情报论文的统计分析 渭南职业技术学院科研论文计量分析 陕西财经职业技术学院科研论文计量分析 基于iHistorian的实时数据库工业报表自动统计分析系统的研究 基于组织机构代码数据库的应用统计分析初探 2006~2012年SCIE数据库收录扬州地区二、三级医院科技论文的统计分析 咸阳职业技术学院物流实训中心建设的构想 数据库在乙型肝炎血清免疫标志物统计分析中的应用 电视机基板品质信息统计分析系统数据库设计 咸阳职业技术学院校园主要绿地植物病害调查初报 咸阳职业技术学院通过微课比赛提升教师信息化水平 基于数据仓库技术的保险业统计分析系统设计 管理数据的统计分析 信息技术在教育科研问卷调查及数据统计分析中的应用 科研院所统计分析中数据的可比性 天津电子信息职业技术学院2009―2013年计量分析 职业院校的科研定位及特色――以宁夏职业技术学院为例 基于BYOD的职业技术学院信息化建设的部署策略 基于web的泸州职业技术学院毕业设计监控平台研究 基于Web of Knowledge Web服务的机构论文统计分析系统 常见问题解答 当前所在位置:.

[3] 秦丽萍, 桂云苗. 基于CNKI的安徽工程大学学术文献计量分析[J]. 安徽工程大学学报,2013,28(3):91-95.

[4] 杨聪, 孙宾宾. 基于CNKI的陕西工业职业技术学院科研论文统计分析[J].电子制作,2015(2):93-94.

[5] 容敏华. 广西高等医学院校发表教育教学论文的统计分析[J]. 卫生职业教育, 2014(23):104-105.

统计学的数据分析篇9

中图分类号:G646 文献标识码:A 文章编号:1672-0059(2012)02-0027-07

一、引言

我国新一轮高等教育大规模扩张以来,大学生就业难问题日益凸现。已有文献对我国大学生就业问题的研究是从三个视角来进行的:第一,有少数文献利用经典的供给―需求分析框架对大学生的整体就业状况进行了研究;第二,也有相当数量的文献从外部因素人手,讨论了劳动力市场的制度性分割、就业环境的变革对大学生就业产生的深远影响;第三,更多的文献从个体差异角度出发讨论决定大学生就业结果的因素,其中,人力资本和社会资本这两个变量都得到了重点关注。

按照“内因是根据、外因是条件”的规律,我们认为个体差异可能是造成大学毕业生之间就业差异的更为童要的因素。因此,本文也从个体差异角度来分析大学生就业问题。具体而言,本文将讨论人力资本和社会资本这两种因素对大学生就业产生了何种作用。另外,本文在分析方法上将只采用描述性统计方法,这与已有的实证文献有所不同。现有的实证文献在研究大学生就业问题时,多使用流行的计量分析方法来进行。虽然在实证分析中也有描述性统计,但是描述性统计通常都很简单,只具有过渡性价值,是为进一步的统计推断(因果判断)做铺垫。我们不倾向于在本文中采用计量分析方法,原因有二:其一,采用计量分析方法的研究都认为,文章通过统计推断得到了因果关系。但实际上,现实世界是十分复杂的,要想得到因果关系十分困难。就像陆铭所说,“这种因果关系在经济学里是非常难确定的。”其二,采用计量分析方法进行的研究受众面较窄,通常只适合于专业人士阅读;而采用描述性统计方法不仅便于发现问题、全面和详细地讨论问题,而且可以使数据显得直白、不僵硬,便于读者直观地了解,从而使文章易于被更多的读者所接受。

本文数据来源于北京师范大学“人力资本、社会资本与大学生就业”课题组的抽样调查。课题组于2009年6月对全国13个省、自治区、直辖市的42所高校的经济类、管理类专业2009届大学毕业生进行了问卷调查,共发放问卷3725份,回收有效问卷2981份,有效问卷回收率80%。调查采用定向抽样方式进行,均通过毕业班班主任的现场指导来实现问卷的发放和填写。表1列出了主要变量的统计信息,其中男生占46.60%,女生占53.40%,女生略多于男生,这与经济管理类专业的性别分布的实际情况相符;汉族和少数民族学生占比分别为81.78%和18.22%;研究生学历毕业生占11.10%,本科及以下学历毕业生占88.90%;从学校层次看,毕业于“985”高校的学生占17.38%,“211”高校的占24.60%,一般高校的占58.02%;家庭所在地为城镇地区的样本占55.85%,农村地区的占39.58%。从样本基本信息看,本次抽样调查数据具有较好的代表性。

二、大学毕业生的就业意向、就业结果和起薪分布

(一)就业意向

我们从地区、城乡、所有制类型等方面来对大学毕业生的就业意向进行分析(详见表2)。第一,在被问及“是否愿意去西部地区工作”时,有54%的大学毕业生回答“愿意”,46%回答“不愿意”,所以从对就业地区的选择来看,越来越多的人愿意在激烈的就业竞争中放宽选择的地域范围;第二,从对就业地域的城乡选择来看,愿意去农村就业的人数只占40.39%,有高达59.61%的毕业生不愿意去农村工作,显示了大学生的就业选择仍然表现出强烈的城市倾向,这一点与前些年的毕业生相比基本没有变化;第三,在回答“您最想去什么样的地区工作”这个问题时,有34.79%的人选择“家乡及附近地区”,27.64%的人选择“东部地区大城市”,21.44%的人选择“就学所在地”,而选择其他地区的人很少。由此可见,对就业地区的熟悉程度或者说适应程度是大学生择业时考虑的首要因素。一般来讲,大学生在家乡及附近地区和就学所在地生活时间长,而且有较多的社会联系,所以一方面他们可以更快地适应环境,另一方面也可以获得来自亲戚朋友的较多帮助,增强就业后生活的稳定性。但对于大学生来讲,在东部大城市就业依然是他们的重要选择。目前我国经济发展还很不平衡,地区之间在就业环境、工作条件、工资福利等方面还存在明显差异,尤其东部大城市的经济相对发达,有更加优越的就业环境,所以很多大学生在这些城市就业的意向十分强烈;第四,在就业单位的所有制类型方面,就业意向最高的是党政机关和国有大中型企业,分别占31.88%、28.85%,其次是外资企业、学校和科研机构,分别占9.83%、7.98%,可见绝大部分大学生倾向于在国有单位就业,以享有稳定的工作和更高的福利。

(二)就业结果

对大学毕业生就业结果的调查主要通过“是否找到工作”和“是否有可签约的单位”两个问题来考察。一方面,在对“您现在是否已找到工作”的回答结果中,有43.84%的毕业生回答“是”,有56.16%的毕业生回答“否”;另一方面,在回答“截至目前,明确表示可以与您签约的单位共有几家”时,有85.34%的毕业生回答“1个或1个以上”,只有14.66%的回答是“无”。由此我们可以判断,从有无就业机会来讲,占85.34%的毕业生拥有至少一个能够签约的单位,是可以就业的;但从是否愿意接受现有的就业机会角度讲,只有43.84%的毕业生愿意就业,并落实了工作单位。这说明,有很大一部分同学未落实工作单位,并非是因为没有就业机会,而是因为还没有找到满意的工作。因此,问卷调查表明,多数大学生在毕业前都拥有就业机会,是可以就业的,但最后是否愿意就业还有一个对工作选择的过程。也就是说,他们会不断寻找,直到搜寻到匹配工作才就业。如果没有满意的工作,宁愿选择自愿性失业行为。这一点,也与以往的研究结果一致。

(三)起薪(工资)水平

已落实工作单位的大学毕业生的起薪水平是反映其就业质量高低的一个重要指标。经初步分析,我们将起薪水平划分成四档:月工资为1000元及以下、1001至2000元、2001至3000元、3001元及以上。从

表2可以看出,绝大多数大学生(53.58%)的起薪水平在1001至2000元之间,而起薪低于1000元的占比很小,起薪水平的均值为2447.8元/月。那么,与大学毕业生的保留工资相比,起薪水平是高是低?数据显示,在“考虑您的个人情况和目前的就业形势,您可以接受的最低月工资是多少元”一题的答案分布中,保留工资值在1000元及以下的占15.62%,1001至2000元的占63.24%,2001至3000元的占14.88%,3001元及以上的占6.26%。将各档的起薪水平与之相比较,可以看出,已落实工作的大学毕业生的起薪水平要明显高于自己的保留工资水平。保留工资的均值为1912.9元,月,也远低于起薪水平的均值。这一方面反映出大学生的就业行为更趋理性,另一方面也说明大学生所落实的工作是符合甚至高于自己的心理预期的。

三、人力资本与大学生就业

按照人力资本的本义,我们选择了学历层次、学校类型、专业类型、学习成绩、奖学金、各种证书、党员、学生干部、兼职经历作为衡量人力资本变量的主要指标,来分析大学毕业生的人力资本状况对其就业的影响。

(一)人力资本状况与就业结果

表3的统计结果显示,在教育背景方面,从学历层次来看,与人们的预期一致,研究生学历落实工作单位的比例为65.86%,远高于本科及以下学历(占41.09%);从学校类型来看,呈现学校声誉越好、就业结果越理想的状况:“985”高校毕业生有60.42%落实了工作单位,“211”高校这一比例为50.07%,而一般高校仅为36.26%;从专业类型来看,就业状况最好的是信息管理专业,然后依次是人力资源管理、会计、经济、公共管理、国际贸易、工商管理、金融、市场营销。

就学习成绩与就业结果之间的关系而言,成绩很好的大学生中有41.04%落实了工作单位,另外58.96%未落实;而成绩一般的大学生中有44.26%落实了工作单位,另外55.74%未落实。比较来看,成绩越好的毕业生落实工作单位的比例却越低。我们认为,这一结果并非表明学习成绩好不利于大学生就业,而是学习成绩好的同学有着更高的就业期望,当无法获得匹配工作时,他们宁愿采取自愿性失业行为。这一点从保留工资指标也可以看出:学习成绩好的同学的平均保留工资为2174元,比学习成绩一般的同学的平均保留工资高299元。同时,获得过奖学金的毕业生中55.21%实现了就业,高于未获得过奖学金毕业生的就业比例(43.47%)。

另外,从所获得的各种证书与就业之间的关系来看,获得了专业四级及以上英语证书和大学英语六级证书的大学生能顺利实现就业的概率最高,表明此类证书对大学生获得工作机会具有积极作用。就政治面貌的作用来看,在政治面貌为中共党员的大学毕业生中,已落实工作单位的比例为53.31%,明显高于非党员(占36.53%)。同时,有学生干部和兼职经历的毕业生的就业情况也都明显好于那些没有相应经历的毕业生,表明这些人力资本因素也对大学生就业产生了积极影响。

(二)人力资本状况与起薪水平

为了进一步分析大学毕业生的人力资本状况之于起薪水平的影响,我们将起薪分为两档:3001元及以上为高工资,3000元及以下为低工资,据此将各人力资本因素与起薪水平之间的关系统计出来(见表3)。可以看出,研究生学历毕业生中拥有高工资的比例为48.23%,本科及以下学历毕业生中这一比例仅为7.16%,差距非常明显,表明学历对工资的影响作用很大;分学校类型看,“985”高校有更高比例的毕业生获得了高工资(占47.68%),而“211”高校和一般高校则仅有5.31%和4.23%;分专业类型来看,与其他专业相比,信息管理和金融专业的毕业生拥有高工资的比例最多,这与经验观察也是一致的。

从直接反映人力资本质量的学习成绩、奖学金等指标来看,成绩好的毕业生的高工资占比(16.85%)高于成绩一般的毕业生(12.95%),获得过奖学金的毕业生的高工资占比(33.33%)也高于未获过奖学金的毕业生(12.49%)。与其他证书相比,拥有托福等外语考试证书和大学英语六级证书的毕业生中,拥有高工资的比例更高一些(分别为27.59%和21.63%),表明这两类证书对工资决定有积极作用。同时,政治面貌为党员的大学生中拥有高工资的比例为17.90%,明显高于非党员(8.78%)。但是,有学生干部和兼职经历的毕业生中拥有高工资的比例并不明显好于那些没有相应经历的毕业生,说明这两个人力资本因素对工资并未产生显著影响。

四、社会资本与大学生就业

我们从社会资本的拥有状况和使用状况这两个角度考察社会资本因素对大学生就业的影响。

(一)社会资本拥有状况与大学生就业的关系

根据问卷中对“春节、古尔邦节等重要节日期间,与您以各种方式(包括打电话、发短信、写信、送贺卡和登门拜访等)互相拜年的亲戚、朋友和认识的人大概有多少人”这一问题的回答,我们将样本中大学毕业生的亲戚、朋友和认识的人加总,得出其所拥有的社会关系数量(见表4)。统计结果显示,65.28%的人拥有的社会关系数量在50个以内,23.21%的人拥有的社会关系数量在50至100个之间,只有少数人(占11.51%)所拥有的社会关系数量在100个以上。就社会资本的拥有状况与大学生就业结果的关系来看,二者呈正相关关系,即社会关系的数量越多越有助于大学毕业生顺利就业;就社会资本的拥有状况与大学生起薪水平的关系来看,社会关系数量越多的大学毕业生获得高工资的可能性也越大。

(二)社会资本利用状况与大学生就业的关系

我们认为,与考察社会资本的拥有状况相比,考察社会资本的利用状况对大学生就业的影响是更为重要的。这是因为,与人力资本和其所有者人身不可分离的特点不同,社会资本是大学生个人所拥有的社会关系网络,即便其拥有规模很大、质量很高的社会关系网络,如果在就业过程中不使用这些社会关系,那么也不会对大学生就业结果产生实际影响。在调查中,当被问及“您在找工作过程中动用过周围的关系吗”,有385人(占12.92%)表示动用过关系,并认为动用关系具有很关键的作用;有910人(占30.53%)表示动用过关系,而且认为有一些帮助;有316人(占10.60%)虽然也动用过关系,但认为没有帮助;有1263人(占42.37%)靠自己努力寻找工作,没有动用关系;另有3.58%的人没有回答这一问题。由此可见,有超过半数的人在找工作过程中动用了关系。下面我们分别考察社会资本利用状况对大学生就业结果和起薪水平的影响。

1、社会资本利用状况对大学生就业结果的影响

第一,从联系强度指标来看,大学生在就业过程中动用的社会关系,有83.78%属于自己经常联系的人,即联系强度大。通过强关系寻求就业帮助的样本

中,有46.03%实现了就业;而通过弱关系寻求就业帮助的样本中,只有35.22%实现了就业。这说明强关系对大学生就业更重要。

第二,我们用提供帮助者与被调查者是否存在亲戚关系来反映亲近程度指标,如果存在亲戚关系则认为亲近程度高。值得注意的是,动用亲近程度高的人找到工作的毕业生占比(42.02%)并不比那些利用亲近程度低的人找到工作的毕业生占比(45.25%)更高,相反还低了一些。这可能是因为亲戚关系在大学生整个社会关系网中只占少数,仅利用亲戚寻找并获取工作的机会远不如利用熟人、朋友更大。

第三,对职位高度方面的描述性统计发现,利用较高职位的社会关系找到工作的毕业生比例为46.51%,而利用职位较低的社会关系找到工作的毕业生比例为42.01%。这一差异显示了职位较高的社会关系对获取就业机会的积极作用。

第四,对帮助力度方面的描述性统计发现,在关系人所提供的帮助方式中,“提供就业信息”这种帮助方式的占比最高,为58.54%,“向有关方面打招呼”的比例为20.46%,“帮助解决找工作中的具体问题”的比例为16.50%,其余诸种帮助方式占比均较低。从上述帮助形式对获取就业机会的作用看,“直接决定录取”的效果最大,通过该方式帮助后实现就业的比例为52.87%,而其余各种方式帮助的效果没有显著的差别。

2、社会资本利用状况对大学生起薪水平的影响

第一,从联系强度与起薪水平的关系来看,通过强关系寻求就业帮助后获取高工资的样本比例为13.88%,而通过弱关系寻求就业帮助后获取高工资的样本比例为11.32%,二者差别不大,这说明强关系对毕业生获得高工资的帮助并不明显。

第二,从亲近程度与起薪水平的关系来看,动用“亲戚关系”获得高工资的毕业生占比(10.19%)并不比那些利用“非亲戚关系”获得高工资的毕业生占比(15.72%)更高。这可能是因为仅利用数量较少的亲戚寻找工作,获得的就业机会本来就较少,在此情境下获得高工资的就业机会则会更少。

第三,对职位高度的描述性统计发现,利用较高职位的社会关系获得高工资的毕业生比例为12.48%,而利用职位较低的社会关系获得高工资的毕业生比例为14.10%,表明职位较高的社会关系对获取高工资的作用并不明显,这与职位高低对就业机会的影响有较大差异。这一结果可能反映出,随着我国劳动力市场化程度的不断提高,市场机制在决定工资水平方面的作用逐步凸显,因而大学毕业生的工资决定也主要通过市场机制完成。在这种环境中,社会关系有可能会通过某种作用机制来影响就业机会的获得,并不能真正影响工资水平。在具体的帮助方面,通过“帮助报名、递交申请”、“帮助解决找工作中的具体问题”、“帮助整理申请材料”这三种方式获得高工资的比例较高(分别为14.83%、14.17%、14.00%),但与其他方式相比,也没有显著差别。总之,可以推断,社会资本的利用状况对于大学生获取高工资应当没有明显的作用。

五、结论与讨论

统计学的数据分析篇10

中图分类号:G642 文献标志码:A 文章编号:1002-2589(2012)33-0198-03

一、大学生党员素质模型研究的背景

随着“90后”一代步入大学殿堂,青年大学生追求个性和自我的特点越来越显著,大学生党员发展和培养工作遇到了新的挑战,如何结合当代青年大学生党员特点开展党建教育工作、如何发挥学生党员的积极带动作用以及如何衡量党员素质等问题越来越多地引起高校思政教育工作者的关注。

一直以来,高校发展学生党员都严格遵守“优中选优”的要求,大学生党员不仅在专业科研方面有突出的成绩,在学生工作等方面也是骨干,他们应该是优秀大学生的代表,但我们会发现,大学生党员在学生群体中的带动作用一直不够明显,党员个体的优秀成绩在带动普通同学方面并不能起到积极的作用。究其原因,认为是学生对学生党员个体没有完全的认同,党员的表现与普通同学对他的期望之间存在的差距过大,以至于党员没有成为同学学生学习的榜样,导致带动作用明显减弱。这就意味着思政教育者在发展和培养学生党员时不仅要关注发展对象个人的情况,更需要了解当代学生群体对大学生党员有怎样的期望,只有培养和选拔符合党员基本要求同时又迎合当代青年期望的学生党员才能真正体现当代大学生的积极风貌,受到学生群体的认同。

需要从学生的角度开展大学生党员素质模型的研究,通过了解学生对大学生党员的期望,建立当代大学生的素质评价模型,用于培养和发展当代大学生党员的工作实践。

二、基于spss统计数据分析的大学生素质模型构建

(一)构建模型的数据收集及信度验证

根据研究的要求,首先开展访谈工作,访谈分两次进行,第一次抽取了文科、理科、工科和艺术类学生党员20人。第二次从四种学科类型专业中各个年级随机抽选一名男生和一名女生同学,共32人开展访谈。访谈的内容围绕“我心目中的学生党员”展开。由学生提出党员应该具备的具体素质。通过访谈笔者总结出38条内容,分为“道德品行”、“政治素养”、“学习能力”、“工作能力”、“心理素养”几方面的内容,并以此作为模型建立的核心调查内容。

调查的问卷采用“李克特”五点量表,对访谈生成的38条建议进行评价,要求被调查者根据自己对学生党员的期望来判断学生党员是否必须做到这一点要求,其中1表示“非常不同意”、2表示“不同意”、3表示“不能确定”、4表示“同意”、5表示“非常同意”。每个问题采用随机排序的方式组成问卷主体。

为了使设计出的问卷更加科学和合理,能够为绝大多数被调查者所理解和接受,在正式大规模发放问卷之前又进行了小范围的预调研,调研的重点在于验证问卷中各问题的提法是否科学,是否存在理解上的歧义和含义上的遗漏,是否便于被调查者理解。

在正式的调查中采取随机抽样的方式对东华大学及少数上海市其他高校校内在校生开展调查,通过在“学生街”现场发放和回收以及发放电子邮件的形式,共发放问卷300份,回收294份,通过有效性筛选的问卷为188份。

在获得有效数据后,通过Spss软件对问卷信度用克隆巴赫(Cranach’s α)系数测量,该系数表示问卷调查结果总变异中由不同被调查者导致的比例占多少。整个问卷和各个子问卷的克隆巴赫系数如表所示:

Cronbach's α系数值介于0与1之间,α值越大表示问卷题目间相关性越好,内部一致性可信度越高。本问卷在各个问卷因素间的值均达到了0.7左右,且总问卷值为0.788,问卷的稳定性和一致性是有一定保障的。

(二)通过因子分析的方法构建模型

在保证了调查研究有效性的前提下,通过spss数据分析中因子分析的方法,进一步确立学生心中的党员素质模型,进行因子分析时,原则上应该将所有变量的测量一并纳入因子分析中;但是,当变量的个数太多时,采取这种做法不太适合。因此,本研究将所有变量分为五大类分别进行因子分析,即道德品行、政治素养、学习能力、工作能力和心理状态几个分类。

为了验证获得的数据的有效性,进行了Bartlett's Test和KMO指标检验。Bartlett's Test 检验的sig为0.000显著,说明参与分析的数据来自正态分布的整总体,即数据相关数阵不是单位矩阵,KMO测度的目的是检验采样的充分性如何。KMO的取值在0~1之间,其值愈逼近1,表明对这些变量进行因子分析的效果愈好。研究分析的结果显示KMO在0.7~0.8之间,表明适合作因子分析。检验具体结果如下表所示:

在因子分析过程中,本研究采用主成分分析法、旋转变换法。在分析过程中,按照剔除无法解释指标和载荷值在0.5以下的指标来筛选指标。

首先我们对道德品行分类进行因子分析,结果如下表所示,从表3中可以看出,该类别由3个因子组成,结合载荷值和指标的内容,将因子分别定义为继承传统美德、遵守社会公德和无私奉献精神三个方面的指标。详细的内容如表4所示。

因子分析的结果表明,当代大学生对大学生党员的道德品行要求是比较全面的,不仅包含了我们以往评价党员的奉献精神,还包含了对传统美德的继承和公民素质的要求,这要求学生党员不仅在大的利益面前要懂得取舍,还要在生活细节方面有较强的奉献意识。遵守《公民道德规范》,在成为模范公民的同时,从事社会活动要具备较强的道德判断能力,主动帮助弱势群体,在构建和谐社会过程中发挥作用。在学校生活中,学生党员不能居功自傲,积极分子更不能凭借为集体作出贡献就认为理所应当成为党员,个人道德品行是在平时的一举一动中表现出来,教师在培养和发展党员过程中不能以点概面。

使用同样的因子分析方法,我们对其他几类要素进行分析。

在政治素养方面,因子分析的结果表明有两方面的具体指标,分别为“鲜明的政治立场”和“社会正义感”。其中“鲜明的政治立场”指标要求学生党员要熟练掌握马克思主义理论等党的基本理论知识,对入党有正确的认识并能维护党的利益,有鲜明的政治观点、政治鉴别力和思想觉悟,具有坚定的社会主义理想信念。有些学生党员没有热情学习党的基本理论知识,在同学中有时以传播负面新闻赚取同学们的关注,在同学对党有误解时不能挺身出来解释,不能表明自己的政治立场,存在以上问题的学生党员将会大大减少普通同学对党员群体的认可度,减低学生党员在群众中的影响力。社会正义感的评价指标要求学生党员要处处明确自己作为学生党员的责任,要主动关心和了解社会现状和发展前景,忠于国家和人民,具备分析社会热点问题和分辨是非的能力,有端正的人生观和价值观,同时能积极引领校园文化,成为构建和谐文化的主力。只有具备社会正义感的学生党员才能赢得学生的信任,才能在学生中起到真正的带头作用。

一个人的心理素质是保证个体全面发展的基础条件,因此大学生党员必须具备健康的心理素质,具备积极适应社会、调节自我的心理状态,通过因子分析的方法得出“自我管理能力”、“沟通能力”和“荣誉感”几方面的指标在大学生党员评价中比较重要。自我管理能力是指学生党员需要具备较强的生活自理能力和规划能力,能很快适应大学生活同时积极为今后的发展做好准备,这要求大学生党员要具备一定的适应能力、抗挫能力、自制能力和情绪调节能力。随着新一代青年走进大学校园,大学适应和生涯规划的概念逐渐引入大学新生教育工作,学生的自我管理能力一定程度上决定了在大学期间他取得的成绩,具备良好的自我管理能力,是成为学生党员的必修课,只有把自己的事情管理规划得好,才能更好地为他人服务。沟通能力指标要求学生党员要有较好的人际协调能力,能妥善处理人际关系,这也是大学生能积极适应社会、融入社会、服务社会的必然要求。大学生党员在追求个性的同时,要学会与周围同学沟通,才能在同学中起到积极的带动作用,党员的先进性才能辐射到学校生活的各个方面。荣誉感指标要求学生党员要有较强的荣辱观念,热爱自己的祖国,有集体责任感。学生党员作为全党未来发展的生力军,也是我国社会未来的接班人,他们中的一些人将会肩负起国家发展的重任,也将成为各个行业的领军人才,热爱自己的祖国,对集体负责是个人发展的动力,学生党员只有具备集体荣誉感和爱国热情才能不断地激发自己的才智,为社会发展作出贡献。

对学习能力和工作能力两方面进行因子分析,均为一个主要因子。所以将学习能力和工作能力作为具体的指标进行解释。学习能力要求学生党员要具备端正的学习态度,掌握学习方法,同时要有优秀的学习成绩,能够做到把理论学习与实际需求联系到一起,做到学以致用,有创新精神,不是“死读书、读死书”,这是大学生党员今后能担任起社会发展重任的基本要求,只有掌握了丰富的科学文化知识,学会学习,才能正确处理好各种社会问题和把握自己的未来。工作能力指标要求学生党员具备一定的担当学生干部的能力,具有一定的组织和策划、领导能力,有一定的号召能力,在从事学校社会工作的同时积极锻炼自己的创新能力和创造能力,敢于尝试和提出新的想法,学会实事求是地分析和处理问题,保持思想与社会发展的一致性,以便大学毕业后能更好地融入社会。这两项指标在高校平时培养和发展学生党员时最容易衡量优略,因此也最为常用。但往往成为衡量学生党员的全部标准,使得学生党员的影响能力大大降低,学生党员绝不是“学习好+工作好”的代名词,学习好和工作好要成为学生党员普遍具备的素质,但更重要的是要有坚定的政治素养和优秀的个人品质。

三、大学生党员素质模型的现实指导结论

以上的分析是在对在校大学生调查的基础上展开的,突出了在校大学生对大学生党员的具体要求和期望,从分析的结论中我们可以看出,在校大学生对党员的看法和认识还是比较全面的,涵盖了学习、工作、生活和思想四大方面,立足于大学生具体的生活,以校园为核心考查领域并逐步扩展到社会范围,具有很强的现实指导意义。纵观以上分析结果,我们可以的出以下结论:

首先,评价标准要求的针对性强,突出了大学生的特色。以往有较多的党员评价标准,也强调了党员的党性、先进性、奉献精神等各个方面,但都过于普遍,适用于各个行业的党员干部,这是由于这些标准是以学生党员进入社会的要求为基本展开的,和校园生活结合不紧密,并不能体现学生党员在学校培养过程中的特点,忽略了学校培养教育的关键点。比如在个人品质要求方面,以往的标准在对学生党员奉献意识强调的同时往往忽视作为公民个人的基本要求,这就会将学生党员教育变成空中楼阁,可望却不可及。而从全体学生的角度开展的学生党员期望调查中就能很好地结合大学生党员自我发展和认知过程中的每个细节,符合青年学生的心理和思想状态,能更好地涵盖大学生党员教育培养过程中的各个环节,更能被青年学生接受。

其次,评价标准要求的涉及范围广,合格公民的标准是底线。通过分析,可以看出,当代青年大学生对党员的素质要求内容范围较广,不仅在学校生活各个方面提出了具体的要求,对其社会层面的活动也有积极的期望,希望大学生党员能作为社会一份子,能继承和发扬传统的美德,对构建和谐友爱的社会风气起到积极的作用。不仅要求在学校做“优秀学生”,在社会活动中更要做“好公民”,遵守社会公德和法律,积极引领有秩序的社会生活,大学生党员的素质模型基础是在合格公民的要求上有进一步的提升,强调了大学生作为社会人方面的要求,这与以往对学生党员的要求是不同的,有一定的拓展。

再次,评价标准要求的思想深度深,强调具备过硬政治素养。在以上的党员素质模型要求中,可以看出,青年大学生对党员同学的思想要求深度高,要求学生党员不仅要了解党内的政策、理论,还要在行动中表现出作为共产党员的政治分析能力,有过硬的分辨是非能力,这是全党加强执政能力建设所带来的积极效应,作为学生党员受到普通同学的信任和支持,在政治素养方面应该起到积极的引导作用,这一点说明青年大学生对于党员的认识更加深入,对于党员同学具备的政治素养有较高的期望,这相对以往大部分学生认为大学生党员就是品学兼优的“好学生”的看法来说是一个巨大的进步。

最后,评价标准要求的内外统一性高,党员素质要求重实效。不仅要求学生党员要具备某项优秀的素质,还要时刻发挥出积极的引导作用。在以上的分析中,可以发现,新时期大学生对于学生党员的素质要求在思想要求和行动要求方面内外统一性高,要求学生党员不仅要在学习和工作中能做到优秀,在思想、品德及心理素质方面也要有一定的高度,同时要将自己的先进性不断地辐射到周围的环境中,起到带动作用,要求在衡量和评价学生党员时要看实效,看各个方面的具体表现,对于细节的关注更多。

通过调查和分析大学生对学生党员的期望,可以更全面地了解目前高校学生中需要的什么样的学生党员作为榜样,党建教育者应该在培养好学生、好公民的基础上重点培养学生党员对党员责任的认识,提高政治素养,这与青年学生对党员的认知是一致的,好学生不等于好的学生党员,只有培养和发展具备较高政治素养的合格公民,才能成为符合学生期望的学生党员,才能成为积极引领校园文化的优秀分子,才能担负起发展社会的重担,成为未来社会的合格建设者。

参考文献:

[1]章文波,陈红艳.实用数据统计分析及spss12.0应用[M].北京:人民邮电出版社,2006.

统计学的数据分析篇11

【基金项目】贵州省科技厅、贵州民族大学联合基金(黔科合J字LKM[2011]09号)

【中图分类号】G642 【文献标识码】A 【文章编号】2095-3089(2014)08-0235-01

1.引言

“大数据”时代的来临和“大数据”处理技术的发展深深的影响着统计学的发展。能否利用传统的统计理论和统计方法对海量的数据做出快速、准确的处理并获取相关信息?如何对传统的统计理论与方法进行改进或探索新的统计理论和方法来对大数据进行挖掘与处理以获取信息?如何在“大数据”时代背景下培养符合市场需求的统计分析师或数据分析师?如何将“大数据”处理技术融入相关统计学课程教学以促进数据处理与分析技术的发展?这些都是我们在统计学相关课程教学过程中必须思考的一个问题。

2.大数据与统计学

“大数据”随着社交网络、物联网、云计算等的兴起而产生。一般认为大数据具有规模性、多样性、实时性及价值性四个基本特征,包含分析、带宽和内容三个要素。“大数据”在数据来源、数据结构和处理方法方面对传统的统计分析方法产生了冲击。第一,在大数据背景下,数据来源不再是原来的简单抽样,而是“样本即总体”,直接将总体作为研究对象。第二,在大数据时代,研究对象也不是原来单一的结构化数据,由于数据的多样化与规模化,我们更多的是研究非结构数据,采用人工智能来进行数据挖掘和信息获取。第三,数据处理方法也不是简单的采用传统的假设检验方法进行研究,特别是对于统计学中的异常点,不再采取以往的丢弃或者平滑处理方式。

“大数据”处理技术对统计学的发展提出了巨大挑战,但我们必须认识到学科之间的发展是相互交融的,“大数据处理技术”其本质上是数据处理与分析技术,其发展对统计学学科的发展也有积极的一面,同时统计学作为一门独立的学科,有其自身独特的学科优势。首先,海量的数据有利于提高各类统计分析的精度,如减小抽样误差等。其次,较之于传统的统计学方法,现有的“大数据”分析方法难度较大、成本较高、耗时较长。而在实际的应用中,我们关心的不是数据量的多少,而是数据量所蕴含的信息。传统的统计学分析方法是以较少的数据进行精确度相对较高的统计分析,这是“大数据”分析所无法替代的。另一方面,统计学在数据收集方法、模型选择、模型假设以及模型诊断方面有很大优势。而且并不是所有的问题都具有海量的数据,并不是每一个“大数据”问题都适合用现有的“大数据处理技术”来处理。

3.对策与建议

3.1 夯实基础教学

针对以上的分析我们可以看出,大数据对统计学的发展既是机遇,又是挑战。因此我们在教学过程中要夯实统计学基础知识的教学,讲清楚统计学的基本原理与基本方法,特别是数据分析与数据处理的基本原理与方法。对于许多传统领域,如生物、医药以及质量与可靠性工程等,我们面对的多是“小数据”而不是大数据,因此基于样本的统计分析方法仍然是进行此类问题研究的最有效的科学手段。

另一方面,我们要结合大数据技术的特点,对统计学的基本知识进行拓展教育,引导学生思考怎样将已有的统计学基本原理与方法运用到大数据处理的技术研究中。如在大数据环境下怎样进行数据的收集、筛选与甄别、存储与分析等,如何分析并厘清可能的数据来源与范围,如何建立相关指标体系并对数据进行分类,如何制定或调整相应的统计参考标准,以及如何对依靠非传统数据源加工生产的统计数据进行规范的统计推断等。

随着大数据时代的来临,各行各业对具有统计背景知识人才的需求必定越来越多。因此,在统计学教学过程中,一定要结合各专业的特点,特别是“大数据”的特点,切实加强统计学的基础知识教学与拓展教学。

3.2 加强统计学专业软件教学

“大数据”环境下,对统计人才需求也发生了变化。面对海量的数据与多样化的数据,一名合格的统计人才或数据分析人才不单需要良好的统计素养与扎实的统计基础知识,更需要具有数据的存储与整理能力、计算能力以及数据分析与处理能力等。这就要求在教学过程中,加强统计软件或数学软件的教学。

针对传统的“数学证明+手工计算”或“重理论轻专业统计软件”的统计学课程教学模式,可将统计软件或数学软件融入课堂教学并安排一定的课时上机学习统计软件,以此提高学生数据处理能力,加深对统计学基本原理的理解与掌握。

在加强统计软件或数学软件,如SPSS、R、SAS以及Matlab的教学过程中,要摈弃“会软件的操作即会统计技术”的思维,要让学生真正掌握相关操作与相关算法,深入思考算法的实现与相关理论的应用。同时引导学生思考对“大数据处理”的技术要求,包括数据搜集、发掘、存储以及计算分析过程中的算法与设备要求等,引导学生针对大数据进行软件升级与开发。

3.3 突出案例教学与实践教学

大数据的产生和发展源于规模经济问题或超规模经济问题的研究。每一个大数据问题的研究都是与实际经济或社会问题紧密相联的,因此,在实际教学过程中,要突出案例教学与实践教学,由易到难,通过案例教学逐步引入大数据的概念以及大数据处理的基本技术,提高学生的分析全局观以及进行实际数据分析与处理的能力。

教学改革的目的是培养在“大数据”时代背景下,符合市场需求的专业统计人才,而合格的专业统计人才必须具备良好的统计实践能力。案例教学与统计实践活动是培养学生统计实践能力的有效途径。因此,在教学过程中,一方面,教师可融合各种与实际问题相关的案例进行分析和讲解,加深学生对相关统计理论知识的理解,激发学生的学习兴趣,培养学生解决实际问题的能力。另一方面,教师可以组织多种形式的课堂或课堂外的统计实践活动以培养学生统计实践。如,指导学生针对他们感兴趣的与经济、社会发展相关的统计实际问题展开统计研究,设计调查问卷,收集数据、整理和分析数据,撰写研究报告,实现对实际问题的分析和解决等。

4.结束语

总之,在“大数据”环境下我们既要积极面对挑战,又要紧紧抓住机遇,切实结合“大数据”的特点和“大数据处理技术”发展的需求,既加强对传统的统计学方法、统计理论的教学,又积极开展 “大数据“环境下的拓展教学,推动统计学的发展,在数据收集、数据分析以及统计制度等方面进行改革和创新。

参考文献:

[1]李国杰. 大数据研究的科学价值[J]. 中国计算机学会通讯,2012,8(9) .

[2]姜奇平. 2013 全球大数据-大数据的时代变革力量[J]. 互联网周刊,2013,1.

统计学的数据分析篇12

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2015)04-0110-02

一、大数据时代统计学专业发展的新特点

(一)数据化的信息收集

传统的统计研究主要是对已收集的数据进行各种技术分析,包括描述性分析、推断性分析、截面分析、时间序列分析等,侧重点在于技术分析手段的使用上。然而大数据时代,关注的是信息本身。现代信息系统的使用使大数据成为可能,文字、地理方位、沟通等,任何事物都可以量化,一切现象都可以用数据或表格来诠释。因此,大数据背景下世界是由各种信息和数据所构成的。

(二)全数据模式的研究对象

在信息处理能力受限制的过去,人们缺少用来分析所收集数据的工具,因此产生了随机抽样。随机抽样法的目的是用最少的数据获得最多的关于总体的信息,从而使用样本对总体进行推断。然而,在大数据时代,数据处理的方式和技术发生了巨大的改变,人们可以通过互联网、数据库以及各种通讯工具获得海量数据,这时随机抽样就失去了它原来的意义。简单廉价的数据收集方法,足够的数据处理和存储能力,使得全数据模式成为可能。因此,大数据背景下样本即为总体。放弃随机抽样分析的捷径,采用所有数据的方法,可以发现一些隐藏在海量数据下的细节。

(三)混杂性的数据处理思维

传统的统计学处理数据的步骤是首先对数据进行整理和清洗,剔除不完整的或者异常值,然后再利用样本信息,在允许的误差范围内对总体进行推断和分析,即通过调整精确度的大小来对总体进行研究和分析。然而,在大数据背景下,来自各个时间和空间的数据来源纷杂,格式广泛,在萃取或处理数据的时候,很难做到把所有的数据都进行仔细地清洗。这种情况下,必须接受数据的混乱和不确定性,因为数据多比少好,因此更多的数据信息比更加智能、更加精确的算法系统还重要。当拥有大量数据的时候,可以忽略一部分精确性,但并不是说不需要精确性,而是数据规模不断扩大时,确切的数量已经不再那么重要了,可以通过大规模的数据来发现事物背后的规律。

(四)相关关系的基础分析方法

传统的统计中,大部分相关关系分析仅限于寻求线性关系,或是在建立假设的基础上揭示数据相互之间的因果关系,例如Granger检验就是依据时间序列数据对变量之间的因果关系进行的判断,但往往会产生一些虚假的因果关系。这是因为统计关系并没有蕴含多少真实的因果关系。在大数据背景下,数据点以数量级方式增长,用数据驱动的相关关系分析不再需要建立在假设的基础上,所以相关关系分析不容易受偏见的影响而发生错误。大数据时代相关关系通过回答“是什么”的问题,为人们认识世界提供了一种新的视角。因此,相关关系统计分析是大数据预测的基础。

二、统计学专业教学体系中存在的问题

大数据背景下传统的统计学专业教学体系存在的问题凸显,具体体现在以下几个方面。

(一)培养目标无法适应大数据时代的社会需求

传统的统计学专业教学体系的培养目标是通过统计专业核心课程内容的介绍,锻炼学生收集、整理和分析数据的能力,培养“应用型”统计专业人才。然而,大数据的出现,使得通过数据分析获得知识、商机和社会服务的能力,从以往局限于少数的学术精英圈子扩大到了普通的社会机构、企业和政府部门,各行各业对统计数据、统计分析的需要使得统计学专业受到了前所未有的关注。大数据背景下,要求统计学作为一种分析工具,能够与其他专业相互衔接,相互服务,培养“复合型”专业人才。因此,传统的统计学专业教学体系培养目标存在两个方面的挑战:第一,如何协调统计与其他专业之间的关系;第二,如何从“应用型”向“复合型”人才进行转变。

(二)忽视数据的收集和创新

传统的统计学专业教学体系重视数据的分析技术,更多的课程设置是围绕着数据分析方法和技术展开的,例如多元统计分析、时间序列分析、统计预测与决策分析等。基础的数据收集部分只在统计学原理中有一章的内容介绍,而且是作为非重点一带而过的。大数据以海量的数据为分析研究的对象,将一切社会经济现象进行量化,重视的是信息的收集和数据的创新,包括数据的再利用,数据的重组,数据的扩展,数据的折旧以及数据的开放等各个方面。这些内容在原有的教学体系中是没有体现的。

(三)与大数据时代脱节的教学内容

传统的统计学专业教学体系仍然固守着原有的教学内容,在近二十年内变化不大。专业的主干课程有统计学原理、国民经济核算、计量经济学、抽样技术与方法等。而在大数据背景下,教学内容以全数据模式为研究对象,强调对所有的数据进行分析,而不是开展随机抽样;允许不精确的存在,而不是在给定的精确程度下对总体进行推断和分析;关注海量数据之间的相关关系,而不是强调数据之间的因果联系。这些内容都无法在现有的教学体系中体现,因此,传统的专业教学体系与大数据时代是脱节的。

(四)实践教学环节薄弱

随着“应用型”统计专业人才培养目标的提出,学校对实践教学的重视增强,与过去相比,现有的专业教学体系中已经增加了实践教学环节。但是,在大数据背景下,实践教学仍然是统计学专业教学体系中的薄弱环节。主要表现在两个方面:(1)以模型驱动为主的实践教学模式已不适应大数据时代的要求。现有的实践教学内容并不是从数据出发,而是通过寻求一些适合模型的数据来“证明”这个模型的确有意义。这种思维方式与大数据时代的要求是不适应的,因为创造模型的目的是适应现实数据,而不是由模型驱动。(2)以SPSS、Eviews为主的软件教学已无法处理大数据。现有的实践教学中,主要讲授的是传统的统计分析软件SPSS和Eviews,因为这两种软件发展成熟,操作简单,可以处理一般的计量模型和时间序列。但是,大数据时代数据是海量的、复杂的,用简单的软件已无法处理和实施。

三、统计学专业教学体系改革的方向

根据以上分析,时代的发展对统计学专业提出了更高的要求,现有的教学体系中存在的各种问题即为统计学专业教学体系改革的方向。

(一)准确定位统计学专业的人才培养目标,重新设计主干课程的教学内容

大数据时代要求培养“复合型”统计专业人才,因此教学体系的培养目标要从简单的“应用型”向“复合型”转变。“复合型”统计专业人才要求学生除了具备数据收集、处理和分析的能力外,还要对统计学应用领域的背景知识有一定的了解。因此,按这个培养目标,需要对现有教学体系中的主干课程重新进行调整和设计。专业主干课程分为方法和应用两个方面。方法类的课程除了原有的计量经济学、时间序列分析、多元统计分析等外,又增加了机器学习、模拟算法、数据挖掘、R软件分析(或SAS软件分析)等处理复杂大数据的方法的课程。应用类课程在保留原有的国民经济核算,金融统计,证券投资,会计学基础外,增加一些统计学应用领域的基础知识课程,例如商业统计、生物统计、保险与精算统计等。此外,适当调整各专业主干课程的课时,一些课程可以增加课时,如软件分析、数据挖掘等,一些课程可以缩减课时,仅作一些简单的介绍,如抽样技术等。

(二)转变固有的思维方式,在大数据背景下积极推进教学改革

大数据时代,数据更多、更杂,传统统计学思维方式受到了极大的挑战。因此,以大数据为背景,转变固有的思维方式,从以统计技术方法为中心转换到以信息数据为中心,推进统计学专业教学改革十分重要。具体来说,可以弱化传统的推理论证的教学模式,强化数据收集、数据处理和数据分析的能力培养;强调数据本身的价值,让数据说话,用简单的方法了解数据背后所隐藏的信息和规律;使用项目式训练,让学生从项目中真正体验数据化处理的整个过程,达到理论和方法的结合;加强课堂教学与实验教学的统一和贯通,如在传统的教学过程中,将统计学原理、多元统计分析结合SPSS软件介绍,而时间序列分析又采用Eviews进行介绍,造成学生疲于学习各种软件,实际上SAS、R等统计软件可以实现所有的功能,用一种软件与课堂教学融合贯通能帮助学生更好更深地掌握软件的使用。

(三)创新实践教学模式,加强实践教学的开展

从以模型驱动的实践教学模式转变为以数据驱动的教学模式,构造课堂案例教学、实验教学、课后项目式训练、校外实习基地锻炼四位一体的创新型实践教学模式。计算机快速发展的今天使得大数据成为现实,在处理数据的时候,根据数据的特征创造出新的计算方法来满足实际需要,这就是数据驱动模式。在实践教学的过程中,要强调统计数据、计算机编程以及统计分析软件的结合。目前,R软件和SAS软件显示出了强大的数据处理和数据分析功能,实践教学环节中可以把这两种中的一种融入到专业课程中去,将计算机软件与课堂教学结合起来。此外,课后的项目式训练和校外实习可以带动学生了解和掌握整个数据分析实践的流程,激发学生学习的兴趣,在实践教学的过程中要多鼓励、多开展。

参考文献:

[1]曾五一,等.经济管理类统计学专业教学体系的改革与创新[J].统计研究,2010,(2).

友情链接