excel数据分析合集12篇

时间:2022-12-05 23:03:55

excel数据分析

excel数据分析篇1

用友、金蝶等财务软件以及企事业其他信息系统的应用和普及,大大提高了中小企事业单位会计信息化程度,减轻了会计人员的负担,节约了财务成本。但实务工作者也发现,财务软件更偏重于会计账务的处理及标准财务报表的提供,而分析功能不足,未提供良好的分析工具,分析方法也不够灵活,其他信息系统更偏重于业务处理。这时就需要借助excel等外部工具进行个性化的财务分析。

一、财务分析数据库的构建

用EXCEL建立财务分析数据库时,可以充分发挥其灵活性,从各个维度、各个层次对企事业单位数据进行分析。尽管EXCEL2007已经解除了以前版本只能处理65 536行数据的限制,但是也要考虑到数据库如果过于庞大,运行速度会降低。因此,建立数据库时如果数据库偏大,可以将数据库拆分成几个小的数据库。

明确了数据库的构建目标后,就可以从不同地方收集财务分析数据。这些数据既可以从用友、金蝶等财务软件获取,也可以从企事业单位的其他信息系统导入,如医院的HIS系统、药品管理系统、材料进销存系统等等。导入的数据既可以是用友等财务软件整个科目数据,也可以是固定资产数据等等。

财务软件和其他信息系统一般都有导出成EXCEL电子表格的功能,如果这些信息系统软件可以导出成分隔符区分的文本文件,也可以通过EXCEL中的分栏工具进行拆分。

(一)基础数据字段整理

在进行基础数据整理时,经常会用到这些函数:

1.时期处理函数。如根据日期提取年、月、周的数据:YEAR(),MONTH(),WEEK()。

2.字符处理函数。如提取字符串中的某一内容:LEFT(),MID(),RIGHT()。字符串联结:CONCATENATE()。

3.数据格式转换函数。如将数字强制转换成文本:TEXT()。

4.逻辑判断函数。如条件判断:IF()。信息提取:ISNA(),ISTEXT()。

(二)数据的归类

财务分析时经常会对数据进行分类,这时可以借助函数VLOOKUP()来实现。如对食品进行分类时,可以首先建立一张字典表,如表1。

然后在数据库里面在目标单元格输入函数vlookup()并设置函数参数,再对整个字段进行填充,就可以根据字段食品名称获取其对应分类了。

(三)数据库的定义

数据收集整理完后,可以在EXCEL里形成一张表单(sheet),可将有数据的区域定义为一张表,并为之命名。本文以医院收入分析数据库为例,基础数据通过医院用友、HIS系统收集整理后,存放在一张名为“医疗收入”的表单内。这时先选择所有数据区域,点击右键,选择“命名单元格区域”,命名为如“数据表”。

定义数据区域可以更方便地对数据库进行维护。建立的数据库如图1。

二、财务数据的分析

数据库建立好之后,就可以充分利用EXCEL的数据分析挖掘工具,灵活方便地对数据进行分析。下面介绍几种常用的分析方法。

(一)对比分析

建立的数据库如果包含了一段时期的数据并进行归类后,可方便地实现对比分析。这里面需要用到EXCEL的数据透视表工具,首先将光标定位到“数据表”,单击“插入数据透视表”,并根据需要选择报表筛选字段、行标签、列标签字段以及值字段。在作对比分析时,应该在列标签选择时间字段,并选择需要进行对比的时间段。

透视表建立后,可以通过报表等字段筛选数据的范围,例如既可以看全院收入,也可关注某一个或几个科室的收入分析。同时,在邻近单元格建立公式对数据进行比较分析。建立的数据对比分析如图2。

(二)趋势分析

趋势分析也是财务分析中的一个常用方法,分析人员可以从数据变化趋势看出数据的长期变化趋势及季节趋势等。

用EXCEL建立趋势分析时,也要建立数据透视表并选择要分析的字段。作趋势分析时,可以辅以图片更能直观地进行分析。将光标定位在数据透视表内,单击“插入折线图”或其他图形模板,并调整图形格式就可以制作出专业的图表。如图3。

(三)结构分析

结构分析可以看出数据之间的构成分析。在EXCEL里面作数据的结构分析时也可以通过建立数据透视表,选择要分析的数据字段进行分析。同时,还可以制作数据饼图等进行直观的观察分析。数据的结构分析如图4。

三、财务分析数据库的维护与更新

财务分析数据库建立完成后,可以根据个性需求灵活地对数据进行抽取和分析。同时,这个数据库也是可以动态更新的。更新数据库时,只需在数据表末端追加数据记录,数据库就会智能地将数据加入。当然,这个数据库也支持对以前数据记录进行修改,批量修改数据时可以使用EXCEL的批量替换功能;具备支持增加和删减字段的功能。

修改数据库后,应确保增加的记录在数据表内可以通过扩大数据表区域来实现。同步更新数据透视表和数据图时,只需要在任意表内,单击“更新数据源”,则所有基于数据库的透视表和数据图都可以同步进行更新,操作非常方便。

从上述研究可以看出,EXCEL具备灵活、简便而功能强大的数据分析和挖掘功能,而基于EXCEL数据库的维护和更新也非常简单,财务人员通过简单的操作,就可以从各个维度、范围对财务数据进行深入的分析。当然,EXCEL还具备更多的数据分析潜能,需要财务人员在工作中发挥主动性和创造力,从而提高财务分析的效率和作用。

excel数据分析篇2

中图分类号:TP391 文章编号:1009-2374(2017)07-0056-02 DOI:10.13535/ki.11-4406/n.2017.07.027

1 概述

在水电站的维护管理中,对水库大坝的监测是极其重要的一项内容,保障了水库大坝日常的运行安全。通过监测技术得到了许多大坝的数据信息,我们对这些数据信息进行系统的分析,可以及时地获取大坝工作运行的实际状态,为水电站的调度与日常维护提供可靠的数据信息。但是在实际的安全检测工作中,监测点是非常多的,每个监测点的数据信息非常多,在许多时候我们需要得到某个事件说明的时候,就需要在这些数据信息中寻找想要的信息,一般需要人工来进行,其效率就会非常慢,并且使用人工就非常容易出错,其结果也会出错。然而Excel有着数据信息统计的能力,只需要使用一些常用的函倒δ埽就能够很容易处理需要检测的数据信息,进而提高数据信息的分析能力。

2 函数工具

在Excel软件里面函数工具极其多,在大坝监测工作中所用到的函数工具主要有以下三种:

2.1 运算符号

在函数公式中,需要用到很多运算符号,主要有算术运算符号、逻辑运算符号、文本运算符号、引用运算符号等,这些运算符号和数学计算法则比较一致的,其运算逻辑也相同。

2.2 查找与引用

Excel系统的查找与引用,主要是把符合有些条件的字符串与数值按照要求查找并引用到指定的单元格内或者放在公式中。我们在对大坝进行监测中会获取许多的数据信息,这些数据信息在分析处理的时候,经常会用到LOOKUP函数与VLOOKUP函数。

LOOKUP函数主要的功能是一个数值和一行数据或者一列数据逐一进行比较,在找到匹配数值之后,把另外一组数据信息中所对应的数值提取出来,但是这种函数公式只能够进行模糊查找。

VLOOKUP函数主要是一个数据与整个表对比,并非像LOOKUP函数那样和某一列数据或者某一行数据进行对比,并且使用VLOOKUP函数公式可选择的范围比较广,精确查询与模糊查询都可以。

2.3 IF函数

IF函数通常用在真假值的判断之后,按照逻辑判断真假值的返回找出不同结果。在大坝监测的数据分析中,在查找函数没有办法在所选表格区域当中找到匹配值,系统会出现“#N/A”的错误值,在“#N/A”错误的时候,可能分析内容起就很容易出错,有时候还要结合其他函数一起使用才行。

3 大坝监测数据分析Excel的应用

3.1 数据的收集

在水库大坝监测工作中,要对监测出来的数据进行分析研究,我们要先明确想要的结果,并且根据实际需求来收集整理监测数据信息,通过Excel函数工具把这些数据信息整理成想要的结果。

3.2 成图

在大坝监测数据分析工作中,Excel函数工具中有插入图表的功能,可以对数据信息进行研究分析整理成想要的图表,一般情况下都是采用散点图来分析趋势的。

4 实例

以某水电站为例,使用Excel函数工具来分析监测数据信息。该水电站工程是大型水电工程,水电站工程的主要任务是发电。水库蓄水位正常的是1300米左右,洪水位约为1300米,死水位大约为1285米,水库的总容量为1.59亿立方米,总装机100兆瓦,保证出力约10兆瓦,装机利用小时数3500小时,今年来平均年发电量约4亿千瓦小时。这个水电站挡水的建筑物是碾压式沥青混凝土墙坝,大坝顶的高程大约为1300米,防浪墙顶的高程大约为1300米,大坝顶的宽度大约为10米,坝高最高为大约为90米,大坝的长度约为439米。在大坝的上游设置半米左右厚混凝土的护坡,在大坝的下游设置预制的网格梁,可以种植草皮来护坡。心墙顶厚度大约为0.5米,心墙两侧摆放过渡料,水平的宽度一般为3米,在大坝的两岸设置4个测压孔,测压孔的参数见(表1)。

4.1 数据的统计与图表

从数据库中导出测压计的历史数据(表2),从测压计的历史数据来看每个测压点的数据信息相互交错,如果要从这些复杂庞大数据库里面找到想要的数据信息,就会用到Excel函数工具数据库里面的每项数据,复制粘贴到各种工作表中:

在使用Excel函数工具把数据进行汇总之后,会发现在数据列里面出现了许多“#N/A”错误,使得过程线无法连续,因此用Excel函数工具来判断数据是否是“#N/A”错误,Excel函数工具的使用可以得到连续的过程

线图。

4.2 数据分析

对上述数据表格进行研究分析,能够发现UP1测压管的历史过程线和库水位的历史过程线的关联非常密切,其相关性非常强,我们结合其他数据信息得知,左岸UP1测压管钻孔和水库内是通着的。

5 结语

总而言之,在以上的实例分析中仅仅使用了Excel数据分析工具中很少的一部分功能,即已经达到了大幅减少大坝安全数据分析工作量的目的,Excel数据分析工具还有很多,通过其强大的分析功能,能够进行各种数据处理并辅助监测人员进行决策,通过更加直观的表达方式大大地提高数据分析工作效率。

参考文献

[1] 赵小莉,李芙蓉,王立志.浅析水库大坝变形监测分析与预报[J].水利大坝监测,2015,23(25).

excel数据分析篇3

1 引言

Excel提供了一组强大的数据分析工具,称为“分析工具库”,使用分析工具库可以在用户建立复杂统计或工程分析时节省许多操作步骤。但由于“分析工具库”中的分析工具具有很强的专业性,一般在统计学或工程学的特定领域应用得比较广泛,因此普通的Excel用户对此“分析工具库”工具都采取了一种敬而远之的态度,很少有用户使用Excel的“分析工具库”功能及其提供的内容丰富的函数。其实在Excel的“分析工具库”中包括了许多非常实用的函数,利用这些函数可以帮助我们方便地解决许多Excel实际应用中的难题。

Excel以其简便易学已为大多数研究人员所掌握,其中的“分析工具库”能做一些常用的统计处理,我们只要针对实际问题找到对应的分析工具就可以了。

鉴于Excel具有强大的数据处理与统计功能,而在药学研究中,血药浓度的计算、药动学参数的求解、给药方案的设计、数据设计及组织管理、绘制图表等,需要进行大量而繁琐的数据处理、绘制各式图形。在医学数据的处理上,数据的统计缝隙也是非常重要的。电子表格处理系统Microsoft Excel for Windows是具有强大的数据处理及管理、图表绘制和打印等功能的软件,该系统操作简单,提供数据的动态显示和报告,数据分析工作直观,图表与Word等字处理软件兼容性好,能相互切换,可以方便地用于医学和药学研究的数据处理。

2 数据分析工具的应用

2.1 描述统计 “描述统计”分析工具用于生成源数据区域中数据的单变量统计分析报表,提供有大数据趋中性和离散性的综合信息[1]。

2.1.1 示例 某医院用中药治疗青光眼的试验中一些患者眼压的变化,用“描述分析”对这组数据进行基本的统计分析。

2.1.2 操作步骤 因为改统计分析软件操作界面比较简单直观,只要按照题目的要求填写相应的数据即可得到所需的结果,这里就不再赘述了。输入界面如图1所示。图1 “描述统计”输入操作界面(略) 汇总统计结果可以包含:平均值、标准误差(相对于平均值)、中值、众数、标准偏差、方差、峰值、偏度、极差(全距)、最小值、最大值、总和、总个数、最大值(#)、最小值(#)和置信度[2]。

2.1.3 结果分析 如图2所示,输出了实验数据所需的各种统计结果,以备医务工作者分析患者的病情。 图2 描述统计分析结果(略)

2.2 t检验 实际工作中,除需要判断某种处理结果与某一已知结果间的差异外,还需比较两种处理的效果,即比较两个样本总体的统一参数的差异。本节将讨论Excel“统计分析”工具包中的t检验。适用于等方差、异方差和成对数据的情况。

2.2.1 t检验 双样本等方差假设。等方差假设这个分析工具可用来确定等方差的两个样本均值是否相等或均值差是否等于给定值。

示例:考察一组成年男女体重的数据进行检验分析。要求用t检验来验证两组体重数据的均值差是否为20。

2.2.2 操作过程 打开t检验工具的对话框,按要求填入相应的检验参数,如图3所示。 图3 t检验:双样本等方差检验(略)

2.2.3 结果分析 统计分析结果如图4所示,从中可以得出分析结果为T统计量(0.020046449)小于双尾临界值(1.972016435),也小于单尾临界值(1.652585979);而相应的双尾概率高达0.984026506,单尾概率也达到0.492013253。所以可以有把握地认为均值差等于给定值20。

2.3 方差分析 方差分析是数理统计中重要的组成部分,在统计实践中也有着广泛的应用。由于方差分析的运算量随着变量的增多呈几何级数增长,如果不使用计算机,很难完成大规模数据的方差分析。在应用统计学的几个主要领域里,方差分析也是惟一无法直接用Excel 2002中的函数完成的科目(当然,如果耐心地对每组数据逐个进行计算,也可以用函数实现,但繁重的运算会使得工作效率变得很低,错误率增大)。

方差分析主要分为单变量方差分析、无重复双变量分析和有重复双变量方差分析。Exce1 2002在“统计分析”工具包中就对应地提供了这三个工具。下面仅介绍单因素方差分析。

单因素方差分析的作用是通过对某一因素的不同水平进行多次观测,然后通过统计分析判断该因素的不同水平对考察指标的影响是否相同。从理论上讲,这实质上是在检验几个等方差正态总体的等均值假设。单因素方差分析的基本假设是各组的均值相等。

2.3.1 示例 进行某化学合成反应时,为了解催化剂对收率是否有影响,分别用5种不同的催化剂独立地在相同条件下进行试验,每种催化剂实验4次,要求用方差分析判断催化剂对收率是否有影响[3]。

这是一个典型的单因素方差分析问题,催化剂是一个因素,而不同的催化剂可以视作该因素的不同水平。

2.3.2 操作过程 将原始数据输入工作表,打开单因素方差分析对话框,按要求填写选项。

转贴于

2.3.3 结果分析 统计分析结果如图6所示,从中可以得出分析结果为

运算结果分成概要和方差分析两部分。

概要:返回每组数据(代表因素的一个水平)的样本数、合计、均值和方差。

方差分析:返回标准的单因素方差分析表,其中包括离差平方和、自由度、均方、F统计量、概率值、F临界值。

分析组内和组间离差平方和在总离差平方和中所占的比重,可以直观地看出各组数据对总体离差的贡献。将F统计量的值与F临界值比较,可以判定是否接受等均值的假设。其中F临界值是用 FINV函数计算得出的。本例中F统计量的值是10.34346,远远大于F临界值3.055568。所以,拒绝等均值假设,即认为5种催化剂的对收率差异有显著性。从显著性分析上也可以看出,概率为0.000317,远远小于0.05。因此也拒绝零假设。

3 讨论

数理统计方面的软件应该说目前为止比较流行的软件也有一些,如SPSS、SASS、STATISTICA等等,但这些软件一是专业性比较强,艰深难懂,操作起来比较麻烦,且基本上是英文版的,对于一般人来讲还使用起来会觉得不方便的,二是软件价格过于昂贵[4]。

Excel是微软公司出品的办公系列软件,是很多人非常愿意使用的软件,所以它的普及程度比较高,即使是人们没有太多的使用Excel的许多高级应用,学习起来也会比其他的专业软件得心应手一些。

Excel中的“数据分析工具”智能地同步引用了多个统计函数对样本数据进行分析,可同时返回所希望的多个分析结果甚至图表,使医药工作者在进行科学研究及实验数据处理时不再忙于繁杂的数据计算过程,而更加专注于试验设计,计算(分析)结果的编辑打印则更便于资料的存档和交流。

本文只引用了几个应用Excel“数据分析工具”进行医药数据统计的实例,其实Excel“数据分析工具”还有好多种统计分析工具,它们能够进行非常复杂的统计计算,这种计算功能非常强大,如果采用人工计算会费时费力,得不偿失,比如,回归分析,方差分析以及各种检验统计分析等等。Excel友好的界面,清晰的统计分析结果,使医药工作者在使用Excel的“数据分析软件”时会感到非常的方便快捷,灵活实用。由于论文篇幅的限制,Excel“数据分析工具”的其他应用实例就不在这里赘述了。

参考文献

1 王晓民.Excel 2002高级应用—数理统计.北京:机械工业出版社,2003,214.

excel数据分析篇4

中图分类号:TP317.3 文献标识码:A 文章编号:1009-3044(2017)04-0235-02

统计分析软件是数据分析的主要工具。无论在工作还是学习中,我们都需要使用这些软件来进行数据分析,而分析的过程主要分为数据的整理,数据的分析,数据的报告 。而市场上有很多的软件来供我们选择,如何选择一款合适的软件就成了我们需要考虑的问题。

1 工具简介

Excel是微软的office系列办公软件中比较常用的一款数据处理软件。我们可以通过Excel进行数据录入,储存和分析的相P操作。Excel提供了大量的函数功能,为我们的数据分析工作提供了便捷。而且强大的VBA编程能力,也让我们处理起数据更加个性化和多样化。

Spss(Statistical Product and Service Solutions),相比Excel这样的办公软件,人们更加倾向于称Spss为统计软件。因为它的数据处理能力更加强大,Excel只能做一些最基本的数据操作,而Spss则可以做一些比较高级的数理统计工作。

R语言(R Language)相比前两者最大的不同之处在于他是非窗口操作软件,更确切地说他是一款脚本语言。用户需要输入相应的指令才可以操作数据。R语言的强大之处在于他的包。R语言平台上提供了各种各样的数理统计包,这些包可以直接由用户使用,而并不用关心它的底层实现机制。

2 三种软件在数据储存阶段的比较分析

数据存储是指分析员在搜集数据之后,把相应的数据有条理的储存起来,以便在以后的分析工作中使用。数据存储是数据处理过程的第一个阶段,也是最重要的阶段,因为他直接影响着以后的操作。如果在数据的存储阶段出了问题,那么整个数据分析的过程也就是有问题的。可见数据存储过程是需要分析员特别重视的阶段。

在此阶段Excel和Spss提供了可视化的操作界面,所以分析员可以很容易的对数据进行录入处理。而R语言则没有提供相应的图形操作界面,分析员只能通过在控制台建立数据框这样的方式,把数据储存起来。可视化操作界面的优点是直观,分析员可以像在实体的纸质表格上写字一样在虚拟的表里填入数据,这样可以减少分析员在抽象脚本语言可能出现的失误。

虽然R没有提供简单的图形操作界面,使得数据的输入没有Excel与Spss软件这么直观,但是R语言这种输入方式却有一个比较强势的功能,就是编程。虽然Excel和Spss也有编程功能,但是语法过于复杂。在R语言中分析员可以编写自己的脚本文件,实现数据的重复录入,从而可以节省出大量的时间,减少不必要的时间浪费。

他们三者最后都可以把数据保存为CSV格式或者TXT格式,这样就为数据的传输带来了方便。保存为这两种格式后三个软件可以实现数据的共享操作。

综上所述,Excel和Spss强在可视化的操作界面,而R语言则强在编程语言。至于最后数据的保存,三者则表现出了一致性,实现了数据在软件之间的传输。

3 三种软件在数据分析阶段的比较分析

数据分析传统上都认为是统计分析,而广义的数据分析则包含了更高级的算法比如机器学习、数据挖掘等。数据挖掘(Data Minning)是指从大量的数据中通过一些特定的算法,计算出隐藏在其中的有意义的信息的过程。主要的数据挖掘算法包括:人工神经网络,支持向量机,KNN算法,随机深林、决策树、回归分析等。

Excel在数据分析阶段的强大之处在于它有很强大的函数库,利用这些函数库里的函数,可以帮助我们方便地进行简单的数据分析,比如求平均数,求和等。当然也可以对数据进行优化和筛选。函数功能是Excel的灵魂,有了函数,Excel就可以组合变化出多种统计方式,来分析数据。

但是,Excel只能进行简单的数理统计分析,而不能进行比较高级的算法分析。 Spss相比Excel则可进行比较高级的数据分析,比如生存分析、Logistic回归、BP神经网络等。虽然Spss能进行这些算法分析,但是它本身也有局限性。由于Spss是一款可视化软件,它的载体在软件开发的阶段就已经被设计好了,分析员很难再根据自己的需要对里面的算法进行更改。这也就意味着,分析员只能使用设计者提供的方法,而设计者没有提供的方法,分析员就不能使用了。因为现在算法更新比较快,而且对具体的业务对算法的要求也是不尽相同的,这样就要求算法的个性化,而Spss则很难满足这一点。

R语言相比前两者在数据分析阶段则有很强大的优势,因为R语言是一个开源软件。有很多R语言的爱好者,在R语言的社区贡献自己利用R语言的语法写成的包,免费的供所有人使用。这样分析员就可以直接从R的官方网站上下载相对应的包。R语言的包基本包含了所有数据分析的算法。

R语言的另一个强大之处,在于分析者不仅能下载相应的包,更能查看包的内部信息。通过查看包的内部信息来确定自己是否需要这个包。而且如果遇到自己所处理的问题不合适的包,分析员可以在自己所找到的包的基础上自己再设计新的算法,来满足自己的业务需要。

综上所述,在数据处理阶段,Excel只能满足最基本的数据处理,而Spss和R语言则可以满足更高层次的数据处理。而且R语言在算法的选择和使用上相对Spss则更具有个性化。

4 三种软件在数据报告方面的比较分析

数据报告是指在经过数据搜集,数据存储,数据分析之后,对得到的结果进行归纳总结,形成报告的方式呈现出来的过程。数据报告可以分为文字报告和图形报告。

而近些年来数据可视化越来越受到人们的关注,数据可视化将复杂的数据表展示为直观的图形,可以让听众更加准确的抓住数据的要害,进而分析数据。而随着科学技术的不断发展,数据可视化的手段越来越丰富,除了传统的柱状图,饼图等等之外,现在的可视化工具,更为我们提供了其他丰富的图形。比如,词云,雷达图等。

在文字报告方面三者都可以根据自己的所能处理的报告生成相应的图表。Excel只能生成饼图,柱状图等简单的数理统计图,当然这和它所能处理的对象是一致的。Spss则能生成更高级的图形,比如线性回归图等。R语言也提供了相应的作图函数,这样的作图函数和Excel与Spss的作图原理是相通的。

而R语言不仅提供了传统的绘图功能,而且更提供了高级的绘图功能。传统的绘图软件的原理类似与我们直接在纸面上画画,一旦画上去就无法更改。这就给作图带来了很大的麻烦,不能随意更改视图,更不能在图形生成后在后期对图形做出整改。R语言提供了一款名叫“ggplot”的包,@个作图包的原理是基于图层,也就是说每一次画图动作都新建了一个图层。在最后绘图完成之后,将一个个图层相互覆盖。这样作图的好处就是我们可以直接更改一个图层,来修改我们某一步的作图操作。这样我们控制最后的输出图就更加的灵活了。

综上所述,R语言在数据报告,特别是可视化这个过程中,相比Excel和Spss更加具有优势。但是R语言并不是完美的,我们在使用包的时候,并不能完全的随心所欲。因为包的设计者也对一些功能进行的限制。但是如果我们确实需要某项功能,我们可以通过改写代码来实现。从这一点来说,R语言数据可视化功能还是很完整的。

5 结论

通过以上的比较分析,我们不难发现他们之间的区别和联系,也让我们在平时的学习和生活中有了选择的参考。但是我们仍然要记住,没有最好的软件,只有最合适的软件。我们在选择软件的时候要根据自己的实际需要来选择,而不能认为某种软件是最强的,就把所有的数据处理工作都交给一种工具来处理。通常结合多种工具来处理数据,我们会得到最好的效果。

参考文献:

[1] 张文霖.数据分析初体验[J].数据,2013(5):46-47.

[2] 段昕宏.巧用Excel编制银行存款余额调节表[J].财会通讯,2005(8):74.

[3] 邓振伟.SPSS软件在正交试验设计、结果分析中的应用[J].电脑学习,2009(5):15-17.

[4] 关彦辉.R软件在《概率统计》教学中的应用[J].现代计算机(专业版),2009(12):87-90.

[5] 姜忠尉.统计分析软件SPSS的特点和应用分析[J].中国证券期货,2012(4):291.

excel数据分析篇5

问卷调查是项目研究过程中使用的一种重要手段,对问卷调查结果的统计和分析是调查研究的关键,现在网上出现了许多调查问卷网站,能够进行复杂的结果分析,但有时没有网络环境,只好用纸质问卷或电子表格问卷,这样就得进行大量的人工录入及统计。我们使用的Excel软件就可以进行调查问卷的统计和分析,Excel提供了大量的统计函数,还有进行数据处理的排序、筛选、分类汇总、数据透视表等功能。下面以Excel2003为平台,以“油田员工培训需求的调查问卷”为例,介绍如何使用Excel数据透视表对调查问卷的结果进行统计分析。

1、问卷表格格式

从“油田员工培训需求的调查问卷”中提取几个问题及选项如下表进行分析,为了统计方便我们把各选项分别给予编号O、1、2、3、4,共5个选项。问卷答题结果也使用该编号,如下图,每列第一行为问题字段,下面是答题时选择的答案的前5行,共90人答卷。

在该问卷中,要统计出不同技术职务、不同年龄段的员工对培训需求的程度,愿意接受的培训频率以及接受的每次培训时间等情况。这是多个条件的交叉统计分析问题。可以利用公式进行统计,但在不同的条件下要选择不同的数据源区域来计算,操作起来麻烦,容易出错,我们现在利用数据透视表来进行统计分析。

2、利用数据透视表进行统计分析

在答题结果工作表窗口中,单击“数据”菜单,选择“数据透视表和数据透视图”命令,弹出“数据透视表和数据透视图向导-3步骤之1”对话框,在“请指定待分析数据的数据源类型:”里,选择第一项“Microsoft Office Excel数据列表或数据库”,在“所需创建的数据表类型:”里,选择“数据透视表”,单击“下一步”,在“步骤2”中选择数据透视表的数据源区域,选中全部数据后返回,按“下一步”,在“步骤3”中,让选择透视表的显示位置,在这里选择了“新建数据表”,单击“完成”,在当前工作表前新插入了一个带有透视数据表的工作表。

现在进入了我们操作的关键,根据统计该问卷的要求,要统计出按不同技术职务、不同年龄段的员工对培训需求的程度,例如:要统计不同年龄段的具有高级工职务的员工对培训需求的程度的情况,我们可以这样操作:在“数据透视表的字段列表”中拖动“技术职务”到数据透视表的“页面区域”的位置,将“年龄”拖到“行区域”,将“培训需求程度”拖到“列区域”,再将“培训需求程度”拖到“数据区域”。然后双击“求和项:培训需求程度”,弹出“数据透视表字段”对话框,在“汇总方式”中选择“计数”,“确定”之后,就出现了数据透视表,如下图。也可以进入“表格选项”对透视表的数据选项进行一些设置,是否要总计或者空白处是否显示数字“0”等。

excel数据分析篇6

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 16. 083

[中图分类号] G64 [文献标识码] A [文章编号] 1673 - 0194(2014)16- 0140- 06

教学管理中,经常要对大量的数据进行分析、汇总,由此也产生了大量的管理软件,但是,软件再多,毕竟无法解决层出不穷的新问题。因此,管理人员掌握常用的数据库软件的使用,可以及时、较好地解决实际工作中的各种问题,提升工作效率。在众多的数据库软件中,Excel作为普及度最高的软件,拥有着强大的数据管理分析功能,而且随着软件的升级,加入了更多、更强大的功能,掌握好Excel的使用、充分运用其功能,将成为解决实际问题的“利刃”。本文以多次考试成绩的汇总、分析为例,提出应用Excel解决类似问题的思路,并详细讲解实际操作方法。还要指出,本问题的解决,还可应用于公司销售业绩、进出货物管理等多种情形,因此具有相当的普适性。

1 提出问题

大量来自不同地区的人员参加考试,每次组织综合科目和不同的专业科目考试,同时通过综合科目和某一专业科目才能取得该专业执业证书,没通过相关科目的人员可能再参加后面批次的考试,要求汇总分析每一次考试和几次考试的人员通过情况和地区通过情况,整理出几次考试后可取得执业注册证书的人员名单,分析每一考试科目的总体通过情况。

2 思路分析

解决该问题的难点在于整理执业证书人员名单时,必须通过综合和专业考试科目,而这两个科目不一定是在一次考试通过,而且考试的专业比较多。

在分析问题时,也应当看到,结果并不要求对每次考试的具体成绩进行层次分析,这样即可简化我们解题思路,即将通过、不通过定义为1、0即可,而不需要分析具体的考试分数(当然也可通过其他办法来进行考试成绩的定量分析)。

基于以上两个主要方面的分析,我们可以得出,利用Excel的数据透视表来解决这一问题是一个比较适当的方法。因为数据透视表是用来从Excel数据列表、关系数据库文件或OLAP多维数据集等数据源的特定字段中总比信息的分析工具。它是一种交互性报表,可以快速分类汇总比较大量的数据,并可以随时选择其中页、行和列中的不同元素,以达到快速查看数据源的不同统计结果,同时还可以随意显示和打印出用户感兴趣的区域和明细数据。数据透视表有机地综合了数据排序、筛选和分类汇总等数据分析方法的优点,可以方便地调整分类汇总的方式,灵活地以多种不同方式展示数据的特征。

3 实际操作

在本节中,以分析解决问题为主线,穿插了Excel数据处理中的常用方法。考虑到Excel 2010在数据透视表方面显著的功能升级和强化,本文以Excel 2010版本为平台进行操作。

3.1 整理数据源

excel数据分析篇7

一、概述

按照“以就业为导向,以服务为宗旨”的职业教育目标,高职院校培养的学生应当具有解决实际问题,具有自我学习、持续发展的能力,具有创新和创业的能力。其中,“解决实际问题”是高职学生能力培养的第一目标。当今社会,计算机应用能力是信息化社会发展的需要,目前许多高职院校都开设了Mi

crosoft 0ffice办公软件等方面的课程,在于培养学生较基本的计算机应用能力,解决一些日常工作的实际问题。其中,电子表格Excel是日常办公中使用最广、掌握相对较难的一个软件,它具有较强的数据处理与数据分析能力,丰富的图表功能,能够完成财会金融数据处理、人力资源管理或生产管理等等。并且Excel以其友好的操作界面和强大的数据分析功能受到了众多企业和个人的青睐,利用Excel进行管理和决策已成为办公人员日常工作的一部分。许多高职院院校开设了计算机应用基础等类似的课程,这类课程中Excel的学习更注重的是学生Excel的基本应用能力,能够制作表格、能够使用简单函数、能够掌握排序、筛选、分类汇总等Excel基本数据处理工具的使用。利用Excel对企业产品市场销售数据、生产数据等做出快速全面的预算,通过分析、比较这些数据,不断改进原有方案,使企业的生产经营活动始终处于最佳状态,这对提高企业竞争力有着非常重要的现实意义,而学生运用Excel进行数据分析作为管理和决策依据的能力却非常有限。

二、教学内容的设计

职业教育课程的内容必须以职业活动为导向,因此Excel数据分析的教学内容,都应紧紧围绕职业能力目标的实现,取材于职业岗位活动和实际工作流程。Excel作为一个工具,最终目的是为各个职业岗位服务,针对不同的专业,Excel数据分析项目的设计应贴近不同的实际岗位。同时,针对不同专业的学生,应设计不同的授课侧重点、教案,引导学生使用Excel来完成其专业课程任务,使学生在实践中体验成就感,因而产生积极的学习兴趣,达到优良的教学效果。在教学中多采用项目驱动的教学方法。项目驱动教学模式针对不同专业的学生根据课程内容选用不同的项目,这样有利于学生把Excel和专业知识相结合,再将项目分解、结合,学生通过合作讨论来分析项目、搜集资料、确定方案步骤,直到解决问题。这一过程是培养学生解决实际问题的能力的有效途径。例如,医药高职学校学生在用Excel进行医疗数据统计处理时,可采用“配对t检验”这样具体的项目,将Excel数据分析工具库的19个模块以及使用Excel进行数学分析的具体操作等融入项目中;房地产专业可设计项目“抵押物价格评估”,分小组确定不同方案对抵押物进行评估,并进行比较;财务管理专业学生的教学可通过完成“账务管理系统”这样具体的项目,结合Excel的图表数据处理功能,实现完整的财务指标体系分析,培养学生使用Excel数据分析从事财务管理工作的能力。

三、教学组织实施

下面,本文以金融专业中最常见的贷款问题为例,进行“制作适合任何利率的住房贷款分期付款计算器”项目设计与实施。(1)具体项目设计。项目设计的原则具有典型性与可操作性,并尽量贴近实际生活,便于学生的理解并能真正解决实际生活的某些问题。因此设计“制作适合任何利率的住房贷款分期付款计算器”项目。该项目情境引入如下:由于住房贷款分期付款的计算比较复杂,所以购房前的决策难度也较大。制作一款快速计算出不同房屋类型和不同付款方式下的月还款额、总还款额及利息总额的万能计算器,以辅助个人购房贷款决策,具有很强的现实意义。(2)项目的分析。将该项目执行过程按照阶段性进行任务划分,形成“政策背景”、“分期付款分析”、“贷款方式选择”共三个任务,三个任务从简单到复杂,并有密切的关联关系。任务一了解项目的行业背景知识,为项目的执行做好准备;任务二难度相对加大,利用Excel的函数完成月还款额的计算,为任务三的个人决策提供依据。(3)教师的具体引导。按照新职教理念,在教学中应充分体现“教师引导,学生为主体”这一教学模式。引导学生分析问题,进而提出解决问题的思路。教师演示和讲解注意应主要讲解解决问题的思路、整体概念和整体框架。在任何项目执行过程中,均会涉及到专业、行业知识等,因此学生收集资料,准备好项目背景知识是很重要的第一步。在任务“政策背景”中,需要了解目前我国各大银行及金融机构的住房贷款方法,如商业性个人住房贷款、公积金个人住房贷款、等额本息还款、等额本金还款等具体含义及实现的数学模型,为后续任务的具体实现作为铺垫。在该项目的“分期付款分析”任务中,财务函数作为新知识点引入,教师可做适当讲解与演示。对年金函数PMT(是基于固定利率及等额分期付款方式,返回投资或贷款的每期付款额)进行介绍,并对比年金函数PMT学生自主学习现值函数PV(即从该项投资开始计算时已经入帐的款项)、期望值函数Fv(在最后一次付款后希望得到的现金余额)、总投资期函数Nper(即该项投资的付款期总数)等等,因为这一系列函数常用于处理贷款问题,彼此之间关联度较大。在任务“贷款方式选择”中,可让学生分组讨论,得出解决方案。一般该任务学生会采用IF函数多层嵌套与窗体来实现。在学生的讨论与尝试过程中,会有普遍存在的疑问,教师可针对学生的典型问题进行引导。同时,部分学生有比较新颖的方案,可让学生将自己的实现过程与解决方案向同学做介绍,锻炼学生的语言表达能力。该项目的执行过程,充分体现学生为主体与教师的引导,起到对学生综合能力培养的作用。(4)学生考核与评价。考核是相对目标而言的。考核学生使用Excel进行数据分析的能力,解决实际问题的能力,因此应重过程考核,使用“任务”对学生进行考核。例如,该项目中,项目任务的完成进度、小组成员之间的协作情况、学生对项目展示的表达能力等等均可作为考核的内容。

四、主要问题的思考

(1)项目设计的关键性。在学生Excel数据分析能力的培养中,项目的设计是最关键的一步。能力的培养必须在教学中进行,教学时间的分配必须合理,项目过大、过难均会影响到教学时间的掌控,从而影响教学的效果。并且,由于教学的对象是未接触实际项目的学生,因此项目应容易理解并尽量贴近实际生活,能解决实际生活的问题,才能真正体现Excel数据的分析是为管理和决策起指导意义。(2)对教师能力的更高要求。Excel教学的教师一般都是计算机基础课的教师,而在教学过程中要求项目与专业相结合,将Excel作为学生专业学习的工具,这就要求计算机教师能认真了解该专业的基本知识,主动了解该专业的最新动态与技术,关心该专业学生的就业动向与行业规则。对教师的行业知识提出了更高的要求。

五、结语

Excel电子表格,作为基本的工具软件应用越来越广,当Excel与专业相结合时发挥出了巨大优势。因此,高职院校学生能力培养的改革过程中,应遵照“以就业为导向,以服务为宗旨”的职业教育目标,重视学生运用Excel进行数据分析作为管理和决策依据的能力培养。

excel数据分析篇8

 

Excel是Microsoft公司推出的电子表格软件,它不仅具有数据的统计分析、图形和图表处理等功能,而且具有智能化的计算和数据管理功能。这些简单易行的功能正适合应用于大量处理、分析和管理数据的会计专业,使其工作更加快速、准确、安全。

一 利用Excel进行数据分析

数据分析是Excel比较重要的一个功能,而人们在利用Excel进行数据分析时,通常会使用熟悉的排序、筛选、分类汇总等命令。其实,Excel中还包含一些比较适合会计方面数据分析的命令,如记录单命令、模拟运算表命令。

(一)利用记录单进行数据分析

记录单是Excel中用来查询和添加记录的工具。利用记录单,可以轻松的设定查询条件,快速的追加记录,以及对查询到的记录进行编辑。其使用方法很简单。

1.将鼠标光标置于如表1的数据清单中,Excel会自动识别数据清单(此处要注意数据分析,设计数据表时请在标题行与数据清单间插入一行空白行,否则“记录单”会将数据清单中的字段行视为数据清单的记录区)。然后选择“数据”菜单中的“记录单”命令。在弹出的对话框中单击“条件”按钮,进入条件设定界面。

2.在如图1的“品种”文本框中输入“苹果”,然后单击“表单”按钮进入查询状态。

3.在查询状态可以通过单击“上一条”按钮与“下一条”按钮进行查询。在此状态下可对查询到的记录进行编辑,编辑后必须按Enter键确认;也可单击“删除”按钮对查询到的记录进行删除操作。如果想追加记录,可以单击“新建”按钮,即可在数据清单的末尾追加新建的记录。

表1 水果销售表

图1 条件设定对话框

(二)利用模拟运算表进行数据分析

在很多情况下,我们利用公式或函数计算数据时,常常想知道如果其中一个或两个数据发生变化,其结果将会怎样变化,我们想要对比这些情况,此时我们就可以利用“模拟运算表”来解决这个问题论文格式模板。

模拟运算表可以根据假设条件和公式计算出结果。模拟运算表分为单变量模拟运算表和双变量模拟运算表。使用单变量模拟运算表可模拟公式中一个数值发生变化对结果产生的影响;使用双变量模拟运算表可模拟公式中两个数值发生变化对结果产生的影响。

1.使用单变量模拟运算表求解

单变量模拟运算表根据变量分布在行或列中,进一步划分为行引用模拟运算表和列引用模拟运算表。下面对一张银行存款情况表(银行存款情况表是利用FV函数计算出存款人十年后可从银行提取的金额数。)分别使用行引用模拟运算表和列引用模拟运算表进行求解。

(1)行引用模拟运算表

将假设值分布在某行中,如图2所示,即应使用行引用模拟运算表来求解。

图2 行引用模拟运算表分析图

现想通过假设每年底存入的金额分别为2500、3000和3500,得出存款人十年后可从银行提取的金额数。

首先在(B9:D9)区域中输入替换“以后每年底存入的金额”的假设值。然后在假设值左下方的单元格里输入公式(此处的公式必须在假设值的左下方输入,否则结果会出错)“=FV(B4,B5,B3,B2)”。输入完成后,选中包含假设值、公式和结果区三个部分的区域(此处选中的区域必须保证包含假设值、公式和结果区三个部分,否则不会得出正确的结果),再选择“数据菜单”中的“模拟运算表”命令。在弹出的对话框中输入引用的单元格,由于这里的假设值分布在行中,所以为单变量行引用模拟运算表,即在“输入引用行的单元格”后的文本框中输入假设值要替换的原公式中的引用“B3”(以后每年底存入的金额),然后单击“确定”按钮数据分析,回到工作表中即可看到根据假设值和公式计算出的结果。

(2)列引用模拟运算表

将假设值分布在某列中,如图3所示,即应使用行引用模拟运算表来求解。

图3 列引用模拟运算表分析图

现想通过假设总存款期分别为12年、15年和18年,得出存款人十年后可从银行提取的金额数。

首先在(A10:A12)区域中输入替换“总存款期(年)”的假设值。然后在假设值右上方的单元格里输入公式(此处的公式必须在假设值的右上方输入,否则结果会出错)“=FV(B4,B5,B3,B2)”。输入完成后,选中包含假设值、公式和结果区三个部分的区域(此处选中的区域必须保证包含假设值、公式和结果区三个部分,否则不会得出正确的结果),再选择“数据菜单”中的“模拟运算表”命令。在弹出的对话框中输入引用的单元格,由于这里的假设值分布在列中,所以为单变量列引用模拟运算表,即在“输入引用列的单元格”后的文本框中输入假设值要替换的原公式中的引用“B5”(总存款期(年)),然后单击“确定”按钮,回到工作表中即可看到根据假设值和公式计算出的结果。

2.使用双变量模拟运算表求解

双变量模拟运算表可以同时根据公式中两个变量的假设值得出计算结果。在使用双变量模拟运算表时,必须保证其两个假设值分布于行和列中,且公式位于它们的交汇处,如图4所示。

图4 双变量模拟运算表分析图

现想同时通过假设每年底存入的金额分别为2500、3000和3500及总存款期分别为12年、15年和18年,得出存款人十年后可从银行提取的金额数。

首先分别在(A10:A12)区域和(B9:D9)中输入替换“总存款期(年)”和“以后每年底存入的金额”的假设值。然后在行和列的假设值的交汇处单元格里输入公式“=FV(B4,B5,B3,B2)”。输入完成后,选中包含假设值、公式和结果区三个部分的区域(此处选中的区域必须保证包含假设值、公式和结果区三个部分,否则不会得出正确的结果),再选择“数据菜单”中的“模拟运算表”命令。在弹出的对话框中输入引用的单元格,由于这里的假设值分别分布在行和列中,分别在“输入引用行的单元格”和“输入引用列的单元格”后的文本框中输入假设值要替换的原公式中的引用“B3” (以后每年底存入的金额)和“B5”(总存款期(年)),然后单击“确定”按钮,回到工作表中即可看到根据假设值和公式计算出的结果。

二 利用Excel函数进行数据计算

Excel函数共有11类数据分析,下面介绍财务函数中几个常用的函数。

1.年金函数PMT

在很多情况下我们需要贷款解决资金问题,同时我们也想知道每期的还款金额,这就可以利用Excel中的PMT函数计算得出。

PMT函数是计算在固定利率下,贷款的等额分期偿还额,也就是平时所说的“分期付款”。在表2(贷款情况表)中计算每年的还款额只要将光标定位到B5单元格中,输入或插入函数:= PMT(B2,B3,B4),此处要注意的是这里我们只对PMT函数的前三个参数(固定利率、总贷款期、本金)进行了赋值,对于后两个参数fv、type没有赋值(视为省略),是由于fv参数为未来值,一笔贷款的未来值即为零,所以这里不为fv参数赋值。而type参数的值若为0或省略代表各期付款的时间在期末,为1则为在期初,这里如没特别说明,我们则认为其付款时间在期末,即可省略论文格式模板。

表2 贷款情况表

2.投资净现值函数NPV

对于财务人员和项目人员经常要了解投资中未来各期支出和收入的当前值的总和,那就可以利用Excel中的NPV函数计算得出。

NPV函数是基于一系列将来的收(正值)支(负值)现金流和一贴现率,返回一项投资的净现值。现值是指未来各期收益折算成现在的价值总和。在表3(投资收益表)中要计算投资的净收益只要在将光标定位在B8单元格中,输入或设置函数NPV。但此处需要注意的是NPV函数根据初期投资的时间是在期初还是在期末分为两种情况。

情况一:初期投资的时间在期初,即在第一年的年初投资50000(投资均用负数表示),第一年的年末收益12000,其余年份的收益也是在年末,则在B8单元格中输入:=NPV(B2, B4:B7)+B3,注意这里要在最后除去初期的投资额。

情况二:初期投资的时间在期末,即初期投资发生在第一年的年末。在B8单元格中输入:=NPV(B2,B3:B7)即可。

表3 投资收益表

三 利用Excel进行数据保护

我们利用Excel进行数据处理后数据分析,可能会对工作表进行保护,但这样只能保证其他人不能修改数据,而所使用的公式或函数还是可以暴露给别人,如果不想其他人查看所用公式的内容,就要使用Excel中的公式隐藏功能实现。

excel数据分析篇9

引言

每次全国普通高校非计算机专业计算机联合考试(一级)考试阅卷结束后,由自治区将成绩以Excel电子表格形式下发到各学校(以下简称成绩表)。成绩表的表头各字段名如下:

教师需对成绩表进行汇总统计与分析,了解全校各系、各年级、各专业的平均分、及格人数和及格率等情况,便于修订教学计划。

针对学生成绩表的多条件统计分析需求给出公式或函数法和数据透视表法两种解决方案。

1.公式或函数法

1.1 SUMPRODUCT函数

SUMPRODUCT函数是在给定的几组数组中,将数组间对应的元素相乘,并返回乘积之和。

语法SUMPRODUCT(array1,[array2], [array3], ...)

其中,数组参数Array1必需,Array2,array3,……可选,其相应元素需要进行相乘并求和。

SUMPRODUCT函数的基本功能是返回相应的区域或数组乘积的和。但也可利用SUMPRODUCT函数进行多条件计数和多条件求和。

若要统计同时满足条件1、条件2到条件n的数据个数,则可使用

SUMPRODUCT((条件1)*(条件2)*…*(条件n))

若要统计同时满足条件1、条件2到条件n的数据的和,则可使用

SUMPRODUCT((条件1)*(条件2)*…*(条件n)*求和区域)

1.2定义名称

为了在公式计算中方便输入和减少输入量,给需使用的单元格区域定义简单易记的名称,它们分别为年级、院系名称、理论成绩和操作成绩。

操作步骤:选择菜单“插入”“名称”“定义”命令,在定义名称对话框中输入名称和引用位置,确定即可。定义名称对话框如图1所示。

图1定义名称对话框

名称引用位置中使用了一个动态的公式“=OFFSET(成绩表!$F$2,,,COUNTA(成绩表!$A:$A)-1,1)”定义数据源,这样就不用管共有多少条记录了,COUNTA(成绩表!$A:$A)-1会自动计算记录数,并且如当一条新的纪录添加或删除时,数据源会自动扩展。

1.3创建统计表

添加一个新的工作表,用于存放统计数据,命名为“统计表”,表头设计如下:

在A和B列分别输入年级和院系名称。

在C3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*(理论成绩>=0))”;

在D3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*(理论成绩>=60))”;

在E3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*(操作成绩>=60))”;

在F3单元格输入“=D3/C3”;在G3单元格输入“=E3/C3”;

在H3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*理论成绩)/C3”;

在I3单元格输入“=SUMPRODUCT((年级=$A3)*(院系名称=$B3)*操作成绩)/C3”。

填充数据,并将小数位设置为两位,部分统计结果显示如下:

2.数据透视表法

2.1创建空白的数据透视表

选定数据清单中的任意单元格,选择菜单“数据”“数据透视表和数据透视图”命令,在弹出的对话框中单击“完成”按钮。Excel将产生一个含有空白的数据透视表的工作表,其中显示字段列表和数据透视表工具栏。

2.2对数据透视表进行布局

若需统计各年级、各院系的理论成绩的平均分、及格人数和及格率等,则可从字段列表中将“年级”字段拖到页字段区,将“院系名称”拖到行字段区,将“理论成绩”字段拖到列字段区,将“理论成绩”、“学号”和“学号”字段依次拖到数据区。将数据透视表中的“数据”拖到右边的单元格。

若要改变数据透视表的布局,就将欲删除的字段拖出数据透视表,然后将新的字段从字段列表中拖到数据透视表相应区域即可。

2.3设置字段的显示方式和汇总方式

将“理论成绩”分为

Excel对“理论成绩”字段默认的汇总方式为“求和”。若要更改汇总方式为“平均值”,可右击“求和项:理论成绩”,选择“字段设置”,或先单击“求和项:理论成绩”,再单击数据透视表工具栏上的“字段设置”按钮,均可调出“数据透视表字段”对话框;在“数据透视表字段”对话框中,单击“汇总方式”列表框中的“平均值”,然后单击“确定”按钮。这就将“理论成绩”的汇总方式改成了“平均值”。

将“学号2”字段的显示方式更改为“占同行数据总和的百分比”。操作方法:右击“计数项:学号2”,选择“字段设置”,在调出“数据透视表字段”的对话框中,单击“选项”,在“数据显示方式”列表框中选择“占同行数据总和的百分比”,然后单击“确定”按钮。

2.4重命名字段

当向数据区域添加字段后,它们都将被重命名,例如“理论成绩”变成了“平均值项:理论成绩”,这样加大了字段所在列的宽度,表格显得不紧凑。如需重命名字段,只要单击数据透视表中需要修改的标题单元格,在编辑栏中输入新标题即可。我们将“平均值项:理论成绩”改为“理论平均分”,“计数项:学号”改为“人数”,“计数项:学号2”改为“人数占比”,将“0~59”改为“不及格”,将“60~119”改为“及格”。

稍作修饰,将小数位数设置为两位小数,隐藏“人数汇总”和“人数占比汇总”。至此,可得到如图2所示的数据透视表。

图2数据透视表

数据透视表创建好后,任何时候都可根据需要,对数据透视表重新进行布局,即只需拖动字段按钮就可,并可非常方便地调整显示方式和汇总方式,以便从不同的角度查看分析数据,从中寻找有价值的信息,满足新的数据分析的要求。

结语

Excel具有强大的数据分析和数据处理功能,包含了9大类、400多个内置函数和大量的分析工具。公式或函数法和数据透视表法都是Excel分析和处理数据的重要手段,合理选取,巧妙应用,能使数据处理方便且高效。

参考文献:

excel数据分析篇10

【中图分类号】G40-057 【文献标识码】B 【论文编号】1009―8097(2010)10―0135―03

引言

考试是教育活动中评价教学质量,衡量教学效果,鉴别人才素质的重要手段之一。所有的教学都是用不同的考试手段来检测和监控教育质量、规范和引导教师的教学行为,并督促学生积极努力的学习。对于考试的准确定位和恰当使用成为现代教育的一个重要问题。在现今情况,各类各级学校的绝大多数考试的结果大都是以分数成绩的形式给出,成绩的评定和使用显得尤为重要。对学生的成绩进行分析评估,为引导教学工作和提高学生成绩提供了重要的依据。

在教学过程中将会产生大量的成绩数据,对其进行人工分析是非常困难的,而且较易受到教师主观因素的影响。随着信息技术的发展并且引入到教育领域[1],利用信息技术对学生的学习成绩进行分析处理将变得可行[2]和简单,目前大多数教师对信息技术的利用仅仅停留在数据的存储和查询上,并没有对数据进一步的统计分析。

使用信息技术对成绩进行有效的统计分析,可以更好发挥考试对教学效果的反馈作用,同时也可以对试卷质量进行评估,辅助指导教师的命题。目前市面上流行着很多专业的统计分析软件比如SPSS[3]、SAS[4]等,但是这些软件价格昂贵、操作复杂,并不适合普通教师使用。MS Excel[5]作为最普及的办公软件,完全可以实现成绩分析和试卷质量分析的功能。

一 MS Excel介绍

MS Excel是美国微软公司的Microsoft Office System办公软件包中的一个重要组件。它集数据管理、数理统计、绘图与一体,既具备存储功能,又可以完成多种表格与图表的设计。同时MS Excel内置了数百个函数,能够完成绝大多数复杂的数据运算和统计分析,精度能达到专业统计分析软件。使用Excel的内置功能可以进行各种数据的处理、统计分析和辅助决策操作。本文使用MS Excel版本为2003版。

二 某英语成绩分析实例

出于教学本身考虑,对学生成绩的统计分析包括最高分最低分、及格率、集中量分析和差异量分析等。

本文以兰州理工大学在2009年5月组织的一次四级模拟考试的部分成绩为样本进行分析,样本数目为925,参考学生分别来自不同院系不同年级。

1 成绩表的建立

我们在Excel中建立成绩表来存储学生成绩。表格存储了学生院系名称、年级、学生姓名、学号、总分和各小题得分。本次模拟试卷由四大部分组成,分别是听力部分、阅读部分、写作部分和综合测试部分,其中听力部分和阅读部分为客观题目,写作部分和综合测试部分为主观题目。

2 初步分析

对成绩的初步统计,是指从整体上对成绩进行分析。包括将成绩按照分数段统计出每个分数段的人数和比例,以及最高分、最低分和整体分布情况等[6]。

在Excel中可以非常简单地对分数段人数和所占比例进行统计。使用内置COUNTIF函数可以计算出所处相应分数段的人数,再除以总参考人数即可得出相应分数段所占比例。

同时Excel提供的图表功能可将工作表中的数据用图形表示出来,使得数据更加直观、易于阅读和评价。如图1所示,本文以三维饼状图的形式表示了不同分数段及所占比例,非常的直观。根据不同的习惯和用途,用户还可以自行选择以柱状图、条形图等图表样式表示。

3 统计量分析[7]

初步的分析只是对成绩进行简单分析,还需要更深入地对成绩进行统计学分析,计算一些能够反映数据分布特征和规律的某些具有代表性的数值,也就是统计量。在数据分析中常用的描述数据特征的统计量主要有描述数据分布的集中趋势的度量和数据分布的分散程度的度量。

分数分布的集中量数主要用来反映该组分数集中趋势的统计量,一般使用均值和中位数来表示。

均值是一组数据的算术平均值,在成绩分析中,它可以反映一个群体对知识的掌握状况。在Excel中,提供了求均值的函数AVERAGE可以直接对分数求均值。由于我们分析的实例缺考人数较多(接近10%),直接使用AVERAGE函数求得的均值不能真实反映实际参加考试学生的知识水平。因此,我们通过Excel提供的其它函数来解决这一问题,SUMIF函数用来按条件对指定区域求和,COUNTIF可以按条件统计指定区域数目。利用SUMIF(总分,”>0”)/COUNTIF(总分,”>0”)可以计算参加考试的学生成绩的平均值。

均值容易受到极端值(极大值或者极小值)的影响,因此在描述一组数据的集中量分布时,一般还要使用到受极端值影响较小的中位数。中位数是指将数据排序后,位置在最中间的数值,在Excel中,提供了直接求取指定区域中位数的函数MEDIAN。

差异量数是用来描述一组学生分数散布状况的量数,差异量数反映的是学生分数的分布范围的大小和波动情况,一般使用标准差作为差异量数。同时使用集中量数和差异量数才能较全面对一组学生成绩进行全面的分析描述。

标准差也称均方差,是各数据偏离平均数的距离的平均数,它是方差的算术平方根。标准差反映的是一个数据集的离散程度。标准差越大,表明这组成绩的偏离平均数的程度越大,标准差越小,这组数据偏离平均数的程度越小,即分布的差异越小。Excel提供了用来估算样本标准差的函数STDEV。

我们对实例使用的四级成绩数据进行统计量分析截图如图2所示。可以看到本次四级模拟成绩的平均分数为379.08,低于总成绩的60%。教学实践表明,如果平均分低于总分的60%,则说明试卷较难或者学生水平较低,在60%到80%之间,说明学生整体水平基本合格,80%以上则说明试卷较易或者学生整体水平较高。本次四级模拟的总成绩为710,平均分是低于总成绩的60%(426),说明参考学生的水平较低,应加强英语学习,同时本次试卷略偏难。

在差异量数计算中我们可以看到,本次考试成绩的标准差为59.16,数值较大,说明参考学生之间的差异性较大,即学生成绩的两极分化较为严重。

三 试卷质量分析

试卷质量分析是分析考试可靠性、有效性的基本方法,是促进考试工作,提高试卷和试卷编制质量的基础,是反馈教学信息,改进考试工作的有效途径。试卷的质量标准为准确可靠、切实有效、难易适当和鉴别能力强,一般用信度、效度、难度和区分度等度量值来描述试卷的质量[7],我们同样可以借助Excel工具对试卷的质量进行定量分析。

1 信度分析

考试信度是反映考试可靠性的重要指标,即检验能否真实反映学生水平程度的数量化指标,它描述的是考试的误差的大小。在教育统计学领域,最常用的求解考试信度的方法是 x系数法。

其中,分子 表示的是每一大题得分的方差,分母 代表是试卷总分的方差,n代表的是试卷的大题数目。我们在Excel中计算了示例使用的某大学四级模拟考试的信度。考试信度 的计算使用到Excel内置的计算方差的函数VAR。使用该函数可以方便地计算试卷总分的方差和每一大题的方差。实践表明,对于正规的大型考试其信度一般要求在0.9以上。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

2 效度分析

效度是衡量试卷质量的另一个度量,效度描述的是试卷考试结果的有效性或正确性,效度较高的试卷能够较准确地测出学生掌握知识情况的真实程度。

效度是测量学上的定义,确定效度一般是通过计算两门性质相近的学科成绩的相关系数或者同一学科两次考试成绩的有效性,由于本文中实例只是单次单科考试,因此不对试卷效度进行演示分析。

3 难度分析

难度就是试卷的难易程度,有多种方法对试卷难度进行评定,基于我们示例所用数据考生人数较多,本文使用分组平均分系数来描述试卷难度。首先将学生的成绩由高到低排序,然后把成绩最高的27%的学生定义为高分组,把成绩最低的27%定义为低分组,分组平均分难度系数的公式为:

其中 为高分组的平均分数, 为低分组的平均分数,W则为试卷的总分。

平均分难度系数的计算在Excel非常的简单,仅仅涉及到简单的排序和求平均值运算。

试卷的难度系数根据考试的目的而定,一般来说,难度系数在0.7以上的为较易试卷,在0.4和0.7之间的为中等难度,在0.4以下则为较难题。

4 区分度分析

区分度是指试卷对不同水平的学生加以区别的能力,又称为鉴别力。具有良好区分度的试卷,实际水平高的学生应该得到高分,水平低的学生应得低分。

区分度的计算取决与试卷的类型,对于客观题的区分度计算公式为:

其中Di为第i题的区分度,Wi为第i题的分数。

由于分数表录入了每一小题的分数,Excel对试卷区分度的计算也非常的简单和方便。一般认为区分度在0.4以上的试题为去区分性优良题,在0.3和0.39之间的试题为区分性良好题,位于0.2和0.29之间的为一般题,0.2以下的为劣等题。

5 实例分析

我们在Excel中对兰州理工大学四级模拟试卷进行度量计算,分析试卷的质量,在Excel中的结果截图为图4所示:

从图中可以看到,试卷的可信度偏低,难度适中、略难,区分度较差,这份试卷的质量一般,应注意调整试卷结构。

四 结语

本文利用MS Excel软件对学生成绩进行统计分析,同时对试卷质量在信度、效度、难度和区分度四个方面进行了分析评估。MS Excel软件普及性较高,简单易用,使广大教师在进行分数统计、试卷分析时更为高效、便捷。

参考文献

[1] Mark Warschauera and Deborah Healya. Computers and language

learning:an overview[J].Language Teaching,2009,(12):57-71.

[2] 李竹宁.试卷质量的统计分析与评价[J].教学与管理, 2006,(12):60-62.

[3] [OL].

[4] [OL].

[5] Excel2003/2007公式与函数的使用艺术[M].北京:中国铁道出版社,2009.

[6] 宋.基于数据挖掘技术的学生成绩分析[D].重庆:重庆师范大学,2009.

excel数据分析篇11

关键词: 药动学; 数据分析; Excel; PKSolver 1.0

目前在药动学数据处理方面有很多专业软件可供选择,如使用最为广泛的WinNonlin和3P87/97程序等,使用这些功能强大的专业软件,即使是常规的药动学数据处理,也要进行复杂的操作,而大部分新药研究部门的科研人员往往畏惧于学习专业软件的操作和设置。Excel是使用最为广泛的统计软件,具有界面明晰、操作方便的优点,本研究在充分挖掘Excel的VBA编程语言的基础上,完全以Excel为平台,编制了药动学数据分析程序――PKSolver 1.0。同时,参照国内外权威药动学数据处理程序的结果,对本程序的药动学数据计算能力进行了评价,程序操作极其简单。程序的编制扩展了Excel在药动学数据处理中的应用,对于扩大药动学基础理论的实际应用,提高基层药动学研究水平具有一定的参考意义。PKSolver 1.0程序目前共包括10个模块,分别为静注1室、静注2室、静注3室、非脉管1室、非脉管1室(有时滞)、非脉管2室、非脉管2室(有时滞)、非房室模型分析、生物等效性分析(双交叉)以及缓控释制剂体内外相关分析。限于篇幅,本研究以静注2房室模块为例,简要介绍本程序的设计思想及编写过程。

1 材料

11 软件 Microsoft Excel 2002(Microsoft Corporation); 3P87(The Chinese Society of Mathematical Pharmacology); WinNonlin 4.1(Pharsight Corporation).

12 数据选自文献[1]中某药物静脉推注给药后在不同时间点测得的血药浓度时间数据。

2 方法

21 程序的编制

211 操作运行界面的设计 本程序运行界面主要包括4个部分,分别为数据输入区、结果输出区、操作设置区以及图表输出区。以静注2房室模块为例,程序运行界面如图1所示。其中数据输入区、结果输出区以及图表输出区的设置较简单,分别利用Excel程序的内置函数和图表向导即可完成,不再赘述;操作设置区是控制程序的主要部位,通过在Excel中添加按钮、按钮选项、组合框、文本框等控件,利用这些控件可以方便的进行药动学参数的选择和设置,并调用后台程序进行数据处理和结果输出。

212 前台数据的计算 利用Excel的内置函数和单元格引用,可以在操作界面上直接计算出很多中间参数,如“ln(实测浓度)”、“预测浓度”、“ln(预测浓度)”、“残差”以及“权重”等,程序可以在后台直接调用这些中间参数,运用VBA程序进行模型的拟合和优化,大大提高程序的运行效率,这种“前后结合”的数据处理方式可部分提高程序的运行效率。

213 优化过程的VBA程序编写 利用VBA语言编写大部分优化计算过程是本程序的一个特点,尽管各个模块的数据处理过程各不相同,但总的来说,每个模块的后台数据处理都大概分为以下几部分内容:①输入数据的基本合法性验证。主要包括有输入时间点的顺序是否合法、药物浓度时间点的个数是否足够用于相应房室模型分析、药物浓度时间数据是否配对、是否出现不符合实际情况的数值(如负值或者非数字型字符)等等;②待拟合参数的初始值计算及初始值的合理性验证。参数拟合结果除与优化方法有关,更重要的是拟合参数初始值的选取,选取恰当的初始值不仅仅能够加快拟合速度,还能够避免拟合过程中的溢出现象。为获得相对准确的初始值,本程序的编制过程中进行了大量的尝试和改进,除运用最为经典的残数法估算初始值外,在非脉管给药房室模型分析模块中还采用了一些经验设置,能够较快地获得非脉管给药模型参数的初始值。同时,本程序还对计算得到的初试值进行合理性验证,并根据验证结果进行参数拟合或者针对数据特征向使用者提出建议,进一步提高模型拟合的成功率;③参数拟合优化。该部分是程序参数求解的核心部分,以计算的初始值为基础,Excel自带的SOLVER加载宏为主要工具,基于GaussNewton迭代的寻优法为核心算法,进行参数的优化求解,为避免出现拟合结果数学上最优,但实际药动学上不合理的情况(如负值参数的出现)。在拟合过程中,对所有参数的结果以及参数间的相应关系进行了相应的规范和限制,从而保证拟合出符合实际情况且数学上最优的结果,最后对优化结果进行合理性验证;④二级参数及模型判据的求解。根据输入的药动学参数、设置的参数单位以及拟合得到的一级参数,求算出15个二级参数,其单位设置和计算公式参见文献[2],9个模型判据按文献[3]公式计算,分别为r、SS、WSS、R2、WR2、Rsq、S、AIC、SC,所有二级参数和模型判据均在程序后台调用Excel内置函数计算。

图1 PKsolver 1.0药动学数据分析程序运行界面 略

214 输出报告的程序编制 好的程序应具有友好的操作界面和简单的使用方法,利用本程序求得所有参数后,只要在运行界面上点击“报告输出”按钮,即可通过后台启动Microsoft Word应用程序,新建Word文件,并自动生成完整的数据分析报告,报告生成速度快且操作简便。

215 其他模块的编制 本程序中7个药动学房室模型分析模块的编制思路基本一致,非房室模型分析、生物等效性分析以及缓释制剂体内外相关性分析模块则根据相应内容进行编制,限于篇幅不再详细介绍。

22 程序的验证由于程序的模块较多,仅选取其中的代表模块,列出其计算结果进行评价,选取文献[1]中某药物静脉推注496mg给药后在不同时间点测得的血药浓度时间数据,分别用3P87、WinNonlin和本程序采用2室模型以1、1/C、1/C^2为权重进行模型拟合,所得结果用于评价本程序计算的二级参数。另外,用三种软件对此数据分别进行静注1室、2室、3室模型3种权重进行模型拟合,计算AIC值,用于评价本程序计算所得房室模型判据。用PKSolver程序进行模型拟合和参数求解时,仅需输入“时间血药浓度”原始数据,在操作设置区中设置好相应参数,点击“参数求解”按钮即可完成所有参数的自动求算,再点击“报告输出”按钮即可以生成完整的报告文件。

3 结果

对文献[1]数据分别采用3P87、WinNonlin和本程序进行房室模型分析的所有结果见表1和表2,三种程序对数据的拟合结果显示该程序在房室模型参数求算和模型判别上均和权威药动学软件非常接近,所求参数基本一致,应用本程序进行简单的药动学数据分析具有一定的可靠性,分析结果基本准确。利用VBA语言编程能够省去大量的繁琐操作,用计算机代替手工操作,将VBA语言编程应用到药学数据处理方面的报道甚少[4],本研究尝试将VBA语言编程应用于药动学数据处理,取得了预期的效果。

表1 3P87、 WinNonlin、 PKSolver对文献[1]数据按静注二室模型拟合结果的全面比较 略

表2 3P87、 WinNonlin、 PKSolver对文献[1]数据按不同模型拟合AIC判据的全面比较 略

4 讨论

41 程序的核心原理和优点利用本程序进行药动学数据分析的核心是首先通过前台界面输入数据并进行自动初步计算,然后在后台对数据进行一系列合理性验证、参数优化求解、计算二级参数、输出最终结果并自动生成报告文件,所有操作仅需点击两个按钮即可完成,操作非常简便。本程序完全基于Excel程序内置的VBA语言编制,利用Excel强大的数据处理能力和自动作图功能,将Excel应用于药动学数据分析,取得了较好的结果。如表3所示,与国内外常用的药动学数据处理程序相比,本程序具有界面友好、体积小巧、操作简单、结果输出直观方便等特点。特别是本程序充分挖掘了Excel编制宏程序的自动操作潜力,代替手工操作分析数据,将一系列药动学数据处理步骤全部集中在一个按钮上由计算机一步完成,不仅极大的提高了使用方便性,还能避免由于手工处理数据可能带来的错误,这在生物等效性分析和缓释制剂体内外相关性分析模块中表现尤为突出,这也是本程序优于一般药动学处理程序之处。

表3 国内外主要药动学数据处理软件部分功能特点的比较 略

42 程序的改进本程序在模型参数的优化时仅能使用GaussNewton迭代寻优法和共轭法两种方法,运用直观简洁的Simplex法或者Marquardt法[5]进行参数优化的VBA程序正在开发之中。另外,PKSolver 1.0目前的版本仅包括最常用的10个模块,更多的药动学数据分析模块正在开发之中,相信通过进一步优化算法、增加模块有望使本程序的数据分析能力不断完善,从而为药学工作者提供一个操作简单的智能化药动学数据处理程序。致谢: 感谢美国Pharsight Corporation提供药动学软件WinNonlin 4.1试用版!本论文在软件试用期内完成,我们正考虑通过申请PAL (Pharsight Academic License)计划获得软件注册。

参 考 文 献

1 Gabrielsson J, Weiner D. Pharmacokinetic and pharmacodynamic data analysis:concepts and applications. Stockholm, Sweden: Swedish Pharmaceutical Press, 1994,129.

2 Gibaldi M, Perrier D. Pharmacokinetics, 2nd edn. New York: Marcel Dekker, 1982,2~108.

excel数据分析篇12

一、统计学教学面临的困境

就目前来看,有一部分同学进入大学校园,数学是其中的一门弱势学科,统计学的一部分计算以数学为基础,很多学生对统计学的学习产生了畏惧心理,从而忽视了这门实用性较强的学科。在现行的高职统计学的教学过程中,理论讲述,公式推导占据了很大部分的比重,案例较少,学生感觉比较枯燥,统计计算仍以_手工计算和半手工的计算器为主,从很大程度上挫败了学生学习的积极性。如果把EXCEL应甩到统计教学当中去,就会把复杂的问题变得简单,解决了同学们在计算上的软肋,提高大家的学习兴趣,会达到事半功倍的效果。

二、利用ExCEL作为统计学学习工具的优势

首先EXCEL软件安装简单,便于操作。对于EXCEL来讲,是常用的办公软件,安装便利,在学生进入大学阶段之前就已经接触EXCEL并且已经具备一定的基础。在大一的上半学期,很多同学就对EXCEL进行过详细系统的学习,相比SAS,SPSS这些统计软件来讲,EXCEL软件更加容易被学生接受。

其次EXCEL具有强大的数据分析功能。Excel提供了多种数据分析手段,从函数、分析工具库、加载宏等,一直到数据透视表和数据透视图。让我们对数据进行归纳后,能够利用这些函数和图表对数据进行分析,有利于提高学生的数据分析能力。

三、EXCEL在统计教学中的具体应用

(一)EXCEL主要的统计功能

1.图表功能

EXCEL总共包括了14种类型的图形,包括柱形图、条形图、折线图等,图表具有较好的视觉效果。

2.数据分析工具

在EXCEL数据工具分析库中,有19种数据分析工具,这些统计分析工具,使EXCEL具备了专业统计分析软件的某些功能。

3.公式与函数

函数的使用,提高了运算速度,EXCEL提供了涉及不同领域的函数,使用函数进行运算可以提高运算速度和准确度。

4.VBA编程

可以利用VBA宏语言进行编程,自行撰写函数公式,为特定的任务制作方案。

(二)EXCEL在统计学教学中的应用实施

整个统计研究的全过程分为四个基本环节:统计设计,统计调查,统计整理,统计分析。其中统计设计贯穿于各个统计环节当中。作为统计学教学来讲,一般统计学的教学就是按照各个环节的展开,而EXCEL在统计调查,统计整理和统计分析的过程中都有所涉及。

统计调查阶段是统计工作的起点,其主要任务是收集反映调查单位特征的数字和文字资料的工作过程。我们可以把搜集到的原始资料采用EXCEL的形式进行记录,这样比较直观整齐,因为EXCEL可以实行自动快速的统计,我们可以利用求和、计数、均值、最大值、最小值等自动计算功能进行计算。统计调查一种常用的方法是问卷调查法,我们可以把我们设计的问卷录入EXCEL,对各选项进行编码,便于以后利照EXCEL的编辑替换,以及数据透视表透视图等功能对问卷进行整理分析。

在统计整理阶段,最常用的功能是统计图的编制,统计图具有形象直观、一目了然的优点。我们可以把原始数据输入电子表格。在插入菜单中选择图表选项,然后选定图表类型,确定数据范围,经过一系列的调整,得到自己心仪的图表,减少了手工绘制的麻烦。

在统计分析阶段,EXCEL的应用更加的广泛。首先对于静态指标的计算尤其是平均指标的计算,函数功能在此显得尤为重要,我们可以利用AVERAGE函数来计算算术平均数,利用HARMEAN函数来进行调和平均数的计算,利用MEDIAN进行中位数的计算,利用STDEV进行样本标准差的计算,大大提高了计算的效率。同样EXCEL的公式与函数功能可以很好地应用于动态分析,指数分析,以及抽样推断中。

EXCEL在统计学教学当中有着非常重要的作用,把EXCEL适当的应用于统计教学当中去能够大大提高学生们的主观能动性,提高学习效率,使学生能够利用现代分析工具对社会现象的发展变化情况进行分析研究。

参考文献

友情链接