信息分类标准合集12篇

时间:2023-08-12 08:25:21

信息分类标准

信息分类标准篇1

信息科学是以信息为研究对象,以计算机、网络、通信等技术为研究工具,以扩展人类的信息功能为主要目标的一门新兴的综合性学科。信息技术在医学领域的应用称为“医学信息学”,主要通过一些软件的开发和应用来实现临床诊疗过程的计算机管理、控制、数据交流和分析以及决策支持等功能,常见的有医院信息系统、电子病历、图像处理、知识与决策支持系统、远程医学系统等。随着医学信息学的发展和医院信息系统的普及,医院之间的信息、数据交流与交换的需求不断增加,信息的标准化已成为医学信息界所面临的一个重要课题。

1 标准化与信息化

标准是以科学、技术和经验的综合成果为基础,并以促进最大的社会效益为目标制定的一种“共识”;根据其适用范围、作用对象和性质的不同,分别有国际标准、技术标准、卫生标准等很多种类。标准化的实质是“通过制定、和实施标准,达到生产、流通的统一”,而标准化的目的则是为了“获得最佳的秩序和社会效益”[1]。

医学(或医疗)信息标准的制定和标准化的实施是实现医学信息网络化和确保信息、数据交流以及资源共享的基础。医学信息的标准化主要包括两方面的内容,一是术语的标准化,二是交换技术的标准化。医学术语的标准化,主要包括信息的分类与编码、医学术语和专用词汇的标准化;而交换技术的标准化则是对网络信息交换和流通的一种规范[2]。

由于缺乏客观、规范的标准以及临床诊疗信息的主观性特点和个性化倾向,目前的中医信息化发展整体上还相对落后于西医,尤其是很少涉及到日常的诊疗活动。因此,中医临床信息的标准化建设是实现中医临床信息化的重要前提条件[3];而信息分类则是中医信息标准化建设中一项重要的基础性工作。

2 中医临床信息分类标准的框架设计

信息分类是标准化工作的基础,是统一和交流的前提。准确地界定中医临床信息的范围并对其进行符合中医临床诊疗特点的分类是制定中医临床信息标准和中医临床信息标准化建设的一项重要的基础性工作。基于对中医临床诊疗过程和特点的分析,我们对中医的临床诊疗模式进行了归纳和概括(见图1),并在此基础上设计、制定了以理、法、方、药为中心的中医临床信息分类框架(见图2)。同时参考和借鉴现代医学的临床信息分类,将中医的临床信息重点划分为患者信息、诊察信息和治疗信息三大类。

其中患者信息主要包括4个部分:①个人基本信息,如姓名、性别、年龄等基本情况;②病情及症状,主要是患者的主诉及对症状描述;③中医特色信息,如生活、居住环境,个人生活习惯,体质等;④相关现代医学信息,如疾病史、既往史、家族史、过敏史以及现代医学的疾病诊断、相关检查结果和数据等。诊察信息主要包括望、闻、问、切和辨病、辨证分析。治疗信息则包括治疗大法、方药、针灸、按摩等药物、非药物治疗及生活指导、注意事项等内容。目前,基于上述分类的中医临床信息及相关内容的细化和完善工作正在逐渐展开。

3 讨论

中医临床信息标准化研究的主要内容是对中医临床信息、数据等进行适合于计算机处理的标准化作业。准确界定中医临床信息的范围是进行中医临床信息分类和设计、制定中医临床信息分类标准框架的前提和基础,也是本研究的重点和难点。

辨证论治是中医临床的主要特征,理、法、方、药则是辨证论治的核心内容。因此,以理、法、方、药为中心的中医临床信息分类标准框架设计基本上可以如实地反映中医的临床诊疗特点和过程。在“理、法、方、药”四大项目中,涉及“理”的部分最为关键,是全面地获取患者信息并准确地进行辨证以及确定治疗原则和选择相应方药的基础环节。由于其中既包含了四诊八纲、内外妇儿等中医诊察以及辨证、辨病等临床内容,也涉及到阴阳五行、脏腑经络、病因病机等基础理念,所以从某种程度上讲,所谓的“中医临床信息”实际上几乎涵盖了所有的中医知识和内容。此外,从目前的临床实际情况来看,中医的日常诊疗活动当中已经不可能不涉及到现代医学的内容,特别是邀请北京各大中医院院长和档案管理专家的两次咨询活动更使我们对现代医学的影响范围和程度有了进一步的了解。是否或如何将现代医学的相关临床信息融入中医的临床信息分类是本课题需要解决的另一个关键问题。

考虑到中医临床信息标准化工作的必要性和紧迫性,本研究将重点锁定在中医临床信息分类标准的制定上,基本上没有考虑现代医学的诊疗信息对中医辨证论治的直接影响。而对于所涉及到的现代医学相关诊疗内容和临床信息,将单列一个项目,并按照现代医学的术语标准加以记述。医学信息的标准化是医疗信息系统网络化发展的必然要求,构架既可充分体现中医自身的特点又可实现与世界先进水平接轨中医临床信息分类标准,则是完善中医临床信息规范,促进中医临床信息和经验的交流,实现资源共享和信息化发展的重要基础性工作。

参考文献

信息分类标准篇2

一、引言

XBRL自1998年由美国注册会计师Hoffman提出思想框架以来,XBRL在国际上已经获得了迅速发展,多个国家、机构及组织已经实施或正在推行XBRL的应用。分类标准的制定对于 XBRL 财务报告的披露起着规范与模板的作用,其质量直接影响着财务报告信息质量。关于分类标准中标准元素是否能满足上市公司披露需求和是否能有效率地表达财务信息一直是分类标准制定者、XBRL财务报告报送主体、信息披露监管者、信息披露中介乃至投资者都关注的问题,同时也是学术界关注的问题。基于上述的问题,本文主要从完备性和效率性方面对分类标准进行研究。

二、样本选择

本文采取了抽样研究的方法,抽样的总体是2011年上交所所有的A股上市公司。按照10%的抽样比例,以10为步长进行系统抽样。依据中国证监会《上市公司行业分类指引2001》所列的13个行业门类,剔除金融类企业,最终得到本文的93个样本。本文选取货币型财务信息,是因为货币型财务信息为财务报告最基本、最核心的信息,规范易于企业填报而较少出现歧义。并且,大多数企业按照统一规范表格填制财务报表正文,对于正文内容研究意义不大,因此本文仅选取财务报表附注中货币型财务信息作为研究对象。

通用分类标准采用财政部2010年的《企业会计准则通用分类标准》。该标准共计元素2984个,分为13种元素类型。在XBRL报表中表达货币型财务信息的元素是由货币型和Member型元素组成。在1464个货币类型元素和301个Member型元素中,剔除非报表附注元素、金融相关行业元素及首次执行会计准则企业元素。其余元素中,剔除单独列示在财务报表中的元素,得到本文研究对象元素,即非金融行业的附注货币型元素903个,Member型元素300个。

三、研究方法

本文采用人工翻阅公司年报,提取货币型财务信息并与分类标准元素逐一匹配的方法。本文收集了这93家样本公司2011年财务报告附注中的84个报告子项目的披露的货币型财务信息,根据财政部2010年的XBRL通用分类标准对具体披露内容进行判断匹配,匹配成功记为1分值。

四、研究结果

(一)效率性

分类标准的效率性即制定的元素冗余最小,是指分类标准应该在尽量满足企业对于财务信息披露需求的前提下,减少分类标准中的低使用率元素和关系(冗余元素),提高元素使用率。

研究结果表明,企业使用通用分类表中元素总数为1057个,其中Member型元素246个,占分类标准中元素的82%;货币型元素811个,占分类标准中的89.81%。通用分类标准元素制定在效率性方面较好,整体使用率为87.86%。

(二)完备性

分类标准的完备性是指标准体系中所含元素应尽量全面,能覆盖企业对于财务信息披露的所有需求。完备性不足体现在企业报表中披露的财务信息无法在分类标准中找到对应的元素,即分类标准中制定的元素存在不足。

企业因实际需要未能在通用分类标准中找到对应元素而进行元素扩展,共扩展标准未定义元素1145个。整体扩展率(扩展率=扩展元素/总元素集合)为48.76%,其中Member型元素扩展率为54.55%,货币型元素扩展率为46.50%。结果表明,通用分类标准的完备性方面还有很大的改善空间。

五、结论

通过实证研究方法,从通用分类标准元素完备性与效率性两方面,探究通用分类标准是否能满足企业信息披露需求。整体而言,现有通用分类标准元素制定效果在效率性方面较好,但在完备性方面较欠缺,存在本文提到的元素冗余与元素不足的问题。一方面,超过十分之一的元素从未被采用,另一方面,企业需要外扩展更多的通用分类标准未定义元素来满足自身信息披露的需求。通用分类表中在完善过程中应补充不足的元素以提高完备性,同时应剔除冗余元素从而提高效率性,更好地满足企业信息披露的需求。

参考文献

[1]张天西.网络财务报告:XBRL 标准的理论基础研究[J].会计研究,2006(9):56-63.

信息分类标准篇3

[中图分类号]P2[文献标识码]A[文章编号]1007-9416(2010)03-0075-02

企业信息化建设的根本目的就是要实现企业信息资源的共享,提高整个企业的信息沟通和业务协作能力,全面提升企业核心竞争能力,确保企业市场竞争优势和长期可持续发展,而企业信息系统如果没有一个统一的编码标准,信息就不能实现共享,搞好企业信息化建设也就无从谈起。在工业社会中,信息分类和编码是提高劳动生产率和科学管理水平的重要方法。美国新兴管理学的开创者莫里斯L・ 库克(Morris L・Cooker)说:“只有当我们学会了分类和编码,做好简化和标准化工作,才会出现任何真正的科学的管理”。在信息化时代,信息的标准化工作越来越重要,没有标准化就没有信息化,信息分类编码标准是信息标准中的最基础的标准。

几年来,我厂的信息化建设取得了长足的进步,以数据库为基础的各类信息应用系统在厂、矿、队各层次间,生产管理、地下分析、地面工艺配套各系统间发挥了越来越重要的作用。由于历史的原因,各应用系统根据自身需要制定应用了很多编码,各专业间重复编码,同一信息在不同的应用系统中编码歧义,跨专业交换信息困难的问题普遍存在,阻碍数据库信息进一步开发利用。油田公司在2003年颁布的信息编码标准,同样未在油藏、工艺、地面工程信息交换上进行充分考虑,面对现场复杂,新技术、新工艺的不断出现等实际情况估计不足,作为宏观指导标准缺乏针对性。因此建立统一、协调的、站在全厂油田开发全局高度的、完整的信息编码体系,实现信息的横向、纵向充分共享是十分必要的。

1 信息编码数据库化管理体系的主要研究内容

进行信息编码数据库化管理体系的研究与应用,就是要从油田信息化建设的基础工作入手,修订、完善、统一采油厂油藏、采油、地面工程等各专业信息编码标准;应用数据库技术建立标准的信息编码字典库;提供分布式的信息编码维护管理软件工具;实现厂内各层次、各应用系统数据采集、数据管理、数据应用标准的统一。

2 信息分类编码标准制定的原则

2.1 科学性

分类编码的科学性是分类编码体系赖以生存的基础。为了保证分类结果的科学性和持久性,不能把非本质的和不稳定的特征作为分类编码的依据。为此在制定分类编码标准时必须对油田的生产过程和管理活动有深入的理解和认识。

2.2 惟一性

信息分类编码必须惟一表示它所表示的对象或对象集合。无论一个还是一组客体,在标准化代码中都应该有且仅有一个确定的代码与其对应。如果一个客体有两个以上的代码就会在信息的表达与交换工作中引起混乱。某些特殊情况必须用两个以上编码表示同一客体时,要加以特殊的标志与说明。

2.3 可扩展性

分类编码应满足事物的不断发展和变化的需要,不应出现无法使用该编码系统完整地处理信息的现象。通常要在相应位置设置一个其他类别的特殊编码,当客观事物没有对应的编码时,可以将其归于其他类编码。同时要考虑新出现的编码对象与已编码的对象之间的顺序关系。

2.4 稳定性

分类编码一旦确定下来形成标准,将会在实践中推广运用。分类编码的变动将会造成人力、物力、财力的浪费。因此分类编码时,应考虑最少变化的可能性,尽可能保持分类编码系统的相对稳定。

2.5 合理性

信息编码是在信息分类基础上建立起来的,代码的结构应与分类体系相适应。如采用线分类法分类形成的树型结构,进行编码时也应通过代码体现出同样的层次关系。

2.6 简短性

信息分类编码应尽量简单,长度尽量短,这样既便于手工处理,减少出错率,又可节省机器存储空间,保证分类编码的可扩展性。

3 建立长效机制管理维护信息分类编码标准

任何一个标准的制定都不会一劳永逸,标准需要不断地维护才能满足事物不断发展变化的需要。信息分类编码对象是不断发展变化的,信息分类编码标准也应随之更新完善。因此,信息分类编码标准的开发及发展完善是项长期的工作任务,需要建立起稳定的工作组织体系,才能保持标准体系及分类编码标准的实用性。同时应当制定出一套包括意见收集、编码起草、修订维护等环节的工作制度,利用信息技术手段建立起快速响应机制,确保信息分类编码标准能够持续扩充、补充完善、保持实用。

3.1 组织评审,批准下发执行

代码编制完成后,一定要形成规范的文档资料,由信息中心组织有关业务人员进行严格的审查评议,最后形成一个切合实际便于应用的代码表,由有关职能部门作为企业标准正式下文执行,一旦下文认定后,相关的应用应严格照此执行。

3.2 代码维护管理是信息编码标准化的重要环节

标准制定、贯彻实施、维护管理构成了标准化活动的三个不可分割的组成部分,信息编码维护软件的开发,为编码的维护管理提供了方便快捷的工具。

信息分类标准篇4

中图分类号:TP391 文献标识码:A

0引言

随着信息化的发展,信息管理在项目管理中越来越重要,不同种类、不同数据格式信息的交流已经成为工程项目管理的一项关键工作。

工程项目规模大、周期长,在管理过程中需要处理大量的信息。如果缺乏统一标准,信息格式各异,必然给信息交换、资源共享带来不便。因此,应建立科学、合理的信息标准,对这些信息进行分类、存储、综合利用。如果是对大型工程项目或多个工程项目进行管理,这一点尤为重要。

工程项目是一个复杂的系统工程,是由多个参与方协同工作完成的。信息资源共享是各方协同工作的前提,信息资源共享要通过信息系统集成实现,而信息系统集成的实现依赖于信息标准化。可见信息标准化是信息系统集成和信息共享的前提,关系到工程项目能否高效率的完成。

1 工程项目管理信息标准化

1.1 工程项目管理信息

在工程项目的实施过程中,要管理产生的各种各样的信息,包括:(1)结构化的数据文件,这类信息可存储在数据库或特定的应用软件中,例如工作分解结构WBS、成本费率、进度计划、人力资源信息、财务会计信息;(2)非结构化的文本信息文件,例如合同、技术规范、变更令、施工报告、会议记录;(3)非结构化的图形文件,例如各种2D和3D的图纸;(4)非结构化的多媒体文件,例如各种图片、声音、影像文件。

1.2 工程项目管理信息标准化

工程项目管理信息标准化包括三方面的内容:信息格式标准化、信息传递标准化和信息管理标准化。

(1)信息格式标准化。信息标准化是信息化的基础,而信息格式的标准化则是信息标准化的基础,也是工程项目各参与方进行信息共享、综合利用的前提。要实现工程项目信息格式的标准化,就要对工程项目管理中的信息进行统一分类编码。对于结构化的数据,要定义标准的数据元素编码,即数据标准;对于非结构化的文件、图纸等信息,则必须规定标准的分类编码格式。

信息分类编码的方法有很多种,如人流分类编码、物流分类编码和信息流分类编码等。人流分类编码适用于工程项目人力资源管理的信息编码;物流分类编码适用于工程项目物资采购管理,工程项目信息分类编码中最常用的是信息流分类编码。

需要特别指出的是,必须为每组编码涉及的信息建立标准索引,如项目编码索引(这对于多项目的管理尤其重要)、组织编码索引、专业编码索引等,而且必须保证索引的一致性,随着工程项目的进展及时更新。

(2)信息传递标准化。在建立了标准化的信息格式后,对工程项目产生的信息,必须规定标准的传递程序,使项目信息能够准确、高效的在各个参与方之间进行传递、交流,保证信息的资源共享和项目的高效完成。从信息的产生,到不同接收组织或个人间的流转,直到信息存储的整个信息传递路径,构成了标准化的信息传递程序。对工程项目实施各个阶段产生的信息,都要建立标准化的信息传递程序。

(3)信息管理标准化。在建立了标准化的信息格式和传递流程后,必须严格按照规定执行,加强对工程项目信息的标准化管理。首先,应充分认识到标准化的信息管理在整个工程项目建设中的重要意义,在工程项目建设初期就应该设立信息管理的专职部门,负责项目信息标准的统一规划,制定项目文件信息管理程序,建立规范的信息控制与文件管理体系,同时由专人负责进行不同信息的收集、整理、分析、利用。其次,应该加强项目信息标准化管理的监督,通过项目信息管理制度保证信息标准格式、信息标准程序的严格执行,从而促进整体项目管理的标准化、程序化、规范化。为了提高工程项目信息管理的标准化程度,应对工程项目的信息进行分类管理。参照Mc-GrawHill Construction公司的项目管理手册,工程项目的信息可以按照如下方法分类:

项目信息:所有与项目有关的信息都在项目信息中归档管理,负责该项目的项目经理应该编制的项目信息包括进度信息、费用信息、质量信息、往来信函、图纸、合同、变更令等。

核心信息: 从项目信息中划分出职能部门和项目的核心信息,指派专门人员进行管理,定期将核心信息文件归档保存。

受控信息:工程项目各参与方敏感的任何信息都应该视为受控信息,对其查阅、复制等操作应受到权限级别的严格限制。

2 工程项目管理信息系统

信息分类标准篇5

[分类号]TP393 G254

随着互联网技术的迅猛发展,Web2.0以应用的开放性、信息传播的交互性、读写并存的表达方式、社会化的联合方式和便捷化的体验方式,使得越来越多的网民参与到互联网信息的创造及中。然而,随着信息量的快速增长,由此衍生的信息杂乱无章、信息的纯净度和可信度大大降低、搜索引擎精准度下降等问题相继出现在互联网用户面前,网民越来越期待及时准确地获得切合自身需求的信息和知识,以及便捷的互动交流和信息的协同共享。面对这一问题,网络模式急需更新换代,能够为用户提供一种更加高效、精确和个性化的互联网平台的Web3.0模式成为首选的解决方案。

1 Web3.0及其特征

Web3.0是新一代互联网应用的统称,它是建立在Web2.0的基础上,包含了Web2.0的所有特点,但同时为了让人们更好地利用网络资源,Web3.0提供了一种方便管理、方便查找信息资料,能够自己控制一切的全新的服务:网站内的信息可以直接和其他网站相关信息进行交互,能够对多家网站的信息进行整合使用,并能根据用户需求,智能化处理互联网海量信息的整合,最终聚合用户个性化的需求,同时实现真正意义上的互联互通。总之,相对于Web1.0的“浏览和下载”、Web2.0的“参与、展示和互动”,Web3.0的核心理念是“个性、精准和智能”。其主要特征表现如下:

1.1个性化信息聚合

Web3.0最大的特点在于信息的聚合以及提供个性化的信息服务,真正的Web3.0时代不仅仅是按照用户需求提供综合化服务,创建综合化服务平台,更关键的是,把散布在互联网上的各种信息点以及用户的需求点聚合和对接起来,提供基于用户偏好的个性化聚合服务。

1.2信息检索的高精准度

Web3.0在对于UGC(用户生产内容)筛选性过滤的基础上同时引入偏好信息处理与个性化引擎技术,对用户的行为特征进行分析,既寻找可信度高的UGC源,同时对互联网用户的搜索习惯进行整理、挖掘,得出最佳的设计方案,帮助互联网用户快速、准确地搜索到自己想要感兴趣的信息内容,避免了大量信息带来的搜索疲劳。

1.3搜索引擎的智能化

Web3.0时代的网络是智能网络,这是一个以整个互联网为基础,聚合了所有知识的智能平台。在这样的平台上,用户可用自然语言表达自己的查询意图,搜索引擎能够对查询进行解析,提取相关概念,组合查询表达式,从而返回准确的结果;甚至,用户可以提出完整的问题,通过搜索获得一些问题的解决方案。

1.4多种终端平台、跨网站和跨语言信息交互

Web3.0不仅能够实现不同网站间的信息交互,而且还能实现不同终端的兼容。通过互联网与通信的融合,用户可以用所有智能终端(固定电话、移动电话、PC、IPTV以及其他智能终端)轻松享受看得见、听得到、用得好、即时交互的信息服务。另外,Web3.0的智能翻译引擎突破了国家、语言的限制,使用户用自己的母语可以与全世界所有人进行交流,实现了更大范围内的信息交流与共享。

2 分众分类及其特征

分众分类(Folksonomy)是随着Web2.0而产生的新型网络信息分类法,也叫大众分类、社会分类、自由分类等,它就是由网络信息用户自发地为某类信息定义一组标签(Tag)进行描述,并最终根据标签被使用的频次选用高频标签作为该类信息类名的一种为网络信息分类的方法。其实质就是以词为类,但其类目却是平面的、非等级的,它是用户用标签对感兴趣的资料进行分类,并与他人共享标签的过程和结果。

2.1分众分类的优势

与传统网络信息分类方法相比,分众分类最大的不同之处在于,它并不采用严格的分类标准,其分类全部由用户直接提交,分类的形成过程完全是自发的。分众分类的主要机制基于“开放性元数据标准”和“自然语言社群聚类”。其优势主要表现在:首先,分众分类的标签形成过程充分体现了其自由性,任何用户都可以自由选择自然语言语词来对感兴趣的资源进行标注,从而可以从多个维度来揭示信息内容;其次,分众分类具备实时性与适应性,用户可以随时对其阅读或创建的内容和主题创建标签,并立即保存下来,并被允许即时快速的进行标签用语的修改;第三,分众分类为用户提供了共享标签的功能,任何人对内容进行标注后,他人可立刻看到这些标签,也可以点击这些标签,进而看到更多使用这个标签的信息内容,或是与此相近的内容。

2.2分众分类的局限

作为使用非控词汇的分众分类目前还存在一定的局限性,具体表现如下:

2.2.1标签的多样性 由于用户认知程度不同,对同一事物的揭示程度也存在很大的差异,导致不同用户在标注同一信息时使用了不同的标签,但是系统却无法创建这些标签之间的联系。标签的多样性极大的影响系统的检全率。

2.2.2标签的模糊性 分众分类是一种基于标签语法层次的简单聚合分类,因此,同一标签可能映射出不同语义的资源,而系统却不能识别出各个语义的不同。标签的模糊性使用户不得不花更多的时间和精力找到与检索标签相关的记录,因而影响到系统的检准率。

2.2.3标签的扁平化组织 分众分类的组织方式与传统的等级体系分类法组织方式不同,它是扁平化的,没有等级层次的划分。因此,系统无法识别各个标签之间的等级层次联系。一方面,这种由于标签缺乏等级控制造成的信息分散也必然影响了信息的检全率;另一方面,类目的平面非等级显示同样会隐藏一些有价值的信息。同时,信息越多利用标签直接找到相关信息就越困难。

2.2.4系统间的交互性很低 很多网络系统都具有标注资源和分享标签的能力,但是目前各个分众分类系统在语义表达和格式规范上并不一致,这不仅阻碍了各个系统之间的信息交互和软件的自动化处理,同时也引发了一系列检索方面的问题。另外,受语言、文化背景等因素的影响,跨国界、跨文化的分众分类系统之间的交互性更低。

2.2.5标签问语义关系缺乏 分众分类是以高频标签作为类目的一种信息分类方法,其分类结构是平面的,标签间是平等关系,缺乏对标签间的层次体系关系、属性关系和其他的复杂语义关系的描述,而标签间语义关系的缺乏不仅影响到检索的精准度,更重要的是对智能化搜索带来诸多障碍。

3 Web3.0对分众分类的需求

Web3.0的基础是Web2.0,因而,分众分类也是Web3.0的一种主要的信息组织方式。但是目前分众分类所具有的上述局限性显然阻碍了Web3.0的核心理念――“精准、个性和智能”的真正实现,Web3.0的发展需求决定了分众分类的发展方向,因而,未来的分众分类还需要在以下几个方面进一步拓展。

3.1微内容的自由整合与过滤研究

微内容是Web3.0的基本信息单元,由于Web3.0同样具有草根性,其内容良莠不齐,有价值的专业分析讨论与各种杂谈闲聊掺杂在一起,因而首先需要对微内容进行筛选性的过滤研究。这部分的研究主要包括:研究分析用户的行为特征,寻找可信度高的微内容源;对微内容的价值进行判定,并按价值量的高低作不同处理;对垃圾信息进行有效过滤等等;其次,研究如何应用Mashup技术对用户生成的微内容进行整合,如何利用ONTO/RSS基础聚合技术对微内容进行有效聚合,从而使信息的特征性更加明显,为实现Web3.0的“个性化”打下基础。

3.2微内容的标准化与结构化研究

要实现Web3.0的跨平台、跨社区、跨语言的信息共享,需要对微内容进行标准化与结构化研究,提出一个通用的数据标准。这方面的研究主要包括微内容的拆分标准、属性选择、结构化表征、数据逻辑结构标准以及数据的存储结构标准等,其目的是使微信息之间实现互动,让Web完全可编程,从而满足复杂程序的需求,为信息在不同的应用平台之间的整合和传播提供支撑。目前,有关微内容的标准化和结构化的研究则仅限于企业网站的构建,如红门资讯在微内容的拆分、词义标准化和结构化等方面进行了深入的研究,其推出的公用信息平台已经实现了厂家信息、商家信息、品牌信息、文章信息等160多类信息平台间的自由互动。但目前整个IT行业中并没有一套完善的有关微内容的拆分、属性选择、结构化表示等方面的标准,这对实现整个互联网信息的无缝连接带来障碍。

3.3标注的规范控制研究

Web3.0核心理念之一是“精准”,而因为网络用户标注行为缺乏控制,导致标签的多样性、模糊性和随意性等缺点,进而影响到检索的精准度,因而需要对用户的标注行为进行规范性控制。主要研究包括:如何利用受控词表等对同义词、近义词、专有名词等进行限定,并构建规范的标引词库推荐用户使用;如何确定标签的含义以及标签间的关联,以帮助用户在创建标签时进行选择;如何利用后控手段对不断产生的大量标签进行筛选、融合和规范化处理,并将其与核心标签关联等等。其目的避免网络用户生产出各种错误的、无意义的、不规则的标签,从而提高标签系统的准确性、兼容性和开放性,以实现标签集合的移植与共享,促进不同网络信息系统对信息资源的协同组织。目前,国内外学者都对标签的规范控制研究显示出极大的兴趣,纷纷提出了多种规范标注行为,从而提高标签质量的解决措施,如有些网站在用户标注时提供一些规范词供用户选择,或对用户的标注结果进行词义转换等,但总的来说研究的系统性不够,其深度和广度都有待加深与拓宽,从而提高检索的“精准度”。

3.4标签的基本属性研究

标签是分众分类形成和使用的基础,也是分众分类类目体系的基本构成单元。标签指代并标示Web3.0环境中的各种微内容,通过查找标签能够检索到关联的微内容。因而,标签本身的相关属性决着信息检索的质量和效率,所以,需要对标签的特征、标签的价值判定(包括垃圾标签的处理)、标签使用量的分布规律、标签的赋予权、标签的翻译、标签库的构建等展开进一步的研究;同时,因为目前的标签比较侧重于横向关系的表达,而专业性、学术性信息的表达则需要纵向和横向两个方面的参照系,因而,如何加强纵向关系的表达,仍然有待于进一步研究。目前,对标签的特征、标签价值判定的相关研究比较多,而对标签使用量的分布规律、标签的赋予权、标签的翻译、标签库的构建等方面的研究相对较少。

3.5传统分类法与大众分类法的融合研究

分众分类是由网络用户的自发标引行为产生,尽管这在一定程度上体现了用户对知识分类的共性,但由于不同使用目的对信息的类分会使得相同的信息被划分在不同的类别中。这种平面胜的分类体系,既无法准确地表达出相关标签的层次,也难揭示出信息之间复杂的关系;另外,受大众浅层信息需求的误导,很多有价值的信息也容易被淹没。因而,分众分类的质量无法满足Web3.0检索精准度的需求。而传统分类法特别是文献分类法历史悠久,在一定程度上体现了知识分类的科学性。为此,应该将分众分类与传统分类法进行融合,以提高信息分类的质量和效率,如可先对选定范围内全部信息划分大类的基础上允许网络用户再进行知识细分。把众多的标签先按人为大类存放,既增强了标引一致性,又降低了平面非等级结构的标签所带来的检索难度。

3.6标签的聚类研究

由于分众分类允许用户使用不同的标签来标记相似的资源,但并不了解这些标签之间的关系,因而其内容检索机制受到严重的阻碍。为克服这一局限,有必要针对标签的统计学规律、标签间的共现分析、层次分析、标签与特定人和物的相关度、标签间的相似度比较等问题进行聚类分析,其目的是寻找相关标签群,从而形成立体的分类体系,并在此基础上展开标签关系库的构建研究。显然,这部分的研究有助于实现Web3.0的“精准”和“个性化信息聚合”。

3.7标签间的关联研究

Web3.0的特征之一是要让用户跨越不同的应用平台,并共享不同社区的信息资源,而这种信息的共享除了需要相关内容的标准化、结构化和规范化研究外,更重要的是通过标签的方式进行相互链接,现有的标签只能做到对站内的关键词进行关联,不同网站之间站信息没有形成真正的网络和关联,往往存在信息“孤岛”,常常要借助其他的搜索引擎,因而未来的研究应该着重予标签间关联的深化研究。一方面,研究同一网站中同一文本和不同文本间的所有标签之间的自动链接技术;另一方面,研究不同网站间标签的关联,从而在更大范围、更高层次上建立起词间关系网络,为实现Web3.0的“跨平台”信息交互打下基础。

3.8标签与本体的结合研究

本体是在语义网环境下为解决语义歧义、实现信息智能处理而提出的一种形式化描述的、共享的概念认知模型,它是对某一领域知识的规范化描述,不仅提供了概念明确的定义,而且揭示了概念问丰富的语义关系,使知识能够在人与人之间、人和系统之间以及各种异构系统之间进行广泛的共享和交流。显然,本体所具备的特性正好弥补了分众分类的许多不足,因而,需要充分挖掘标签间的语义关系,将标签与本体进行结合研究。具体研究包括:分析分众分类中用户、网络资源和标签三者之间的同现关系,对分众分类中的各种标签进行语义分析,研究标签之间的主题相关性,并给出这些标签间相互关系的明确定义,同时探讨如何基于标签的语义关系构建被标注对象之间的联系,并在标签中建立起概念层次,构建大众标注中各类标签词的本体,从而构成语义Web的基础,真正实现web3.0的“智能化”。目前,这方面的研究多集中在标签语义的提取、标签本体的构建等方面,并推出了多种语义标注平台。但是目前在大多数语义标注的过程中仍需要大量人工的辅助,标注平台的可用性、互用性、重用性和扩展性较差,需要进一步提高。

信息分类标准篇6

XBRL的作用:由于XBRL具有准确的财务数据录入、无须重复键入财务数据、快速精确地搜索信息、良好的动态分析功能、可扩展标记等优点.因此,基于XBRL技术的财务报告不仅能降低公司编制与财务报告的成本,还能提高投资者或财务分析人员获得信息的准确性,还是支持公司财务创新的有力工具。

二、XBRL 应用于会计信息质量存在的问题

(一)管理者对会计信息质量和XBRL 认识不足

有些管理者将会计电算化当作会计信息化,认为会计信息化就是利用计算机处理会计数据,以减少财务人员的工作量,提高劳动效率和质量。XBRL在我国的应用时间很短,企业经营管理者对XBRL的认识不足或只停留在表面上,不了解XBRL 的作用及带来的经济利益。有些管理者甚至不愿意应用XBRL 来提高财务信息透明度,害怕将企业内部控制的弱点暴露出来,使企业相关者的利益分配受到影响。

XBRL在我国起步于2003年,应用的时间还比较短,高校的相关课程的设置非常之少,XBRL的实际应用屈指可数。这样,在教育、宣传、推广都滞后的影响下,大多数企业对其认识不足。如果说有所认识的话,也仅仅停留在很浅薄的层面上。

XBRL是一门新技术,掌握和了解其特点和应用的财务人员在整个财务工作者中属于少数,如果企业决定使用XBRL,必定会对有XBRL相关知识的财务人员产生较大需求;此外,企业需要组织专门人员,针对本企业自身的特点进行需求分析和可行性分析,设计方便自身应用的方法,可能会涉及到企业财务和相关的业务流程改造、企业组织结构的调整等。这是给企业在实施XBRL时需要考虑的第一成本。

(二)制定XBRL 标准的国内专家很少

国内能够真正理解并且精通XBRL 标准的专家较少,很多研究者只是在理论上对XBRL 标准进行研究,不能将标准真正融入会计信息系统。国内第一个实际应用XBRL 标准的是上海证券交易所年报标准化报送系统。

(三)适合企业发展的XBRL 分类标准不完善

我国的《企业会计准则通用分类准则》自2011年颁布以来陆续在大型国有企业、上市公司及银行业等金融机构中实施,但目前还没有制定出完善的、适合企业发展的XBRL 分类标准。《企业会计准则通用分类准则》仅仅给出了工业企业会计报表的相关会计科目,而对其他行业没有给出适用的会计报表科目。

三、XBRL 应用于会计信息质量的对策

(一)提高企业管理者对会计信息化和XBRL 的认识水平

XBRL 意为可扩展的商业报告语言,它是以互联网联结为基础,运用XBRL 分类标准实现企业间信息的实时、准确、高效存储、操作、多用途使用与数据交换,使企业的内外部信息交流及整个商业活动形成一个无缝的信息传递网。

企业管理者不仅要理解和支持会计信息化,而且要高度重视和积极参与会计信息化工作,为建立基于XBRL 的会计信息系统提供保障。会计信息化是管理信息化的重要组成部分,企业在制定管理信息化总体规划时要考虑自身的实际情况和需要,制定科学合理的会计信息化发展规划。企业管理信息化和会计信息化是一项系统工程,将XBRL 融入会计信息系统,实现企业人、财、物的实时监控,做到人尽其用、财尽其利、物畅其流,对于企业经济效益的提高大有裨益。

(二)成立XBRL 分类标准研究机构

政府要尽快成立研发XBRL 分类标准的机构,加强对XBRL 知识的宣传和培训,为企业了解和学习XBRL 创造各种可能的机会。由于我国的会计准则、会计制度、审计准则是由财政部组织和参与制定的,所以最好由财政部带头研究XBRL 分类标准,以建立国内XBRL 分类标准中关于标准化的会计科目和报表项目,使会计科目、报表项目按照一定的标准规范表达,便于公司之间数据的转换。此外,财政部还应组织制定XBRL 分类文档翻译计划。XBRL 仅是一个电子财务报告文件的标准格式,不会改变会计准则,也不要求企业必须提供会计准则或会计制度规定以外的财务信息。因此,XBRL 分类标准的制定应由财政部门牵头,以适用的企业会计准则和会计制度为依据,制定出中文架构下的XBRL 分类标准。

信息分类标准篇7

[分类号]G307

1 信息与文献标准化的发展现状与形势分析

1.1 现状

1.1.1 成绩 全国信息与文献标准化技术委员会(以下简称技术委员会)于1979年成立。作为一个基础性的标准化工作组织,全国信息与文献标准化技术委员会从成立以来一直由国家标准化行政主管部门管理。其工作范围与国际标准化组织第46技术委员会“信息与文献工作”(ISO/TC46Information and Documentation)的工作范围完全一致。

近30年来,在原国家标准局、国家技术监督局、国家标准化管理委员会的直接领导下,在国内各有关单位、专家、学者的共同努力下,全国信息与文献标准化技术委员会按照国际标准化组织的工作体系,将我国原本相对独立的图书、情报、档案、出版系统,通过全国信息与文献标准化技术委员会的工作机制,建立了我国实现信息与文献工作统一、协调、共享的工作基础,为实现我国信息与文献资源的共享发挥了重要作用。

全国信息与文献标准化技术委员会成立后,制定并颁布了近50项国家标准。这些标准的实施为推动我国图书、情报、档案、出版行业的标准化、信息化建设做了大量卓有成效的工作。30年来,我们初步建立起了文献信息资源组织、加工、利用和服务的标准化体系,为上个世纪80年代以来我国文献数据库建设、90年代中后期的图书馆、文献中心的自动化建设以及数字图书馆建设奠定了重要的技术基础,这些标准在实现我国文献著录、文献检索语言和数据交换的国际化和标准化过程中发挥了积极的作用。

1.1.2 主要问题 近30年的实践使得我国的信息与文献标准化工作取得了实质性的成绩,这一点有目共睹,也一直为信息文献界称道。但依然还不能满足社会信息化的需求,特别是面对网络化数字化的环境,面对未来的发展,还存在一些亟待解决的问题,主要表现在以下方面:①网络环境下的技术标准建设相对滞后,传统标准数量多,适应网络环境的新标准数量少;②标准的功能配置不到位,某些数据交换类标准、通信协议类标准和检索语言标准缺乏一致性测试,一定意义上影响了标准的有效应用;③尚未健全科学合理的信息文献标准体系,一定程度上造成标准制定在总体结构上不尽合理,例如术语类、字符集类等基础标准和方法标准的数量少于某些专业标准。

1.2 形势分析与对策

1.2.1 信息与文献标准化的发展趋势 现代信息技术飞速发展的背景下,信息与文献工作的发展引发了标准化的新的发展趋势,主要表现在以下三个方面:①国际范围内的文献与信息资源共建共享已成为现实和可能,在网络环境下信息资源建设和组织已具有利用国际化成果的特点;②信息资源组织的标准化建设已经由传统的注重信息资源本身加工和描述的标准化发展到关注到整个生命周期的标准化建设;③新型标准化组织层出不穷,譬如W3C、FILE等,在信息与文献标准领域,“事实上的标准”、“论坛标准”、“合作体标准”异常活跃,有的已被国际标准化组织和发达国家(以美国和日本为代表)吸纳,形成国际标准和相关的国家标准。

1.2.2 应对策略 以信息内容为主要对象的标准化工作更需要:①跟踪国际标准化组织确定的技术体系,强调这一领域标准化工作的统一、协调和可持续发展;②在信息产品的整个生命周期中,从信息产品的生产、流通、加工到利用等各个环节都采用统一的标准,才能实现信息资源的共建与共享;③在文献与信息资源建设中,保持技术上和方法上的先进性与国际性,从而保障所制定标准更具有科学性和通用性。

面对新的形势,加快文献与信息标准体系建设显得十分迫切,它将推动国家在该领域整体信息化水平的提高。一个科学合理的标准体系是实施标准的重要保证,抓好标准工作,对促进信息与文献事业的发展、整体提升信息与文献工作的效率会起到事半功倍的作用。

2 信息与文献标准体系的相关研究

2.1 信息与文献标准体系的有关概念

2.1.1 标准 ISO和GB/T20000.1-2002对“标准”的定义是:“为了在一定范围内获得最佳次序,经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范行文件”。并加注“标准应以科学、技术和经验的综合成果为基础,以促进最佳社会效益为目的”。

由此,我们可以看出:①标准是一种规范性文件,与其他规范性文件不同的是必须协商一致并由公认机构认定;②制定标准的对象是共同的重复使用的事物或概念;③标准产生的客观基础是科学技术成果和实践经验的总结;④标准的本质特征是统一,它是由标准主管机构批准,以特定形式,共同使用和重复使用的统一规定。

2.1.2 信息与文献标准 综上所述,信息与文献标准可以理解为:以情报学、图书馆学的基础理论、技术、方法和实践经验的综合成果为基础,对于信息与文献工作领域中比较稳定的重复性事物和概念,经有关方面协商一致,并由标准化主管机构批准,以特定形式予以,作为共同遵守的准则和依据的统一规定。

2.1.3 信息与文献标准体系 信息与文献标准体系则是在信息与文献领域内,按其基本规律和业务要求,由一系列相互依存、相互作用的标准形成的标准体系。它是指导信息与文献标准化工作的指导性文件,为信息化、网络化环境下的信息与文献业务工作提供新型标准和重要的技术基础。

2.2 信息与文献标准体系的定位

信息与文献标准体系的定位是:①明确信息与文献标准化的现状和发展趋势。通过信息与文献标准体系的研究和建设,可以科学合理地确立信息与文献标准化对标准的类目、内容、现状和发展趋向的总体与具体要求,从而推动标准的研究、制定和应用。②为信息与文献标准化发展提供决策依据。为信息与文献标准化主管部门提供所需标准的总体框架和发展蓝图,指明未来标准化工作的重点和发展方向;为信息与文献标准化研究者和工作者提供可供决策的信息;为技术委员会编制年度标准制修订计划提供依据。③有效避免标准制定的盲目性。为实现国家信息与文献标准化的总体要求,按照轻重缓急的原则,实事求是地向主管部门提出标准制修订项目的申请,使标准制定工作紧密结合信息与文献工作的需求,避免在标准制定工作中的盲目性和与实际工作脱节的现象。

2.3 信息与文献标准体系的构建原则

信息与文献标准体系是由信息与文献领域内具有一定内在联系的标准组成的科学有机整体,是包括现有、应有和

计划制定的标准工作蓝图,它勾画了信息与文献标准化的总体结构,反映了信息与文献领域内整体标准的相互关系。因此,在构建信息与文献标准体系过程中应遵循以下原则:

2.3.1 与国际体系一致的原则 全国信息与文献标准化技术委员会(国内编号TC4)成立于1979年,是我国最早成立的全国专业技术标准化委员会之一。委员会从成立一开始,业务范围就与国际标准化组织第46技术委员会“信息与文献工作”(ISO/TC46 Information and Documentation)完全一致。ISO/TC46的工作范围是:有关图书馆、文献和信息中心、出版业、档案、文件管理、博物馆文献、检索和文摘服务以及信息学等工作的标准化(见ISO官方网站,原文为:infor-mation centres,publishing,archives,records management,mu-seum documentation,indexing and abstracting services,and in-formation science)。

国际标准化组织将涉及情报信息、知识信息和载体信息的标准化工作统一归并在“信息和文献工作标准化”的范畴之内是有其道理的。无论图书馆、文献和信息中心、出版业(新闻出版)、档案馆,还是文件管理、博物馆文献、检索和文摘服务、以及信息服务等工作都属于“智力信息”的范畴,大信息、大交流是信息社会的基本特征。而上述领域划定的标准化工作领域,正是实现智力信息资源共享的基础和条件。特别是在信息技术和网络技术已经广泛应用的情况下,信息产品无论在内容还是在形态上的相互融合、彼此兼容已成趋势,必须从产品的生产、流通、加工到利用等各个环节都采用统一的标准,才能实现信息资源的共享。

2.3.2 信息资源生命周期的原则 信息与文献工作是一项涉及社会各个方面的基础性工作,也可以说任何部门、任何行业都会涉及到信息和文献工作。信息资源的组织利用和共享是信息与文献工作的根本。网络化、数字化的环境下,分布、异构和自主的信息资源不断涌现,需要从更高的层次和更系统化的视角来认识和组织信息资源,围绕着信息资源的创建、描述、组织、检索、服务和长期保存的整个生命周期来规划、设计、组织标准规范。有鉴于此,国际标准化组织第46技术委员会早在上世纪90年代中期,就将原第5分技术委员会(检索语言)、第6分技术委员会(著录)和第7分技术委员会(出版物格式)合并成第9分技术委员会(文献的描述与识别)。这样,一方面能对信息文献领域的信息资源建设提供系统化、基础性的指导和约束;另一方面,可保证各类信息资源的广泛可使用性,保障分布资源和服务的互操作,促进文献信息资源的长期保存和可持续利用。

2.3.3 开放建设的原则 信息与文献标准体系不应该是自定义一套标准或规范,而是充分吸纳和选择那些在国际范围被广泛接受和应用、得到有效标准化过程支持并具有良好可持续发展前景的标准和规范,减少标准规范制定和应用成本。

为保障所选标准和规范的可互操作性、可扩展性和可持续发展,信息与文献标准体系所列标准应充分体现采用国家标准、等同或修改采用国际标准和国外先进标准的原则。以保持信息与文献领域的标准与国际标准或国外先进标准的一致性或兼容性,以保证信息与文献领域的资源建设、应用系统建设等在全国或全球范围内共享。在信息与文献领域借鉴和参照的国际和国外发达国家标准有ISO、IEC、ITU、UNESCO、IFLA、DIN、BSI、ANSI等国际主流标准化机构、相关国际组织和发达国家的标准化机构制定的标准。

信息与文献标准体系建设应满足信息与文献业务不断发展的需要,特别是针对信息技术、网络技术等先进技术在信息与文献领域越来越广泛应用的现实,在标准体系建设中,要与时俱进,既要考虑当前的技术,也要对未来的发展有所预见,及时制定新标准和修订标准,使信息与文献标准体系所包容的标准能适应信息与文献领域各项业务工作的发展,适应网络化、数字化环境下信息与文献工作的实际需要。

3 信息与文献标准体系的层次结构

3.1 信息与文献标准体系的层次

信息与文献标准体系分为4个基本层次:第一层为信息与文献基础标准;第二层为信息与文献通用标准;第三层为信息与文献专用标准;第四层是信息与文献工作标准。信息与文献标准体系层次见图1。

3.2 信息与文献标准体系的结构

信息与文献基础标准、信息与文献通用标准、信息与文献专用标准和信息与文献工作标准可以是各自独立的子体系,也可以是多个子体系的组合,也可分成若干相互作用的子体系。

信息分类标准篇8

主编了《中国会计改革理论与实践》等与会计工作有关的著作10余部,公开30余篇,主持资产减值,政府财务会计报告等多项部级重点科研课题,多次获得财政部、中国会计学会优秀论文奖。

前言

2010年10月,财政部,国家标准化管理委员会分别了基于企业会计准则的可扩展商业报告语言(XBRL)通用分类标准、XBRL技术规范系列国家标准,标志着我国以XBRL应用为先导的会计信息化时代的来临。通用分类标准体现了我国企业会计准则和内控规范的要求,实现了国际趋同,可扩展性强,是完全开放的统一数据标准,其推广应用将大幅提升企业管理效篚同时极大地方便外部会计信息使用者对会计信息的深度分析,利用。财政部按照“积极稳妥、先行试点,总结经验、分步推进”的原则,采取多种措施推动XBRL在我国财务报告领域的应用推进我国会计信息化建设。

一、XBRL及其起源

XBRL是一种计算机语言,是XML(可扩展的标记语言,EXtens,bIe Markup Language)在财务报告信息交换方面的一种应用,用于商业和财务信息的定义和交换,是目前应用于非结构化信息处理尤其是财务信息处理的最新技术。它可以根据财务信息披露的相关要求,将财务报告内容分解成不同的数据元(data elements,),再根据信息技术规则对数据元(data elements)赋予唯一的数据标记,从而形成标准化规范。作为一种计算机语言,XBRL是计算机技术在会计领域深度应用的产物,是一种用于包括财务报告在内的商业报告编制、交换、、分析的标准化方法,它是计算机信息技术和传统财务报告内部控制等企业经营管理报告有机融合,并进一步拓展的产物。

XBRL信息模型主要是由两部分组成的,即XBRL实例(XBRL instarice)及XBRL分类标准(XBRL TaXonomy)。XBRL实例包含了报表中的具体事实(concrete facts,如销售额是多少等)。分类标准则是对具体事实的定义,它确定了实例中的具体事实应该遵守怎样的语言规范,他们的形式和属性如何等等。具体而言,分类标准要反映出编制财务报表所依据的会计准则,并据以定义财务报表中将要使用的各项财务报表元素,同时还要附加上相关的其他信息,比如各个元素之间的关联性,以及各个元素在报表中的名称、位置。

XBRL产生于1998年,由美国华盛顿州的注册会计师查尔斯。霍夫曼提出,当时主要是为了解决会计数据及相关信息的标准化以及深度分析和利用问题。经过多年的实践和发展,XBRL逐步得到了上市公司、会计中介机构、政府宏观管理和监管部门的认同,并迅速在发达国家采用,美国、日本、澳大利亚等发达国家先后成功开展了XBRL的应用项目,国际财务报告准则基金会也每年与国际财务报告准则相对应的分类标准。

二、XBRL在我国的发展

(一)我国推动XBBL发展的历程回顾

二十一世纪是网络化和信息化的世纪。中国政府一贯高度重视信息化工作,积极支持和推动包括XBRL在内的会计信息化工作不断发展。2004年,我国了《信息技术一会计核算软件数据接口》国家标准,2006年,财政部启动了XBRL项目前期研究,中国XBRL的进程日益加快并逐渐与国际接轨,2008年11月,财政部等九部委成立会计信息化委员会和XBRL中国地区组织,并于2010年5月经XBRL国际组织批准,XBRL中国地区组织成为正式地区组织成员,2010年10月,国家标准化管理委员会了XBRL技术规范系列国家标准,财政部了基于企业会计准则的可扩展商业报告语言(XBRL)通用分类标准。两套标准的是我国继实施企业会计准则内部控制规范之后的又一重大系统工程,标志着后危机时代我国以XBRL应用为先导的会计信息化时代的来临,在中国会计信息化建设史上具有里程碑意义。XBRL国际组织主席迈克・威利斯对此给予高度评价,认为中国通用分类标准代表了全球XBRL分类标准的最新发展趋势,中国开发这一标准和推广其应用的努力对全世界其他国家来说是一个杰出的榜样。

(二)XBRL与我国会计信息化发展战略

2006年5月,中共中央办公厅、国务院办公厅印发《2006-2020年国家信息化发展战略》,指出“信息化是当今世界发展的大趋势,是推动经济社会变革的重要力量。大力推进信息化,是覆盖我国现代化建设全局的战略举措,是贯彻落实科学发展观、全面建设小康社会、构建社会主义和谐社会和建设创新型国家的迫切需要和必然选择”,2009年4月,财政部了《关于全面推进我国会计信息化工作的指导意见》(以下简称《指导意见》),提出了全面推进我国会计信息化建设的目标:力争通过5―10年左右的努力,建立健全会计信息化法规体系和会计信息化标准体系,全力打造会计信息化人才队伍,基本实现大型企事业单位会计信息化与经营管理信息化融合,进一步提升企事业单位的管理水平和风险防范能力,做到数出一门、资源共享,便于不同信息使用者获取、分析和利用并据以进行投资和相关决策;基本实现大型会计师事务所采用信息化手段对客户的财务报告和内部控制进行审计,进一步提升社会审计质量和效率;基本实现政府会计管理和会计监督的信息化,进一步提升会计管理水平和监管效能。通过全面推进会计信息化工作,使我国的会计信息化达到或接近世界先进水平。

《指导意见》确定了我国会计信息化以XBRL为先导,引领和带动全面会计信息化的有序推进和目标的实现。《指导意见》指出,XBRL分类标准是会计信息化标准体系的重要组成部分,“各企事业单位在贯彻实施会计准则制度内部控制规范制度并与全面信息化相结合的过程中,应当考虑XBRL分类标准等要求,以此为基础生成标准化财务报告和内部控制评价报告,满足不同信息使用者的需要”。

《指导意见》后,财政部会计司团队紧紧抓住XBRL这个牛鼻子,作为全面启动会计信息化的关键环节和突破口,会同有关方面依据《指导意见》所确定的全面推进我国会计信息化的目标、任务内容、工作步骤,工作方式和要求,从企业会计准则人手,形成系统的披露模板,广泛征求意见,从中提取财务报告元素,起草完成了基于企业会计准则的XBRL通用分类标准(征求意见稿),再次向全社会征求意见,直到,先后经过18个月的艰苦努力,为我国推进应用XBRL和全面会计信息化奠定了扎实的基础。

(三)XBRL对推进我国会计信息化工作的意义

信息化关系到一个国家的核心竞争力和发展水平。XBRL

在发达国家日益广泛的应用,为财务报告及相关信息的使用者包括企事业单位、投资者、债权人、会计中介机构、宏观经济管理部门和政府监管机构等,带来了极大的便利,提升了整个社会的科学化精细化管理水平。

对于企事业单位而言,XBRL能够较好地实现财务系统与单位内部管理系统的数据交换,较好地实现财务报告与内部控制的融合,以会计为基础根据内部管理的需要进行扩展,及时、快速、准确地分析判断运营状况以及内部管理中的薄弱环节,并不断加以改进,有助于管理者大幅度提升管理效能,从而在微观层面实现管理现代化。

对于投资者、债权人等而言,XBRL大大降低了获取信息的成本,显著提升了信息获取、加工和扩展的速度、准确性和科学性,及时形成所需要的个体、整体或行业等各类信息,包括历史信息和当前信息,从而做出更加科学合理的投资和信贷决策。以往的专业机构、投资机构和债权人等所拥有的庞大昂贵的数据库,是通过人工输入公司财务报告及相关信息形成的,不仅差错率高,而且不能扩展,分析利用受到很大局限。XBRL推出后,投资者数据获取将变得更加方便,成本大大降低,投资者也可以拥有进行深入分析所需的大量数据,从而增强中小投资者的分析和决策能力。近期,美国已经开发出了在手机上使用XBRL数据进行财务分析的软件,把原本孤立、静止、繁杂无序的信息转变为投资者、债权人等信息使用者可以随时随地高效利用的“掌中宝”。实践证明,XBRL在有效资本市场条件下,已成为投资者进行投资决策、债权人进行信贷决策的重要技术支撑。

对于会计师事务所而言,XBRL将对会计中介机构从事审计及相关业务产生革命性的影响。被审计客户广泛应用XBRL之后,会计师事务所面临的审计环境将发生重大变革,XBRL格式数据将大幅度提升审计信息获取效率,注册会计师需要考虑XBRL数据生成过程的合规性。更为重要的是,在审计过程中应用XBRL,将重塑现有的审计业务流程,从客户信息系统提取数据进行转换的过程将大大简化,审计师能够有更多精力集中到对客户业务和财务状况的分析,提高审计工作的附加值和审计工作的信息化水平。

对于宏观经济管理部门而言,通过获取企事业单位和会计中介的实例文档,借助兼容XBRL技术的应用软件进行深度分析,可以实现从宏观上掌握和监测经济运行状况,科学分析判断经济运行中存在的问题,以便采取有效措施同时为制定宏观经济政策提供科学依据。

对于政府监管机构而言,利用XBRL可以将被监管者纳入现代化的统一监管系统,从而大大降低监管成本,提升监管效能。与此同时,XBRL能够打通不同监管系统、不同监管部门间的数据屏障,从而形成“数出一门、资源共享”的统一监管平台。

对于软件开发商而言,XBRL带来了难得的发展机遇曲于XBRL是一种计算机语言,在其逐步推广过程中所涉及的各个环节,都需软件开发商提供技术支持。XBRL的广泛应用将催生一个新的产业链,相关方面实施XBRL的解决方案,无一例外都需要软件开发厂商的配合,软件开发商尤其是国内的软件厂商应当积极主动地参与到XBRL的推广和应用中来,一是参与扩展分类标准及相关技术标准的制定和推广;二是按照财政部的统一要求,为相关方提供符合通用分类标准及其扩展分类标准的解决方案;三是参与符合XBRL技术规范国家标准和通用分类标准要求的财务软件或管理信息系统的升级改造I四是研制开发符合通用分类标准及扩展分类标准的各种分析和利用XBRL报告的应用工具;五是参与对用户进行XBRL相关应用的培训,为培养XBRL人才做出贡献。

三、实施企业会计准则通用分类标准,推动XBRL在我国财务报告领域的应用

XBRL对软件开发专业人员而言并不很难,但是,由于推广这种语言涉及到财务报告或内部控制等,国家制定并实施了统一的会计准则制度和内部控制规范,如果做到在全国范围内有序推广应用XBRL,必须要有国家统一的标准,包括技术规范和基于国家统一会计准则制度和内控规范的通用分类标准和相关扩展分类标准,否则就会导致混乱,有悖推广应用XBRL的初衷。

(一)推动XBRL在我国财务报告领域的应用涉及的环节

1 XBRL技术规范系列国家标准

推动XBRL在我国财务报告领域的应用,首先要制定和XBRL技术规范。XBRL技术规范是XBRL分类标准制定和扩展、软件开发及相关应用所需共同遵循的底层技术标准,如同建造高楼大厦的地基,地基的基本要求需要统一的技术标准。

XBRL技术规范属于信息技术范畴,具有全球通用性目前由XBRL国际组织制定和,已得到国际广泛采用。为了推动XBRL在我国的应用,我们(指作者及其领导的团队――编者注)在研究论证的基础上,决定采用XBRL国际组织制定的技术规范,将其制定为国家标准,经国家标准化管理委员会批准对外实施。

目前,可扩展商业报告语言(XBRL)技术规范系列国家标准主要包括基础,维度、公式和版本等四个部分,未来可根据情况由财政部提出修订或增补。其中,《可扩展商业报告语言(XBRL)技术规范:基础》是XBRL技术的详述规范,描述了XBRL的技术架构,定义了XBRL分类标准和实例文档中使用的XML元素和属性;《可扩展商业报告语言(XBRL)技术规范:维度》提供了一个定义维度元数据并且在XBRL实例文档中对其进行引用的通用机制;《可扩展商业报告语言(XBRL)技术规范:公式》标准定义了一套语法,用于以公式的方式描述从XBRL实例文档获得信息并产生新XBRL事实数据的规则;《可扩展商业报告语言(XBRL)技术规范:版本》标准定义了XBRL分类标准版本管理报告的XML语法,提供了两个可发现分类标准集之间差异的结构化描述。基础标准是核心,维度标准、公式标准和版本管理标准分别从不同方面对基础标准进行了扩展。

2 制定和《企业会计准则通用分类标准》和相关扩展分类标准

XBRL分类标准是根据XBRL技术规范对商业报告(包括财务报告、企业内部控制评价报告、监管报告等)中的元素及其关系进行标记和描述的“业务词典”,是编制XBRL格式报告(实例文档)的具体标准。财政部的《企业会计准则通用分类标准》,从总体架构上,包括逻辑设计和物理结构两个层面。逻辑设计是指将企业会计准则关于财务报告的各项规定映射到XBRL语言上的方法;物理结构是指分类标准各文件和文件夹的具体层级设计和组织方式。通用分类标准的架构与国际财务报告准则分类标准2010版的架构趋同,即物理结构保持基本一致,逻辑设计采用了基本相同的方法。通用分类标准装载了国际财务报告准则分类标准核心模式文件,对于在国际财务报告准则分类标准中已定义与我国企业会计准则含义一致的会计概念,通用分类标准采用直接引用的方式。从内容上,通用分类标准包括财务报表和附注等财务报告组成要素,涵盖了企业会计准

则关于财务报表列示和披露的各项要求。通用分类标准包含1个核心模式文件和6种链接库。其中,核心模式文件中包含通用分类标准所使用的全部元素,6种链接库分别是列报链接库、计算链接库、定义链接库、标签链接库(包括中文和英文标签)、参考链接库和公式链接库。

《企业会计准则通用分类标准》在技术严格遵循《可扩展商业报告语言(XBRL)技术规范系列国家标准》的规定,在业务上严格遵循企业会计准则,可以理解为XBRL格式的企业会计准则,是我国会计准则体系的重要组成部分。今后,财政部还将制定基于企业内部控制规范和事业单位会计准则等的通用分类标准。

XBRL分类标准具有可扩展性。其他政府监管部门可依据相应的监管要求,根据通用分类标准制定和适用于各监管需要的扩展分类标准;企事业单位出于内部管理的需要,也可依据自身要求在通用分类标准基础上进行相应扩展。无论是监管机构的扩展还是企业的扩展,都应当遵循通用分类标准应用指南中规定的扩展原则,以免造成混乱。

3 做好XBRL实例文档的生成、报送和利用

实例文档是依据XBRL分类标准生成的电子商业报告。按照分类标准生成实例文档,如同每个人都可以根据手中的一本词典中定义的词汇以及语法和语义,遣词造句,输入数据,写作出自己的文章,即实例文档。因此,做好XBRL实例文档的生成、报送和利用,是推进XBRL应用、发挥XBRL的功能效用、实现深度分析利用会计及相关信息的关键环节,这需要企事业单位与政府监管部门、会计中介机构、软件开发商、投资者、债权人等信息使用者共同作用完成。简言之,企事业单位要借助报送软件生成实例文档;会计中介机构应当对企事业单位实例文档的台规性进行审计并协助报送;政府监管部门应当根据XBRL技术对原有监管系统进行改造,逐步将被监管企事业单位的实例文档统一纳入监管系统;投资者、债权人以及宏观经济管理部门等信息使用者应当对深度分析利用实例文档提出需求,并且熟练掌握各种基于XBRL数据的分析工具的使用;软件开发商应当为实例文档的生成、报送和分析利用开发出各种适用的应用工具。

(二)我国XBRL通用分类标准的主要特点

我们在制定通用分类标准的过程中采取特别谨慎的态度,广泛吸收社会各方意见,加强国内国际合作,以保证通用分类标准的高质量和可操作性。在分类标准开发前,进行了广泛深入的调查研究,先后详细解析XBRL技术规范,分析研究世界主流分类标准的制定模式,调研了解XBRL应用项目,确定了通用分类标准制定工作的思路。在此基础上,今年年初,我们联合会计师事务所、科研院所、软件厂商和企业等启动了通用分类标准的开发工作。在开发工作中,我们与国际财务报告准则分类标准的制定机构――国际财务报告准则基金会保持密切合作,通用分类标准征求意见稿后,我们采用公开征集意见、与国际专家召开工作会议、成立质量审核委员会和进行实地测试等方式,确保通用分类标准经得起实践检验。

制定通用分类标准的过程中,我们坚持“人无我有,人有我优”的工作思路,力争在继承发扬基础上进行创新。总体而言,通用分类标准主要有以下特点:

1 与国际主要分类标准架构相同,确保通用分类标准的国际趋同

目前,世界主流分类标准都已经实现了架构趋同,在我国企业会计准则已与国际财务报告准则实现了实质性趋同并正在持续趋同的基础上,通用分类标准采取了与国际财务报告准则趋同的架构:这一特点符合建立全球统一的高质量会计准则的要求,也将有利于我国通用分类标准获得更广泛的国际认可。

2 可扩展性强,能够满足相关各方的多样性需求

通用分类标准全面支持行业监管部门、企业等有关方面对通用分类标准进行扩展,各方对此反响良好,银监会、证监会、保监会等监管部门和中石油等企业均支持这一模式同时,为了避免监管部门和企业在扩展分类标准过程中出现分类标准架构不一致、各监管部门扩展分类标准不能互操作等情况,强调在扩展过程中应当遵循财政部的通用分类标准指南中规定的扩展原则。

3 建立完全开放的统一数据标准,提高财务等相关信息的多次运用价值

以会计准则为基础,建立面向各监管部门的通用分类标准是一项符合我国实际的创新,得到了各监管部门和企业的大力支持。通用分类标准将成为我国企业财务等相关信息的统一电子数据标准,大大增强企业及相关财务信息跨行业、跨部门的多次可用性。

四、推广应用XBRL的工作安排与具体措施

由于XBRL推广和应用涉及面广、技术性强、影响面广,在当前形势下要以通用分类标准的为契机,积极做好相关工作,促使XBRL在财务报告领域推广应用,切实推动会计信息化建设进步。

(一)推动通用分类标准的分布实施

经过反复调研和征求各方意见,我们认为,在推进通用分类标准的实施中应当坚持“积极稳妥、先行试点、总结经验、分步推进”的原则,推动各监管部门和企业扩展应用XBRL。

在监管部门扩展应用中,拟先以通用分类标准在银行监管和证券监管中的应用为重点。在银行监管和证券监管扩展应用的基础上,积累总结经验,进一步为在央企管理、税务、统计等其他相关部门应用XBRL技术和通用分类标准提供技术支持。

在企业和会计师事务所层面,按照《财政部关于企业会计准则通用分类标准的通知》要求,自2011年1月1日起,在美国纽约交易所上市的我国部分公司、部分证券期货资格会计事务所施行,鼓励其他上市公司和非上市大中型企业执行。做出这样的实施安排,主要基于以下两点考虑:(1)根据美国证券交易委员会(SEC)的XBRL强制报送规定,我国在纽约交易所上市的企业需在2011年6月15日或之后结束的会计期间向SEC报送基于国际财务报告准则的XBRL实例文档。鉴于财政部制定的通用分类标准与国际财务报告准则分类标准的趋同关系,我们要求这部分在美上市公司先行实施,编制基于企业会计准则通用分类标准的2010年XBRL实例文档,积累经验后再逐步推广到国内上市公司及执行企业会计准则的大中型国有企业。(2)为了探索通用分类标准在注册会计师行业监管中的应用,首先依托财政部的注册会计师行业管理系统,选取少数信息化水平高、业务规模大、代表性强的证券期货资格所先行试点,遵循通用分类标准对其上市公司客户2010年年报进行XBRL格式的报备。首批实施通用分类标准的上市公司和会计师事务所名单将于年内。

(二)加强推广应用XBRL的组织领导的协调

在推动XBRL和会计信息化的工作组织方面,由财政部牵头成立联合9个部门会计信息化委员会。XBRL技术产生于会计领域,扩展到其他领域并得到广泛应用。但截至目前,会计依然是XBRL应用最为成熟和成功的领域。世界各国的XBRL应用项目证明,以会计领域为切入点,推动XBRL分类标准的制定,能够形成不同领域的最大合集,有利于XBRL的深入应用和长远发展。

基于上述考虑,作为我国会计工作的主管部门,财政部于2008年联合工业和信息化部、审计署、人民银行、国家税务总局、国资委、银监会、证监会和保监会等9个部门成立了会计信息化委员会,推进中国的XBRL工作。

在XBRL相关标准的制定方面,归口财政部和相关部门归口管理。一是在XBRL技术规范的制定方面,由财政部提出匡家标准立项申请,经过立项、国标起草、修订、评审和报送等程序,由国家标准化管理委员会正式。XBRL技术规范系列国家标准由财政部牵头起草并负责归口管理,未来可根据情况由财政部提出修订或增补。二是在企业会计准则通用分类标准和扩展分类标准的制定方面,由财政部制定基于企业会计准则的XBRL通用分类标准和相关扩展分类标准。未来还将制定基于企业内部控制规范和事业单位会计准则等的通用分类标准。三是其他政府监管部门可依据相应的监管要求,根据通用分类标准制定和适用于各监管需要的扩展分类标准。此外,企事业单位出于内部管理的需要,也可依据自身要求在通用分类标准基础上进行相应扩展。

在推进XBRL应用方面,搭建监管协调平台,建立协调机制。XBRL的推广实施,尤其是实例文档的生成、报送和利用等,需要企事业单位与政府监管部门、会计中介机构、软件开发商、投资者、债权人等信息使用者共同作用完成。因此,我们将在会计信息化委员会统一领导下,建立一个相关部门组成的有效务实的协调机制,定期协商解决相关问题,避免不同部门在扩展和实施中的重复建设,节约社会资源。此外,我们将在这一机制下组建一个XBRL技术服务平台或技术团队,用以整合XBRL技术、人才和信息资源,共享分类标准建设和实施经验,切实为分类标准实施提供多维支持。

(三)加强人才队伍艰涩,推广应用XBRL提供人才保障

推进XBRL应用,人才是关键。要重视发挥高端人才在推广应用XBRL中的引领作用,着力培养复合型高端人才。2010年9月,财政部制定的《会计行业中长期人才发展规划(2010―2020年)》指出,各企事业单位要着力培养造就一批精通财会业务,熟悉市场规则,掌握金融、法律、内部控制、信息技术等相关专业知识,具有国际视野和跨文化交流能力,能参与战略经营和管理决策、把握行业发展趋势、解决复杂经济问题的具有国际业务能力的高级会计人才。我国会计信息化事业开展以来,各部门、地区、基层单位都已认识到培养信息化专业人员或复合型人才的至关重要性,并进行了多渠道、多形式的人才培训工作,一些院校相应开设了专门课程,从理论基础和应用技能上培养了一批又一批会计电算化、信息化专业人才。但是,在推进XBRL应用、全面推进我国会计信息化的背景下,既懂会计又懂计算机知识的复合型人才非常缺乏,培养复合型会计信息化人才已是当务之急,也是未来我国会计人才发展规划的战略需要,要求我们从现在开始正式启动会计和XBRL复合型高端人才的培养工程。

信息分类标准篇9

关键字:管理信息系统;教育管理信息化标准

在高校信息化建设过程中,业务资源的数字化贯穿于高等院校各个层次的信息管理系统上。各种管理系统,如教务管理系统、教学管理系统、人事管理系统、学生管理系统等,相继建立起来之后,便会从不同侧面将高校中的各种资源以数字信息的形式保存于不同的管理信息系统之中。由不同的公司在不同的时期用不同的开发公司使用不同的数据库和平台开发而,且运行在不同的平台之下,导致了“信息孤岛”。因此,使用国家相关教育信息化标准来改造这些系统是非常必要的。

1.高校信息标准化改造的必要性

随着信息化建设的深化,各系统在应用中出现了要相互引用对方信息的需求。如教务系统中教师的身份信息需要引用人事管理系统的相关信息,而学生管理系统中学生的学习成绩信息需要引用教学系统的相关记录。然而,很多情况下数字化资源是各部门根据自身工作需要生成的电子数据,由于目前各系统信息的存储格式或表现格式不一样,因此,信息建设中各系统之间无法直接引用,有时甚至无法引用。[1]

为落实《国家中长期教育改革和发展规划纲要(2010-2020年)》加快教育信息化进程的要求,建立教育信息化标准体系,以保障教育信息化健康有序发展,实现数据互通、资源共享,教育部研究制定了《教育管理信息 教育管理基础代码》、《教育管理信息 教育管理基础信息》、《教育管理信息 高等学校管理信息》、《教育管理信息 教育统计信息》等7个教育信息化相关标准,作为教育部行业标准予以,并于2012年3月15日起实施。教育部2002年的《教育管理信息化标准 第1部分:学校管理信息标准》同时废止。[2]

有了国家相关标准,对高校管理信息系统标准化改造,使得数据可以互联互通,互相引用。

2.高校管理信息系统标准化改造探索

2.1有效协调工作

高校针对管理信息标准化工作,指定相应牵头部门,该部门应该主要从以下方面开展工作:

* 成立信息化建设实体机构,从机构、人员、资金等各方面为信息化建设提供保障。

* 制订学校信息化建设总体规划,统筹考虑和部署学校整体的信息化建设。

* 在学校层面上建设一个统一的应用平台,以实现资源的统一和共享。

* 制订信息化建设和管理的规章制度,确保信息化建设各项应用的顺利实施。

* 加大培训和宣传力度,逐步提高师生的信息素养。[4]

2.2确立高校信息化标准

学院应在教育部2012年3月15日分布的标准基础之上,尽快完成本校信息的标准化工作。教育管理基础代码(JY/T 1001—2012)中已有的代码,则在学院信息化标准实施过程中,不得再另行制定,同时应该填充高等学校管理信息(JY/T 1006—2012)中相应数据集。

由于数据集较多,为便于信息化标准的实施,应该主要考虑以下数据集的制定:

(1)GXXX0101 学校基本数据子类

该数据子类包含学校代码、学校名称、学校简称、学校地址、邮编等数据项。

(2)GXXX0102 校区基本数据子类

该数据子类包含有校区号、校区名称、校区地址等数据项,该数据子类取用 JY/T 1002:JCXX0102 校区基本数据子类。

(3)GXXX0301 院系所单位基本数据子类

该数据子类包含了单位号、单位名称、单位地址、隶属单位号、单位类别码、单位办别码等数据项,该数据子类取用 JY/T 1002:JCTB0103 单位基本数据子类。

(4)GXJG0101 教职工基础数据子类表

该数据子类包含了工号、单位号、姓名、英文姓名、姓名拼音、曾用名、性别码、出生日期、出生地码、籍贯、民族码、国籍/地区码等数据项。

(5)GXJX01 专业信息数据类

该数据类包含了专业号、专业名称、专业简称、专业英文名称、专业方向号、单位号、学制、学科门类码本专科专业码、研究生专业码等数据项。

(6)GXJX02 课程数据类

该数据类包含了课程号、课程名称、课程英文名称、学分、周学时、总学时、理论学时、实验学时、课程简介、教材、参考书目、课程负责人号、课程开设单位号等数据项

2.3使用国标和行业标准对高校管理信息系统进行标准化改造

国标GB/T 14946.1-2009已经定义了民族代码、政治面貌代码、性别代码等代码,加上教育部《教育管理基础代码》(JY/T 1001—2012)已经定义的处分名称代码、高校毕业去向代码、户口迁出状况代码、就读方式代码、奖励方式代码 、奖学金类型代码等代码,现有管理信息系统中数据库涉及到相应数据项和数据类时,应该无条件的更改为《教育管理基础代码》标准中所定义的代码。

2.4使用标准数据类对高校管理信息系统进行改造

在教育部行业标准基础之上的高校信息标准数据类制定完成后,应从以下方面进行现有管理信息系统的改造:

(1)统一现有管理信息系统代码库。

例如学生管理系统、教务管理系统中相应的教工字典库、校区字典库、教学院系字典库、专业字典库等代码库将使用2.2所制定的数据类至少编号和名称2个字段。同时将对应以文档的形式进行说明,并随高校数据类变化而更新。

(2)统一现有管理信息系统中相应数据项

现有的有些管理信息系统,并没有设置相应的字典库,而是在字段值中直接体现专业名,院系名等。这些字段值也应按2.2所制定的数据类中名称相应字段值相同。同时将对应以文档的形式进行说明,并随高校数据类变化而更新。

3.结束语

本文介绍了教育部最新颁布的教育管理信息相关标准,并提出了利用这些标准将现有管理信息系统进行标准化改造。这种标准化改造有利于处于“信息孤岛”的高校现有的管理信息系统进行信息交换和引用,同时最大程度保留了对现有信息管理系统的投资。

本文系四川省教育厅《基于URP的高校学生数据管理中间件研究与设计》成果之一,课题编号11ZB140

参考文献:

信息分类标准篇10

中图分类号:F224.9

文献标识码:A文章编号:

16721101(2015)02003605

Abstract: Based on information entropy from the perspective of data quantity under index system of regional development, this paper establishes the way of evaluation by the standard of information entropy, explores how to improve the information of data using fuzzy c-means algorithm, and validates the the proposed method from theoretical proof and empirical analysis.The paper makes improving experiments via panel data under comprehensive index system of regions of northern Anhui and along the Huaihe river.Its result suggests diversity in data by information entropy standard and marked improvement of information, which lays good basis of better data quality for consequent data mining.

Key words:regional development; quality of panel data; information entropy; fuzzy c-means algorithm; feasibility demonstration

在现代信息技术迅猛发展的背景下,越来越多的领域都采用数据驱动的方式进行研究。应运而生的数据技术从传统的统计分析到数据挖掘,再到现今的云计算和大数据都很好的给生产生活带来更多的价值。但是随之而来的数据量度和尺度都变得纷繁复杂,再加上各行业所取观测指标的不同使得数据在单位、量纲和指标含义等客观情况下呈现很大差异性和不确定性,特别是经济数据指标的数值差距过大,因此给数据技术方法本身的可行性以及所得结果的可靠性带来很大挑战。传统的数据预处理中多采用清理、变换和规约等方法来提高数据质量[1,2],在大多数文献中多采用Min-Max标准化[3,4]、Z-score标准化[4]、Decimal scaling小数定标标准化[5]以及Log和Atan函数转化[6]来处理数据,并不着重讨论数据达到的质量程度。但是由于标准化方法的一些理论局限性,容易在处理中降低数据的信息量。所以在研究中如何能够判断标准化后数据信息量的改变程度,这对采用的技术方法本身和后续结果分析将起到重要的作用。本文将尝试探讨数据信息量衡量熵标准,并从理论层面和结合皖北沿淮区域经济发展数据做相应的实证分析。

一、构建熵标准下FCM分类改进模型

(一)信息熵与FCM准备

1.数据质量的信息熵标准

热力学第二定律表明孤立系统中任何变化都不可能减少熵值,1948年Shannon定义通信信号中平均信息量为熵[7],从此熵作为衡量信息量的一种方式被广泛应用。信息熵是数据含载信息程度的一种度量方式,当信息熵越大时表明数据越无序,需要理清数据所需信息就越多,也说明数据的信息量越大。离散随机变量的信息熵定义为自信息的平均值

H(X)=Ep(x)[I(x)]=-∑xp(x)logp(x)

其中I(x)为事件的自信息,Ep(x)表示对随机变量的概率取平均运算。其具有熵的非负性、对称性、扩展性和可加性等相关性质。

2.模糊C均值聚类FCM

模糊C均值聚类[8,9](FCM)是由Bezdek在1981年提出的一种模糊分类方法,FCM需要根据类中距和类间距构造分类准则,利用预先给定的分类数C对所给样本点进行分类。即求解规划问题:

minJm(U,Z,c)=∑ci=1∑Nk=1μhikd2ik,

s.t.∑ci=1μik=1,l≤k≤N;0≤μik≤1;

通过求解上面规划问题,利用得到的隶属矩阵Uik=∑cj=1(dikdjk)-2m-1和聚类中心

Ci=∑nk=1umikXk∑nk=1umik,进行迭代运算得到分类结果。

(二) 熵标准下FCM分类改进模型

由于熵值代表了数据的信息量,而通过衡量信息量可以产生评价策略,陈衍泰等在综合评价方法分类的研究中总结了信息熵方法应用在评价领域的情况[10],张树森等将熵与聚类算法结合提出改进的模糊聚类算法EFC[11],韩宇平等将最大熵原理用于评价区域水资源短缺问题[12],刘红琴等将信息熵应用到能源消费的分配衡量中[13],本文考虑将信息熵引入到数据质量的评价中。

再由于区域发展数据在数值上差距过大,如果仅仅统一进行z-score标准化处理则可能带来信息损失,本文考虑利用FCM方法将数据进行分类标准化,这样也同时带来数据扁平化特征,而由离散最大熵定理[7]可知,数据出现概率越相同,那么数据的信息熵越大。

设n维数据集{xi}ni=1进行z-score标准化后{xi-μσ}ni=1在D段中出现的概率为{Pj(x)}Dj=1,利用FCM对数据分C类后原始数据重新组合变为{xij}i=1,…C,j=1…ni,在每个数据集中表转化得到数据集{xij-μiσ}i=1,…C,j=1…ni在D段中出现的概率为{Qj(x)}Dj=1,当分段数D足够体现数据概率分布时Q(x)比P(x)更加趋近相同概率。利用P(x)对Q(x)的散度D(P//Q)非负特征,有如下推导:

D(P//Q)=∑xP(x)logP(x)Q(x)=

∑xP(x)logP(x)-

∑xP(x)logQ(x)≥0

Hp(x)=-

∑xP(x)logP(x)≤

-∑xP(x)logQ(x)≤-

∑xQ(x)logQ(x)=HQ(x)

因此在分类标准化后的数据信息量比直接标准化的信息量要大。从分类的角度来看,分类后数据标准化数值会产生比整体标准化更多的多样性,从而带来的信息量的增加,而数据信息量的增加也给后续的研究方法提供更好的数据质量。

二、基于区域发展面板数据的实证分析

(一)指标体系构建与数据来源说明

1.区域发展指标体系构建

结合前期工作制定指标体系[14]21,指标的选取原则兼顾经济、生活、环境、社会、特征产业和可持续发展的指标体系,构建一级指标,细化二级指标共选取5个一级指标和69个二级指标如图1所示,并由此构建整体指标模型和各级别体系。

具体指标表现为:(1)在经济发展与产业结构方面:GDP;城镇固定资产投资额;出口总额;进口总额;农业总产值;工业总产值;建筑业乡村从业人员数;交通运输、仓储及邮政业乡村从业人员数;乡村私营企业从业人员数;农、林、牧、渔业乡村从业人员数;乡村个体从业人员数;工业从业人员年平均人数;城镇房地产开发投资额;(2)民生能力与生活质量:职工工资总额;总户数;农民人均纯收入;城乡居民储蓄存款余额;社会消费品零售总额;城镇居民最低生活保障人数;新型农村合作医疗参合率;建成区绿化覆盖率;城市出租汽车数;公共汽(电)车客运总量(市辖区);人口自然增长率;城市公共汽(电)车客运总量;城市每万人拥有公共交通车辆数;城市人口密度;人口密度;基本养老保险基金支出;基本医疗保险参保人数;人均公园绿地面积;(3)政府管理与社会服务:财政收入;财政支出;财政用于教育的支出;财政支出中卫生经费;等级公路里程;公路货物周转量;公路旅客周转量;公路客运量;铁路客运量;城市道路长度;城市供水总量;城市清扫保洁面积;城市天然气供气量;地质灾害防治投资;城市公园数;街道办事处数量;(4)资源实力与可持续发展:降水量;人均水资源量;土地面积;林业用地面积;水田耕地面积;城市污水排放量;生活垃圾无害化处理率;城市排水管道长度;城市污水处理率;工业废气排放量;工业废水排放量;“三废”综合利用产品产值;(5)教育产业与创新科技:财政用于教育的支出;普通高等学校数;普通高等学校在校学生数;普通高中在校学生数;普通小学在校生数;发明专利申请受理量;发明专利授权量;科技活动人员数;

图1综合区域发展指标结构图

基于以上初步指标体系充分涵盖从经济发展到人民生活,从政府能力到社会服务,从可持续发展到特色产业的方方面面,兼顾发展的效率、速度、质量、潜力和能力。但是在数据收集中往往遇到很多实际情况需要做修正,对于少部分的数据遗漏采用数据拟合回归和缺省值补充等传统数据预处理方法进行修整[1],对于大部分的数据遗漏则采用指标替换的方式进行变通。

2.面板数据来源说明

本文依托皖北沿淮地区6市39县区的区域发展研究,因为在皖北沿淮地区中蚌埠市和淮南市具有相同的地缘特征和相似生活特征,所以对两个地区指标的衡量具有很好的实际意义,故而采用2005年到2012年蚌埠市和淮南市数据,数据来源于中国知网提供的《中国统计年鉴》、《中国城市统计年鉴》和各地区发展统计年鉴等。同时本文数据属于面板数据,可以克服时间序列分析受多重共线性的困扰,能够提供更多信息、变化、自由度和估计效率。

(二)具体实证分析

本文的具体实证分析分为以下三个方面:(1)对于原始数据的处理过程:按照论文前面介绍的科学指标模型和数据采集来源,将两个城市69个属性从2005年到2012年共8年的数据进行矩阵化,得到一个138行8列的原始数据矩阵,对于原始数据矩阵中的缺省值采用外插和内插法进行相应的差值拟合得到完整的使用数据。(2)对于使用数据的分析过程:第一步根据本文前期工作[14]22通过对数据进行谱系聚类、HCM和FCM三种聚类方法,采用Matlab2012b进行编程,比较从分2类到分10类的由R方统计量和伪F统计量得到的半偏相关统计量SPRSQ数值,发现当分三类时谱系聚类方法和HCM的SPRSQ数值达到最高值分别为0.400 1和0.023 9,而FCM的SPRSQ数值在分四类时达到最高值0.027 0,因此在进行分类构建信息熵时,将分三类和分四类的情况均予以考虑。第二步根据论文前面讨论的信息熵构建过程进行分类信息熵构建,首先将利用FCM对数据分三类和分四类得到的数据集

{xij}i=1,…C,j=1…ni(其中C=3或者4),在每个数据集进行z-score标准化:{xij-μiσi}i=1,…C,j=1…ni;然后讨论这些数据在分D段中出现的概率{Qj(x)}Dj=1,其中分段数D的大小要足够体现数据概率分布特征 [7,11]取D分别为10和20两种情况,计算相关信息熵数值H(X)=

EQ(x)[I(x)]=-∑xQ(x)logQ(x)

;最后通过和没有进行分段改进的原始数据集的未标准化和统一标准化两种情况进行比较得到相关结论。(3)对于数值比较的分析结果:通过比较未标准化、普通的列统一标准化和采用FCM分三类和四类的类标准化的三种方法在取分段数为10和20下的信息熵大小,得到了相关的数值结果表1。

对表1中的相关数值做图进行直观的表达,可以得到在分10段情况下的图2和分20段情况下的图3,其中横坐标为从2005年到2012年每一年的数据情况,从图中可以发现不论哪一年的数据数值在分类标准化后的熵值都高于图中最下面的线,即统一标准化的数据熵值。

从以上图表的结果来看,采用FCM算法对于数据分类标准化后得到的信息熵提升效果是明显的,具体可以概括为以下的一些结论:

1.未标准化和统一标准化的结果数值完全一样,这是因为z-score标准化过程并不改变数据分布特征,因此他们拥有相同的概率分布,则信息熵也完全一致,故而数据所含信息不变,因此在作图阶段就不体现未标准化的结果图形。

2.分段标准化后所有的数据结果均大于统一标准化的数据值,即信息熵在分段标准化后都有显著提高,这和理论推导的结果一致。故而分段标准化的方法可以有效消除量纲差异,同时还能有效的提高数据信息熵,从而使得数据含有更好的信息量。

3.就分段标准化而言从所有列信息熵的总和数值可以发现,在两种最佳聚类数时信息熵的总和情况分别可以表示为:分10段3类时的9.07高于4类时的7.8,分20段3类时的12.19高于4类时的11;同时数据信息熵随着分段的增大数值也在增大,这是信息熵本身性质所决定的,因为分段越多概率分布越接近均匀分布,由离散最大熵定理以及本文理论推导可知数据信息熵在增加。但是如果分段过多,甚至达到数据总量的一定比例,此时再高的信息熵数值也并不能够说明很好的信息量,所以在分段数的选取需要与数据总量相互匹配。

三、结论

根据以上论证发现,从理论角度和实证分析都验证了分类标准化可以有效的提高数据信息量。所以在相应数据分析方法使用之前,对于数据标准化处理阶段可以尝试采用分类标准化的方式,这样既可以消除数据量纲差异,也可以有效的提高数据含载信息,为进一步使用数据挖掘方法得到更好的数据结论提供较好的前期准备。

同时由于在数据集统一标准化中均值唯一,相当于只有一个中心节点。但是在分类标准化后,在不同类中都有相应的均值作为中心节点,所以分类标准化比传统的统一标准化更符合现代互联网思维,那就是去中心化和多节点多分类,以及扁平化结构体系的相关思想。参考文献:

[1]Jiawei Han.Data Mining Concepts and Techniques, Second Edition[M].BeiJing: China Machine Press,2008:30-65.

[2]韩京宇.数据质量研究综述[J].计算机科学,2008(2):1-5.

[3]程惠芳,唐辉亮.开放条件下区域经济转型升级综合能力评价研究――中国31个省市转型升级评价指标体系分析[J].管理世界,2011(8):173-174.

[4]张钢.长江三角洲16个城市政府能力的比较研究[J].管理世界,2004(8):18-27.

[5]安悦.基于微博客的手机供应商排名推荐[J].数学的认识与实践,2013(10):23-29.

[6]汪冬华.我国沪深300股指期货和现货市场的交叉相关性及其风险[J].系统工程理论与实践,2014(3):631-639.

[7]田宝玉.信息论基础[M].北京:人民邮电出版社,2008:18-26.

[8]史小松,黄勇杰,刘永革.数据挖掘技术中聚类的几种常用方法比较[J].中国科技信息,2009(20):99-105.

[9]诸克军,苏顺华,黎金玲.模糊C均值中的最优聚类与最佳聚类数[J].系统工程理论与实践,2005(3):52-61.

[10]陈衍泰.综合评价方法分类及研究进展[J].管理科学学报,2004(2):69-77.

[11]张树森.改进的基于熵的中心聚类算法[J].计算机与现代化,2014(3):53-56.

[12]韩宇平.基于最大熵原理的区域水资源短缺风险综合评估[J].安徽农业科学,2011(1):397-399.

信息分类标准篇11

中图分类号:TP311.52 文献标识码:A 文章编号:1009-914X(2014)29-0300-01

一、背景

为规范运行,加强沟通协调,充分挖掘现有设备保障能力,民航空管各级部门纷纷建立了适于本地的设备运行信息管理系统或设备运行电子值班系统。民航局空管局也建设了设备运行监控电子值班系统和设备集中监控系统。这些系统的建立有力地提升了各地的运行保障能力和上下级间的协调工作能力。

但对各系统数据信息进行分析和交互的过程中,我们可发现了存在以下不足:

1、空管设备分类标准不完善。现有的设备分类通常参考民航局的电信人员执照管理规定中执照所对应设备的分类标准,且分类比较粗,只能初步定为到设备,不能定位到部件、模块、元器件。

2、空管设备故障分类分级不健全。空管设备故障的分类分级标准采用民航局空管局于2008年下发的《空管设备故障分类等级标准(试行)》(以下简称《故障分类标准》),但随着空管设备种类不断增加,分类需要补充完善。原有的故障分类标准中故障分类只定义到设备级,随着故障分析的深入,需要故障能定位到部件、板件甚至元件。

3、故障信息描述指标不完善。在《故障分类标准》中规定了故障信息数据的组成包括设备系统种类、设备配置属性、设备故障技术分类、设备故障影响评估分级、设备故障部件属性和其它相关属性等信息段。但对于故障信息描述,这些属性信息不够全面、规范,增加了建立数据分析模型的难度,不利于深入挖掘利用设备故障数据,总结维护维修经验,形成科学全面的运行态势分析报告。

4、无线电干扰分类分级规范仍为空白。目前电磁环境日益复杂,无线电干扰对民航设备正常工作的影响也日益加大,但至今空管系统没有对无线电干扰分类分级的定义与标准。

5、设备停机数据分类无标准。大量的停机数据如果没有统一的规范,既不利于用户单位查阅,也不利于设备运保单位对设备的维护状态的统计分析。

上述是由于缺乏统一的设备运行数据分类规范,各个系统往往基于本地,甚至本单位的业务工作设计开发,数据分类不全,方法各种各样。“十二五”期间,民航空管系统将开展全国范围的设备运维系统建设工作,并对集中监控系统进行升级,这些系统建设后,各地运行数据的互联互通、上传下达、统计分析将成为进一步提升设备运行保障能力的关键;而使用统一规范的设备运行数据分类标准,是保证各地方各系统顺畅互联和有效统计分析的必备条件。因此,建立空管设备运行数据分类规范势在必行,且应尽早实施。

二、空管设备运行数据规范化研究内容

空管设备运行数据化规范的研究应至少包括设备分类规范、故障分类分级规范、无线电干扰分类分级规范、设备停机维护数据分类规范等内容。

1、设备分类规范。将目前空管设备进行分类,同时建立统一规范的设备模型,给出设备模块级、板件级分类规范,即同厂家同型号的设备其模块级组件,以及组成模块的板件信息规范化。

2、故障分类分级。依托设备分类,实现将故障信息定位至板件级或元件级,细化故障分类,便于分类统计和分析总结。

3、备件和元器件的分类。建立与设备相关又独立的备件、元器件分类规范。便于备件的规范管理。

4、无线电干扰分类分级。根据干扰发生地、干扰程度、干扰特征、干扰对管制运行产生的影响等判断标准对干扰信息进行归类描述。

5、设备运行基础信息统计规范。包括设备台站名称、设备位置、设备用途、故障分类、故障分级等设备运行基础信息,规范基础信息包括的内容和格式,制定统一的命名规则。

6、设备停机维护数据分类规范。对于大中型空管单位,每天有许多设备停机维护在实施,需合理规范停机信息,准确停机信息。

7、建立接口标准,定义各业务系统间数据交换格式与基础数据规范。

三、空管设备运行数据规范化研究举例

以空管设备分类为例说明空管设备运行数据规范化研究的内容。空管设备可以采取以下分类方案:(表1)

设备分类需说明的事项:

1、空管设备根据设备提供的功能不同来分类,共分为“通信、导航、监视、辅助、信息、其它”6大类。

2、“通信类”设备包括各种地地、地空通信设备、语音及数据信息的传输和交换设备、语音及数据信息的记录设备。根据设备的功能不同又分为:甚高频地空通信系统、高频地空通信系统、地空数据链系统(上述3类设备实现地空的信息交互)、语音通信交换系统、自动转报系统(上述2类设备实现信息的交换)、地面通信系统、卫星通信系统(上述2类设备实现信息的传输)、记录系统(此类设备实现信息的记录)。

“导航类”设备包括各种为飞行器提供导航定位信息的地面设备。根据设备的功能及技术不同分为全向信标、测距设备、无方向性信标、指点信标、航向信标、下滑信标、卫星导航地面设备。

“监视类”设备包括各种飞行目标探测、飞行计划处理和综合监视信息显示系统。根据设备的功能及技术不同分为自动化系统、一次雷达、二次雷达、场面监视雷达系统、自动相关监视、多点相关定位系统。

“辅助类”设备包括各种动力、时钟、防雷等辅助设备。根据设备的功能不同分为不间断电源系统、油机、配电设施、时钟系统、防雷设施。

“信息类”设备包括各种为提高空中交通管制工作质量和工作效率而研制开发的,直接面向管制部门的,为安全生产服务的,未包括在上述通信类、导航类、监视类、辅助类中的信息辅助系统。根据设备的功能不同分为塔台辅助信息、区管辅助信息、飞行计划处理、流量管理、协同决策系统。

“其它类”设备指各种不包含在上述分类、但保障部门为方便管理而录入的设备。根据设备的功能不同分为电子值班系统、集中监控系统、杂项。

3、“通信、导航、监视”类设备为局方要求须申请开放备案的主体空管设备。

4、“信息类设”备包含FIPS、TOMS、CDM、流量管理、SIPDS(第四网)等管制信息应用系统,这类设备在现实应用中地位越来越重要,但不须向局方申请开放备案,故将信息设备作为独立一类与通信、导航、监视并行的分类。

5、“其它类”设备主要是不纳入设备信息通报要求的非安全生产、但属于技术保障部门维护的系统设备。

信息分类标准篇12

中图分类号:C35文献标识码: A

前言

在目前我国信息技术飞速发展的时代,我国对于测绘地理星系标准一致性的测试研究也越来越深入。在地理信息的测绘中,不仅要加强一致性的研究,还要加强对于协调性的研究,整个测绘工程中如果标准之间不一致,就会影响测绘地理信息数据,导致测量出现错误。

一、一致性测试理论

(一)在测绘地理信息标准体系下,将被测标准与现行测绘地理信息标准协调一致应满足的要求通过一定的方法实例化组成可执行测试套件)(ETS) ,由测试所需要的计算机硬件软件与通信网络等构成被测系统(SUT) ,基于SUT执行ETS,形成一致性测试结果,并按照所规定的判定准则对测试结果进行分析,形成一致性测试报告,以确定被测标准与现行测绘地理信息国家标准、行业标准之间的一致性。测绘地理信息标准一致性测试原理如图1所示。

(二)根据GB/T1.1―2339标准化工作导则,标准按结构划分为前言、引言、范围、规范性引用档、术语和定义、正文和附录7大部分。标准按要素划分是由4类要素构成的: 资料性概述要素、规范性一般要素、规范性技术要素、资料性补充要素所要关注的是被测标准的内容而非形式。测绘地理信息标准一致性测试内容参考模型如图2所示。

测绘地理信息标准一致性测试的主要测试部分是规范性引用档、术语和定义、技术要求和规范性附录 4个部分,将这 4个部分与现行测绘地理信息标准相应内容通过一定的方法进行对比来判断被测标准的一致性。

(三)测试类型

参考ISO19135:2333《地理信息 一致性与测试》,并结合测绘地理信息标准一致性测试内容,根据测试结果所能提供的一致性证明范围,将测试确定为2 种类型: 基本测试和能力测试。基本测试是提供与被测实现( IUT) 相一致的初步证明,是有限的测试,主要检测明显不一致的情况。基本测试作为初始步骤,用以决定是否进行能力测试。对于测绘地理信息标准一致性测试,基本测试的范畴主要包括:

1) 被测标准题目是否重复,检测与现行测绘地理信息标准题目的重复性;

2) 被测标准内容是否重复,检测与现行测绘地理信息标准内容的重复性;

3) 被测标准范围是否清晰,检测与测绘地理信息标准体系的关系。

能力测试是检验必选能力及在实现一致性声明(ICS) 中被确定由IUT 支持的那些可选能力,尽可能地提供全面的测试。对于测绘地理信息标准一致性测试,能力测试就是对被测标准的规范性引用档、术语和定义、技术要求和规范性附录 4个部分的具体指标、要求和方法等进行测试。能力测试宜在被测标准规定范围内尽可能进行详细的测试。

(四)测试范围

我国按照测绘地理信息标准化的内容和需要,已构建了统一、结构化的测绘地理信息标准体系,规定了体系中系列标准的范围,明确了标准之间的关系。标准一致性测试就是在测绘地理信息标准体系框架下的各标准之间的测试。测绘地理信息标准体系框架如图 3 所示。

测绘地理信息标准分为管理标准和技术标准,其一致性测试只针对技术标准进行。其中,定义与描述类属于基础标准,主要包括参考系、分幅与编号、分类代码、数据字典、图式、术语等; 获取与处理类属于工艺标准,主要包括大地测量、航空航天摄影测量、遥感、地图编制与印刷、数据库建设、测绘仪器、其他测绘等; 检验与测试类属于检验标准,主要包括成果与产品检验、仪器检验、软硬件与环境测试等; 成果与服务类属于产品标准,主要包括数

据成果与产品、地图成果与产品等。在测绘地理信息标准一致性测试过程中,首先要

确定被测标准在测绘地理信息标准体系中的位置,明确其与现行行业标准之间的关系。这种关系可分为两部分,第一部分是被测标准与基础标准之间的一致性测试,第二部分是被测标准与关联标准( 工艺标准、检验标准、产品标准) 之间的一致性测试。只有对这两部分都进行了一致性测试,才是完全的一致性测试,所得的结果也才全面、完整和可靠。

二、一致性测试技术方法

(一)测试方法

一致性测试依据观察结构的透明性方式可分为白盒测试、黑盒测试和灰盒测试 3 种测试方法,任何工程产品都可以使用这 3 种方法之一进行一致性测试。一致性测试依据测试结果的肯定与否定可分为验证测试和证伪测试,还可依据测试速度分为自动测试和人工测试。

黑盒测试从产品功能角度进行测试,无需理会产品的内部特性是否符合要求; 是站在用户立场上进行的测试; 如果规格说明有误,将无法发现; 它是不充分、不完整的测试。白盒测试从产品内部结构和逻辑角度进行测试,能够对内部特定部位进行覆盖测试; 不需要顾及其外部功能是否实现; 它是一种较为充分和完整的测试方法。灰盒测试介于这二者之间。对于测绘地理信息标准一致性测试,它检测标准与标准之间一致性实现的程度,需要对标准结构的 4个部分进行测试,因此必须把被测标准拆解,测试其内部具体的指标、要求、方法、规则以及实现形式等是否与现行测绘地理信息标准的规定相一致。所以测绘地理信息标准一致性测试属于白盒测试。

验证测试可以对一个实现的一致性进行严格的正确性证明,因此建议尽可能使用该方法进行一致性测试。然而,由于技术与经济等原因,大多数标准的规模与复杂性经常导致使用正确性证明方法是不现实的,因此,证伪测试也已成为一致性测试可接受的方法。证伪测试是根据一项标准,为一个实现开发特定的测试集合或套件,以检测该实现中的错误的一种方法。与正确性证明方法不同,证伪测试不能保证一个特定的测试套件能够覆盖一项标准的全部内涵。对于测绘地理信息标准一致性测试,针对具体的指标、要求、方法等制定相应的测试套件,检测与现行测绘地理信息标准不一致的内容,因此,测绘地理信息标准一致性测试适合采用证伪测试方法,亦可根据实际情况采用复合方法。

当前,一致性测试通常采用软件系统来进行,即自动测试的方式。但是,标准的描述内容往往用自然语言,这些语言在语法一致性上容易做到,而语义一致性却不容易达到。这时自动测试将过于复杂,需要结合人工进行测试。但是,人工测试存在工作量大、速度慢、测试结果受人为因素影响多等问题,因此为保证测试结果的客观性,需要尽量采用自动测试,人工测试只在自动测试无法进行时使用。同时,为提高测试的客观性,人工测试时需要有明确的判定准则。

测绘地理信息标准的内容可大致分为 、 类: 指标类、描述类、图片类、表格类和公式类。其中,指标类和表格类主要是测绘地理信息标准中关于精度指标或技术指标的具体数值,可使用自动测试;描述类、图片类和公式类主要是测绘地理信息标准中关于定义、术语方面的描述,如流程、示例等涉及的图片和计算方法涉及的公式等,需辅以人工判断。一致性测试方法见图 4。

图 4一致性测试方法

(二)标准拆解

标准一致性测试对被测标准的内容进行测试,是决定该标准与相关联的现行标准之间符合程度的符合性测试。因此测试包含两方面的内容,即被测标准和现行标准。被测标准决定测试的内容,现行标准提供测试范围和测试用例的判定准则。现行测绘地理信息标准的对象众多,标准内容多种多样、覆盖面广,利用其作为测试范围确定依据和测试用例判定准则应依赖于对标准的形式化描述。最常用的也是最成熟的形式化方法为树表结合表示法( TTCN) 。标准通常呈树状结构,内容形成层次结构,同层内容之间通过节点连接,因此,现行标准的TTCN描述可通过标准拆解来实现,将标准按层次进行拆分,按章、条、段、列项的层次拆分成“标准树”结构,如图5 所示。

“标准树”中列项为最小不可再拆分单位,赋予具体数值作为测试基础,形成可执行测试套件 ETS,将其以XML 语言录到SUT,作为测试的数据库。同样,被测标准根据相关联标准的必选要求和ICS, 声明的可选要求进行拆解,形成 XML 文档,作为测试准备。

(三)测试的框架

依据以上对于标准一致性测试理论以及方法的描述,与相关国际的标准相结合,构成了测绘地理信息标准一致性的测试框架,如图6所示。

将现行标准和被测标准中的技术要求按图5 拆分成“标准树”,由键( 关键词) 和值构成,转化为XML形式,并将现行标准录入数据库; 然后将拆解完的被测标准与数据库中相关标准进行比较,通过自动测试和人工辅助检测约束性内容是否一致,并记录检测结果,最终形成测试报告。

结 语

综上所述,对于测绘地理信息标准一致性的测试不仅有利于整个测试的统一协调性,还有利于提高标准的质量以及标准的使用性。

参考文献