大数据开发的过程合集12篇

时间:2023-07-05 15:59:44

大数据开发的过程

大数据开发的过程篇1

中图分类号:TP311.13;TP311.56

文献标志码:A

Universal external database design program

ZHONG Runyang,DAI Qingyun,ZHOU Ke,DAI Xinbo,WANG Jing

(Faculty of Info. Eng.,Guangdong Univ. of Tech.,Guangzhou 510006,China)

Abstract:As to the issues of the lack of visualization,the management difficulty of database table fields,and the big program modification with database change,an universal external database design program is implemented under the software design background of Discrete Manufacturing Execution System(DMES) which is combined with the universal principle and object of software design. The development uses Delphi 6.0 and an ini file that save the configurations to increase the flexibility of database link and unify all link model for all application programs. The application example in DMES shows that the program can improve database visualization level,manage database resources flexibly,shorten software development cycle and improve software development efficiency.

Key words:external database design program;visual database design;discrete manufacturing execution system

0 引 言

软件技术和方法的不断推陈出新,都必须以适应现有数据库为前提;与此同时,软件开发过程中,数据库设计与实际业务流程及软件性能要求密切相关;数据库设计的好坏、性能的高低直接关系着整个软件系统的生命周期长短.所以,辅助数据库设计程序是最有力的辅助设计工具之一.

当前,数据库设计采用SDE中间件技术的数据引擎处理,但是SDE是位于客户端及RDBMS之间的空间服务器,与RDBMS集成于服务器端.[1]目前,软件设计过程中通常使用基于中间件的思想设计数据库辅助工具.[2]另外,一些大型软件系统用本身自带的数据库辅助工具配合软件设计,但这些程序缺乏通用性,只能针对某一具体数据库及其相应软件进行数据库设计,如SAP等大型的ERP软件等.

目前,产品化数据库辅助软件的数据库管理程序只是单纯的数据管理系统,缺乏辅助软件设计、数据库表及字段管理、其他数据库资源管理的基本功能,及对数据库个性化设计功能.而全方位、自定义的辅助数据库设计工具是软件设计人员梦寐以求的,所以集数据库辅助设计程序和软件系统开发本身于一体的辅助程序越来越被人们研究和探讨,通用外挂式辅助数据库设计程序(以下简称设计程序)是软件开发人员研究的热点.

1 设计程序

该设计程序是不脱离数据库设计和软件设计、以程序外挂形式呈现出来的软件系统设计辅助工具,为提高软件开发效率、减少软件开发周期而设计.软件开发人员用其管理数据库、协助软件开发,使数据库设计可视化并具有灵活性.

1.1 概念提出

外挂式就是以用户界面形式呈现出来,用以完成对数据库内容进行灵活管理,同时结合所开发的软件系统,实现软件开发与数据库设计无代码开发、自定义设计.

1.2 参数传递定义

设计程序不仅辅助数据库设计,而且还通过模块化参数传递实现软件模块化设计.该设计采用通用函数完成模块功能,通过不同参数代号完成不同操作,达到满足不同程序模块功能需求的目的.以下为具体实现方式.

(1)Q|另一个表的字段名称.将另外一个表的记录自动赋给该字段,且该字段在新增窗体中为隐藏字段.

(2)B|ListName|Caption,ID|ID|caption|Condition|caption|Related Key.本字段则可省略最后1项,含义为:类型|表名|Select语句|读写字段|显示名称|Where条件|Order排序|本表关联过来的字段.

(3)R|MainID|ID.取值为主表传入字段值,含义为:类型|本表字段名称|父表字段名称.

(4)R|t-BatchMain|BatchNo,ID|ID|BatchNo|BatchMainID.含义为:类型|表名|Select语句|读写字段|显示名称|本表关联字段名称.

(5)S|10,T,R|UserID:通用模块中的用户自定义字段.

(6)W:表明是不存在的表的字段.

1.3 语法定义

(1)Q|j-bug-part|BugPart,BugPartCode|BugPartCode|BugPart|ID>0|BugPartCode|PartCode|QW1|Main|j-bug-partToitem|PartCode|ProcCode|@@ProcCode:写在关联字段BugPart的列规则上,|QW1|Main表明存在其他字段的变化依存本字段的值,其中序号的存在可以完成多个这样的触发功能.在该规则中:j-bug-partToitem为依存表,PartCode为条件列名,ProcCode为关联条件字段,@@ProcCode表明为外联记录集条件字段.

(2)Q|j-bug-item|ItemName,ItemCode|ItemCode|ItemName|ID>0|ItemCode|ItemCode|QW1|Sub|j-bug-partToitem|ItemCode|PartCode|@PartCode|ProcCode|@@ProcCode:写在关联字段ItemName的列规则上,|QW1|Sub表明该字段的变化与该字段的依存字段有关.在该规则中:j-bug-partToitem为依存表,ItemCode为条件列名,PartCode为级联触发字段,@PartCode为级联触发字段值,ProcCode为关联条件字段,@@ProcCode表明为关联条件字段值.

通过定义规则,利用设计程序辅助软件程序的开发,在此基础上对关联表进行操作,无须增加源代码开发量和数据库语句的书写量,节约开发时的语句成本,增加通用性,修改也较方便.

1.4 解析定义

通过以上参数定义及语法定义,将传入的参数转换成字符串,通过解析表(见表1)进行统一解析.

2 设计程序特点

设计程序具有如下特点:

(1)面向数据库管理的全方位详细设计,包括视图和存储过程等数据库设计中常用的技术及方法;(2)支持无代码开发,自定义设计功能较强,通过模块化的设计思想,把模块功能以参数形式输入,无须重复开发源码;(3)流程化处理,对建立的数据库表格在外挂式辅助数据库设计程序中统一管理;(4)开放式数据管理,支持各种数据库格式,支持网络数据库开发,轻松设计服务端与客户端应用程序;(5)信息分类方便,支持数据表模糊查询、排序;(6)支持可视化数据库表、字段备注.

以离散制造执行系统(Discrete Manufacturing Execution System,DMES)在离散制造业中的软件设计为背景,结合DMES系统中管理程序、通信服务程序、计划服务程序和接口服务程序来阐述设计程序的实现.

3 实现方法

设计程序以界面形式管理软件开发过程中的数据库资源.在DMES系统中,数据库表较多、关系复杂,视图、存储过程和事务等较难管理,这是在离散制造业中生产场景较多、流程复杂的实际背景下,DMES系统较难实现的最重要原因之一.如何管理离散制造业中相关的软、硬件数据是数据库设计人员必须面对的重大问题.结合软件系统开发,整合有效数据库实现方法是目前DMES软件开发亟待解决的问题

3.1 程序框架结构

基于离散制造业系统背景下的DMES系统主要由以下几部分构成:管理程序,主要负责车间内部生产执行的管理、基本资料的管理以及生产过程中各种资源的协调;计划服务程序,主要对车间任务布置、计划调度、车间排产进行有效整合,达到自动排产的目的;通信程序,主要对生产过程现场作业的实时数据进行采集,实现软硬件系统的实时数据交互,是系统数据交互的桥梁;接口程序,用来整合DMES系统与其他系统的数据,给生产车间上层的系统提供服务,为管理层提供车间作业真实数据,是数据传递的主通道.设计程序是在软件系统开发时,整合以上所有系统的数据库设计辅助工具,当软件成型后,在测试阶段对数据库的数据一致性和完整性等提供有效检测.系统框架结构见图1.

图 1 系统框架结构

3.2 主要解决的问题

在DMES软件开发过程中,以上几个程序部分为并行开发,使用共用数据库,所以统一管理数据库资源,使数据库保持数据的一致性、完整性、流畅性显得更为重要.[3]而设计程序最主要的就是根据软件系统的需要,针对各个程序进行辅助数据库及程序模块设计,使用不同的参数传递方式,实现各模块间数据的传递及模块功能自定义设计.具体体现在以下几个方面:

(1)在协助数据库资源管理的同时,辅助软件系统的开发.设计程序对数据库所有资源进行管理的同时,用无代码开发技术开发软件模块,通过模块代码及参数的输入方式实现软件开发,从单纯的软件代码开发变为可配置式的软件模块开发模式,以此提高软件开发效率,缩短开发周期.

(2)通过可视化管理数据库表字段的方式,提高数据库表及字段的可视化程度.通过设计程序界面对数据库内用户表、视图和存储过程等进行全面管理,控制这些字段在软件系统中的显示方式、关联性及其他相应属性,如空值、只读、外部赋值和默认值等.

(3)通过通用的输入条件函数,对所有数据库表格进行关联性操作,利用字母代码表示不同模块和不同操作.

(4)携带的查询分析器功能可以测试相应的数据库程序,还可以方便地进行数据库语言编程,把一些不用的数据库表从数据库中删除.

(5)可以对需要管理的数据库进行配置,同时支持本地和远程数据库,可管理多数据库类型.

3.3 程序实现

设计程序的实现采用面向对象的开发工具Delphi 6.0进行开发[4],采用ini文件方式保存系统配置,增加数据库链接的灵活性并对整个软件系统起作用,并统一各程序链接数据库模式.设计程序界面见图2.设计程序可以协助软件模块的开发,以模块配置的形式开发软件,只需与该程序中的数据库表、视图、存储过程名称一致,把相应字段作为参数输入到条件表达式中,即可完成相应模块的软件开发.在软件功能模块修改时无须更改源程序代码,只需更改输入条件参数,为以后的软件测试及软件维护提供方便.

图 2 设计程序界面

设计程序可以对用户指定链接的数据库资源进行管理,通过对数据库选择进行配置,该配置与DMES软件系统的其他配置一致,达到统一管理软件所涉及数据库资源的目的.

4 结束语

利用设计程序协助软件的开发思想近年来比较流行,正是因为通过外挂式辅助程序可以大幅度提高软件开发效率,而协同式软件设计模式正符合当前软件设计过程中可视化、同步性的要求.通过实践证明,应用该设计程序可以大大缩短软件开发周期,通过模块化、配置式的软件开发模式,可以大大减少软件开发过程中源码的书写量及错误的发生;当软件测试阶段出现问题时,无须改动较大程序代码,只需调整输入的条件参数,对特殊业务下的模块功能只需增加相应的通用性函数,通过数据参数输入实现功能,大大方便程序开发人员,尤其是那些没有相关软件开发经验的程序员,通过这种“黑盒”式软件开发环境,可以更快融入开发团队.

参考文献:

[1] 吴孟泉,崔伟宏,梅新. 基于空间数据引擎的数据库设计与构建[J]. 计算机工程,2007,33(6):54-56.

[2] 蔡瑞强,程浩忠. 基于中间件技术的电力市场辅助服务实时数据库设计[J]. 继电器,2007,35(12):22-24.

[3] 谷震离. 数据库设计对SQL Server数据库性能优化分析[J]. 计算机与网络,2007(8):46-47.

[4] 王志新,金寿松. 制造执行系统MES及应用[M] .北京:中国电力出版社,2006:34-57.

[5] 钟润阳,戴青云,周科,等. 基于RFID的Web实时系统构建与实现[J]. 现代计算机,2008(9):7-9.

[6] 周科,钟润阳,戴青云,等. 基于RFID技术的离散制造业MES系统设计与实现[J]. 中国制造业信息化,2008(19),5-11.

[7] 汤国华,叶丹,徐罡,等. 基于设计模式的通用数据库视图生成方法[J]. 计算机辅助工程,2008,17(1):78-82.

[8] 王安保,蒋文蓉,朱彬. 基于扩展无共享结构的并行数据库数据一致性[J]. 计算机辅助工程,2007,16(4):64-67.

[9] 刘卫宁,黄文雷,孙棣华,等. 基于射频识别的离散制造业制造执行系统设计与实现[J]. 计算机集成制造系统,2007,13(10):16-20.

[10] (美)MANNINO M V. 数据库设计、应用开发和管理[M]. 韩宏志,译. 3版. 北京:清华大学出版社,2007:56-67.

大数据开发的过程篇2

中图分类号:TP311 文献标识码:A 文章编号:1007-9599 (2013) 01-0004-03

进销存系统是对企业的进货、销售、库存进行统一管理的应用系统。随着计算机技术不断普及、随着市场竞争越趋激烈,现在中小企业普遍使用进销存系统进行管理。市场上各种进销存系统参差不齐。企业要想在这种大环境中取得竞争的胜利,必须依托信息系统。另外,企业的这些数据量非常大,能对这些数据进行统一管理、统计分析,为提高运作效率、提供决策,提供及大方便。开发一个实用、高效的管理信息系统,为企业带来很大帮助。存储过程在系统设计中应用,能为提高系统的安全性,提高执行效率,方便代码管理带来很好的效果。高效的进销存系统是支撑中小企业实现“零库存”、极大限度降低企业运作成本、追求利益最大化的法宝。中小企业在开发进销存系统软件时,由于开发方便、部署简单、性能优良,通常使用SQLSERVER作为后台数据库管理。开发过程中需要使用SQL语句向后台数据库发送命令,对数据库返回结果进行处理。进销存数据库中的表结构各异,记录规模较大.如何编写高效的程序以实现与数据库进行交互、对数据库进行维护等复杂操作是进销存管理软件开发中的一个难点。现就在基于.NET的开发环境中,以通用进销存系统业绩提成统计模块开发中结合应用视图和存储过程作一些探讨。

1 视图和存储过程概述

视图相当于创建的一张虚拟表或存储查询,视图访问的数据不作为独特的对象存储在数据库内。SELECT语句结果集构成视力的内容,在程序开发中可以使用视图实现下列功能:限定用户查询表中的特定行或特定列上;将多个表中的列链接起来,使它们看起来像一个表;聚合信息。使用视图的优点:保护敏感数据;封装复杂查询;满足不同用户对数据的需求;提供一定程度上的独立性。在数据库管理系统中使用CREATEVIEW指令来创建视图。

存储过程是在数据库系统中,一组为了完成特定功能的SQL语句集,经编译后存储在数据库中,用户通过指定存储过程的名字并给出参数(如果该存储过程带有参数)来执行它。

使用存储过程明显具有以下优点:允许组件式编程。存储过程在被创建以后可以在程序中被多次调用而不必重新编写该存储过程的SQL语句,而且数据库管理人员可随时对存储过程进行修改。只要过程接口不发生变化,对应用程序源代码并无影响,从而极大地提高了程序的可移植性;更快的执行速度。存储过程是预编译的,在首次运行一个存储过程时查询优化器对其进行分析、优化,并给出最终被存在系统表中的执行计划。而采用第一种方法则需要在每次运行时都要对发送到数据库的所有SQL语句进行编译和优化;降低网络负载。应用程序调用存储过程时,网络中传送的仅是该条调用语句。而采用第一种方法将传送多条SQL语句,从而大大增加了网络流量,在对数据库网络访问量达到一定程度时,可能造成网络堵塞;增强数据库的安全性。系统管理员通过对执行某一存储过程的权限进行限制,能够实现对相应的数据访问权限的限制,避免非授权用户对数据的访问,保证数据的安全。在数据库管理系统中使用create procedure指令来创建存储过程。

2 以业绩统计为例探讨视图和存储过程在进销存系统开发中的具体应用

现在中小企业的管理中,为了提高员工的积极性,常用的激励办法是业绩提成。组合查询业绩统计是进销存系统最复杂的逻辑。现以组合条件查询业绩为例,结合视图和存储过程来来实现。例如中小企业为每个客户公司设定一个销售主管和销售助理,并对销售主管和助理设定一个提成比例,每一个员工,既可以是这个客户的主管,也可以是其他客户的助理,根据不同类型的客户,其提成比例都不一致。每完成一笔对该客户的销售,可以分别会对销售主管和助理按提成比例统计业绩。现将实现这功能所需要的数据表、创建视图、存储过程及运行效果表述如下:

2.1 数据表及关系

客户资料(数据库表名:tb_client)用途:存放客户相关的数据;

销售表(数据表名:tb_bill)用途:存放销售单的数据;

销售明细表(数据表名:tb_bill_product)用途:存放销售单中相关的货品明细数据;

货品信息(数据库表名:GoodsData)用途:存放货品信息数据;

用户表(数据库表名:Username)用途:存放系统用户的数据;

2.2 创建视图

用CREATEVIEW指令创建视图view_tj_yeji。该视图通过链接多个表显示每个客户每个销售单的每个商品的情况。主要包括客户的信息、客户的销售单情况、销售单包括的商品情况、商品明细信息。

SQLSERVER数据库端创建视图代码:

2.3 创建存储过程

在视图的基础上创建存储过程,用CREATEPROC EDURE指令创建名为P_view_hjyjgw的存储过程,进行业绩提成统计。该存储过程是带参数的,其参数是输入的组合条件,实现生成以员工为基准的统计表,按照输入的复杂条件进行统计。

组合查询图:

运行统计效果图:

点击业绩数据,可以显示该名员工在组合条件查询下的产生该业绩数据所包含的销售单及商品情况。后台是调用之前创建的视图view_tj_yeji。

调用视图的代码:

销售业绩明细表效果图:

以上代码在真实环境中运行通过,相关图片是真实运行情况下的切图。与数据库连接,一些相关函数的定义代码省略。在实际应用中,我们还可以通过带参数的存储过程构建动态SQL语句,实现更复杂的功能,提高程序的通用性和可扩展性。

3 结语

在进销存系统开发过程中,将与数据库相关的操作通过视图和存储过程等方式写到数据库组件中,将数据呈现通过数据控件调用视图或存储过程实现,这样做将大大提高系统的开发效率,对于程序维护也相当方便,与数据库相关的修改直接在后台数据改视图和存储过程即可,无须改程序代码,无须重新编译。在进销存系统软件开发过程中综合运用存储过程和视图,会给软件设计带来极大的方便,还可以提高软件的安全性、提高软件的运行效率。当然,SQLSERVER数据库对象除了存储过程和视图以外,还有触发器和索引等等,在以后应用程序开发过程中,综合运用上述组件,往往会带来事半功倍的效果。

参考文献:

[1]邓超群,蒋永进.销存一体化管理信息系统分析与设计[J].现代商业:177-178.

大数据开发的过程篇3

一、引言

在开发客户/服务器模式数据库应用程序过程中,SQL语句是应用程序与数据库之间使用的主要编程接口。应用程序与数据库交互执行操作有两种方式:一种是在应用程序中存储一系列操作命令,应用程序在执行的过程中向数据库发送每一条命令;另一种操作方式是在数据库中定义存储过程,在存储过程中记录了一系列的操作命令,每次应用程序只需要调用该过程就可以完成所有操作。

二、在数据库应用程序开发中使用存储过程的优势

在客户/服务器模式数据库应用程序中开发者尽量不使用存储在客户计算机本地的SQL程序,而是将常用的或很复杂的工作预先用SQL语句写好,并用一个指定的名称存储起来,那么以后要求数据库提供与已定义好的存储过程的功能相同的服务时,只要调用这个存储过程就可以了。使用存储过程完成操作有很大优势。

(1)符合模块化程序设计思想。存储过程是根据实际功能需要而创建的一个程序模块,它存储在数据库服务器中,所有用户要完成存储过程的功能,只要在程序中调用该存储过程即可。并且存储过程可以重复使用,这也减少数据库开发人员的工作量。当对数据库进行复杂操作时,将操作用存储过程封装起来,与数据库提供的事务处理结合一起使用。

(2)提高数据库应用程序的执行效率。存储过程只在创建时就进行编译和优化,以后每次执行存储过程都不需再重新编译,所以调用存储过程可提高数据库执行速度。这能大大改善系统的性能。

(3)减少网络流量。一个复杂的操作可能需要数百行T-SQL代码的操作,应用程序向数据库服务器发送每一条指令,并对返回的数据进行处理。如果将其创建成存储过程,那么使用一条调用存储过程的语句就可完成所有操作,这样就可避免在网络上发送数百行的代码,从而减少了网络负荷。

(4)存储过程安全性高。数据库管理员可以设定指定用户具有对指定存储过程的使用权限,而且管理员可以不授予用户访问存储过程中涉及的表的权限,而只授予执行存储过程的权限。这样,可以保证用户通过存储过程操纵数据库中的数据,又可以保证用户不能直接访问涉及的表。用户通过存储过程来访问表,所能进行的操作是有限制的,从而有效保证表中数据的安全性。

三、在客户/服务器模式数据库应用程序开发中用户存储过程的创建及执行

存储过程类似于编程语言中的过程和函数,用户存储过程可以使用T-SQL语句CREATE PROCEDURE来创建,使用T-SQL语句EXECUTE(或EXEC)来执行存储过程。

在学生图书借阅管理数据库系统中,图书管理最重要的两项事务是:借书过程和还书过程。为了提高工作效率,创建如下借书存储过程和还书存储过程:

大数据开发的过程篇4

1 引言

软件数据挖掘技术是在软件储存的大量数据中寻找所需信息的技术。软件数据挖掘技术是软件工程研发中数据搜索领域中一项重要研究方向。数据挖掘技术不仅可以有效缩短开发的周期,同时也能够增加软件的延伸性和稳定性。随着电子行业的快速发展,软件开发领域不断受到重视,其数据搜索技术将得到更加广阔的发展和重要应用。因此软件数据挖掘技术的发展不仅具有重要的学术研究价值,同时也具有十分重要的应用价值。本文主要介绍软件数据挖掘技术的研究现状、所遇到的发展问题及未来的发展方向。

2 软件数据挖掘技术

2.1 软件数据挖掘技术的发展背景

软件数据主要是在软件研发过程中,研究人员对软件的开发进行模拟,分析,对软件开发,升级进行操作性分析,其重要编码、代码等相关数据。这些重要的信息数据是研究人员获取软件开发信息的唯一来源。随着软件技术的发展和软件的升级更新,软件中其重要的研发编码和工程信息将出现指数性增长。例如:Kumia软件研发数据中,其编码超过600万行。随着软件的升级更新,这对研究者对软件价值数据开发的有很高要求。因此利用软件数据挖掘技术获取软件工程数据对研发人员开发和软件升级是十分重要的。

2.2 软件数据挖掘技术的过程

通常情况下,软件研发中工程数据的获取主要寻找未升级更新的原始数据,这些工程数据便于研究人员发现。这些数据信息来自不同形式的云数据中,来源途径不同,数据格式有差异,但较为容易转为同一格式。通过对软件挖掘数据过程中数据噪音、无序数据的筛选,可以对工程数据进行挖掘。近些年,主要的稻菟阉鞔理技术包括LDA、LSA。

工程数据挖掘这一技术是从软件数据信息中的海量数据中寻找出能够代表软件重要信息和基本规律的原始数据。导入的数据是规律有序的代码或文本,将相关、分支信息的形式表现出来,这些信息的表现形式与挖掘技术有重要联系。

评估论证信息。通过对搜索结果的评估确认出对开发者和使用者有价值的数据。其中包括将软件和工程信息等转化为使用者能够理解和方便使用的形式,并将评估结果提供给研发人员。

3 软件数据挖掘技术面临的问题

3.1 软件数据复杂化

目前软件工程所涉及的数据主要包括两类:结构化和非结构化。结构化数据中包含很多信息涉及软件类型和错误报告。而非结构化数据主要包含软件工程的编码、代码等。两类工程数据采用不同的算法和编撰程序,但是两者之间还有很多密切的联系。因此在软件工程数据挖掘过程中要深入了解两个工程数据的联系和结构不同,这对数据提取造成很多困难。

3.2 分析方法难道高

软件工程数据挖掘后期的主要工作是将获取的数据转换成用户能够接受的形式。在传统的数据提取技术过程中,如电子商务等需要将其转换成数字或图表等,但是这对软件开发者并不是件轻松的工作,其包含很多分析编程方法、错误报告的选取。这对软件数据挖掘技术发展存在一定挑战。

3.3 软件数据挖掘结果标准多样化

很多行业对软件工程数据挖掘都有一定应用。但是在表达和评估结构上,软件工程数据存在较多标准,且标准不唯一。这对软件开发者获取数据后处理将是极为复杂,同时不同标准需要数据表达的方式也不尽相同,若想获取准确的数据信息结果存在一定困难。

4 软件数据挖掘技术的解决方法

4.1 软件信息复杂化解决办法

数据复杂化解决办法主要有三种:

4.1.1 数据结构类型复杂化

目前研究人员通过对软件信息的结构图和结构网中获取信息。

4.1.2 数据间联系复杂化

这种类型数据可以通过软件数据升级,强化数据间的联系程度,进一步提高获取有用信息数据的准确性。

4.1.3 数据中存在大量错误报告和缺失数据

对于这种类型的报告可以采用半管理式分析方法降低错误或缺失数据带来的影响。

4.2 非传统数据的分析方法

对于文本或数据等软件数据,软件研发人员采用使用范例的形式进行分析,很多研究结果涉及软件使用案例和编程规则。同时将程序可视化,极大的满足了研究人员对非传统数据挖掘的要求。

4.3 挖掘数据评估结果解放办法

传统的数据评估方法很难使用不断变化的软件工程挖掘技术,研究人员通过利用缺陷检测的评估方法对提取数据进行评估,但是这种方便也存在一定问题,还不成熟,评估结果的客观性不充分,由于服务对象用户的需求不同,因此需要软件工程数据挖掘技术采用更多管理学上的方法。

5 软件工程数据挖掘的发展趋势

对于软件工程数据的需求,开发出更高效的挖掘分析方法。从精准的关键数据向模糊数据发展;分析检测错误或缺陷更加适应其复杂化;探索更为高效预处理数据方法;引入新的软件工程技术,利用互联网技术智能化的特征开发数据挖掘工作;这些利用数据挖掘技术整合技术信息、工程数据或利用数据挖掘工具设计软件,辅助软件模块的开发等。

6 结论

随着互联网时代的不断发展,电子技术日新月异,同时软件开发技术也得到前所未有的发展,人们利用软件技术开发解决生活、工作中的问题更加普遍,这对软件工程数据挖掘技术提出了更多要求,难道也越来越大。本文通过对软件工程数据挖掘技术的介绍和相关概念的分析,对目前所面临的一些技术问题进行概述,同时对未来遇到的挑战和应对措施进行探究,最后提出一些解决办法。希望能够为软件工程数据挖掘技术的研究人员提供一些有意义的建议和参考。

参考文献

[1]毛澄映,卢炎生,胡小华.数据挖掘技术在软件工程中的应用综述[J].计算机科学,2009(05):1-6.

[2]李新,张晓静,米燕涛.软件开发过程中的数据挖掘[J].石家庄职业技术学院学报,2007(02):31-33.

大数据开发的过程篇5

大数据技术事实上是将人类日常生活中产生的各种数字信息,将这些信息收集起来之后分类处理,设定不同类别的存储空间,按照类别存储。大数据技术从功能的角度出发可以划分为多个类别,诸如分析技术、机器学习技术、遗传算法技术、自然语音处理技术等。应用大数据技术分析,就是基于当前的科学技术发展起来的一种分析技术。它主要依靠现代科技手段发挥技术的作用,特别网络技术发挥着基础性的作用。整理基础数据,对数据信息进行分类整理,应用相应的计算机算法,将相似特性的数据划分为一类,最终得到大量的数据,应用大数据技术对这些数据进行分析。大数据分析应用于互联网行业中,所发挥的优势是有目共睹的,而且还不断地引入新技术,在软件工程技术中应用,对该技术的发展起到了促进作用[1]。

大数据时代,社会各个领域都已经实现了信息化发展,人们对软件工程的概念越来越熟悉。事实上,软件工程的历史始于20世纪的中期,其研究重点是软件技术和工程管理。将相关工程内容引入其中,使得工程系统化运行,其中所涵盖的研究内容包括软件的生命周期、软件工程设计、软件的技术维护等方面。因此,在软件设计的过程中,要控制好技术开发成本,保证工程质量,使其生命周期不断延长,不同项目的技术需求和用户的各种技术需求都能够得到满足。

2大数据背景下的软件工程基础

处于大数据时代环境中,软件工程的发展中关乎到不同的领域,需要高度重视。大数据技术具有专业性的特点,还具有很强的实用性价值。在软件工程技术的研究中,要从应用需求出发不断创新软件技术,对于传统的技术要不断摒弃,对软件工程的发展创造良好的客观条件。大数据技术环境下,软件工程基础是基于互联网技术建立起来的,对各种数据信息系统化管理,根据需要进行处理,对工业的发展非常有利[2]。在软件工程技术中,大数据的安全性问题是需要高度重视的,否则,就会对软件工程技术造成不良影响,引起严重的后果。

2.1软件服务工程

在软件工程的研究范畴中,软件服务工程的数量不断增多。软件工程服务化方向发展,就是发挥服务的作用,使其成为软件开发的基本原则,按照服务项目内容为用户展开服务。由于软件工程发展的主题有所,服务内容也要做出相应的调整,同城是对软件工程的进行技术维护。在具体的服务工作中,需要软件开发人员使用分布式应用程序,在管理工作中采用虚拟操作的方法为用户2019.08提供服务[3]。软件工程技术应用中,结合使用大数据技术,可以对网络数据进行编程,使得软件具有互操作性,对于数据主动协调,使其符合动态场景的变化节奏,软件系统的集成度有所提高。

2.2软件开源

软件开源更为注重用户对软件技术的体验。在对软件开源进行研究的过程中,采用常规的方法,虽然获得一定的成果,但是应用价值不是很高。一些研究人员在研究软件工程技术的时候,就是将软件开源作为突破口,将开发项目划分为多个模块,将每个模块分给指定的研究人员进行开发。

2.3群体软件工程

群体软件工程是通过网络发布的方式进行软件开发,具体的实施中采用工程众包的形式,使得软件开发技术发挥作用。群体软件工程是一个分布式软件开发模型,这个工程项目的运行中,可以通过网络实现,对各项任务进行分配,也可以进行创造性的查询,通过众包解决软件开发过程中遇到的一些困难和重要问题。同时,在软件工程开发过程中,软件工程可以在任何阶段通过众包进行开发[4]。

3大数据与软件工程技术的未来发展方向

3.1大数据与软件工程技术开放式的发展

大数据技术的主要前提是大量的数据流,需要技术不断地升级和创新,寻求开发的研究途径是非常必要的。计算机网络的发展意味着计算机可以在开放的环境中相互通信,共享数据资源,软件等信息的有效利用能力也会有所提升。通过网络运行可以增加利润,使得用户的各种需求得到满足,提高资源的利用率。

3.2大数据与软件工程技术融合到其他领域

软件工程技术在当今许多科学领域有着广泛的应用。由于软件工程技术给予各个领域非常大的帮助,从航空到生活中都发挥着软件工程技术的作用[5]。应用程序的运行,可以使用数据平台对信息进行收集并分析。比如,用户在进行股票交易的过程中应用大数据技术,可以使用软件工程技术构建数据模型,通过对数据模型的分析,预测股票的变化趋势。

4众包软件服务工程中的大数据技术

在软件开发过程中,必须有足够的硬件和软件基础来支持数据流,随着数据流的量逐渐增多,对硬件和软件就有了新的要求。专家学者在分析数据流的时候,还对在线服务进行了研究。数据流是重点内容,主要是对数据流的使用方法进行研究,对支撑数据流的软件和硬件进行研究[6]。从软件工程开发的角度而言,软件运行中都会产生大量的数据流,包括服务端、用户端等,都会有很多的数据信息产生,这些数据流对软件和硬件的使用寿命起到了决定性的作用。软件工程的开发中,要做好数据流的管理工作。有必要对原始数据进行深入的研究,为提高软件的使用寿命创造条件,对数据流的分析要高度重视[7]。

5密集型数据科研第四范式

第四种科学研究范式是指根据实际情况建立独立的科学研究方法,探索第四种范式的理论基础,以及大型数据存储设备在发展中的重要性。软件工程中,采用传统的大数据研究方法,大数据的有效分析是不可能的,大数据的研究还没有取得突破性的成果。因此,目前大多数软件不能在短时间内同时实现数据信息的存储、数据信息的传输和有效识别。在探索第四范式理论和研究方法的过程中,首先需要对集成大数据的软件服务价值进行估计,抛弃传统的大数据统计方法,建立新的大数据信息统计方法和分析方法[8]。此外,有必要从多个方面研究大数据的处理,对大数据信息进行管理并深入分析,讨论大数据的价值以及存在的可变性,这对软件工程的发展起着重要的作用。在研究软件工程技术的时候,必须更新传统的软件开发理念,重视软件处理和分析大数据能力的发展,使得软件产业呈现出新的发展面貌。

在当今大数据时代,软件工程技术的研究已经区域复杂。随着数据的指数的不断增长,软件技术对硬件设备数据处理能力产生一定的影响。因此,在对软件工程技术的研究中,就需要对大数据技术的特点进行研究,基于此研究软件工程技术,使得硬件设备的数据处理能力有所提高。在研发开发软件技术的过程中,要从应用领域的需求出发对大数据技术进行分析,在大数据开发理论的基础上创新软件开发理论,促进软件技术更好地发展。

大数据开发的过程篇6

作者简介:文娟(1982-),女,湖南长沙;研究方向:计算机应用,大数据,云计算。

近年来,信息技术飞速发展的过程中,相关软件技术也不断增加,增加了软件维护的难度。现阶段数据挖掘技术被有效应用于软件工程中,在及时提取数据上具有重要意义。不同软件在使用过程中会经历多个阶段,其中开发及测试阶段尤为重要,如果能降低二者使用时间及成本,将有利于软件工程效率的大幅度提升。本文首先对软件数据挖掘进行了简要介绍,并探讨了数据挖掘特点,在此基础上对面向软件工程数据挖掘的开发测试技术展开了研究。

1软件数据挖掘简介

现阶段,数据挖掘技术在应用过程中影响力越来越大,其在应用过程中能够深入挖掘大量数据中的重要信息,这一功能对于软件工程具有深刻影响,软件开发时间的缩短,促使效率大幅度提升,对稳定性和实用性在软件中的体现具有促进作用[1]。软件工程数据指的是在产生于开发软件过程中大量数据的积累,这些数据能够对文本的分析及解释起到重要作用[2]。这些数据是软件开发工作者获得信息的重要途径。现阶段,指数性特点是增加软件工程数据的主要特征,是在提升软件开发技术、扩大其规模基础上形成的。在这种情况下,数据的挖掘能促使软件工程在开发过程中更有规律地进行。

2软件工程数据挖掘的技术特点

在开发软件的过程中通常会产生大量的数据,这些数据统称为软件工程数据。这部分数据拥有重要的功能及作用。例如,能进行有效的文档设计、对文档可行性进行分析,生产软件代码、确定软件版本等。由此可见,软件工程数据的产生对软件开发工作具有重要贡献。作为一项信息工作,复杂而系统是数据挖掘最大的特点,重要的信息只能在大量的数据中筛选和应用。现阶段我国在积极进行计算机技术研究的过程中开展了软件工程数据挖掘工作,充分代表了我国在信息技术中的创新性[3]。在软件工程领域中有效应用软件工程数据挖掘技术,能够更地进行提取和分析挖掘技术,也能够保证软件开发及使用者在日常工作过程中享有更加完善的服务。

3面向软件工程数据挖掘的开发测试技术

3.1代码理解

开发软件流程中,工作人员需要解决很多问题,其中包括:首先,维护项目代码。然而原有文档在项目当中已经超出使用期限,也有很多情况下该文档已经消失;其次,修改项目缺陷。然而这一过程中,工作人员根本没有项目代码的详细资料;再次,审查项目代码。由于代码众多,工作人员的工作难度较大;最后,提取项目架构设计。这一过程中工作人员通常只能够掌握其源代码[4]。针对以上问题,分层聚类是工作人员面对源代码的主要方式,可视化展示不同的模块,这样一来能够更加准确地掌握项目架构在代码中的体现。分层聚类法的有效应用,能够促使源代码的分析更加精确,而这一方法在使用过程中通常包含2个内容,即聚类分别建立在PageRank和调用入口基础之上。

在分析软件系统结构的时候,软件聚类是重要的方法之一,该方法的有效应用能够促使维护软件工作更加顺利。例如,复用软件模块,挖掘软件体系结构等。在这一方法下,相关工作人员可以充分掌握总体结构在软件系统中的体现,并能够明确局部的详细信息。一般来讲,如果想灵活切换在该方式下得以体现,应提升相关设备的性能。例如,首先,划分软件聚类模块的层次;其次,在详细掌握用户对软件聚类使用状况的基础上促进调整的动态性。在软件聚类内容中,一个重要的组成部分就是图聚类,加强对其的研究便可以得出软件聚类的层次化算法,该算法是建立在有效分析源代码基础上的,能够促使聚类结果和层次的显示以多粒度的方式进行。同样,该算法在应用过程中也包含2个方面,同时能够将新的途径应用于命名输出的聚类结果模块当中,这种方式是建立在文本挖掘基础上的,模块命名具有一定的语义信息是文本信息的主要特点。

3.2代码开发

目前,编程建立在开源框架基础上的就是JAVA应用,这一过程中,XML配置文件是促使逻辑控制在配置中得以实现的前提,然而现阶段单机版是JAVA应用的主要特点,复杂性是框架逻辑的主要特征,文档化在开源框架当中较低。在这种情况下,工作人员在配置和使用框架的过程中存在较大的误差。新时期在积极解决以上问题的过程中,相关专业人员提出了一个推荐方法,该方法建立在XML配置文件和XML配置片段基础之上,前者根据应用代码库而建立,后者根据代码关联结构挖掘而建立。在软件开发过程中积极应用这一手段,促使编辑配置文件的过程中大幅度提升效率和质量。而频繁字数挖掘是以上方法的关键所在,在大量的实现分析数据下,会充分展现该方法的有效性,其在XML配置片段当中更是充当着不可替代的地位,由此可见,其在软件开发过程中具有重要意义。

现阶段,新系统的构建是软件开发的重要环节,工作人员要想实现编程,必须对编程框架进行明确的利用,从而充分发挥其通用,同时还能够清楚表达其程序机构。在框架编程的过程中,工作人员应当积极扩展相关编程,并且应构建XML配置文件。相当一部分优势体现在框架编程当中,然而现阶段在将其应用到实际环境中时,仍然体现出种种不足[5]。例如,很容易利用其逻辑缺陷,同时工作人员无法正确而有效地使用该框架。由此可见,有效应用配置代码,充分发挥其实用性,能够促使数据及途径得以展现出来。

3.3回归测试

在开发软件应用以后,使用者在使用过程中经常会出现修改代码的状况,这一状况产生于使用以前和使用过程中,产生这种状况的主要原因是功能更新及代码缺陷等现象的存在。如在更新代码以后,需对其重新,在这之前,需要精确测试代码,就是所谓的回归测试。这一步骤实施的主要原因是对修改软件进行验证,从而充分发挥软件使用过程中的功能[6]。在这种情况下,软件在使用过程中,回归测试的价值不容忽视,对软件质量具有直接影响。新时期,我国在积极进行面向软件工程数据挖掘的开发测试技术研究的过程中,应当首先注重创新软件工程理念及措施。

加强分析实施需求,促使形式化、规范化等要求在数据挖掘中得以体现,在开发软件的相关理念上,重视数据挖掘,将烟花性设计有效应用于软件工程的架构当中,同时进行科学的创新,有效应用先进技术,促使软件编写能力得以提升;其次,加强对人工智能的应用。在我国科学和信息技术不断进步的背景下,我国各个领域在研究过程中已经开始对机器学习进行充分的利用,因此在软件工程数据挖掘的过程中,也应当对该技术进行充分的利用,为我国的软件开发创造更多奇迹。人工智能是现阶段我国科学技术创新中的代表,其拥有较强的学习和运算功能,能够促使软件工程数据挖掘工作更加精确、快捷,同时能够运用较为成熟的方式对运算过程中遇到的问题进行处理;最后,有效评价数据挖掘结果[7]。我国传统的数据挖掘测试技术在应用过程中无法对其结果进行充分的评价,也就导致重要的数据在经过深入挖掘以后无法得到有效应用。因此,新时期,我国工作人员应当对数据挖掘进行全面的缺陷检验,加强对结果的分析,在充分利用相关软件的基础上,得到用户的真实评价,在实践中不断完善。

4结语

综上所述,软件工程数据挖掘指的是在软件挖掘过程中产生的海量数据,被深入挖掘以后产生重要的、有价值的数据。这部分数据的有效应用能够促使软件开发更加便利和顺畅,能够促使开发出来的软件更具使用价值,使用寿命也更长,在此技术基础上进行的开发测试技术,能够为提高软件工程开发效率起到促进作用。因此,现阶段积极加强面向软件工程数据挖掘的开发测试技术的研究具有重要意义。

参考文献

[1]陈媛.基于数据挖掘的软件缺陷预测技术研究[D].长春:中国科学院研究生院长春光学精密机械与物理研究所,2012.

[2]朱沿旭.面向开源社区的Web数据抽取与挖掘关键技术研究[D].长沙:国防科学技术大学,2011.

[3]胡瑞飞.面向机械工程计算机测试系统的数据挖掘技术研究[D].成都:四川大学,2006.

[4]张律.面向数据挖掘的科研信息管理系统的研究与开发[D].成都:电子科技大学,2013.

[5]沃高全.基于实时可视化数据挖掘的高并发性能监测系统设计与实现[D].上海:复旦大学,2010.

大数据开发的过程篇7

1 课程发展的定位和作用

《网络数据库技术》是我院计算机网络技术专业的一门职业技能课和专业核心课程,课程的教学任务是使学生具备SQL Server 数据库的基本理论知识与应用技能,通过一个实际数据库应用开发项目的层层推进,使学生在学习解决问题的过程中,学会数据库的应用技术、原理和工具的使用,培养学生成为能够胜任生产、服务、技术和管理第一线工作的高素质劳动者和高级技术应用型人才,更好地为专业建设和专业群的发展服务。

《网络数据库技术》课程开设于学院升格初期,从最初的信息技术类专业职业技能基础课《数据库技术》Access、VFP到2005年的职业技能课《网络数据库技术》SQL Server2000,再升级到2009年的专业核心课程SQL Server2005,2012年被确定为江苏省重点专业群高层互选课程之一,同年,成功申报院“质量工程”的转型升级课程。

2 课程设计的理念与思路

以专业群“项目引领、任务驱动”的教学模式进行设计,学生在教师的带领下以完整的数据库项目作为教学资源,学习SQL SERVER 数据库应用技术。学生要完成的任务是根据实际数据库的设计和开发过程划分的子项目,包括数据库的设计、数据库的创建直至数据库的维护与管理等。其中较大的子项目又可分为若干个模块,在上课的过程中让学生通过一次或几次课逐步完成,每个模块均以数据库系统项目为驱动,提出项目开发中要解决的问题,解决问题的过程就是导入学习数据库实用、够用的知识的过程及掌握SQL SERVER数据库应用技术的过程,这样便以层层递进方式实现数据库系统设计和开发的过程。

为了能更好地训练学生掌握各项能力,针对本课程设计了一个综合的大项目――学生信息管理系统,以其具体实现贯穿教学全过程。学生在教师的带领下开发学生信息系统的过程,就是学习和掌握SQL SERVER数据库应用技术的过程。对于该系统学生要完成的任务是根据实际数据库的设计和开发过程划分为8个子项目,包括数据库的设计、数据库的创建直至数据库的维护与管理等。其中较大的子项目又可分为若干个模块,在上课的过程中让学生通过一次或几次课逐步完成,每个模块均以学生信息系统项目为驱动,提出项目开发中要解决的问题,解决问题的过程就是导入学习数据库实用、够用的知识的过程及掌握SQL SERVER数据库应用技术的过程,这样便以层层递进方式实现“学生信息管理系统”设计和开发的过程。

学生信息管理系统主要让学生课堂训练时使用,此外还使用员工工资管理系统作为课外学生自主学习的同步深化项目,使学生达到复习、巩固、强化知识和技能、开阔视野的目的,并培养学生知识迁移的能力。

通过一学期的学习和能力训练,使学生在以后的工作岗位中能够熟练使用SQL数据操作语句管理和维护数据库,并能在开发实际系统中设计规范化的数据库。

3 教学内容的组织与安排

《网络数据库技术》以任务驱动、项目导向进行教学活动组织,教师在学生的带领下,通过项目教学、问题引导、自主学习等方式,完成完整的、有实用价值的数据库设计项目,学习SQL Server数据库应用技术。教学所使用案例,是根据实际应用中数据库设计和开发过程所划分的小项目,包括数据库的需求分析、数据库设计、数据库的创建、数据库部署应用直至数据库管理维护的数据库开发全过程。

其中较大或较复杂的项目,则根据知识结构进行划分、细化,在上课过程中让学生分次完成,逐步推进,最终完成整个项目的设计,从而让学生了解软件项目及数据库项目开发的全局和细节。

具体教学内容及安排见下表。

4 教学模式的设计与创新

⑴项目引领,工学结合――通过与企业合作,开发一个具体的实际项目的学习,掌握大型数据库的应用技术。教学内容面向企业应用,与就业岗位零距离对接。

⑵任务驱动,问题牵引――宏观教学上以具体项目为驱动,在微观上采用“问题牵引”,通过在各任务单元中要解决问题的延伸、拓展,在前、后知识点之间建立起联系,实现知识点的多重循环;完成各任务单元的过程,就是以层层递进方式实现“学生管理数据库”的过程。

⑶行动导向,主动参与――此方法在本课程教授过程中已经持续使用了4届,学生普遍反映行动导向的教学法对于枯燥的程序设计来说更能够激发学生的学习兴趣和学习主动性。每个学生都能在课堂和课余时间积极地参与进来,完成项目后也很有成就感。此方法为学生创造了参与课程教学的机会,引导学生自主学习。

⑷网络平台,互动创新――学生在实践课或业余时间可以充分利用课程建设的网络资源,变简单的学生观看为学生参与,参与讨论、参与案例设计,使网络教学平台能够为学生自主学习提供支持,充分发挥了网络学习平台的开放性特点。

5 实践教学条件的建设与使用

从2009级起,我们在教学计划中增加了实践教学比重,改革了实践教学内容,改善了实践教学条件,创新了实践教学模式,增加综合性、设计性实验,倡导自选性、协作性实验。

针对专业群面向的行业(产业)与岗位群,以专业群内各专业的岗位通用技能与专门技能训练为基础,系统设计实训体系,整合核心专业与相关专业的实践教学资源,分类组建实训基地。按照实训基地的功能定位,通过“模块化”和“项目化”的形式,开展实训教学内容的系列化建设。

⑴校内实训条件(设备与环境)。为了给学生创造更好的教学和实践环境,我系建设了具备网络数据库应用开发的机房2个。学院配备了多媒体教室,分别配备有计算机、投影仪、音响、话筒等多媒体设备,极大地推动了教学质量和效果的提升。

大数据开发的过程篇8

二、大数据管理工程档案与工程管理模型

大数据管理工程档案也是一个信息的整理的过程,本文在整合管理工程档案现有模型研究的基础上,结合大数据时代的来临给管理工程档案的实施带来的挑战和机遇,通过大数据管理工程档案来促进工程的发展,分析了的大数据时代来临下针对管理工程档案的双向决策模型,分别从工程评估与预测及工程监测与预警两个维度构建了针对大数据管理工程档案的方案[6]。因此,在本文中,针对大数据管理工程档案构建了两种工程档案管理的模型,第一个模型是数据驱动下的的工程监测和预警的模型,采用的技术是跟踪以及聚类;第二个模型是目标驱动的工程评估与预警模型采用的技术是推送以及表征,如下图1所示。1.工程内部集成档案数据目标驱动管理的工程评估与预测模型。工程评估与预测模型的是目标驱动的一个模型,也即在工程内部的目标驱动下的模型,也就是说在这一模型中,工程的决策者需求清楚的界定自己目标需求,根据自己的目标寻求实现目标的路径。可以使用普通的数据挖掘和收集的方法,利用工程信息系统中关于工程档案数据收集、整理以及分析计算等方法来达到,通过收集的数据表征、检索、可视化以及推送等技术实现工程档案大数据开展有针对性目标的挖掘,从而把这些收集整理的数据转化为可以为工程决策目标所利用的信息及建议。此外,工程评估与预测模型是于传统的数据挖掘和收集的方法上发展的,结合计量学学科中的相关技术方法应用于工程档案管理工作中,在目标驱动下对大数据时代来临时工程的策划、工程的实施以及工程的评估等工程档案数据中的海量信息进行有效整理和探析,以达致管理工程档案的效用,从而有效评估工程的发展情况,有效及时的对工程发展的最终目的进行预测。2.工程外部网络信息建档数据驱动管理的工程监测与预警模型。大数据时代来临时工程外部网络中有着海量的有用信息,这些信息对于工程建设中的新思维、新想法能起着启发或促进作用,大数据管理工程档案可以通过实时建档对这些有效核心数据加以收集和利用,在工程实施过程中,可以通过大数据收集对工程发展有积极作用的新信息和新技术,同时对于工程的不利影响因素和工程竞争对手的一些相关技术进行监测,在监测后针对所有会发生的情况进行分析,最终建立起工程的预警和监测档案数据库,从另一个角度说,这也是建立工程监测与预警模型的最终目标。与工程评估与预测模型的目标驱动不同的是,工程评估与预测模型通过预先定下的目标,来根据目标收集和整理相关数据,而工程监测与预警模型则不同,其更为重视通过数据系统自主分析来对网络舆情进行研究,大数据时代来临时的舆情分析系统有聚类、热点主题检测等相关的计算机文本信息的内容识别技术。3.工程管理档案大数据安全战略体系构建。以档案大数据的方式来对工程的实施进行管理有着安全的风险,这也是大数据管理工程档案的存储存在的新安全问题,一般来说,工程档案数据的数量以及质量会对安全存储系统的运行状况带来影响,大数据管理工程档案中的安全存储技术的升级速度较之数据增长的速度慢,因此,相应的面临的大数据安全防护预警风险也大。

大数据开发的过程篇9

Abstract:Conventional database application is restricted by the field structure,although simplified the processing flow,but the processing efficiency is low,often the bottleneck in the application.Using united fields to optimize the database structure.The original repeating data can be integrated,with the combination of SQL language and the single type of storage,can improve the efficiency of data retrieval,fast generation primary optional set.On the optional set operation can use the original database system,can also use the custom database.Customize database can not only get rid of the limitation of database system development process,but also more initiative and flexibility in the data processing and encryption and decryption,is a development trend in small database application. 

Keywords:database structure;united fields;optimize retrieval efficiency;customize database 

1 引言(Introduction) 

近年来,随着计算机硬件设备的不断升级,软件处理能力显著提高。然而,在数据库论文处理方面,却始终存在着一个瓶颈,那就是数据库的字段结构一直制约着数据的处理速度。目前数据库的主要存储方式是硬盘设备,而硬盘设备本身存在着处理速度的极限。在这种条件下,如何提高数据的检索速度就成为一个迫切要解决的问题,尤其是在数据库容量越来越大的情况下。 

数据检索的核心问题在于,如何在海量数据(硬盘存储)中检索出符合条件的可选集,而不在于对于可选集的处理(内存)上,因为内存的访问速度对于数据检索来说是足够的。一旦从数据库上获得可选集,后继的工作就可以转移到内存中工作,处理器的性能就可以得到充分发挥。因此,在提高数据检索的速度方面,应该在优化数据库结构,快速获得可选集上面下工夫,其中包括:减少数据库字段与记录的数量、简化数据类型、减少数据冗余等方面[1]。 

2 数据库结构的优化(Optimization of database structure) 

常规的数据库字段是根据数据的内容属性来定义的,用户对数据的操作界面与数据库结构保持一致,以简单的人员信息管理为例,数据库结构如表1所示。 

这是一种通用的途径,也是数据库厂商建议使用的方法,因为这样可以直接使用数据库访问的预定义功能,包括用户操作界面,同时简化数据库应用程序的开发工作,把程序开发人员和操作人员与核心数据库隔离开来,充分保证数据的安全性[2]。但是,这种使用方法也制约了数据库开发人员的视野,尤其在大型数据库的应用开发过程中,在数据检索的效率方面显得无所作为,或者在具体应用出现瓶颈时推卸责任。 

因此,在数据库开发的规划方面,不一定严格遵循数据库厂商建议的方式,可以根据不同的应用场合和数据类型,建立灵活的数据结构,从而提高数据检索的效率[3,4]。 

这里给出的一种方案,是在数据库结构方面进行的一个大胆的尝试,对于数据类型单一、数据容量较大的应用场合较为适用。它不按数据的内容属性来定义具体的字段,而是采取“联合字段”的结构,将原来多个单一的字段组合成一个联合字段,从而简化了数据库的结构,大大提高了可选集的产生过程可数据检索的效率。 

表1中的人员信息数据库,变换为组成联合字段以后,结构简化如表2所示。 

从表2可以看出,原来数据库中的一张表,现在被简化成了一条记录。通过这种变换,甚至可以把整个数据库都整合在一个字段中,将针对数据库的操作转换为针对少量字符串的操作,大大简化数据的操作过程,提高数据的检索效率。 

在这种方案中,当可选集产生以后,不再使用数据库系统提供的缺省操作界面,而由数据库应用程序开发人员编制特定的操作界面,当然,从外观上,可以借鉴操作人员已经习惯的系统界面,甚至与系统界面保持一致,但下面的代码完全由开发人员自己来完成。这样的开发工作并不复杂,不管在哪种平台上,都不会给开发人员增加太多的额外工作量。而且,程序使用效率的大幅提高,也会很快将额外的开发工作量弥补掉。

联合字段的数据工作过程如图1所示。 

虽然在界面上可以与数据库系统保持一致,但数据库接口与数据库结构对用户来说是完全不透明的,从这个角度来看,不但没有降低数据的安全性,而且在数据转换与存储的过程中,还可以采取灵活的手段进行加解密,提高原有数据的安全性。由于变换后的数据对数据厂商也是不透明的,因此,就实现了数据的双向安全性,这正是目前几乎所有大型数据库应用系统一直面临的困惑。 

联合字段实现双向安全性,如图2所示。 

联合字段的作用,是简化可选集的产生过程,提高可选集的检索效率,因为针对硬盘存储的数据库检索,也是以字段为最小单位进行的,字段数量的缩减,以及字段类型的单一化,对于可选集检索效率的贡献是可想而知的。 

3 数据的处理过程(Data processing procedure) 

3.1 数据单元的概念 

为了阐述方便,首先给出“数据单元”的概念,把按规律排列的格式整齐的重复性的一组数据称为一个数据单元,在常规的数据库中,数据单元也许是一条记录,也许是一条记录中的几个字段[5]。例如在上面的人员信息数据库中,每个人员的信息就可以作为一个数据单元,如:“001王勇男”,姓名在中间,左侧是编号(占三个字符),右侧是性别(占两个字符),格式整齐,排列有规律。在这样的一个数据单元中,编号数据可以从单元数据的左侧选取,性别数据可以从单元的右侧选取,中间剩下的就是姓名的数据,这样的选取方法,不要求位于单元中间的姓名数据为特定的长度。 

利用数据单元,可以对原有的字段进行初步的整合,减少字段的数量,简化字段的类型,精简数据库的原有结构。这样变换后,并不影响对原有数据库的常规操作,因为用户界面是根据功能而重新开发的,不依赖于数据库系统,它所使用的是内存中的数据,已经把磁盘中的存储数据库恢复为原有结构的工作数据库[6]。工作数据库根据操作需要,只选取全部数据的一个子集,所以,对于处理速度与实时性的影响有限,这与系统数据库的工作原理是一样的,见图1。只是在得到可选集的条件上,要进行相应的变换,由于数据单元并不复杂,而且是大量的重复性数据,所以在原理上可以保证可选集的确定性。 

如果数据单元的变换已经能够满足应用的需要,优化过程就可以就此为止,有时候,为了简化开发工作,甚至可以将工作数据库与存储数据库保持一致,这样,应用效率的提高,只体现在可选集的产生过程中,尽管如此,变换前后的效率差异还是显而易见的。 

3.2 数据整合 

如果要进一步提升系统的功能,可以在数据单元的基础上,在两个层面上继续对数据进行整合[7]。 

第一个层面,对数据单元进行整合。把多个数据单元连接在一起,进行联合操作。实现的方法是多种多样的,比如,可以使用特定的分隔连接符,把单元数据连接起来,上面的人员信息数据库,整合以后简化成一条记录: 

001王勇男-002李小萌女-003张虹男-… 

上例中分隔符的选择不能与数据库中的任何数据重复,当数据库的性质与内容确定后,找到合适的分隔符并不困难,它的作用只是单纯地将数据单元分隔开来,并且在数据处理以双向过程中作为定位符,实现工作数据库与存储数据库之间的数据传递。 

第二个层面,是对字段进行联合。这可以打破数据库系统对字段容量的限制。数据单元整合后得到的数据,具有单一的字符串类型,跨字段存储只涉及到简单的分割问题,这是稍有编程经验的开发人员都可以完成的工作。在数据处理的过程中,直接对多个字段进行联合操作,处理过程并不复杂,由自主开发的用户接口程序完成这一工作,应用人员不必关心其中的细节。 

数据库系统在进行数据处理时,往往以字符类型为主,如果数据库中存在多种数据类型,在进行数据处理时也会在内部先转换为字符类型,然后再进行相应的操作。对数据库结构进行优化后,联合字段类型可以全部设置为字符串类型,这样就简化了内部的类型转换,提高了处理效率,检索速度也是最快的。 

要注意的是,最好不要让整合后的联合数据超过操作系统平台所允许的长度,否则在开发时就要面临来自操作系统的种种限制,会影响到用户程序开发的效率。 

3.3 整合数据的处理 

对整合数据进行处理,主要是在工作数据库与存储数据库之间建立起联系的通道,数据检索时,根据指定的条件,首先从存储数据库产生可选集,并以此为基础建立工作数据库,其后的大部分操作都是面向工作数据库的,在内存中完成,只有在操作结束后,或者数据出现变动的情况下,才与存储数据库进行数据交换[8]。 

例如,在人员信息数据库中,按姓名查找某个人员,直接输入查询条件,将优化后的联合字段作为操作对象即可。如果有多个查询条件,比如姓名与性别,可以先对条件进行组合,把“姓名+性别”特征串作为查询条件,然后在存储数据库中进行检索。 

由于存储数据库中的字段已经被优化,字段数量减少、存储类型单一,因此,从存储数据库中检索出可选集的效率得到大幅度提高。 

3.4 注意事项 

(1)使用SQL查询语言 

在可选集的产生过程中,应该充分利用数据系统的技术支持,比如SQL查询技术及数据库索引等技术。即使数据库结构保持不变,使用SQL查询语言,也可以成倍提高检索的效率。在具体的检索过程中,数据库系统会自动建立索引文件,进一步提升数据检索的速度。经初步测算,使用SQL查询语言比不使用在速度上可以提高几十倍。 

(2)用户界面与工作数据库 

由于数据库系统对用户来说是不透明的,所以,应该在数据库应用层面上建立特定的用户接口程序,上面已经提到,这部分工作是传统的数据库开发工作之外的额外工作,主要完成可选集的建立工作,与优化后的数据库结构相匹配。此类的开发工作并不复杂,主要内容是进行大量的字符串变换。用户接口程序是双向工作的,在工作数据库与存储数据库之间传递用户的数据。应用系统对数据操作完成以后,用户界面负责临时数据库中的内容交换到存储数据库中,这个过程只在数据存在变换时进行。在用户操作的过程中,使用的数据库是临时的工作数据库,可以建立在原有数据库系统的基础上,使用临时数据库或者数据快照,把整合的数据重新恢复成内容属性的字段,这是与存储数据库无关的过程,只不过针对的是内存中的临时数据库。因此,如果只是使用现有的数据,而不进行数据的改动,这部分操作界面的实现相对简单[9]。

4 使用定制数据库(Using custom database) 

如果数据规模不大,但对安全性要求较高,可以彻底摆脱数据库系统的限制,采取用户定制的数据库,从底层上直接对数据进行操作,同时便于数据的加解密。目前这类系统在国内的应用不多,也没有引起大多数应用人员的重视。近年来,随着网络安全形势的日益恶化,对于涉及国家重大利益的数据操作,安全性已经成为系统开发的首要目标。因此,使用定制数据库与密文存储的技术,将是未来一段时间内数据库应用开发的重要方向。 

定制数据库的工作过程如图3所示。 

4.1 存储形式 

定制数据库,可以用磁盘文件的形式直接存储在物理介质上。如果数据量不大,可以将多张数据表格放在一个文件中,以简化存储结构。如果数据量较大,可以将数据表格单独存储,以提高数据处理的速度。 

文件的格式可以采用BINARY或者ASCII编码的形式,使用开发平台下的文件存取指令进行操作。在文件的头部或尾部,添加指定的数据表及数据块的索引信息,用以标明文件的数据属性。 

在数据的组织上,仍然延用联合字段的思想,只不过不再借用数据库系统的字段结构,直接与磁盘文件进行数据交换。这样就省去了数据的间接操作过程,在底层上控制数据的存储,增加了数据存储与处理的灵活性,提高了系统的工作效率。 

在此类应用中,要求开发人员对数据库系统的结构有大致的了解,除了常规的文件操作外,还应考虑大量的容灾与安分方面的性能。由于对磁盘文件的操作只包括存储与产生可选集两个方面,类似的开发过程肯定比专业的数据库系统简化,否则就失去了定制开发的意义。 

4.2 数据处理的过程 

由于底层数据不再依赖数据库系统的支持,在可选集产生之后,工作数据库也没有必要再使用数据库系统提供的处理功能,而转由常规的数据结构来实现,比如使用动态数组或容器等结构。 

这样,在用户界面的开发方面,就具有了更大的空间和灵活性,打包后的应用系统也更加精简,便于移植与发行,拓宽了应用系统的应用领域,特别是对于一些安全性要求较高的场合较为适用。 

在具体数据的处理过程中,仍然可以使用前面介绍的方法,只是在用户界面的修饰方面,要下一定的功夫,达到与专业数据库系统同样的水平,这方面的开发工作不影响具体的数据应用,只是照顾用户的原有操作习惯。 

4.3 加解密过程 

定制的本地数据库,只对存储环节进行加解密,正常的使用过程,只有数据变动时才需要与存储数据库进行数据交换,大部分操作都是针对内存中的工作(临时)数据库进行的。此类数据加解密过程如图4所示。 

定制的网络数据库,可以通过直接调用底层的网络传输协议进行访问,数据加解密的过程在全部在客户端实现,经过网络传输的数据都是加密后的密文,这样就有效确保了数据传输过程的安全性,也不必考虑众多的网络安全设备(如网络防火墙、网络安全网关等)的影响。 

定制的网络数据库的加解密过程如图5所示。 

4.4 定制数据库的开发环境 

定制的数据库不依赖于商业化的数据库系统,直接对磁盘文件进行读写。因此,在开发环境的选择方面更加自由,包括普通的桌面系统、网络化的C/S、B/S系统、移动(手机、平板)平台等,都可以完成有效的开发工作。 

而且,当基本的应用流程固定以后,可以在不同的平台之间实现快速移植。一个平台上开发完成的代码,只需改动少量的外围代码,就可以应用到另一个平台上。这样,就彻底摆脱了平台软件与数据库系统对用户程序的开发限制,也减少了庞大的软件与系统资源开销,使开发工作变得更加简单灵活。 

IT产业发展到现阶段,硬件的性能得到了很大的提升,原来依靠专业数据库来支持的大型数据库应用系统,现在如果转而使用定制的数据库,可以将其部署在普通的硬件环境之上,几百万上千万条的数据容量,可以轻而易举地在新平台上流畅运行。 

在移动终端平台上,使用定制的数据库,能够大大减少数据库系统占用的开销,转而支持新的应用项目,使有效的硬件资源得到充分合理的运用。 

5 应用实例 (Application examples) 

以上技术最初应用于《列车时刻表查询软件V4.0》(软著登字第0002941号)中,经实际检测,使用联合字段对数据库结构进行优化以后,数据检索的效率比优化之前提高了70多倍,较好地解决了数据检索速度的瓶颈。下面简要介绍应用的过程。 

(1)问题分析 

交通信息的数据具有统一的规律,就是除了少数的数据以外,大部分数据都是重复性的信息,如到达某个站点的进出站时间与站名等信息。这种数据的特点,比较适合采用联合字段的优化方法。 

如果按着常规的定义方法,每个班次的数据定义成一张独立的表格,如果实现区域联网,数据量将是惊人的。当对联网后的数据库进行模糊检索时,检索效率低下的问题表现得十分明显。因此,采用技术手段对数据库结构进行优化,是解决问题的一个途径。正是基于这样的思路,尝试将联合字段技术应用在大范围交通信息数据库系统的开发过程中,将每个班次的交通信息简化成单条记录,所有区域联网的班次都纳入一张数据表格中,大大简化了数据存储与处理的效率,较好地解决了同类系统开发过程中长期存在的症结。 

(2)数据单元 

将中途站点的数据制作成数据单元,形式为:进站时间+站点名称+出站时间,进出站时间的字符长度直接固定为5,如12:48,因此,数据单元的首尾长度都是确定的,只有中间的站点名称是不确定的。始发站点与终到站点的数据不用特殊处理,直接按上述规则放入数据中即可。 

(3)数据编辑 

数据单元之间使用常规数据中不会出现的特殊字符进行连接,如“-”字符,一个班次的数据按着字符形式存储在一条记录中。数据处理时,通过检索条件在存储库中产生初级可选集,然后对可选集进行具体的操作。

可选集的产生,可以使用数据库系统提供的功能,组合SQL查询条件。在可选集中,根据连接字符将记录中的数据单元分离出来。每个数据单元,先分离出首尾的时间数据,中间余下的就是站点名称数据,并依此建立临时工作数据库,与用户接口程序进行交互。数据变动后,将数据进行逆向处理,最终完成存储数据库的更新过程。 

(4)实例:区间模糊检索 

这是最常规的应用,只设定两个站点的名称,即可以检索出区间内的所有班次。检索条件可以组合为:记录中“前面包含‘出发站点名称’并且后面包含‘到达站点名称’”的可选集”。 

(5)实例:生成站点的班次时刻表 

时刻表是动态生成与显示的,可以直接上物理的大屏系统,为所有站点的出行人员提供信息服务。检索条件可以组合为:记录中“包含‘站点名称’”的可选集。在可选集中,根据进出站时间的特点,可以将班次的属性区分开来,如始发、途经与终到等班次。 

6 结论(Conclusion) 

通过对数据库结构的优化与定制,使数据类型单一化,不但简化了存储形式,而且可以快速实现数据的加解密过程,加解密运算全部在客户端实现,充分发挥了本地处理器的处理能力,不影响网络数据的访问速度。 

可见,数据结构优化后,简化了数据结构,有效提高了数据的处理效率与安全性,节省了存储空间,方便了数据的跨平台移植,是小型数据库应用系统开发的一种新思路,特别适合于以大量重复数据为主体的数据库应用场合。 

参考文献(References) 

[1] 李宏伟.地名本体数据库存储模式及应用研究[J].计算机应用与软件,2012,29(4):35-38;74. 

[2] 陈正举.基于HIBERNATE的数据库访问优化[J].计算机应用与软件,2012,29(7):144-149. 

[3] 林沣.分布式数据库中空间拓扑连接查询优化处理方法研究[J].计算机应用与软件,2013,30(11):247-250;282. 

[4] 房俊华.DB-Tree:一种高性能的闪存数据库索引结构[J].计算机应用与软件,2013,30(11):243-246. 

[5] 陈芬.改进量子粒子群算法优化神经网络的数据库重复记录检测[J].计算机应用与软件,2014,31(3):20-21;115. 

[6] 林桂亚.基于粒子群算法的数据库查询优化[J].计算机应用研究,2012,29(3):947-949. 

[7] 王兵.数据库应用系统逻辑结构设计初探[J].现代计算机,2012,(5):14-17. 

大数据开发的过程篇10

随着我国计算机技术的不断成熟和发展,软件应用日益广泛,无论是从计算机存储或是整个IT环境,在硬件平台的搭设基础上,越来越多的软件功能丰富的大数据时代的主体内容。做为人类发社会发展的必经道路,大数据时代在不断适应和改造人类认知世界的过程中,不断丰富着人们的生产生活。因此,在软件工程设计分析时,我们要结合大数据的整体时代背景,进一步缓和软件工程发展的进程,并且不断优化传统的信息结构资源,强化软件工程的信息处理能力,提升软件工程与网络的结合度。

一、大数据时代下软件工程服务类型

随着我国软件工程的不断发展,近几年来服务软件工程的数量越来越多,以服建设为基础的软件工程根据实际情况进行发展变化,现代软件工程服务通过分布式的应用和互操性虚拟化管理对软件工程展开维护工作,通过这样的管理信息方式将网络中的虚拟化软件变为动态化情景下的操作系统,通过解决集成系统和工程软件协作的问题,来进一步扩大大数据时代下软件工程服务的应用范围,例如在云计算、移动互联网络、大数据应用等方面都得到了有效的发展。大数据时代所要求的网络化和软件工程服务化,这让现代软件开发也变得更加开放,通过网络信息交流和学术信息共享,在共同协调开发的基础上采集用户评价信息,对建设性价比较高的软件进行进一步的投入,例如,开源软件就是在我国现阶段软件工程中较为成功的软件习作模式。所以,我们在开源社区中要加强合作、优化结构。但是以往的软件工程研究方法并没有太大的突破,部分学者虽然运用社会网对数据进行的一定的分析,但是在一些规模较大的项目中,开发团队等核心人员由以往的传统团队逐渐转为外围开发者为主的科研研发队伍,整个软件工程研究模块发生了显著的变化。开源软件工程建设除了以往传统软件的典型性之外,在现如今群体软件工程中更加注重的是在众包基础上的研发过程,众包基础指的是以一种分布的形式来解决研发问题和生产问题,这就让开源软件或是其他商业软件都可以通过络进行软件工程研发责任分配,通过多方面研究提出创意或解决现有问题。所以,在软件工程关键技术的研发处理上,无论针对哪个阶段都可以采用众包的方式进行了重点问题的研发解决。

二、大数据时代下计算机信息处理技术在软件工程上的应用

大数据开发的过程篇11

引言

数据库技术表示为依托于数据库的基础架构与存储方式进行数据库开发,结合有关理论与技术手段,完成对数据库中海量数据信息处理的过程,数据库的主要作用体现在可以确保系统稳定、有序的工作。同时可以更好地满足用户的使用需求,对数据库开发原则进行深入分析和探究,为软件设计奠定基础。在实际开展数据库开发时,围绕数据库互有特征进行分析工作,从而逐渐构建共有的数据实体,最后按照具体的应用环境来完成实体的转化。随着现代科学技术与计算机技术水平的不断提升,计算机软件设计中包含的元素与内容越来越多。数据库设计品质直接关系到计算机软件的运行效果,进而影响到用户的实际体验感受。为此,工作人员在进行数据库设计过程中,应当要充分认识到数据库开发的重要性,严格遵守数据库设计相关原则,提高计算机软件设计的科学合理性,更好发挥计算机软件数据库的应用价值。

1数据库开发的必要性原则

(1)缩小维修成本,强化资源利用率。工作人员在进行计算机软件设计时,数据库开发是极其重要的一部分,所以在进行数据库设计过程中,必须要从不同角度和层面来探究计算机设计中的重要影响因素,如软件的具体运用环境、开发人员的想法、开发人员的专业水平等,这些因素都会对数据库开发质量产生较大影响[1]。从软件功能开发的层面来审视,工作人员将自身的主要精力和时间用于软件功能设计与研究中时,而忽略了对计算机软件数据库的开发,没能够全面认识到开展数据库开发的意义,必然会导致开发的软件中有各种类型的安全漏洞,这样的软件在使用过程中不仅会产生许多不确定的问题,严重的还会造成计算机系统的错误。与此同时,一些计算机软件数据库开发过程中,设置的许多参数存在不合理、不科学的问题,无形之中造成了后期维护工作难度大,消耗更多的人力与物力资源,不利于提高资源的利用效率。所以,工作人员在进行计算机软件数据库开发时,必须要从思想上正视数据库设计,充分认识到数据库开发的必要性,防止产生更大的损失。(2)有助于提高计算机软件的运行效率。数据库设计品质的高低直接关系到计算机系统的运行质量,在开展数据库实际过程中,不仅要达到计算机软件的运行标准,同时也要和计算机系统本身有着较高的匹配度,从而确保计算机系统能够稳定、有序运行[2-4]。一个优秀的数据库设计,在接收到计算机发送的命令之后,能够在非常短的时间内准确检索到需要的信息资源,从而很好的提高计算机的运行速度。数据库中往往涵盖了海量的数据信息,良好的数据库能够帮助工作人员在较短的时间内查找到自身需要的数据资源,同时也可以在较短时间内完成数据信息资源的更新,甚至还能够将计算机系统中残留的无用数据进行删除,在不影响计电子技术第50卷第5期(总第534期)2021年5月107算机软件正常使用的前提下,进一步提高计算机软件的运行效率。(3)降低计算机软件产生问题的概率。当工作人员在进行数据库开发过程中,既没能够充分了解软件要实现的具体功能,也没能够科学合理的计算数据库的大小,因为数据库开发过程十分烦琐与复杂,很容易造成计算机软件系统在实际运行时统计功能不能够正常使用,由此产生计算问题。数据库在进行开发时,还应当要科学设计日志信息,这样避免使用者在后期使用时产生错误操作,也能够依照日志信息及时的更正,确保数据库功能能够正常使用。此外,数据库与计算机软件系统有着密切的联系,假如数据库开发过程不科学,极易对计算机软件运行产生很大影响。当数据库开发存在较多漏洞时,还会造成计算机软件部分功能不能够正常使用,为此,工作人员必须要充分重视数据库的开发与设计,更好发挥计算机软件的各项功能。

2计算机软件数据库设计原则

大数据开发的过程篇12

计算机软件开发的实际意义就是为了更好地实现计算机软件开发的价值,往往需要在开发的前期准备过程中提前做好需求调查,然后再进行后面的工作。同时,开发的过程中也需要尽可能地使开发的软件能够具有各项应该具备的功能,使其能够高效运行,并逐渐走进市场。随着科技的不断进步,计算机已经成为时代主流,被大家所接受、运用,人们的生活已经无法离开计算机,且也越来越满足顾客的需要,成为大众化的实用工具。因此,软件的开发也需要开发者能够切合实际地考虑消费者的利益,使开发出的软件能够真正满足大众需求,做到普遍性和大众性的有效统一。其中,数据管理是整个计算机软件开发设计的核心环节,起着不容小觑的重要影响。

2数据库管理

2.1数据库管理的具体内容

以目前情况为主要基础,主要包括以下内容:第一,其自身存在的程序以及相关数据拥有一定程度上的独立性,在数据呈现过程中一般会采用数据模型的方式将其中存在的相关关系表示出来,同时包含了数据的相关特征。第二,在开展基础性数据管理工作的过程中将某一部门或企业作为独立的个体,并以此为依据建立一套完善且具备系统化的数据库系统,将其用于对数据的管理与控制。第三,其自身存在的用户接口属于普通型,相关用户在进行数据开发与利用时,会获得一定优势。第四,以实际情况作为具体的参考标准管理相关应用程序,同时通过数据库找寻与之相关并具备实用性的信息,进一步减少存储过程中出现重复储存现象的发生;另外,建立上述新型的数据管理结构可以有效、全面使用数据。

2.2数据库目前存在的相关问题

第一,在管理数据库的过程中出现人为问题。譬如,数据库的相关管理人员在进行相关操作的过程中方法使用不当,没有按照相关安全管理标准进行操作,导致在管理数据库的过程中出现不同种类的安全问题。第二,在开展数据库工作的过程中出现系统自带问题,进而导致出现一系列运用过程中的问题。譬如,随着当前网络技术的发展与创新,其自身的安全性受到极大地挑战,管理过程也必然会出现相应的问题。第三,数据库系统在操作过程中存在的相关问题。就目前的实践情况结果显示,该问题是数据库出现信息泄露的主要原因。同时,随着用户的操作存在一定的不规范性,使计算机受到病毒的入侵。随着这些病毒的爆发,其中的数据与信息会被曝露出去,使计算的运行与工作受到严重影响。此外,在计算机用户进行日常操作时,某些黑客会趁机向数据库进行攻击,修改和破坏其中的内容进,使数据泄露。

2.3数据库在管理时所采取的方法

2.3.1安全策略

第一,以数据库为基础有针对性地进行加密,尤其对于一些重要的数据信息,其对安全性的要求更高。因此,要不断提高该部分数据的安全性,尽量杜绝出现修改数据和非法访问的现象。在实施该措施之后,虽然系统受到一定程度的破坏,但是其中存储的相关数据被散播出去和被窃取的可能性并不是非常大。在整个安全保护系统中,需要建立一个完善的身份认证机制,确保用户与服务器数据进行对接时,能准备核实身份信息等数据,以避免一些非法或其他不当手段入侵后台程序,并限制和打压干扰破坏整个系统的行为,让对方无法进入系统核心,破坏系统安全。具体实行方法可以通过WPKI或Keberos三重加密验证等方法进行用户安全管理。这样一来,可以很好地对用户身份进行识别和辨认,强化安全性能。第二,需要加强访问权的管理。这个管理重点在于对储存内容的访问限制。尤其针对移动管理,需要后台管理员能够随时调动访问口令,实现动态管理用户。第三,需要对信息数据内容进行加密。除了要控制访问权限之外,还需要增加层层防护,提高安全系数。信息加密能够防止数据外泄而导致各种恶性事件的发生。通常情况下,需要根据不同的数据功能模块来安置相对应的安全口令。目前,计算机加密方法各种各样,破解难度各异,其中安全系数较高的包括椭圆曲线密码体制,这种体制当前还没有攻破方法,是个相当不错的加密方式。第四,需要长期进行数据审计跟踪管理,掌握数据动态信息,及时发现异常。另外,还要对攻击手段进行检测,找到系统发生漏洞之处,从而找出问题并进行改善和加固。

2.3.2管理策略

在使用数据库的过程中,必须时刻保持防范意识,增加其警惕性,从根本上杜绝信息泄漏事件。运用之前所说的方法,可以使数据库的安全性得到增强,也能保证使用者的合法权益。增强数据安全性最为有效的方法就是对其进行必要的维护。在对数据库维护与管理的过程中,必须备份有需要的信息,这样即使有黑客入侵,也很难有可乘之机。虽然数据库通过一些安全手段可以在一定程度上提高安全等级,但仍然无法杜绝安全事故发生。因此,加强管理机制十分必要,可采用虚拟服务器和动态分布式数据库管理等方式进行管理,只有这样才可以确保数据库的正常运转,使事故发生时能够及时采取保护手段管理数据安全。

2.3.3维护策略

当前,数据库维护也成为计算机软件开发中需要考虑的重要对象之一,一个安全的系统除了需要有各种防护手段之外,还需要拥有优良的系统维护管理。而数据库的维护水平主要取决于该数据库是否具有强大的维护能力和高效的数据整合能力。就目前的市场而言,提高数据库维护水平可以充分利用市场资源,通过购买各种开源数据库和整合系统来保证自身数据库的安全管理。在日常维护管理过程中,可以很好地利用这些开发公司的数据维护工作。除此之外,计算机设计开发公司需要不断引进复合型人才,注重对专业性人才的培养,并吸纳精英,保证公司的稳定运营和开发工作。为整个系统提供充沛的管理人员,加强维护管理效率,降低风险发生的概率。

友情链接