神经网络基本原理合集12篇

时间:2023-06-11 08:13:01

神经网络基本原理

神经网络基本原理篇1

1引言

在对实际问题进行描述和处理中,为了能够获得更加全面的信息,我们经常需要统计多个变量的数据。但是这些多个变量之间经常存在一定的相关性,并不是每个变量都是我们所需要的,或者说它们携带的信息可能是重复的。因此我们希望用少数几个变量来代替原有的多个变量。主成份分析法的基本思想就是通过对原始数据的降维,将多个相互关联的变量转化为少数几个互不相干的变量的统计方法。

由于期货价格的变化是一个非线性的时间序列,利用传统的统计方法对期货的价格直接进行预测,所得到的结果不是很理想。而神经网络在非线性模式中具有优势,因而它不需要建立复杂的数学模型就可以完成期货价格预测。基于BP网络和RBF网络的预测都有较好的结果,但是相对BP网络而言,利用RBF神经网络不仅解决了常用BP网络易陷入局部最小的问题,而且训练时间更短,预测的精度也比BP网络高得多。本文提出使用基于主成分分析法的RBF神经网络方法对期货价格进行预测。通过主成分分析法对原始数据降维,然后,再用这些个数较少的新输入变量作为RBF神经网络的输入进行模拟预测。由于主成分之间是相互独立的,所以由各主成分组成的输入空间不存在自相关性,从而有效地简化了RBF网络在高维时难以寻找网络中心的问题,提高了预测精度。

2主成分分析法简介及RBF神经网络算法概述

2.1主成分分析法

主成分分析法的步骤如下:

(1)原始数据的标准化处理。

主成分分析法的目的就是使用较少的变量代替并综合反映原来较多的信息,综合后的变量就是原来多变量的主要成分,利用这些综合后的主要成分去代替原来的变量去解决实际问题。这里首先利用以下公式对原始变量进行标准化处理。其中原变量为xij,其含义为第j个变量的第i个值,则处理后的变量值为yij,

(3)计算矩阵R的特征根和特征向量。

利用R的特征方程|R-λi|=0求出其特征根,其对应的特征向量利用|R-λi|A=0和AA''''=1求得。然后对所求得的特征根按照大小顺序进行排列。

(4)计算方差贡献率与累计方差贡献率。

利用公式Ki=λi/∑ni=1代入所求的特征根λi,求出各个主成分的贡献率Ki,其贡献率就代表了原数据信息量的百分比。

(5)确定主成分计算其得分值。

主成分的确定方法主要有两种:(1)当前K个主成分的累计贡献率达到某一特定值的时,则保留前K个主成分。一般采用超过85%以上。(2)选取特征值大于1的主成分。这两种可视情况进行选取,一般前者取得主成分要多,后者要少,通常情况下是将两者结合一起来进行使用。

2.2RBF神经网络算法概述

径向基(RBF)网络是以函数逼近理论为基础构造的一类向前网络。其网络结构为三层,隐含层采用高斯函数为激励函数,理论上,只要隐含层中有足够的径向基神经元,径向基函数网络就可以逼近任何非线性函数。输出层为简单的线性加权函数,其网络结构如图所示。

其中W1i为每个隐含层神经元与输入层相连的权值向量,Xq为输入矢量,b1i为阈值。则隐含层的第i个神经元的输入为:

kqi=j(w1ji-xqj)2×b1i

输出为:

rqi=exp((-kqi)2)=exp(-(||w1ji-Xq||×b1i)2)

输出层的输入则为各隐含层神经元的加权求和。由于激励函数为线性函数,因此输出为:

yq=∑ni=1ri×w22

RBF网络首先通过无教师学习确定训练输入层与隐含层间的权值w2。再通过有教师学习,确定训练隐含层与输出层间的权值w1i。在RBF网络训练中,隐含神经元的数量确定是一个关键的问题。其基本原理是从0个神经元开始训练,通过检查输出误差使网络自动增加神经元。每次循环使用,使网络产生的最大误差所对应的输入向量作为权值向量w1i,产生一个新的隐含层神经元,然后检查新网络的误差,重复此过程直到达到误差要求或最大隐含层神经元为止。由此可见,径向基函数网络具有结构自适应确定、输出与初始权值无关等特点。

3改进的RBF神经网络对期货价格的实例预测

3.1主成分分析

期货的价格是受很多因素影响,如国家政策、季节气候、供求关系、战争等,所以其价格会上下波动,呈现出一个非线性时间序列。其交易价格本文选取2007年6月7日至8月29日燃油0801每个交易日的开盘价、最高价、最低价、收盘价、交易量、持仓量、前5日均价、前10日均价为初始变量,每个变量60个数据,前59个为训练样本,最后一个为检测样本。考虑到期货交易与股票交易的不同,其交易方式是双向交易,从投资者获利的角度考虑,其并不像股票市场一样单纯的考虑股票价格增长,加上每个星期正常的期货交易日仅为5天,所以在这里我们考虑选取后5日均价作为预测目标,这样的选择更有实际意义。在这里本文直接利用SPSS软件包,选择数据降维,再选用主成分分析,可以直接得到各个主成分的方差累计贡献率,如表1所示:

从表中我们可以看出,第一个主成分主要包含了开盘价、最高价、最低价、收盘价、以及前5日均价共五个变量的信息,第二个主成分主要包含了成交量和持仓量两个变量的信息,而第三个主成分则主要包含了前十日均价一个变量的信息。由此可以看出,通过数据降维,将原来的8个变量,转化为现在的3个变量了。

3.2神经网络的设计及训练

现设计一个三层的神经网络,输入层有3个神经元,输出层神经元为1个。利用下式对输入、输出值进行标准化,可使得输入、输出值其均落在[-1,1]区间。

xn=2*(x-minx)/(maxx-minx)-1

在matlab的神经网络工具箱中用newrb函数设计这个径向基函数网络,用其作函数逼近时,可自动增加隐含层神经元,直到达到均方误差为止,利用语句:net=newrb(P,T,GOAL,SPREAD)进行网络设计,其中GOAL为均方误差,这里取值为0.0001,SPREAD为径向基函数的扩展速度,其值越大,函数的拟合就越平滑。经过试验,当其取0.058时,其预测效果最好。把2007年6月7日至8月28日的燃油0801选定的主成分作为输入的训练样本,标准化的后5日均价的值作为输出的训练样本,8月29日的数据作为测试样本,计算结果如下:

4结语

由此可看出基于主成分分析法的径向基神经网络较一般的径向基网络有更简洁的网络结构,对于相对比较复杂的期货价格预测,基于主成分分析法的径向基神经网络得到的结果也更加精确。不过径向基神经网络本身对扩展速度的选择没有一个固定的标准,不同的值得到的结果有较大的偏差,这是该网络的一个缺陷,也是今后研究的一个方向。

参考文献

[1]黄颖,白玫,李自珍.基于主成分-BP神经网络的期货市场预测[J].数学的实践与认识.2007,(7):23-26.

神经网络基本原理篇2

随着网络的迅速发展,网络上承载的业务和应用日益丰富。加强网络管理、有效提高网络运行速度和利用率,网络流量预测是关键,也就是对网络出口的流量发展进行动态分析,并在定性基础上对流量进行定量的计算。有很多种因素可以影响网络流量,在实际发生的时间序列中,弱相依性、突变性和随机性等复杂非线性特征对网络流量预测都存在很大的影响,而且在以往的学者中针对于这些特点所构建的数学模型也不是很完善,还不够成熟。针对这些特点本文将在时间序列的预测中结合使用径向基神经网络的方法,在时间序列的延迟性中运用自相关分析技术进行合理分析,建立基于MATLAB6.5环境下的黑龙江信息技术职业学院网络出口流量预测的径向基神经网络数学模型,并对实际网络出口流量数据惊醒有效的验证。

1、建立径向基神经网络流量的预测模型

对于网络流量这样的非线性系统进行建模时,本文采用径向基神经网络技术,针对隐层节点的数量处选择合理的改进方法。经过实际操作的甄选后选择网络流量的均方误差的目标值为0.001,隐层节点数选择最大为23个。除此之外,为了保证径向基神经网络泛化能力的良好运行,并且保证径向基函数的输人输出范围足够大,就需要对输入的训练值进行postmnmx归一化处理。

从隐含层到输出层之间的权值是基于径向基神经网络函数来调整,并采用线性传递函数进行实现的,综合考虑,这样就不存在在局部会出现极小点的问题。对于这种基于径向基神经网络的局部函数,会有很快的网络学习速度,对于函数迫近时的收敛速度问题,能够很好地克服。

2、算例分析

对基于径向基神经网络函数是有一定的精度要求的,本文采用newrb函数进行设计,并满足函数的精度要求。函数格式为:net=newrb(a,b,m,n),采用基于径向基神经网络函数进行逼近原始函数时,newrb函数能够自动增加基于径向基神经网络的隐层神经元,直到均方误差满足为止。对于输入向量矩阵、目标向量矩阵、均方误差和径向基的分布分别使用式中变量a,b,m,n来表示。

在时间序列的预测上采用用sim函数进行预测。函数格式为:y= sim(net,x),对于待评价时间序列的输入向量和用基于径向基神经网络对时间序列进行计算的预测值分别使用式中的x,y进行表示。基于径向基神经网络的网络流量预测模型是在Matlab6.5环境下的,并对网络流量在时间序列上进行预测。

基于径向基神经网络采用1个输出单元和23个输人单元,并对基于径向基神经网络进行训练,自动调整网络训练程序的最终隐含层节点数,调整后的节点数为23个。最后比较网络流量预测模型所得的最后的网络输出和实际的网络流量数据,其结果如图1所示。

把表1中2013年10月28日实际发生的网络流量真实值作为训练的样本,在MATLAB6.5环境下的基于径向基神经网络模型对2013年10月28日我校网络流量进行预测,其预测的结果如表1所示,在MATLAB6.5环境下的网络训练的图形输出结果及预测结果如图1所示。

在表1中实际数据值和预测值可以看出,经过多次的历史预测,每次模型预测的绝对误差值均为0,可以总结为采用的训练样本的合格率均为100%,具有较好的拟合精度和预测精度。

神经网络基本原理篇3

一、引言

神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。当常规方法解决不了或效果不佳时神经网络方法往往显示出其优越性。尤其对问题的机理不甚了解或不能用数学模型表示的系统,如故障诊断、特征提取和预测控制管理等问题,神经网络往往是很好的工具。另一方面, 神经网络对处理大量原始数据而不能用规则或公式描述的问题, 表现出极大的灵活性和自适应性。

二、神经网络应用分析

(一)样本数据

1.数据采集和分组

采用神经网络技术建模的首要和前提条件是有足够多典型和高精度的样本。为监控学习过程使之不发生“过拟合”和评价建立的网络模型的性能和泛化能力,必须将收集到的样本数据随机分成训练样本、检验样本(10%以上)和测试样本(10%以上)三部分。同时数据分组时还应尽可能考虑样本模式间的平衡。

2. 数据预处理

神经网络的输入变量一般根据专业知识确定。若输入变量较多,可通过主成份分析方法减少输入变量,也可根据剔除某一变量引起的系统误差与原系统误差的比值的大小来减少输入变量。输出变量即为系统待分析的外生变量,可以是一个,也可以是多个。一般将一个具有多个输出的网络模型转化为多个具有一个输出的网络模型效果会更好,训练也更方便。

预处理的方法有多种多样,各文献采用的公式也不尽相同。但必须注意的是,预处理的数据训练完成后,网络输出的结果要进行反变换才能得到实际值。为保证建立的模型具有一定的外推能力,数据预处理后的值在0.2~0.8之间比较合适。

(二)拓扑结构确定

1. 隐层数

增加隐层数可以降低网络误差,提高精度,但也使网络复杂化,从而增加了网络的训练时间。在设计神经网络时,应优先考虑3层BP网络。一般地,靠增加隐层节点数来获得较低的误差,其训练效果要比增加隐层数更容易实现。

2. 隐层节点数

在神经网络中,隐层节点数的选择非常重要,它不仅对建立的神经网络模型的性能影响很大,而且是训练时出现“过拟合”的直接原因,但是目前还没有一种科学的和普遍的确定方法。为尽可能避免训练时出现“过拟合”现象,保证足够高的网络性能和泛化能力,确定隐层节点数的最基本原则是:在满足精度要求的前提下取尽可能紧凑的结构,即取尽可能少的隐层节点数。研究表明,隐层节点数不仅与输入和输出层的节点数有关,也与需解决的问题的复杂程度和转换函数的形式以及样本数据的特性等因素有关。

3.神经网络训练

神经网络的训练是通过应用误差反传原理不断调整网络权值使网络模型输出值与已知的训练样本输出值之间的误差平方和达到最小或小于某一期望值。如何设计一个合理的网络模型并通过向所给的有限个样本的学习来地逼近样本所蕴含的规律的问题,目前在很大程度上还需要依靠经验知识和设计者的经验。因此,通过训练样本的学习建立合理的神经网络模型的过程,是一个复杂和困难的过程。例如BP网络采用误差反传算法,其实质是一个无约束的非线性最优化计算过程,在网络结构较大时不仅计算时间长,而且很容易限入局部极小点以致得不到最优结果。

4. 初始连接权值确定

BP算法决定了误差函数一般存在多个局部极小点,不同的网络初始权值直接决定了BP算法收敛于哪个局部极小点或是全局极小点。因此,要求计算程序必须能够自由改变网络初始连接权值。根据Sigmoid转换函数的特性,一般要求初始权值分布在-0.5~0.5之间是合适的。

5.模型参数确定

传统的误差反向传递BP算法较为成熟,并且应用广泛,因此提高该方法的学习速度具有很高的实用价值。BP算法中有几个常用的参数,包括学习率η,动量因子α,形状因子λ及收敛误差界值E等,这些参数对训练速度的影响最为关键。在实际应用中,需根据实际问题确定这些参数。

三、小结

神经网络具有自学习、自适应能力及非线性问题处理能力,在智能控制管理领域得到广泛应用。基于神经网络的智能系统设计是软件和硬件相结合的复杂过程。本文详细的阐述了神经网络方法的应用过程,对实际问题中应用神经方法解决问题具有一定指导作用。

基金项目:2014年广东科技学院院级项目

参考文献:

神经网络基本原理篇4

中图分类号:TP393 文献标志码:A 文章编号:1009-3044(2015)13-0171-02

网络给我们带来巨大机会和发展的同时也给我们带来了恶意入侵的危险。就现在的整体情况来看,经常使用的网络安全技术还局限于防火墙等一些静态的安全保护方式,要是没有积极主动的一些安全防护方式相配合,他的安全性能就是有残缺的。开发一种主动防御、及时控制的技术就很有必要。入侵检测技术恰恰就是这样的一种技术。入侵检测在国内有很多文献进行研究,目前入侵检测存在的最大问题是检测中误报率较高。所以我们要提高入侵检测的智能型。神经网络顾名思义模仿人的大脑,具有很好的并行计算,自适应计算,抗干扰和智能判断的特征,可以准确处理失真信号。这些特征能优化现有的入侵检测方法,是发展的必然趋势。

1网络攻击的分类

从攻击的技术手段方面看,网络攻击分为两大类。第一类分析攻击行为,并在数据包的载荷部分把其特征隐藏。有字符串结合而成的,服务于系统的一些常用命令,没有被显示出来。但是一旦点击包含此字符串的对象,入侵行为就被激活。这种利用计算机本身系统结构特点和应用层协议的一些漏洞产生的攻击称为高层网络攻击。第二类攻击称为低层网络攻击。主要攻击发生在网络连接的时间和数据流量上,这类攻击主要是针对TCP/IP协议栈中的基础协议的漏洞进行攻击。

2入侵检测原型总体结构

图1描述了原型的总体结构模型。对主要模块的总体功能进行如下介绍。

1)数据捕获模块,捕获在系统中运行的数据包,预处理模块处理这些数据包。在实现时,将网络接口设成混杂模式,方便数据流通,并同时监听经过设备的数据[1]。

2)数据预处理模块分析网络上获得的信息,对数据包根据协议类型一层一层解析。记录和计算TCP连接信息,半开连接信息,保护网络主机不同端口连接信息和半开连接信息,并对SYN报文和FIN报文的链表状态和链表结点进行维护。IP协议处理函数中进行碎片信息的处理和记录,目的是把基于碎片的拒绝服务攻击提供给神经网络模块。总结信息并把信息转化,进行归一化处理,结合TCP数据报的标志位送入神经网络检测模块,检测攻击的存在。最后把得到的特征用于ICMP协议的扫描或攻击检测。

3)数据预处理模块把得到的特征传给神经网络检测模块,神经网络检测模块负责计算输出层的输出结果,并根据结果判断攻击。神经网络检测模块有三大模块构成。能检测网络漏洞扫描和TCP协议中拒绝服务攻击的TCP神经网络检测模块;能通过检测到拒绝服务攻击和ICMP的IP神经网络检测模块;基于ICMP的主机活性扫描和拒绝服务攻击的检测被神经网络检测模块实现。

4)神经网络训练模块对己知的网络攻击离线训练,以矩阵形式将训练好的神经网络的各层连接权存入磁盘文件中,在系统开始运行时神经网络检测模块读入磁盘中的权值到神经网络结构中。神经网络训练模块也可分为TCP神经网络训练模块、m神经网络训练模块和ICMP神经网络训练模块[1]。

5)响应报警模块报告当前的被检测数据对象是否存在攻击的迹象,判断依据是神经网络的输出。

3基于神经网络入侵检测原型详细设计

详细设计分为数据捕获模块、数据预处理模块、神经网络训练模块、神经网络测试模块、响应报警模块五个模块。

数据捕获模块。网络数据的捕获通过Libpcap编程接口实现。这种接口是网络数据包的标准捕获接口,它效率高、独立性和移植性强。使用具有快速的网络数据包过滤功能的BPF数据包捕获机制。数据捕获过程中通过Libpcap截获网络数据包。

数据预处理模块。数据预处理模块接收网络数据包,这些数据包由数据捕获模块送过来。接收后先处理这些数据包,并将处理的结果转化为向量送入神经网络检测模块检测。数据预处理模块处理的数据包分别针对三种协议:IP、TCP、ICMP。IP协议的预处理主要提取针对基于m碎片的攻击特征;TCP协议的预处理针对基于TCP协议网络扫描并对拒绝服务攻击特征提取。

神经网络训练模块。采用双隐层BP神经网络作为神经网络训练模块的网络结构。离线状态下运行神经网络训练模块。网络攻击和正常网络流通的一些知识,让检测模块在对网络攻击事件进行检查入侵之前学会。提供给神经网络训练模块已知攻击的输入特征向量和与之对应的期望输出向量由系统管理员负责。本原型输入特征向量是预处理模块得到的可描述攻击行为的特征向量;期望输出数据一般为一串二进制0、1串指示了是何种具体的攻击。本原型对基于IP、ICMP、TCP协议的网络扫描和拒绝服务攻击进行检测,相应定义了三种(IP、ICMP、TCP)神经网络[2]。

神经网络检测模块。神经网络检测模块接受的特征向量是由预处理模块送来,这些特征向量做为神经网络的输入向量,是由神经网络的各层计算出结果,然后把结果在输出层输出。输出结果可能显示的是正常的数据流,可能指示某一种网络攻击,也可能是未知的结果即这个结果在神经网络训练时没有定义。针对这种情况,对于前两种情况,系统管理员应记录下这时神经网络的输入向量和输出向量,在神经网络进行训练时,加入这两种情况。对于后一种情况,需要在进行分析。

响应报警模块。响应报警模块对接受神经网络输出向量,根据编码的对应关系,判断攻击行为。发现对应的攻击。就会有相应的消息打印在屏幕上,并会有指示这种攻击的全局变量在系统中设置;若没有找到对应攻击,则不打印消息。理论上讲训练神经网络时,对输出向量的编码是0、1串。但真正的输出不会严格的是0、1串,所以约定,数值大于0.7的按1对待,小于0.3的按0对待。

改进后BP神经网络的训练

4神经网络训练流程

P代表样本总数。

F代表不合格样本数。

M代表正确率,设在1%-100%之间。

E为网络训练后要达到的精度,设为小数。

5神经网络检测

对参数和变量进行初始化;

从记事本文件中读取检测样本、期望值、权值、阈值;

for(n=1;n

{放入矩阵第一行;

{for(n=1;n

根据阈值和权值的到线性输出,放入矩阵第二行;

}

if(小于正确率) 不合格样本数++;

}

输出该组数据的检测结果;

end

正确率输出结果越接近l,表明可能受到攻击。

6 结束语

本文调研了常见的网络攻击手段,探讨了入侵检测技术的研究方法、入侵检测的发展方向。根据神经网络的特点,将神经网络与入侵检测结合。设计了一个简化的基于神经网络的网络入侵检测原型。原型通过统计底层网络协议的数据流量信息数据包协议头的信息,将这些信息预处理后送入已训练过的神经网络模块,以此判断当前网络数据流量存在的攻击或扫描行为。此原型提出了具有更高检测率并且能检测变种攻击的模块设计。

参考文献:

神经网络基本原理篇5

Research on the Models of GPS Height Fitting Based on BP Neural Network

Li Yongquan

【Abstract】International and domestic multifarious control nets in use of GPS’s positioning techniques are only to solve the horizontal coordinates, but the height still follow to use the geometric leveling.Therefore, The basic theory of neural network and algorithm of BP are described, Discuss the problem of GPS height fitting based on BP neural network by trials. BP neural network is a kind of nonlinear mapping for its inputs and outputs,BP neural network is a high precise method for translating height.

【Key words】GPS;height anomaly;back propagation neural networks; fitting models

1. 引言

GPS平面定位的精度目前已经可以达到毫米级,但相对于平面定位精度,GPS在高程方面的定位精度较低。 神经网络是一种高度自适应的非线性动力系统,神经网络的数学理论本质上是非线性数学理论,通过BP神经网络学习可以得到输入和输出之间的高度非线性映射,因此,使用神经网络可以建立起输入和输出之间的非线性关系。BP神经网络本身也是一种高精度的高程转换方法。

2. 神经网络的模型及BP算法

2.1 神经网络的模型

(1)生物神经元模型。神经元模型是基于生物神经元的特点提出的,人脑由大量的生物神经元组成,神经元之间互相有连接,从而构成一个庞大而复杂的神经元网络。神经元是大脑处理信息的基本单元,结构如图1。神经元由细胞体、树突和轴突三部分组成,其中突触是神经元之间的连接。细胞体是由很多分子形成的综合体,内部含有细胞核、细胞质和细胞膜。细胞体的作用是接受和处理信息。树突是细胞体向外延伸的纤维体,是接受从其他神经元传入信息的入口。轴突是神经元的信息通道,是细胞体向外延伸最长、最粗的树枝纤维体,也叫神经纤维。(2)神经元模型。神经元一般表现为一个多输入(多个树突和细胞体与其他多个神经元轴突末梢突触连接)、单输出(每个神经元只有一个轴突作为输出通道)的非线性器件,通用的结构模型如图2所示。

(3)神经网络模型。神经网络的神经元之间的互连模式有前向网络、有反馈的前向网络、层内有相互结合的前向网络和相互结合型网络四种。

前向网络神经元分层排列,组成输入层、中间层(隐含层)和输出层。每一层的神经元只接受来自前一层神经元的输入,后面的层对前面的层没有信号反馈。输入模式经过各层次的顺序传播,最后在输出层上得到输出。目前对前向网络得出的一致的结论是:甚至是单中间层网络,只要隐节点数目足够多,前向网络就可以通过训练学习样本,以任意精度逼近(或表达)期望目标。

2.2 神经网络BP算法

(1)BP(Back Propagation)网络模型结构。BP网络的结构如图4所示,BP网络具有三层或三层以上神经元的神经网络,包括输入层、中间层(隐层)和输出层。上下层之间实现全连接,而每层神经元之间没有连接。当一对学习样本提供给网络后,神经元的激活值从输入层经各中间层向输出层传播,在输出层的各神经元获得网络的输入响应。接下来,按照减少目标输出和实际输出之间的方向,从输出层反向经过各中间层回到输入层,从而逐层修正各连接权值,这种算法称为“误差反向传播算法”,即BP算法。

(2)BP算法的数学描述。BP算法基本原理是利用输出后的误差来估计输出层的直接前导层的误差,再用这个误差估计更前一层的误差,如此一层一层的反传下去,就获得了所有其他各层的误差估计。

BP网络学习规则的指导思想是:对网络权值和阈值的修正要沿着表现函数下降最快的方向――负梯度方向。

xk+1=xk-akgk(1)

其中xk是当前的权值和阈值矩阵,gk是当前表现函数的梯度,ak是学习速率。

三层BP网络,输入节点xi,中间层节点yi,输出节点zl。输入节点与中间层节点间的网络权值为wji,中间层节点与输出节点间的网络权值为vlj。当输出节点的期望值为tl时,模型计算公式如下。

中间层节点的输出:

yi=f(∑iwjixi-θj)=f(netj)(2)

输出节点的计算输出:

zl=f(∑jvljyj-θl)=f(netl)(3)

3. BP神经网络用于GPS高程拟合

3.1 山区高程异常拟合实例:以本溪GPS和水准资料作为样本来源,进行BP高程异常拟合。

通过山区高程异常拟合实例,对数据分析可以得到如下结论,学习样本数与测试样本数之比在1/4之间时网络稳定性较好。高程拟合的精度与学习样本数量有关,学习样本数越多,拟合精度就越高。

3.2 平原地区高程异常拟合实例:以某市D级GPS部分数据进行实验研究

通过平原地区高程异常拟合实例,对数据分析可以得到如下结论,学习样本数与测试样本数之比在 1/3 之间时网络稳定性较好。学习样本数对测试对象的精度也有着重要的影响,一般随着学习样本数的增多,中误差会有所改善。这主要是更多的学习样本就更能表述出所研究问题的一些基本特征,进而仿真的效果就能更好。

4. 结束语

重点研究基于BP神经网络的GPS高程异常拟合算法,详细介绍了人工神经网络基本理论,重点讨论了基于BP神经网络的GPS高程拟合,包括BP神经网络的基本原理、主要特点。分析了神经网络的BP算法,包括其数学模型、网络结构。构造了基于BP神经网络的GPS高程拟合模型,结合具体工程数据进行了神经网络性能分析。

参考文献

[1] 国家测绘局测绘发展研究中心.测绘发展研究动态[R].北京:国家测绘局,2008,8:1-7

[2] 李征航、黄劲松.GPS测量与数据处理[M].武汉:武汉大学出版社,2005,277-278

[3] 曹先革.基于人工神经网络的GPS高程异常拟合方法研究[D],北京:中国地质大学,2008

[4] 徐绍铨.GPS高程拟合系统的研究[J],武汉:武汉测绘科技大学学报,1999,24(4),11-15

[5] 阎平凡.人工神经网络与模拟进化计算[M],北京:清华大学出版社,2000,5-6

神经网络基本原理篇6

1 引言

由于数控机床具有提高零件的加工精度、稳定产品的质量、提高产品的生产率、可适应不同品种及尺寸规格零件的自动加工等优点,因此其运用越来越广泛,已经成为一个国家工业水平和综合科技水平的重要标志。数控机床对大中型企业来说,是其最重要的设备,如果其任何部分出现故障,其就会导致精度减低,严重的话,使企业停顿,企业的经济损失更大,进而对相关人员的安全造成危害。在一方面,数控机床特点就是先进、复杂和智能化,当其出现故障后,维修也相对困难,因此对数控机床机械故障诊断进行分析研究就显得非常迫切。

2 诊断故障系统的网络化管理

2.1专家系统和神经网络内涵

1)专家系统的基本原理;具有获取、处理、存储和使用知识的特点的系统叫做专家系统(可以进行知识处理),其主要包括知识库、推理机、数据库、知识获取模块、解释程序和人机接口等方面组成。

2)专家系统和神经网络的结合;尽管在运用方面,专家系统取得了不小的成就,但是,其在模拟人类抽象思维方面也有着明显的缺陷,这些缺陷主要有:(1)存在“瓶颈”问题;(2)推理能力弱;(3)自学习能力差;(4)存在“窄台阶效应”。

3)神经网络的基本结构;神经网络的基本结构主要有以下七部分组成,具体如:(1)一组处理单元(让相关单元可以激活);(2)输出函数(由处理单元进行输送);(3)衔接模式(主要处理单元之间的链接问题);(4)一定规则进行传递;(5)一定规则进行激活(输入处理单元和当前状态结合规则);(6)一定的学习规则(根据经验进行联接);(7)系统所需要的环境。

2.2专家系统和神经网络的结合

2.2.1对专家系统和神经网络进行比较

根据其二者不同的定义、结构及工作原理,神经网络与专家系统是两种截然不同的技术:其主要区别有:(1)知识获取不同;(2)知识表示不同;(3)推理形式不同。

2.2.2 对专家系统和神经网络的相关性进行分析

二者存在的特点各不相同,神经网络和专家系统在其各自的领域都运用较为广泛,但同时在满足设备故障诊断任务方面又各自存在着的局限性,因此就需要让其二者有效结合起来,其结合方式主要有:(1)神经网络与专家系统共存于一个系统中;(2)使用神经网络来构造专家系统。

2.3 神经网络的类型选择及结构设计

2.3.1 神经网络不同选择类型

由于径向基函数网络具有确定自适应、输出与初始权值无关等各种优点,因此其在拟合多维曲面、重构自由曲面和故障诊断等方面有着巨大的运用。因此认为径向基函数神经网络是最好的。

2.3.2 隐层神经元的设计

提取并存储内在规律,使每个隐层神经元都有不同的权值,同时每个权值都相对应着一个参数(增强网络映射能力)。

2.4基于web的神经网络专家系统

对现代信息传输载体(比如Internet)进行有效利用,可以较快地传递和收集相关故障信息,高效提高诊断故障的能力,使数控机床设计者和使用者更好地参与进来,以期得到更合理的措施。

3 系统的总体设计原则

3.1网络化专家系统的设计原则

其设计的原则主要有以下几方面,具体如下:(1)模块化原则。(2)实用性原则。(3)可扩充原则。(4)安全性原则。(5)统一性与简单性原则。

3.2专家系统的功能模块设计

新用户首次登陆必须要通过注册模块先进行注册,老用户可以直接登陆,登陆又分为管理员和普通用户登陆,只有管理员有权利处理系统的数据库。通过故障诊断模块对相应故障进行诊断,其功能模块主要主轴、进给系统、刀库刀和辅助装置等几部分组成。

3.3系统运行的环境

1)Web服务器的选取;通过Windows操作系统,发挥在PC界的优势,推出的IIS成为目前运用最广泛的服务器,经过验证,也是目前用户最好的选择。

2)后台数据库的选取;通过分析研究,同时结合Access的特性、相关程序的匹配性和开发者的业务水平,本文的系统选取Access最为合适。

3.4系统的软件开发环境

3.4.1 服务器相应的软件环境

操作系统:Windows XP Server/Professional;服务器:IIS6.0;数据访问:ADO -ActiveX Data Objects;数据库系统:ACCESS

3.4.2 客户自己机器所对应的软件

操作系统:Windows 98/2000/xp,浏览器:IE5.0以上,MATLAB6.5以上版本。

3.5开发相应工具分析

目前开发工具主要有以下两种形式:(1)网络化专家系统开发工具:具体采用FrontPage。(2)径向基函数神经网络开发工具:具体采用MATLAB程序控制。

4 系统的研究与实施

4.1总体结构设计

该系统的总体结构主要采用一个并列协调式(神经网络和专家系统并存)。两者分别处理各自不同的知识,管理着不同的模块,分别处理各自不同的功能,但是也可以进行联合诊断。

4.2知识库的设计与实现

本系统直接把数据库和数据库管理系统作为知识库的重要组成部分,一方面通过数据对象来处理知识,另一方面,用数据库来对相关知识的存储、编辑、删改、更新查询和安全保护等功能进行有效管理。

4.3推理机的研究与实实施

通过模拟专家的思维模式,对相应问题进行控制和研究,这是推理机的主要功能。结合目前已知的事实,通过知识库,按照一定的规则和方法,进行推理分析,再对其修正,得到最终的结果。

4.4解释模块及人机界面

解释功能作为数控机床机械故障诊断系统最主要的功能,其主要具有向用户、远程用户、领域专家和知识工程师解释相关的问题的优点。目前的人机界面都需要通过ASP编程来实现,主要采用中文视窗的的模式,这样比较简单明了,更容易实现人机交互。

4.5径向基函数神经网络故障诊断

当专家系统部分得出的初期诊断结果不能使用户满意那么就需要进行进一步的深层次诊断。采用径向基函数神经网络进行深层次的定量诊断。

5 结论

由于现在数控机床的技术和水平的快速提高,其相应结构复杂程度进一步提高,功能也越来越多,这样就是的设备出现的问题概率大大增加,因此针对数控机床存在的机械故障进行分析研究,提出采用网络化对其故障进行控制的方法,以期更好地服务相关公司,为之后出现的机械故障提供一定的参考。

参考文献

(1) 李晓峰.数控机床远程故障诊断专家系统的研究(D).辽宁:沈阳工业大学,2005.

(2) 赵中敏.数控机床故障诊断技术的发展和关键诊断技术(J).中国设备工程,2007 6: 5152.

神经网络基本原理篇7

中图分类号:TP393.06

随着计算机、通信以及互联网技术的飞速发展及应用,网络作为一种重要的工具,在军事、政治、经济和科研等诸多领域起着越来越重要的作用,已经成为社会生产和生活必不可少的一部分。与此同时,网络的规模和复杂性不断增大,一旦网络发生故障,如果不能在有效时间内对网络故障进行诊断与修复,将会造成巨大的损失,甚至严重威胁社会的安全与稳定,因此对网络故障诊断技术进行研究具有越来越重要的应用价值和现实意义。

1 网络故障诊断一般过程

通常来说,网络故障诊断是以网络原理、网络配置和网络运行的知识为基础,根据网络出现的故障现象,并使用专门的网管理和检测工具以获取告警信息进而对网络中出现的故障进行诊断、恢复以及预测的过程,一般可分为以下五个部分[1]:

(1)故障检测,即网络故障告警信息的获取。网络发生故障时,通过主动轮询或异步收集方式,对网络中的相关设备或服务的相关告警信息、设置和性能参数,状态信息等进行收集和分析,及时发现网络出现的故障及问题。

(2)故障定位,即定位故障源。对故障检测阶段收集的海量告警数据进行分析和处理,在网络中找出故障,为下一步的故障原因的诊断提供依据。

(3)故障原因的诊断,即查找故障产生的根源。根据故障定位的结果综合运用各种规则进行系统的推理,快速的找到故障产生的原因或者最可能的原因。

(4)故障修复。根据网络故障诊断结果修复网络故障,恢复网络的正常运行。

(5)故障预测,即根据先验知识和监测数据预测网络可能发生的故障。

其中故障检测,故障定位,故障原因诊断是必不可少的三个步骤,下面将重点对上述三个步骤进行详细的介绍。

2 网络故障检测

通常计算机网络通过以下两种方式收集信息,通过分析收集到的信息来检测故障[2]。

(1)Trap机制。在网络中每一个被管设备中都要运行一个程序以便和管理站中的管理程序进行通信。

(2)主动轮询。网络中发生故障的被管设备或服务主动向网络管理系统发出告警信息,能够及时发现网络中的故障,网络管理系统还需通过主动轮询这种方式了解与网络性能密切相关的信息,并对这些影响网络性能信息设置阈值,来判断网络性能,超过设定阈值也会触发事件。

3 网络故障定位

网络系统中,一般通过监测被管设备或服务等各种方法获取大量原始告警数据或历史积累信息,这些数据往往由于通信系统的复杂性、网络结构异构性、噪声、外界因素、因果关系等原因而具有相当大的不确定性和不精确性,导致故障症状和故障原因都存在非线性映射关系,需要利用关联技术对数据进行处理和分析才有效的进行故障定位[3],目前常用的故障定位技术主要有下面几种:

3.1 基于人工智能的故障定位技术

3.1.1 基于规则的推理技术

基于规则的推理(Rule-based Reason,RBR)是最简单的关联技术,已被用于多种构架。一般而言,基于规则的系统由三个组成部分组成,如图1所示。

(1)推理引擎,主要提供解决问题所需要的策略。

(2)知识库,提供和定义与问题相关的规则和专家知识。

(3)工作内存,主要提供解决问题所需要的数据。

在基于规则的推理的网络故障定位系统中,知识库充当一个专家的角色,利用从人类专家获取专家积累的经验和知识,这些知识主要包括对网络问题的定义以及当某一特定问题发生时,网络故障定位系统需要执行的操作。工作内存主要是利用具体的网络协议对网络中的被管设备或服务进行监测,得到有关被管设备或服务的各种信息。在对网络故障进行定位时,推理引擎与知识库共同合作,将监测得到的网络中被管设备或服务的状态信息与知识库中定义好的条件部分进行比对,根据条件满足与否,来进行网络故障的定位。

基于规则的网络故障定位系统,由于无需对专家系统的具体结构和操作细节进行深入了解,从而具有结构简单等诸多优点,并且实现起来比较简单,非常适用于小型系统。但是基于规则的网络故障定位系统在匹配规则时,需要网络状态与知识库中的规则条件精确匹配,否则将推出整个推理过程,无法定位故障,并且规则存在不易维护性和指数增长性,所有这些缺点决定了基于规则的网络故障定位系统不适用大型系统。

3.1.2 基于模型的推理技术

基于模型的推理(Model-based Reason,MBR)是建立在面向对象上的基础之上,利用现有的专家经验和知识,将具体的目标系统中的实体都模型化诊断对象,并且明确地表现出现实目标系统中对象之间存在的各种关联关系,再根据系统模型对具体的目标系统的行为进行推测。由于通常情况下,具体的目标系统与理想的系统模型之间存在差异性,因此基于模型的推理的专家系统需要对推测的行为和目标系统的实际行为进行不一致诊断,以确定具体目标系统中的故障根源。

为了更好地说明基于模型的推理专家系统的工作流程,文献[4]使用一个物理模型和对应的对等模型分别如图2、3所示的网络系统。网络系统按一定的周期,有规律的向图2中的被管设备发送ping命令以监测网络系统中的被管设备是否运行正常。管理系统和被管设备之间通过一个模型对象实现彼此之间的相互通信,具体来说,如图2所示,系统中的集线器模型向被管设备集线器发送ping命令,路由器模型则向被管设备路由器发送ping命令。当目标网络发生故障时,如果故障发生在集线器1,则集线器1模型可以将其发现并且识别出来,如果集线器1模型连续3次向被管设备集线器1发送ping命令,在3次响应超时以后,集线器模型1根据现有的网络现象推测被管设备集线器1有可能发生故障,或者说目标系统中的故障位于集线器1。集线器1模型则会在确定故障并正式发送告警信息之前,集线器1模型将分析自身与图2中其他被管设备的模型之间的关系以此来确定其是否应该询问网络中路由器模型,如网络中的路由器模型返回的是相应的被管路由器设备工作处于正常状态,则集线器1触发警报。

3.1.3 基于范例的推理技术

基于范例的推理(Case-based Reason,CBR)故障定位技术与前面的基于规则推理技术和基于模型推理技术相比具有很大的差异性,主要因为基于范例的推理技术的思想源于人类现实生活,主要根据过去积累的实际经验或经历,利用类比的推理方法对现有的新问题做出相似的解答,然后根据新问题与旧问题之间的差异对解答进行修改从而得到新问题的完全解答。基于范例推理的网络故障定位技术主要由四个部分组成,检索 (Retrieve)、复用(Reuse)、修正(Revise)、保存(Retain),简称4R过程。

基于范例推理的故障定位技术与基于规则推理的故障定位技术相比,由于在基于范例推理的故障定位技术中检索只是基于对案例的部分匹配,而基于规则推理的故障定位技术则是完全匹配,因此基于范例推理的故障定位技术对网络配置变化的适应度更好,更适用于问题的总体解决方案。

3.2 模型遍历技术

模型遍历技术(Model traversing techniques)是一种构建网络故障传播模型的方法,该方法在构建故障传播模型时,主要根据网络在运行时各种被管对象之间的相互关系,并且按照从引起事件的被管对象开始的顺序进行构建。该方法主要适用于网络中被管对象之间的相互关系类似于图形,并且一般情况下较容易获取的情况,并且在系统配置变化较频繁时该方法的鲁棒性很好。模型遍历技术主要具有两大特点,事件驱动和事件关联,所谓事件驱动是指在一个故障症状报告到来之前,系统一直处于等待故障症状状态;事件关联则是确定两个故障症状是否来源同一个事件源。

一般情况下,模型遍历技术需要在其事件报告中明确标识网络系统中故障的征兆类型、征兆目标等相关信息,如果网络系统中出现故障征兆,且不妨用si来表示该故障征兆,当si的目标和si来源相同,则说明si是一个次要征兆也就说明某些告警信息可以被忽略。模型遍历技术的整个处理可分为以下3步:

(1)首先,对网络中的每个事件,依据网络在运行时各种被管对象之间的相互关系对其构建一个和事件源相关的对象图。

(2)当给定的两个事件的对象图相交时,此时说明两个图至少包含同一个对象,则认为这两个对象图的事件源是关联的。

(3)当给定三个故障症状si,sj,sk,其中si,sj相互关联,sj,sk相互关联,则根据故障症状的传递性可知si是一个次要的故障症状。

4 网络故障原因诊断

(1)基于信号处理方法。该方法主要是依据信号模型,直接对网络系统中的可测信号进行分析与处理,并通过提取可测信号的频率等特征值,对网络中存在的故障原因进行诊断。

(2)基于解析模型的方法。基于解析模型的方法主要依据数学模型和数学方法来进行故障原因的诊断,在诊断时需要建立对象的精确数学模型。

(3)基于知识检测的方法。与基于解析模型方法相比,此方法最大的特点在于其并不需要对象的精确数学模型就可以对网络中的故障原因进行诊断。

下面主要介绍几种目前国内外研究学者研究比较多的基于知识检测的方法,基于专家系统故障原因诊断方法和基于模糊理论故障原因诊断方法以及基于BP神经网络故障原因检测方法。

4.1 基于专家系统故障原因诊断方法

基于专家系统故障原因诊断系统主要是利用人类专家的经验和历史积累诊断数据,使用一定的方法将其转化为系统能够识别的规则存在专家系统的知识库中。当网络中出现故障时,诊断系统利用专家系统知识库中的规则,对发生故障网络中的被管对象的各项性能参数进行处理与分析以正确的确定网络故障发生的具体原因[5]。组成由人机接口、推理机、知识库等六部分组成:

目前,国内外学者公认的专家系统瓶颈是知识获取问题,因为专家系统在诊断过程中主要依赖于从人类专家领域内获取的知识、经验和以往诊断数据,而这些获取起来途径有限,操作起来具有一定的局限性和复杂性。另外,专家系统在实时性和学习能力等方面也存在一定的局限性,因此目前通常将专家系统同其他方法相结合以提高专家系统在这些方面存在的局限性和不足。

4.2 模糊故障诊断方法

很多时候,网络中的故障与系统得到的网络现象之间存在非线性的映射关系,这种非线性的映射关系很难用确定的数学公式或者模型来刻画,相应的在故障原因诊断时,很难给出故障的精确原因。相反,只能给出故障发生的可能原因。对于这种存在一定模糊性的问题,可以使用模糊逻辑来解决。

目前使用的比较多的是向量识别法,其诊断过程可分为以下3步:

首先,需要根据网络中的故障与表征网络故障的数据,建立二者之间的关系,通常用关系矩阵R来表示。

其次,对需要诊断的目标网络系统(对象)进行状态检测,提取相关的特征参数以构建特征向量矩阵X。

最后,根据模糊理论和矩阵理论,求解前面两步构建的关系矩阵方程Y=X・R,得到关系矩阵方程的解Y,再根据隶属度等原则,对目标网络系统的故障向量Y进行处理,得到故障的原因。

从上述诊断过程可知,在模糊故障诊断中,正确的进行故障原因诊断的前提是建立关系矩阵R、隶属函数、特征值向量X,而这些矩阵、函数、向量的建立是人为构造而成,难免具有一定的主观性,并且由于该模糊诊断方法对特征元素的选取也有一定的要求,所以两者若处理不当,会导致该方法的诊断结果精度严重下降甚至完全错误。

4.3 BP神经网络诊断方法

由于人工神经网络的这些特性以及网络中故障与征兆之间有可能存在的非线性映射关系,使得人工神经网络在网络故障诊断中大有用武之地。目前,人工神经网络已经大量应用在网络故障诊断领域。BP神经网络是常用的人工神经网络模型[6]。

BP神经网络故障诊断分为训练和诊断两个阶段:

(1)训练阶段。BP神经网络对样本进行训练,以选定网络结构和规模,确定网络总层数、各层神经元数。借助BP学习算法,将原始网络收集到的故障样本的特征参数作为BP神经网络输入样本集,以与之对应的网络故障原因编码为BP神经网络的输出,以此对BP神经网络进行训练。

(2)故障诊断阶段。主要对待检测对象的故障样本进行特征提取和归一化处理,然后输入到BP神经网络进行诊断输出诊断结果,整个过程分为以下4个步骤:1)故障样本集预处理。2)BP网络结构设计。3)训练BP神经网络。4)故障诊断。

5 结束语

本文对网络故障的概念以及基本过程进行了概述,重点对当前网络故障中的故障检测、故障定位、故障诊断的关键技术及方法进行了研究和总结归纳,对开展网络故障诊断技术研究具有一定的指导意义。

参考文献:

[1]王成等.网络故障诊断技术研究[J].科技信息,2011(11).

[2]陈琳.一种网络环境中的故障诊断模型[J].北京航空航天大学学报,2004(11).

[3]张燕.网络故障诊断关键技术[J].电脑知识与技术,2009(31).

[4]李千目.战略互联网智能诊断技术研究[D].南京理工大学,2005.

[5]吴晓知,李兴明.网络故障管理专家系统中知识库的构造[J].微计算机信息,2008(06).

神经网络基本原理篇8

关键词: 组合神经网络;粗糙集;武器系统;效能评估

Key words: neural ensembles;rough set;weapon system;effectiveness evaluation

中图分类号:E92 文献标识码:A 文章编号:1006-4311(2013)35-0313-03

0 引言

武器系统的效能是武器系统在规定的条件下达到规定使用目标的能力,是衡量武器系统质量的重要指标体系,是预期一个系统能否满足一组特定任务要求的程度的度量[1]。武器系统的效能研究是一项复杂的系统工程,其效能的运用与发挥将直接影响到作战的成败,因此,在武器系统的设计、研制、试验、采购、使用及维护等各个阶段都离不开武器系统效能的评估。目前,国内专家学者采用的武器系统效能评估方法主要有:层次分析法(AHP)[2]、模糊综合评估法[3]、数据包络分析(DEA)[4]等。

随着现代科技的迅猛发展,武器装备越来越复杂,效能评估所要考虑的因素越来越多,只考虑系统效能评估指标间单纯的线性关系,是无法做出准确评估的;同时,单纯地采用主观评估方法使得评估者所掌握的经验对评估结果具有很大的影响,用传统的评估模型进行效能评估显得越来越困难。近年来随着人工神经网络和人工智能技术的发展,基于实例的效能评估方法也取得了极大的进展。在已有武器系统效能评估样本数据充足的情况下,专家学者利用人工神经网络在解决复杂相互关系方面的独特优势,开始将人工神经网络技术引入到效能评估领域[5],使得武器系统的效能评估更加方便。但是,随着武器系统变得越来越复杂,单纯地运用神经网络模型对其评估研究仍显不足,一是单一神经网络模型不具有很强的联想记忆功能,容易陷入局部极点,使得评估结果具有波动性,影响评估的精度;二是武器系统效能评估指标较多,需要根据具体对象,具体任务,确定出评估系统效能的主导因素,减少一些参数的不确定性,避免收集不相关数据带来的时间浪费。关于如何合理选择武器系统效能评估指标、有效区分评估指标重要度的研究尚不多见。

本文结合粗糙集在属性约简上的有效性以及组合神经网络在评估效果的精确性对武器系统效能评估进行了研究,提出了一种新的基于实例的效能评估方法,先采用粗糙集对效能评估指标集进行约简,除去冗余的评估指标;之后,再运用组合神经网络模型对武器系统进行效能评估,最后,通过飞机空对地作战效能评估进行实例应用研究,验证了该方法的可行性和有效性。

1 粗糙集—组合神经网络效能评估模型

武器系统效能评估的过程可以理解为对研究对象的效能评估等级进行分类和识别。具体来说,通过粗糙集,从反映武器系统效能的众多指标中提取出那些对评估等级分类识别最有效的特征,把它们作为效能评估模型的输入,减少神经网络的规模;对武器系统效能的评估等级进行预先分类,把这些不同的类作为效能评估模型的输出,那么对应于不同的特征输入,效能评估模型将有不同的分类输出。由于粗糙集有强大的数值分析能力,而神经网络具有准确的逼近收敛能力和较高的精度,所以通过两者的结合,能得到一种可理解性好、计算简单、收敛速度快的效能评估模型。

1.1 粗糙集属性约简[6] 粗糙集理论是一种解决不完

整性和不确定性问题的数学工具,它可以根据数据本身进行分类处理即可表征对象集,揭示数据内部潜在的规律;能发现数据间的依赖关系,从经验数据中生成分类规则;能在保留关键数据信息的前提下对冗余数据进行化简,发现知识的最小表达。

粗糙集理论利用信息表来描述论域中的对象,它是一个二维表,每一行表示一个对象,每一列表示对象的属性,简记为S=(U,A),其中U称为论域,A称为属性集。粗糙集认为,多数情况下,信息表中存在一些对某个给定的学习任务无关的、不重要的属性。如果去除这些冗余属性,并能找到最小的相关属性集,具有与全部属性相同的分类能力,就能简化信息表。粗糙集关于属性约简的定义如下:

设S=(U,A)为信息表,B?哿A且a∈B,

①如果IB=IB-{a},则称属性a在B中是冗余的,否则,a在B中是必要的;②如果B的所有属性是必要的,则集合B是独立的;③设B′?哿B,如果B′是独立的,且I′B=IB,则B′是B的一个约简。

约简是保留论域划分的最小属性集,约简与整个属性集的分类能力相同,即对于论域的分类能力来说,不属于约简的属性是多余的。

1.2 组合神经网络评估原理 BP神经网络理论上可以以任意精度逼近任何连续函数,但传统的BP神经网络在训练过程中容易陷入局部极小点,导致训练时间过长,因此,本文采用遗传算法(Genetic Algorithm,GA)对BP神经网络的权值进行优化,提高训练精度,缩短训练时间。然而,遗传算法优化后的BP神经网络预测出来的结果并没有很强的联想记忆功能,因此,再引入可以实现联想记忆功能的Hopfield网络,将武器系统效能评估等级看作是网络中稳定的平衡状态,这些平衡状态称之为吸引子,吸引子具有一定的吸引域。记忆过程就是将记忆和存储的模式映射为网络吸引子的过程;联想过程就是给定输入模式,网络按照动力学的演化规则运行到稳定状态,收敛到吸引子,从而回忆起存储模式的过程[7],其原理如图1所示。

根据GA-BP网络和Hopfield网络的训练原理,结合粗糙集的属性约简原理,建立了新的武器系统效能评估模型,如图2所示。

第一层是采用GA-BP神经网络,通过平时在武器系统效能评估工作中收集到的各种历史数据以及其对应的效能评估等级获得GA-BP网络的训练样本。训练后的GA-BP网络在新装备的效能评估中可以较高精度地体现专家经验知识。第二层采用Hopfield网络,通过原先的效能评估等级设计Hopfield网络,使得Hopfield网络对所有的评估等级具有联想记忆功能。新装备先通过GA-BP网络进行效能评估,再将GA-BP网络得到的效能评估结果用Hopfield网络进行联想,通过联想将新装备的效能评估等级与原有评估等级对应起来,便于进行武器系统的研制与选购决策。

1.3 评估程序 基于粗糙集与组合神经网络的武器系统效能评估的具体步骤主要由3个步骤组成:①根据具体问题,分析对象特点,构建评估指标体系,通过粗糙集选择出关键要素指标集,并确定武器系统效能评估等级分类。②根据选取出的评估指标集,通过平时工作收集相应指标值,获得对应武器系统效能评估等级的数据,建立组合神经网络模型,用已知样本集训练网络,使其达到预设的预测精度,构造专家系统的知识库。③用户根据新采集到的武器系统评估指标数据,经组合神经网络处理后,获得此时的效能评估等级,对评估结果进行分析。

2 实例分析

根据以上的对具体原理和步骤的分析,本文以作战飞机的空对地作战效能评估作为研究对象,并结合采集到的数据对该方法进行验证。通过实践调查,收集到28种作战飞机的历史数据以及与之对应的效能评估等级,取出25组数据作为训练样本,剩余3组作为学习样本用以检验模型的有效性[8]。训练样本的具体数据如表1所示。

①属性约简。本文利用粗糙集专业软件—ROSSETA数据分析软件对表1数据进行属性约简。由于表一数据充足,因此采用布尔推理算法对原始数据进行离散化处理,随后,采用动态约简对飞机指标进行约简,动态约简能够有效地增强约简的抗噪声能力。最终得出,约简{C,E}出现的频率最高,support=42,约简后的飞机空对地作战效能评估指标集由原来的7个指标变为5个指标,为{A,B,D,F,G},以此作为输入组合神经网络的变量,可以减少神经网络的规模,提高评估精度。

②神经网络学习。将25种机型的{A,B,D,F,G}指标数据作为神经网络的输入,将对应的效能评估等级编码作为神经网络的输出,对神经网络进行训练,利用训练好的神经网络作为系统的知识库。

本文基于MATLAB的神经网络工具箱进行编程,构建了图2中的组合神经网络模型。同时,对效能评估等级进行编码,如表2所示。

根据选取的训练样本数据,通过MATLAB BP工具箱构建BP网络,并采用遗传算法工具箱对其进行权值进行优化。遗传算法的进化代数设为15,种群规模设为25,交叉概率设为0.3,变异概率设为0.1,训练过程中,遗传算法的适应度曲线和神经网络的误差变化情形如图3所示。

从图3中下图可以得到,经过遗传算法优化,仅经过3次迭代,网络就达到了期望的误差目标。

同时,根据效能评估等级对应的编码,利用MATLAB Hopfield工具箱设计Hopfield网络,确定组合神经网络输出的评估等级。

③效能评估。本文选取文献[8]中三种机型(F-15E、F-5E、SU-25)的空对地作战效能评估数据作为验证样本,检验评估模型的有效性。根据约简后的指标集,在收集相关数据时只需统计三种机型的{A,B,D,F,G}指标数据,如表3所示。

将统计到的三种机型数据输入到评估模型中,经过GA-BP预测得到评估向量后,再由Hopfield网络联想,最后得到三种机型的评估向量分别为[1 1 1 1 1 1 1 1 1 ],[1 1 1 -1 -1 -1 -1 -1 -1 ],[1 1 1 1 1 1 -1 -1 -1 ],对应的评估等级分别为好、差和中。从评估结果来看,符合实际情况,说明模型是可行有效的。

3 结论

本文针对武器系统效能评估,提出基于粗糙集和组合神经网络的评估模型,该模型综合了粗糙集和组合神经网络各自的优点,根据历史数据,利用属性约简方法和组合神经网络构造专家效能评估的知识库,不仅避免了专家知识获取的瓶颈,而且缩小了网络的规模,提高了效能评估的精度,为解决武器系统的多指标综合评估和方案优化问题提供了一种可行的新方法;最后,通过对飞机进行空对地作战效能评估,验证了该模型的有效性。

参考文献:

[1]郭齐胜,杨瑞平等.装备效能评估概论[M].北京:国防工业出版社,2005.

[2]吴智辉,张多林.AHP法评估低空导弹武器系统效能[J].战术导弹技术,2003,26(4):8-12.

[3]苑立伟,阳家宏等.基于模糊理论的防空导弹武器系统综合评估模型[J].装甲兵工程学院学报,2005,15(6):24-29.

[4]鲍鸿飞,赵祚德等.DEA方法在水雷障碍效能评估中的应用[J].四川兵工学报,2009,30(1):66-68.

[5]刘帅,寇英信等.基于人工神经网络的空战效能评估[J].电光与控制,2010,17(4):26-29.

神经网络基本原理篇9

神经网络是一个具有高度非线性的超大规模连续时间动力系统。是由大量的处理单元(神经元)广泛互连而形成的网络。它是在现代神经科学研究成果的基础上提出的,反映了脑功能的基本特征。但它并不是人脑的真实描写,而只是它的某种抽象、简化与模拟。网络的信息处理由神经元之间的相互作用来实现;知识与信息的存储表现为网络元件互连间分布式的物理联系;网络的学习和计算决定于各神经元连接权系的动态演化过程。因此神经元构成了网络的基本运算单元。每个神经元具有自己的阈值。每个神经元的输入信号是所有与其相连的神经元的输出信号和加权后的和。而输出信号是其净输入信号的非线性函数。如果输入信号的加权集合高于其阈值,该神经元便被激活而输出相应的值。在人工神经网络中所存储的是单元之间连接的加权值阵列。

神经网络的工作过程主要由两个阶段组成,一个阶段是工作期,此时各连接权值固定,计算单元的状态变化,以求达到稳定状态。另一阶段是学习期(自适应期,或设计期),此时各计算单元状态不变,各连接权值可修改(通过学习样本或其他方法),前一阶段较快,各单元的状态亦称短期记忆(STM),后一阶段慢的多,权及连接方式亦称长期记忆(LTM)〔1〕。

根据网络的拓扑结构和学习规则可将人工神经网络分为多种类型,如不含反馈的前向神经网络、层内有相互结合的前向网络、反馈网络、相互结合型网络等〔2〕。本文的人工神经网络模型是采用BP算法的多层前馈网络。

该模型的特点是信号由输入层单向传递到输出层,同一层神经元之间互不传递信息,每个神经元与邻近层所有神经元相连,连接权用Wij表示。各神经元的作用函数为Sigmoid函数,设神经网络输入层的p个节点,输出层有q个节点,k-1层的任意节点用l表示,k层的任意节点用j表示,k+1层的任意节点用l表示。Wij为k-1层的第i个神经元与k层的第j个神经元相连接的权值。k-1层的节点i输出为O(k-1)i,k层节点j的输出为:

k层节点j的输出为:

Okj=f(netkj)

设训练样本为(X,Ye),X为p维向量,加到输入层;Ye为q维向量,对应于期望输出;网络的实际输出Y也是q维向量。网络在接受样本对的训练过程中,采用BP算法,其权值调整量为:

ΔWij=-ηδkjO(k-1)i

其中,对于输出层为:

δkj=yj(1-yj)(yej-yj)

对于非输出层为:

η为训练步长,取0<η<1。

用样本集合反复训练网络,并不断修改权值,直到使实际输出向量达到要求,训练过程结束〔3〕。

上述人工神经网络可以完成多种信息处理任务,如从二进制数据中提取相关知识,完成最近邻模式分类,实现数据聚集等。而本文要用的是其极强的数学逼近映射能力,即开发合适的函数f:ARnBRn,以自组织的方式响应以下的样本集合:(x1,y1),(x2,y2)…,(xm,ym),其中yi=f(xi)。这里描述的是一般的数学抽象,像识别与分类这些计算都可以抽象为这样的一种近似数学映射。

所谓诊断,实质上是一个分类问题。即根据候诊者的症状,医学检查结果(如体温、心跳等)等一些情况,它们可以用一向量(e1,e2,…,em)来表示,将其归类为病人或非病人。这也可以转化为寻找一差别函数f使得:

(1)f(e1,e2,…,em)>ε, (e1,e2,…,em)∈T

(2)f(e1,e2,…,em)>ε, (e1,e2,…,em)T

其中集合T表示患病。

因此,病情诊断最终也可作为一类函数的逼近问题。

而许多研究已表明,前向神经网络可作为非线性逼近的标准型。对于实数空间的任一函数,只要它满足一定的条件,一定存在唯一的具有单一隐层的前向网络作为它的最优最佳逼近。而含有两个隐含层的前向网络可在任意的平方误差内逼近某一实函数〔3〕。

诊断步骤

肺癌病例数据选自1981~1994年在某医院住院的病人,共计551例。其中486例(88%)经病理学、细胞学诊断证实为肺癌。每一病例都包括多项数据,其中用于诊断的数据项有:病人的一般情况(如年龄、性别等),家族史、既往史、吸烟史、术后病理、X射线检查、CT检查、纤维支气管镜检查、PAT痰检等多达58项。因此,原则上 58项数据应作为神经网络的输入项,而神经网络的输出值就是病人是否患肺癌的结果。

1.网络训练集的确定:在最原始的551例病人数据中存在着各种各样的差别,如性别差异(419例男性,132例女性),诊断结果的差异(486例经证实为肺癌),所患肺癌种类的差异(鳞癌、小细胞癌、大细胞癌等),患病程度上的差异(早、中晚期的不同)等等。显然,训练数据集应最大限度地保证兼顾各种病例情况。经过仔细筛选,选择了含有460个病例的集合作为肺癌诊断用的网络的训练集。

2.神经网络输入和输出数据的预处理

按照人工神经网络的理论,神经网络的输入输出数据都应该属于(0,1)区间的实数,为此我们需对原始数据进行如下的规一化处理:

其中xi为原始数据项,而Max=max{xi∶xi∈X},Min=min{xi∶xi∈X}。这里X为原始数据集。经过(7)式变换后,yi将在(0,1)区间。因此,可作为神经网络的输入输出。

3.应用神经网络进行肺癌诊断

将描述病人各种情况的数据作为前向网络的输入数据加到其输入端,并按(1)~(6)式计算各神经元的输入和输出,同时调整神经元之间的连接权值以使网络的输出和实际的病例情况相符。即当病人确实患肺癌时网络的输出结果也恰好指示为肺癌,反之亦然。如果对所有的训练样本集网络的输出基本上(95%或更高)能保证与实际结果一致,则训练过程结束。我们认为神经网络已建立起病人的各种因素与他是否是肺癌患者之间的函数映射关系。对于一个新的候诊病人来说,只要将他的情况输入到训练好的神经网络中去,根据网络的输出结果就可以知道他是否已患肺癌。

表1 基于不同发病因素的诊断网络模型

型 训练集精度 测试集精度

基于遗传因素的诊断网 53.8% 46.3%

基于个人生活习惯的诊断网 57.1% 44.9%

基于病症的诊断网 89.4% 83.3%

基于医学检查结果的诊断网 98.5% 92.6%

上述结果表明不同类型的因素应分开来考虑。于是我们将58项输入数据分成四类,这四类有各自的BP诊断网,依次称为诊断一、诊断二、诊断三、诊断四。它们先单独测定,然后再将它们各自的结果综合起来得出最后的判断。

上述四种诊断网络所得结果的可靠性各不相同。其中,根据医学检查结果所作的诊断准确性最高,因此在最后的综合分析中要重点考虑它的诊断结果,我们给它设一个相对最高的权值。其次,根据病人的症状所作的诊断往往也具有较高的准确性,因此给它的权值也较高,但比医学检查结果的稍低。其他两类因素在有关肺癌的诊断中仅具参考作用,因而所设的权值相对较小。

最后的结果O为:

O=a1.O1+a2.O2+a3.O3+a4.O4

a1+a2+a3+a4=1

其中Oi,ai,i=1,2,3,4分别为各诊断网的输出及其对应的权值。

当O>0.5时最后的诊断结果为患肺癌,反之则正常。对所有的病例数据经上述方法的诊断结果见表2。

表2 神经网络对肺癌诊断结果分析

神经网络

诊断结果 训练数据 测试数据

肺癌患者 非肺癌患者 肺癌患者 非肺癌患者

+ 460 2 25 3

- 0 38 1 22

其中对于训练集,肺癌病人的正确检出率为100%,非肺癌病人误诊率为5%。对于测试集,肺癌病人的正确检出率为96.2%;非肺癌患者正确检出率为88%,误诊率为12%。

讨 论

1.本研究所采用的人工神经网络的肺癌诊断方法的结果较好地符合了已知数据,具有较高的准确性,特别是对于肺癌患者一般都能准确地做出诊断,有利于肺癌的早期发现和治疗。

2.要想进一步提高该方法的准确性,应该注意收集更多更全面的病例数据。人工神经网络主要是利用它能自动从数据集中抽取函数的关系的功能。如果我们所使用的数据越多越全面,则其中所蕴含的事物本身的规律性就越强,利用人工神经网络从中所抽取的函数关系就越具有普遍性,因而就更准确。

3.实现对肺癌的诊断的关键在于准确找到罹患肺癌的判定函数,可利用前向网络的函数逼近功能来实现。但是这里涉及到两个问题。首先,由于差别函数和预测率函数都是利用人工神经网络从已知的病例数据集中抽取出来的,它实际反映的是这些数据集中输入输出对的映射关系。因此要想保证诊断具有较高的准确性,就应该使用来建立函数关系的这些数据集(称训练集)具有充分的代表性,即这些数据应基本蕴含肺癌诊断的医学原理。这就涉及到如何选择网络合理的训练集及关键的输入项。另一个问题涉及到神经网络本身的要求,即网络的输入输出数据值都应在区间(0,1)中。这可以通过数据的编码和归一化来实现。

4.由于某些原因有些病人的病例数据不完整,约占总病例数据的10%左右。显然,如果按照传统的方法来建立肺癌病人的诊断模型〔4〕,这些有缺项的数据是不太好处理的,但是由于人工神经网络有较强的容错性,输入数据在某些项上的错误对网络最终结果的正确性影响不大。

参考文献

1.焦李成.神经网络系统理论.第1版.西安:西安电子科技大学出版社,1995,3

神经网络基本原理篇10

神经网络是一个具有高度非线性的超大规模连续时间动力系统。是由大量的处理单元(神经元)广泛互连而形成的网络。它是在现代神经科学研究成果的基础上提出的,反映了脑功能的基本特征。但它并不是人脑的真实描写,而只是它的某种抽象、简化与模拟。网络的信息处理由神经元之间的相互作用来实现;知识与信息的存储表现为网络元件互连间分布式的物理联系;网络的学习和计算决定于各神经元连接权系的动态演化过程。因此神经元构成了网络的基本运算单元。每个神经元具有自己的阈值。每个神经元的输入信号是所有与其相连的神经元的输出信号和加权后的和。而输出信号是其净输入信号的非线性函数。如果输入信号的加权集合高于其阈值,该神经元便被激活而输出相应的值。在人工神经网络中所存储的是单元之间连接的加权值阵列。

神经网络的工作过程主要由两个阶段组成,一个阶段是工作期,此时各连接权值固定,计算单元的状态变化,以求达到稳定状态。另一阶段是学习期(自适应期,或设计期),此时各计算单元状态不变,各连接权值可修改(通过学习样本或其他方法),前一阶段较快,各单元的状态亦称短期记忆(STM),后一阶段慢的多,权及连接方式亦称长期记忆(LTM)〔1〕。

根据网络的拓扑结构和学习规则可将人工神经网络分为多种类型,如不含反馈的前向神经网络、层内有相互结合的前向网络、反馈网络、相互结合型网络等〔2〕。本文的人工神经网络模型是采用BP算法的多层前馈网络。

该模型的特点是信号由输入层单向传递到输出层,同一层神经元之间互不传递信息,每个神经元与邻近层所有神经元相连,连接权用Wij表示。各神经元的作用函数为Sigmoid函数,设神经网络输入层的p个节点,输出层有q个节点,k-1层的任意节点用l表示,k层的任意节点用j表示,k+1层的任意节点用l表示。Wij为k-1层的第i个神经元与k层的第j个神经元相连接的权值。k-1层的节点i输出为O(k-1)i,k层节点j的输出为:

k层节点j的输出为:

Okj=f(netkj)

设训练样本为(X,Ye),X为p维向量,加到输入层;Ye为q维向量,对应于期望输出;网络的实际输出Y也是q维向量。网络在接受样本对的训练过程中,采用BP算法,其权值调整量为:

ΔWij=-ηδkjO(k-1)i

其中,对于输出层为:

δkj=yj(1-yj)(yej-yj)

对于非输出层为:

η为训练步长,取0<η<1。

用样本集合反复训练网络,并不断修改权值,直到使实际输出向量达到要求,训练过程结束〔3〕。

上述人工神经网络可以完成多种信息处理任务,如从二进制数据中提取相关知识,完成最近邻模式分类,实现数据聚集等。而本文要用的是其极强的数学逼近映射能力,即开发合适的函数f:ARnBRn,以自组织的方式响应以下的样本集合:(x1,y1),(x2,y2)…,(xm,ym),其中yi=f(xi)。这里描述的是一般的数学抽象,像识别与分类这些计算都可以抽象为这样的一种近似数学映射。

所谓诊断,实质上是一个分类问题。即根据候诊者的症状,医学检查结果(如体温、心跳等)等一些情况,它们可以用一向量(e1,e2,…,em)来表示,将其归类为病人或非病人。这也可以转化为寻找一差别函数f使得:

(1)f(e1,e2,…,em)>ε, (e1,e2,…,em)∈T

(2)f(e1,e2,…,em)>ε, (e1,e2,…,em)T

其中集合T表示患病。

因此,病情诊断最终也可作为一类函数的逼近问题。

而许多研究已表明,前向神经网络可作为非线性逼近的标准型。对于实数空间的任一函数,只要它满足一定的条件,一定存在唯一的具有单一隐层的前向网络作为它的最优最佳逼近。而含有两个隐含层的前向网络可在任意的平方误差内逼近某一实函数〔3〕。

诊断步骤

肺癌病例数据选自1981~1994年在某医院住院的病人,共计551例。其中486例(88%)经病理学、细胞学诊断证实为肺癌。每一病例都包括多项数据,其中用于诊断的数据项有:病人的一般情况(如年龄、性别等),家族史、既往史、吸烟史、术后病理、X射线检查、CT检查、纤维支气管镜检查、PAT痰检等多达58项。因此,原则上 58项数据应作为神经网络的输入项,而神经网络的输出值就是病人是否患肺癌的结果。

1.网络训练集的确定:在最原始的551例病人数据中存在着各种各样的差别,如性别差异(419例男性,132例女性),诊断结果的差异(486例经证实为肺癌),所患肺癌种类的差异(鳞癌、小细胞癌、大细胞癌等),患病程度上的差异(早、中晚期的不同)等等。显然,训练数据集应最大限度地保证兼顾各种病例情况。经过仔细筛选,选择了含有460个病例的集合作为肺癌诊断用的网络的训练集。

2.神经网络输入和输出数据的预处理

按照人工神经网络的理论,神经网络的输入输出数据都应该属于(0,1)区间的实数,为此我们需对原始数据进行如下的规一化处理:

其中xi为原始数据项,而Max=max{xi∶xi∈X},Min=min{xi∶xi∈X}。这里X为原始数据集。经过(7)式变换后,yi将在(0,1)区间。因此,可作为神经网络的输入输出。

3.应用神经网络进行肺癌诊断

将描述病人各种情况的数据作为前向网络的输入数据加到其输入端,并按(1)~(6)式计算各神经元的输入和输出,同时调整神经元之间的连接权值以使网络的输出和实际的病例情况相符。即当病人确实患肺癌时网络的输出结果也恰好指示为肺癌,反之亦然。如果对所有的训练样本集网络的输出基本上(95%或更高)能保证与实际结果一致,则训练过程结束。我们认为神经网络已建立起病人的各种因素与他是否是肺癌患者之间的函数映射关系。对于一个新的候诊病人来说,只要将他的情况输入到训练好的神经网络中去,根据网络的输出结果就可以知道他是否已患肺癌。

表1 基于不同发病因素的诊断网络模型

型 训练集精度 测试集精度

基于遗传因素的诊断网 53.8% 46.3%

基于个人生活习惯的诊断网 57.1% 44.9%

基于病症的诊断网 89.4% 83.3%

基于医学检查结果的诊断网 98.5% 92.6%

上述结果表明不同类型的因素应分开来考虑。于是我们将58项输入数据分成四类,这四类有各自的BP诊断网,依次称为诊断一、诊断二、诊断三、诊断四。它们先单独测定,然后再将它们各自的结果综合起来得出最后的判断。

上述四种诊断网络所得结果的可靠性各不相同。其中,根据医学检查结果所作的诊断准确性最高,因此在最后的综合分析中要重点考虑它的诊断结果,我们给它设一个相对最高的权值。其次,根据病人的症状所作的诊断往往也具有较高的准确性,因此给它的权值也较高,但比医学检查结果的稍低。其他两类因素在有关肺癌的诊断中仅具参考作用,因而所设的权值相对较小。

最后的结果O为:

O=a1.O1+a2.O2+a3.O3+a4.O4

a1+a2+a3+a4=1

其中Oi,ai,i=1,2,3,4分别为各诊断网的输出及其对应的权值。

当O>0.5时最后的诊断结果为患肺癌,反之则正常。对所有的病例数据经上述方法的诊断结果见表2。

表2 神经网络对肺癌诊断结果分析

神经网络

诊断结果 训练数据 测试数据

肺癌患者 非肺癌患者 肺癌患者 非肺癌患者

+ 460 2 25 3

- 0 38 1 22

其中对于训练集,肺癌病人的正确检出率为100%,非肺癌病人误诊率为5%。对于测试集,肺癌病人的正确检出率为96.2%;非肺癌患者正确检出率为88%,误诊率为12%。

讨 论

1.本研究所采用的人工神经网络的肺癌诊断方法的结果较好地符合了已知数据,具有较高的准确性,特别是对于肺癌患者一般都能准确地做出诊断,有利于肺癌的早期发现和治疗。

2.要想进一步提高该方法的准确性,应该注意收集更多更全面的病例数据。人工神经网络主要是利用它能自动从数据集中抽取函数的关系的功能。如果我们所使用的数据越多越全面,则其中所蕴含的事物本身的规律性就越强,利用人工神经网络从中所抽取的函数关系就越具有普遍性,因而就更准确。

3.实现对肺癌的诊断的关键在于准确找到罹患肺癌的判定函数,可利用前向网络的函数逼近功能来实现。但是这里涉及到两个问题。首先,由于差别函数和预测率函数都是利用人工神经网络从已知的病例数据集中抽取出来的,它实际反映的是这些数据集中输入输出对的映射关系。因此要想保证诊断具有较高的准确性,就应该使用来建立函数关系的这些数据集(称训练集)具有充分的代表性,即这些数据应基本蕴含肺癌诊断的医学原理。这就涉及到如何选择网络合理的训练集及关键的输入项。另一个问题涉及到神经网络本身的要求,即网络的输入输出数据值都应在区间(0,1)中。这可以通过数据的编码和归一化来实现。

4.由于某些原因有些病人的病例数据不完整,约占总病例数据的10%左右。显然,如果按照传统的方法来建立肺癌病人的诊断模型〔4〕,这些有缺项的数据是不太好处理的,但是由于人工神经网络有较强的容错性,输入数据在某些项上的错误对网络最终结果的正确性影响不大。

参考文献

1.焦李成.神经网络系统理论.第1版.西安:西安电子科技大学出版社,1995,3

神经网络基本原理篇11

中图分类号:TP393.06 文献标识码:A 文章编号:1007-9599 (2016) 06-0000-02

1 引言

目前的网络规模、网络结构越来越复杂,这些新的变化变得越来越难作出诊断网络故障,迫切需要的一种工具来进行网络管理与网络故障诊断与排除。网络故障诊断依赖于各种网络设备的状态信息,当发生故障时,通过这些信息的分析和判断,找到原因[1]。在本文中采用粗糙集理论,在原有的规则提取的网络状态信息,算法的基础上决定神经网络的粗糙集(RSNN),并引入层次分散优化的思想和错误的传播原理设计,网络故障诊断模型,引进的层次分散优化网络故障诊断模型,可以在混合网络环境中提供一个singlenetwork的操作控制环境来管理所有子网和管理设备,统一远程控制的,以建立合理的和有效的诊断知识库,故障排除和网络设备,从而提高产品质量的网络,抗干扰能力和快速恢复能力的重新配置。

2 网络故障诊断的相关概念和它们的状态信息

定义1 网络状态S是一个二元组 , 是非空有限的对象,称为被管理对象的空间,记作 , 是被管网络对象, 是相应的属性参数, , 是状态属性, 是相应属性的参数。网络状态信息是指行为信息提取的网络实体在网络运行的状态。

定义2 网络实体可以定义成一个三元组 ,其中 这是一个系统迁移。G是映射功能状态变化,A是造成物理状态变化的事件集合。网络局部状态能分成L个不相干的特征 , L是由域节点的性质确定。网络故障是一种从正常状态过渡到不正常的状态。

网络状态信息通过信息的收集交界处,基于SNMP轮询的时序相关的MIB变量的数据采集,E调换改变当前网络运行状况E,数据管理,转换成网络状态信息:

为实体状态的属性参数 设定了一个阈值 , 固态性能参数的物理性能特点的基础上,可以设定一个阈值,需要的专业知识或反复实验,调整,建立比较函数:

用 代替 ,替换预处理后的状态信息。得出: 。令 得到:

因此,要使用的n-维矢量表示本地网络状态的特性。

3 系统原理及实现

在获取信息的基础上RSNN的网络性能、网络的局部特征的性质定义的属性过滤掉所有重要的属性,以反映网络故障的性质之间的关系,然后根据这些属性,建立最低起ruleslayered综合的知识基础,根据神经网络,以提高系统的性能,降低误报率的特点。预处理模块是负责网络状态记录在一个特定的时间间隔相应的离散特征属性,建立基于粗糙集理论和层次分布的优化思路,以减少网络故障可辨矩阵的功能,为了消除矛盾(冲突)和重复的分类规则的故障诊断系统,为每种类型的网络层包含多个子分类粗糙集理论,构成了一个多层次的复杂的神经网络系统。上面的步骤包含规则的故障检测。

诊断问题的实质是一个映射,我们使用一个神经网络来近似这种映射,故障分类系统的学习样本集由故障状态和故障,如在下面的表1中示出的判决子格式的子集的属性组成:

训练样本集在给定的知识领域的专家,所以难免不兼容,导致多余的样品,对这些样品进行培训,不仅不提高决策的正确性,会降低效率的学习神经网络,使用的是三层神经,每个属性贡献的故障现象子集的决策是不一样的,系统需要反映不同的属性在学习过程中的重要性,提高学习效率;此外,网络的故障信息描述的网络结构中的神经元和连接权特定的数目,必须导致低效的学习算法,并最终因为它是有限的使用,以得到样品决策表决策的标志包含只有一部分的的完整冲突样品,沙美特罗H优化算法的神经网络结构的原始库的规则,在每个层的神经元素来定义一个性能指标,i-层优化指标:

其特征在于,表示的第p个样本输入端,第i层的第j个结点的的实际加权和输出;表示第p个样本输入端,第i层的第j个结点加权和期望的输出,以确定网络的神经元的神经网络的权重可以调整到决策过程中的分层分散子优化问题的修正神经网络的学习和粗糙集的决策规则之间的交流达到了粗糙集学习,提高学习当选最低的构成正确的训练集。

(1)简化网络故障信息样本系统。设R是故障属性集,如果对于a∈R,属性集D,如果 ,那么就删除a;

(2)计算信息表的可辨识矩阵 ;

(3)对于可辨识矩阵中的所有取值为非空集合的元素 ,建立相应的析取逻辑表达式 ,将所有的析取逻辑表达式 进行合取运算,得到合取范式 , ,将L转换为析取范式的形式,得 ,其中,每个合取项中包含的属性组成约简后的条件属性集合,得到降低冗余后的知识系统K。

(4)穿越不同类别的知识系统属性,如果有重复的记录删除冲突记录,如果删除一列保留了原有的属性值,标记为其他记录,其余的属性值可以判断决策,然后删除该值,否则保持原有的价值知识系统;

(5)如果两个记录仅仅是一个条件属性值,和的财产已被删除的记录,那么没有标记的属性值的记录时,可以判断决策,然后再删除另一条记录,否则,删除记录在案;

(6)在上述处理中,一个新的信息表,所有的属性值是值的表芯,所有的记录都对应一个决策规则,沙美H优化算法知识的神经网络,输出为每一个输入对做如下处理:

(a)输入信号前向传播:

(b)输出误差信号后向传播:

输出层:由 ,得到:

隐层:和BP算法一样,将输出层的误差沿代价函数的负阶梯方向逐层后向传播:

(c)计算:由 可得到:

将上式带入 ,得到:

(7)更新权值:设误差能量函数 ,其中 。 表示梯度,设 得到:

其中, 表示 的单位梯度向量。

(8)重复步骤(6),直至收敛或学习步数达到规定值;

(9)如果训练成功,固定权值,用于回代,重新迭代。

4 结束语

针对传统的网络故障知识库难以共同存在的缺陷的高冗余性和稳定性,综合运用神经网络方法和粗糙集理论,提出了RSNN算法,以获得研究样品净化处理。该算法简化了样本,具有高适应性和高容错性,不容易陷入局部极小点,可以有效地处理噪声或不兼容的网络故障诊断。使用这种方法与其它相似的方法相比,可以提高诊断的精度和速度的诊断,具有一定的价值。

参考文献:

神经网络基本原理篇12

0 引言

近年来,随着城镇化建设速度的飞速发展,大量高层建筑和大体型的公共建筑在城市里日益增多,这些建筑的安全性直接关系到巨大的社会影响性和经济利益。由于结构原始的缺陷性和意外灾害,这些建筑的部分构件往往会受到损伤,如果能及早发现建筑结构的损伤,并采取加固措施,则可以降低经济损失和避免人员的伤亡。因此,结构的损伤识别技术研究日益受到人们的重视。

神经网络由于具有较强的非线性映射能力和较强的鲁棒性,所以非常适合于模式识别的工作。20世纪90年代以来,国内外学者对基于神经网络进行结构损伤识别的理论和技术进行了大量的研究,并尝试了BP神经网络、RBF神经网络、概率神经网络、模糊神经网络[1]等多种类型。本文对基于概率神经网络进行结构损伤识别的研究进展进行讨论,并对其将来研究方向提出建议。

1 概率神经网络工作原理

概率神经网络(PNN)是由Specht D F[2]在1990年提出来的一种人工神经网络类型。概率神经网络采用的是前向传播算法,用指数函数来取代在神经网络中使用较多的S型函数,和其他反向算法中的试探法不同,它是基于统计原理的概率密度函数的估计法。概率神经网络是把具有Parzen窗口估计量的最小错误率贝叶斯决策放入神经网络框架中,基于贝叶斯决策算法来判断输入向量的类别状态。

Parzen窗口被用来估计核密度估计量的概率密度函数[1],其表达式如式(1)所示 :

f■(x)=■■exp[-■](1)

式中: m是q类中的训练样本数量,p是样本向量的维数,σ为光滑系数,X是输入的待检验样本向量,Xqi是q类中第i个训练样本。

概率神经网络由输入层、模式层、求和层和输出层(竞争层)组成。输入层的神经元个数是输入向量的维数,待分类的向量是其神经元;模式层的激活函数是高斯函数,神经元个数是训练样本的个数;求和层的神经元个数是类别个数,该层的每一个神经元接收与其相连的给定类的所有模式层的输出,将其按不同类别相加;竞争层输出判决结果。

基于概率神经网络进行结构损伤识别的基本思路是首先对结构可能发生的损伤情况划分为若干种损伤模式,然后将从振动信号提取的损伤指标作为网络的输入向量,最后用识别出的损伤模式来判断结构发生损伤的位置。

2 概率神经网络用于结构损伤识别的研究进展

由于小波能量特征可以较好刻划含有噪声的信号特征,所以对结构响应信号进行小波变换,并用变换后的信号能量特征向量作为PNN的输入向量,就构成了松散的WPNN,使其能更有效的进行结构损伤识别。

杨晓楠[3]通过比较小波函数的正交性和双正交性、正则性等特性,选择Mexican cat小波函数对结构加速度时程响应进行小波变换,然后将其作为概率神经网络的输入向量,对美国ASCE提出的一个12自由度的四层钢框架剪切模型进行了损伤识别验证。姜绍飞[4]以小波变换作为动力信号处理工具,采取小波基函数对加速度响应进行处理,提取小波能量作为损伤识别的特征参数,同时利用遗传算法来优化PNN网络模型中的圆滑参数,提出了自适应小波概率神经网络,用小波能量特征向量作为APNN输入向量,并加入不同水平的噪声使其更真实的模拟现实工况,通过对一个框架模型的数值模拟验证了该网络的有效性。王勇[5]利用小波变换对结构动力不同频段信号进行处理,然后作为概率神经网络的输入向量对一四层钢框架进行了损伤识别。文中讨论了小波变换的尺度个数与尺度大小对损伤识别结果的影响。算例表明当小波尺度的选择范围正好对应结构的频率范围时,可以明显提高网络的识别准确性。

为了消除多传感器所采集的信息具有的冗余性,有些学者提出了数据融合技术。翁光远[6]建立了基于小波概率神经网络和数据融合技术的模型,利用ANSYS有限元程序模拟钢筋混凝土悬臂板,用频率变化率作为输入向量对其进行了损伤识别。算例表明,这种WPNN与数据融合的损伤识别方法有良好的容错性。王万平[7]利用数据融合技术进行桁架结构损伤识别,他用Ansys有限元程序建立了桁架结构的计算模型, 然后取损伤前后的前六阶固有频率经过融合技术处理作为概率网络的输入向量,对所建立的模型进行了数值模拟。算例表明,对一处和两处单元发生30%单元刚度折减的损伤情况都有较好的识别效果。

肖仪清[8]应用小波分析提取桥面的一阶振型,从空间换时间的角度导出曲率模态乘子矩阵,将振型转换为曲率模态差,并作为普适概率神经网络的输入参数,对滨州黄河大桥的铝质缩尺模型的有限元模型进行了损伤识别。文中采用模拟脉动风荷载激励斜拉桥振动,得到动力响应参数,使该方法的实用性大大提高。

禚一[9]提出分步损伤识别方法,以天津河北大街混合梁斜拉桥为例,首先采用概率神经网络判定发生损伤的子结构位置,输入向量选用正则化的频率变化率,然后用径向基神经网络对有损伤的子结构中的局部构件进行进一步的损伤位置和程度的识别。采用这种组合网络进行分阶段的损伤识别效率较高,特别适用于大型结构的损伤识别。通过分步识别法,减少了每次损伤识别都要对所有构件同时进行损伤程度判定的工作量,也使识别的精度和准确性有了很大的提高。

3 结论

(1)概率神经网络对训练样本的工况代表性较高,如何使训练样本全面包含可能出现的所有损伤类别对于损伤识别的准确性非常重要。因此训练样本的数量必然庞大,需要极大的存储空间;

(2)输入向量的选择对于概率神经网络的损伤识别效果也非常重要,在不同的结构类型下如何合理的选择小波变换函数和数据融合技术,使测得的动力信号可以得到最优化的处理需要更深入的研究。

【参考文献】

[1]姜绍飞.基于神经网络的结构优化与损伤检测[M].北京:科学出版社,2002.

[2]Specht D F.Probabilistic neural networks[J].Neural Networks,1990,3:109 -118.

[3]杨晓楠,姜绍飞,唐和生等.小波函数的选择对结构损伤识别的影响[J].沈阳建筑大学学报(自然科学版),2005,21(6):635-639.

[4]姜绍飞,张帅,杨晓楠,等.自适应小波概率神经网络损伤识别方法[J].沈阳建筑大学学报(自然科学版),2006,22(1):45-48.

[5]王勇,杨俊青,肇启才,等.小波尺度选择对钢结构损伤识别的影响[J].山西建筑,2007,33(30):99-100.

[6]翁光远,王社良.悬臂板损伤数值模拟试验与WPNN识别(下转第68页)(上接第51页)方法[J].西安工业大学学报,2009,29(3):290-293.

友情链接