图像法论文合集12篇

时间:2023-03-08 14:52:19

图像法论文

图像法论文篇1

1引言

近年来,视频压缩编码和视频加密这两个领域的研究均十分活跃,其中主要的研究技术也较为成熟,但是作为图像处理的两个重要的方面,人们对他们结合起来的分析和研究还缺乏足够的重视和足量的人力物力的投入。

混沌理论是近年来发展较快的非线性科学的重要分支,因其具有非周期、连续宽频带、类噪声和长期不可预测等特点,所以特别适用于保密通信等领域。分形编码有着精细的结构,具有任意小比例下存在某种自相似细节的特点。分形理论的特点决定了人们着重研究它在图像压缩方面的作用,但是它在图像加密方面的应用还没有被人们开发出来。本文通过对现有图像压缩算法和加密算法发展方向的分析,提出一种将分形压缩编码和混沌保密算法相结合的算法。经分析该算法具有较好的压缩加密效率,并且能够满足对图像的安全的要求。

2分形图像压缩

分形图像压缩是利用原始图像所具有的自相似性,构造一个迭代函数系统(IFS),利用IFS抽取图像的自相似性,即用图像中的一个子块经过分形仿射变换来逼近同一图像中的另一子块,而且仅仅将仿射变换系数记录下来,从而达到压缩图像数据的目的。

分形压缩理论主要包括:分形空间上的压缩映射,迭代函数系统,压缩映射的不动点定理,拼帖定理及仿射变换等理论。

一般的分形压缩编码过程为:

(1)将原始图像分块

把原始图像分别分割成尺度K*K的值域块Ri和L*L的定义域块Di,一般取L=2K.

(2)寻找合适的分形变换参数

利于图像局部之间的相似性,根据了IFS拼贴定理,为图像中每一个值域块Ri寻找与之最匹配的定义域块Di及相应的仿射变换wi.

(3)存储分形变换参数

找到最佳匹配块,记下坐标值和应用误差值,依次完成对原图像的编码,从而实现图像的压缩。

经过上面的分析可以看出在分形图像压缩算法中最核心的部分就是对图像的仿射变换的选取。下面我们来详细分析其算法:

首先定义图像f(x,y)上的映射wi:FF为:

在变换中,常数Si控制灰度图像的对比度,Qi控制图像的亮度。

空间压缩变换一般可以简化成8种形式,即旋转0°,90°,180°,270°,垂直中线反射,水平中线反射,相对45°反射以及相对135°反射。我们用c++编程实现仿射变换,主要编码如下:

对当前定义域块做变换(8种)

for(t=0;t<8;t++)

{if(t==0)

{for(k=0;k<BLOCKSIZE;k++)

for(l=0;l<BLOCKSIZE;l++)

TransDomain[k][l]=Domain[m+k][n+l];}

//旋转

同样类似其余七种变换主要形式如下:

TransDomain[k][l]=Domain[m+k][n+BLOCKSIZE-1-l];//旋转90°

TransDomain[k][l]=Domain[m+BLOCKSIZE-1-k][n+l];//旋转180°

TransDomain[k][l]=Domain[m+l][n+k];

//旋转270°

TransDomain[k][l]=Domain[m+l][n+BLOCKSIZE-1-k];//垂直中线反射

TransDomain[k][l]=Domain[m+BLOCKSIZE-1-l][n+BLOCKSIZE-1-k];//水平中线反射

TransDomain[k][l]=Domain[m+BLOCKSIZE-1-k][n+BLOCKSIZE-1-l];//相对45°反射

TransDomain[k][l]=Domain[m+BLOCKSIZE-1-l][n+k];//相对135°反射

通过寻找图像的反射变换,我们可以得到变换后的图像与原图像之间的误差,设其为erri,预先给定一个误差标准ε,只要每一块的误差erri<ε,就认为完成了图像的分形编码,否则将值域块分割成更小的值域子块,重复该过程,直到误差满足要求或者值域块的分割已经达到预先确定的最小值则认为完成了图像的分形编码。分形编码中对图像的分割越小,则编码的精确程度就会越高,但同时高的编码质量却影响了压缩率和计算速度。

对一幅图像进行分形编码后,存储的文件中是原图像的所有变换参数。我们可以明显看出,对一幅图像来说,存储映射参数所需的存储空间要远远小于存储原图像的空间,因此我们很好的实现了图像压缩的目的。在上节的处理中我们把变换参数存进了一个M*N的矩阵中,设为Y(M,N)。编程时定义了一个结构体用于存储编码参数:RangeX,RangeY,DomainX,DomainY,TransformNo,Scale,Offset,因此M的大小就是由定义域块、值域块的位置与大小及仿射变换wi确定的,取M=7;而N的大小可以定义为:N=IMAGESIZE/BLOCKSIZE。

3混沌加密算法

混沌现象是在确定性非线性动力系统中出现的确定性、类随机的过程,它对初始值有极其敏感的依赖性。因此混沌加密技术非常适合用于图像加密。

Logistic序列的混沌特性和统计特性分析如下:

(1)

其中xk为映射变量,u为系统参数,取值范围为-1<xk<1,0<u<2。当u逐渐增大时,迭代出现多次突变。研究表明:当0<u<0.750时迭代为稳定的1周期,当u增大到0.750时,迭代出现2点周期分岔;u增大到1.250时,出现4点周期分岔。随着u的增大,这种2n倍周期分岔越来越快。当u1.40115时迅速达到周期N∞即进入了混沌状态。

算法原理步骤:

第一步:根据Logistic映射(1),利用密钥u、x0生成一组混沌序列xk,从xr(r>0)开始取M×N个元素构成N×M矩阵G,G(i,j)∈[-1,1]。因此可知此混沌序列的密钥为xr。

第二步:根据式(1)生成混沌序列xk,令L=2。首先,把xk整数化,生成置乱矩阵G,并令其值[0,255],取整算法:

gk=round(*255/2+255/2)k=0,1,…MN-1(2)

第三步:对原图像进行加密处理。将分形压缩后形成的参数矩阵Y与置乱矩阵G中相对应的进行位的异或运算,生成加密图像M,

即mk=yk^gk=0,1,…MN-1(3)

第四步:对加密图像M进行行列置乱处理。将M中元素位置为1的元素移到元素位置为2的位置,将2移到3的位置,依此类推,最后将M×N移到1的位置。即得到最终加密图像。

4解密算法

输入正确的密匙xr,生成相同的混沌序列xk,及gk。接着进行加密第四步和第三步的逆运算即可。

加密流程图如图1所示:

图1加密流程图

5算法的编程实现

实验中我们我们取x0=0.3,并先跌代300次后开始取之后的M*N个元素作为矩阵G,取u=1.42,对编码后的图像进行加密,我们用matlab仿真,图2为原图像,图3为加密后的图像。我们可以看出图像的加密效果很好。在解密时候只有正确输入密钥xr(r=300)、u才能得到正确的解密图像。

本算法先对图像进行了压缩处理,编码后的文件大大缩小,有利于下一步的加密处理;加密时置乱矩阵是随机选取的,只有知道正确的密钥解密后才能够得到正确图像,利用混沌序列大大提高了安全性。通过大量实验证明,此压缩加密算法在加密文件数据量大,要求加密速度高的情况下具有较好的效果,因此在许多领域能够得到广泛应用。

参考文献

[1]XiaokeXu,XiaomingLiu,JidongSuo,AnImprovedTargetDetectionMethodonWavelet-BasedFractalScalingAnalysis

图像法论文篇2

1.引言

伴随着计算机网络技术、多媒体技术和数字化信息处理技术的飞速发展,互联网上的多媒体信息迅速膨胀。与此同时,计算机所能处理的媒体信息范围也在不断扩大。如何对海量数字图像信息资源进行高效地组织、管理和检索成为了当前热门的研究课题。图像检索成为多媒体领域研究热点的现实原因包括:一方面,图像作为一种内容丰富、表现直观的媒体资源,已经应用在社会各个层次和领域;另一方面,人们面对日益增长的多样化的图像信息,如何在这些海量图像信息中检索出满足自身需求的资源,是近年来网络图像信息处理领域迫切需要解决的问题。

2.图像检索国内研究综述

从20世纪70年代开始,国外有关图像检索的研究就已开始,当时的研究内容主要是基于文本的图像检索技术,到90年代以后,出现了对图像内容语义检索的研究,即基于内容的图像检索。与国外相比,我国有关图像检索的研究起步较晚,从20世纪90年代开始,我国图情领域的核心期刊才开始有相关图像检索的研究论文出现,研究内容大多也是参考国外的研究方向。近年来,随着相关专家、学者对图像检索领域关注度的提高,我国图情领域有关图像检索的研究论文大量出现,相关研究的理论和技术也取得了一定进展。

2.1图情领域核心期刊中图像检索研究论文分布及相关分析

根据中国社会科学引文索引(CSSCI)数据库1998年来对图书情报领域有关图像研究来源文献的收录情况,下文将运用文献计量方法对目前我国图情领域有关图像检索的研究论文按期刊种类、年份、研究主题分布等进行统计分析。

2.1.1图像检索研究论文年度分布情况及相关分析

从表l可以看出,截止到2014年我国图情领域的相关核心期刊在图像检索方面论文收录量总体上呈余弦波状趋势。其中,2002年以前,我国有关图像检索的论文在图情领域核心期刊上的分布处于量少且分散化的状态。2002年到2006年来数量相对较多,属于有关图像检索研究的高峰期,2005年达到最大值。但在2006年以后,相关论文数量趋于明显回落的状态。从以上表格数据的分布状况可以看出,尽管我国图情领域的专家、学者对于图像检索领的研究出现过关注密集期,但重视程度并非长期处于始终如一的状态。

另外,从上表中还可以看出研究论文在核心期刊的分布状态,其中《现代图书情报技术》、《情报科学》、《情报杂志》、《图书情报工作》这四种期刊对图像检索这一研究方向相对关注较多,几乎每年都有相关的。其余的期刊对图像检索研究方向的关注程度相对不高,只有少量其上,并且期刊中有关图像检索的研究论文按年度划分时,总体分布也是相对比较分散的状态。

2.1.2图像检索相关研究论文主题分布及整体分析

对于CSSCI中所收录的126篇有关图像检索研究的文章,按照所研究的相关内容可大致划分为图像检索基本理论与概述、基于具体图像特征的检索、图像检索的具体应用、图像检索交互性与反馈机制、图像检索系统及搜索引擎的设计与评估和图像检索技术、方法研究六个主题方向。

以上结果表明,我国图书情报领域近十年以来对图像检索的研究主要集中于图像检索基本理论与图像检索技术、方法方面。通过对这些相关主题研究论文的阅读,可以发现近十年来,我国对图像检索的研究比较理论化,缺乏对具体图像检索系统的设计、图像检索技术在实际生活中的应用与用户交互性方面的研究。对基于内容的图像检索技术,无论是从低层视觉特征,还是从高层语义中的图像检索,均是涉及理论方向的探讨居多。这表明我国图情领域有关图像检索的研究,无论是从广度还是深度上,均有较大提升空间。另外,有关图像检索系统及搜索引擎的设计与评估方面,则比较注重典型系统和搜索引擎的比较和分析,新的图像检索系统的设计较少。

(1)图像检索基本理论与概述

该主题方向主要包括图像检索的所涉及的基本原理、基本理论模型构建、已有的国外检索系统简介等。相关论文及研究内容有,毛力、张晓林1999年在“基于内容的图像检索技术与系统”一文中首先简述了传统图像检索中出现的问题,又初步探讨了基于内容的图像检索的原理,并简要介绍了国外几个典型基于内容的图像检索系统,开了我国研究基于内容图像检索的先河。2005年王彤、魏成光在“数字图像信息的组织和检索”一文中介绍了网络信息环境中数字图像信息的检索原理。随后,又有一些新的学科理论原理相继在图像检索领域涉及和应用,相关论文包括“基于压缩与特征点的快速图像检索”、“基于贝叶斯定理的遥感图像检索”“数字图书馆中基于本体的图像检索”等。由研究论文所涉及的内容可以看出,越来越多的新的学科内容将应用于图像检索领域中。

(2)基于具体图像特征信息的检索

该主题主要涉及基于具体的图像内容特征的检索方式,包括基于图像的颜色、纹理、形状等具体内容特征及其在具体实验中的应用。彭斌2000年在“基于颜色内容的图像检索”一文中论述了基于颜色内容的图像检索方法,并提出基于图像分割的颜色直方图和将主色调进行适当扩展检索,这是对原有基于颜色特征的图像检索方法进行改进的开端。随后又有多篇关于颜色内容特征的研究论文相继出现,例如毛力、张晓林的“基于颜色内容的图像检索原理与方法”、张学福的“论图书馆基于颜色内容的图像检索技术”、何立民、万跃华的“数字图书馆基于内容的多分辨率颜色特征检索和相关反馈技术”等。2006年来,并未有涉及具体图像特征信息检索的研究论文出现。

(3)图像检索的具体应用:

主要包括图像检索技术在社会农业、商业、工业、医学、艺术等方面的实际应用及实际现象研究。1999年张学福、冷伏海发表“商标数据库信息检索技术研究”一文,基于当时图像检索技术水平探讨了图像商标信息数据库的检索问题,旨在推进我国商标数据库的建设和利用,更好的满足我国市场经济发展需要。黄琨、赖茂生2007年在“彩色自然风景图片的四季特征提取”一文中根据彩色自然风景图片的特点,提出“天空去除”和“1/2区域分析”提取图像特征改进方法,同时采用四季轮盘调查法收集用户评价,然后通过多元线性回归方法建立颜色特征与用户评价的映射关系,用于彩色自然风景图片四季特征的自动提取,通过实验验证了该映射机制对于正确预测彩色自然风景图片四季特征的有效性。近年来并没有相关图像检索的具体应用研究论文的出现。

(4)图像检索交互性与反馈机制

主要讨论目前图像检索系统的交互和有关用户反馈及其相关反馈技术的发展。董文军2001年在“基于内容的图像检索的相关性反馈机制”一文中阐述了一种新的相关性反馈机制―通过对用户指定的相关及不相关图像的特征分布进行统计分析来动态更新相似性度量和查询,从而更准确地表达用户特定的信息需求及提高检索系统的性能。2006年黄琨,赖茂生在“以用户情感为线索的图像检索研究”一文中介绍了以用户情感为线索检索图像的产生背景,并提出了其实现原理、检索流程、检索系统的一般架构。从2006年以后,我国图像检索领域未有关于用户交互性的研究论文在图情领域的核心期刊中出现。

(5)图像检索系统及搜索引擎的设计与评估

该部分主要研究内容有原有系统的改进以及新系统的设计,此外还包括相关搜索引擎的设计与评估标准的研究。文燕平2001年初在《现代图书情报技术》上发表“基于内容的图像检索系统研究”一文,首次介绍了一些国外著名的图像检索系统,并且对图像检索系统的新成果进行了详细阐述。王惠、沈玉利2005年发表“基于内容的图书馆图片检索系统”一文,该文提出了一种基于特征向量的索引方法,构建了一个高效实用的图书馆图片检索系统,并对系统的构建方法进行了较详细的讨论。近年来,又相继有多篇关于图像检索搜索引擎的研究论文出现,例如:“集成式图像搜索引擎体系结构分析”、“基于用户满意度的图像搜索引擎评价研究”等。

(6)图像检索技术、方法研究

主要包含各种各样的图像检索系统的检索工具、支持技术等,以及对原有技术的评估以及对新的核心技术进展的探讨。袁方、刘明2001年在“数字图书馆中的基于内容图像检索技术”一文中分析和介绍了图像数据库构建、图像的内容描述、特征提取和匹配、快速检索等基于内容图像检索的关键技术。高仕龙2010年在“基于特征融合的图像检索算法研究”一文中提出了一种新的基于特征融合的灰度图像检索算法。期间又有多篇有关图像检索技术、算法研究论文的出现,如“图像检索中版面自动分析技术研究”、“图像检索中索引技术研究”等等。

2.2存在问题

通过阅读近年来我国图情领域核心期刊所包含的有关图像检索的126篇研究论文,并对其在发表时间、研究主题、发表期刊的分布状况进行了统计分析,发现目前我国图情领域对图像检索的研究存在着一些不足,需要做出相应的对策以促进其的进一步发展。

2.2.1整体研究水平不高

多年来我国图情领域对图像检索的研究总体关注度不高,有关研究文献分布上较为分散,并没有大量、集中、系统性的研究性文章集合出现。这种分散的趋势给有关人员查找、利用相关信息带来了不便,也不利于图像检索的深入研究。另外,我国图情领域对图像检索的研究课题独立性不强,研究理论和技术也不够成熟。因此,在重视研究成果的系统性与全面性的前提下,更应该积极借鉴国外有关图像检索的研究成果,紧密跟踪图像检索发展动态,关注热点、难点、前沿问题,提高我国图像检索领域的整体研究水平。

2.2.2研究内容不平衡

正如前面表2对论文研究主题统计分析的一样,近十年来我国图情领域有关图像检索的研究集中于图像检索基本理论与图像检索技术、方法方面,缺乏具体图像检索系统的设计,图像检索技术在实际生活中的应用与用户交互性方面的研究设计的也较少。面对这一研究现状,一方面应对现今较成熟的研究方向继续深入探索。另一方面,应拓宽研究领域,促进其他研究方向共同发展。尤其是系统用户界面、图像检索的具体应用等研究薄弱的方向更应该引起相关领域的专家、学者的足够重视。

3.发展与展望

由于其检索对象和应用领域的多样性,有关图像检索的研究具有广泛的内容,它不但吸收了传统计算机信息的存储、检索和图像处理等各方面的理论和技术,同时又促进了这些理论和技术研究的深入和发展,成为了一个目前比较热门的研究课题。目前,在图像检索技术的新发展方面,还要解决多种检索手段相结合的问题,以提高图像检索的查全率、查准率。有关图像检索算法、方法研究的发展趋势表现为,一是对原有算法的不断改进;二是新方法、新概念的引入和多种方法的有效综合运用。与此同时,图像检索有关新的算法、方法应该向更智能化、精确化和实用化方向发展。本文通过对我国图情领域有关图像检索的研究论文进行统计分析,发现我国图情领域有关图像检索研究的不足,并预测未来的发展方向,以期为今后我国图像检索领域的发展与完善起到参考作用。(作者单位:乐山职业技术学院)

参考文献:

[1]韩建新.图像数据库与图像检索.图书与情报(J),1993(03):38―40

[2]毛力,张晓林.基于内容的图像检索技术与系统.现代图书情报技术(J),1999(05):30―33

[3]柳群英.基于形状特征的图像检索技术.情报杂志(J),2004(04):87―88

[4]董文军.基于内容的图像检索的相关性反馈机制.情报杂志(J),2001(07):17―18

[5]黄琨,赖茂生.以用户情感为线索的图像检索研究.情报科学(J),2006(09):1395―1399

[6]严丽君.新浪、Google、Yahoo图像搜索引擎比较.图书情报工作(J),2003(10):83―87

[7]吴金红,张玉峰.基于内容的图像检索之相关标准研究.图书情报工作(J),2004(09):48―51

图像法论文篇3

当然,必须看到的是,影响国内的图像转向的观点来自图像,也即视觉文化更为发达的西方,所以,对于中国而言,对“图像转向”的关注无疑是这种理论旅行的结果。在西方,明确提出“图像转向”的是米歇尔。在《图像理论》一书中,米歇尔大致从如下几个方面讨论了“图像转向”的问题:首先,他认为“图像转向”可以从哲学和文化理论对视觉再现的焦虑,对形象的恐惧和抵制得到确凿无疑的证明。他说:“罗蒂决定‘把视觉的、尤其是镜像的隐喻完全排除在我们的语言之外,’这与维持根斯坦的形象恐惧和语言哲学对视觉再现的普遍焦虑相呼应。我想要说明的是,这种焦虑,这种要保护‘我们的言语’而抵制‘视觉’的需要,就是表明图像转向正在发生的一个准确无误的信号”。[1]

其次,米歇尔认为图像转向会在当前产生的另一个征候是对潘诺夫斯基的图像学的复兴,或者重新激发的对图像学的兴趣。米歇尔认为,潘诺夫斯基关于文艺复兴视角的论述,充分证明了图像方式的转变并不取决视觉经验本身,这一点与福柯后来所说的知识型的建构具有相似性。也许正是由于图像学与知识考古学的这种类似,使米歇尔看到了图像学作为一种研究方法,超越了艺术史研究的领域而具有当下图像转向的意义。

第三、在《图像理论》一书中,米歇尔对元图像的论述,也即对图像的自我指涉功能的论述,在我看来,可以理解为他所说的图像转向具有自身基础的证明。[2]

如果我所理解的米歇尔关于图像转向的理由是正确的,那么在我看来,它们都不能证明图像转向具有语言学转向的意义。因为在第一条理由中,米歇尔所说的图像无处不在地统治着我们,以及哲学家们对图像的恐惧,并不能证明哲学和方法论上的图像转向已经发生。

在第二条理由中,我们则发现,即便图像学的研究具有普世性的方法论意义,也只能是众多方法之一种,而无法承担凌驾其它方法之上的重任。

事实上,在我看来,如果米歇尔对元图像的论述,也即图像的自我指涉能力能像语言一样,甚至是更具有当代意义的话,那么,与语言学转向具有同样性质的图像转向则可成立,但是,值得注意的是,从米歇尔所选取的例证看,图像的自我指涉并不只是发生在现代和当代,而是从古到今都有。这也就是说,用视觉再现的图像表现和反观自身,古已有之。当然,这并不是最重要的,重要的是自我指涉的元图像,真的能像语言一样,建立一套不仅能言说自身,而且还能在研究众多对象时,为其它学科提供方法论吗?即它能像索绪尔的语言学那样,作为一种方法论,为人类学、文学理论、社会学等学科提供研究的方法吗?我以为答案是否定的。我们知道,在语言学的转向时期,不仅改变了研究的方向和方法,而且几乎所有的领域都要涉及语言问题,几乎所有的问题都最终被归结为语言(文本、话语等)问题。所以,假如我们用语言学的转向来衡量今天米歇尔所说的图像转向,显然有根本的区别,它表现为图像自我指涉能力的有限性,使元图像本身无法成为一种在所有领域使用的方法;图像作为研究对象,也并非能普及到所有的领域。

基于上述理由,我认为在语言学转向之后并没有一个图像的转向发生和存在,尽管我们生活在图像泛滥的时代,但从严格意义上讲,支配图像,并使其具有意义的方法和哲学,仍然是20世纪发展起来的语言学和符号学。当然符号学有很多种,有索绪尔的以文字语言为原型的符号学,有卡西尔的文化符号学等。潘诺夫斯基的“图像学”,在方法和哲学上就受到卡西尔的符号学的影响。巴特对流行文化,如服装的研究,则与索绪尔的结构主义有关。事实上,图像泛滥的图像时代并不意味着在语言学、符号学转向之后有一个图像转向。从哲学史上几次大的转向看,如从本体论向认识论的转向,从认识论向语言学和符号学的转向,都是书写文化内部的转向,图像则因自我指涉功能的限制而承担不起转向的重任,因为仅凭图像本身的力量,建构不出一套全新的看问题的方法。所以,我对这一问题的基本看法是,在20世纪整个学术思潮中,如果有图像转向的问题的话,那么它也仅只是语言学和符号学转向中的一部分,并且说白了,前者甚至只是后者的滞后反应。

在国外的学者中, 同样对“图像转向”或“视觉转向”持怀疑态度的是斯洛文尼亚的美学家阿莱斯・艾尔雅维茨(Ales Erjavec)。这位《图像时代》的作者,在一次关于“图像转向”的演讲中说:“我们是否可以说一种视觉转向已经实现?我认为,现在做这样的断言还为时过早。”他从三个方面给予论证:“首先,一种转向必须是普遍的,也就是说,它必须涉及到社会领域的方方面面。”但他认为图像还不具备这一普遍性;“第二,从它并没有包含全球所有地区的意义上来说,视觉转向也不是普遍的,尽管一种视觉转向正被全球资本主义以电视以及其他不计其数的方式所播撒,但是,在全球的许多地方(比如亚洲和拉美的许多国家),一般来讲,艺术、理论、话语仍然具有很大的发展潜能,远远没有陈腐过时。”其三、“今天,没有人能够宣称他/她――不管是个体、组织、智囊还是电视网络――掌握了与自己相关的所有‘知识’,更不用说是掌握世界上其他地区的所有知识了。全球化生存变得如此复杂,以至于‘认知图绘’受到严重的阻碍。”

我对“图像转向”的怀疑与阿莱斯・艾尔雅维茨的实证主义立场不同,因为在我看来,“图像转向”是否可能,还涉及到一个更为基本的哲学问题,那就是图像与语言,看与说、形象与书写的关系问题。这是一个在哲学和文化史上不断被提及,但从来没有被深入讨论过的问题。不管是中世纪的反偶像运动,还是西方哲学家把图像视为儿童或智力不发达的人所依赖和喜爱的对象;也不管是中国古代文化传统中的“万物皆下品,唯有读书高”的观念,还是现代西方马克思主义把现代文化工业生产出来的大众文化中的图像,视为剥夺人的理性的罪魁祸首。都说明在主流话语中,语言高于图像的地位是不证自明的。其实,我们也只有把这个问题放到更广阔的背景,更悠久的人类历史,更基本的人性基础上来考察,我们才能清楚地看到图像对语言的依赖关系。事实上,人类的理解能力正是在符号(语言、图像、手势等)对视觉的自然性、具体性、个别性和无限性的超越过程中发展起来的,并且,在文字符号没有出现之前,图像作为人类对世界的理解方式之一,就已经在一定意义上具备了超越视觉的自然性、具体性和个别性的特征。在只有图像能够超越时空限制的史前和原始社会中,正是图像使人类看到的世界具有了可理解的类概念的抽象意义。而当书写文化出现之后,语言也就成为其它文化形态的统治者,占据着文化中心的地位,并使其它文化方式,如图像等受其支配。尽管在人类漫长的历史中,语言占据文化中心,并支配其它文化形态的时间并不长,但是可以肯定地说,直到今天,我们仍然生活在这一历史中而没有根本性的改变。

二、 视觉艺术研究和批评中的图像转向

尽管我不同意有一个与语言学转向的性质类似的图像转向的看法,但是,在两个意义上我们可以谈论图像的转向:一、视觉文化中的理论、批评和历史研究,二、艺术创作中的图像问题。让我从前者谈起。

从视觉艺术研究的角度看,图像或视觉文化的转向,只能是相对现代主义的艺术史、艺术理论研究和艺术批评的特点而言的。这也就是说,在现代主义时期,只从艺术性,也即艺术的形式、风格和语言的角度,研究和批评视觉艺术,并且其精英主义的立场,使其只关注伟大且纯粹的艺术。视觉艺术作品中的主题、内容、题材和意义,都被排斥在研究之外。图像或视觉文化转向之后,这一状况则发生了根本性的变化,其中最重要的是,一切形象都可以从图像或视觉文化的意义上来理解,从最经典的美术作品,到最通俗的卡通和广告,甚至包括最实用的地图和医学挂图,在视觉文化的意义上都是图像,都承载着文化的意义,都包含着意识形态的问题,所以都是值得研究的对象。正是从视觉艺术研究的角度看,有一个从过去只重视纯艺术和伟大的艺术向视觉文化,也即图像,包括高与低两极的一切图像转向的问题。

如果我们考察一下学术史,就会发现,最早从文化的角度讨论图像的是西方马克思主义,即法兰克福学派对文化工业的批判,如本雅明、阿多诺等,特别是本雅明对现代复制技术条件下,图像的生产和传播的性质和功能的论述,直接影响到对视觉文化的研究。大约到上世纪五六十年代,也即与英国波普艺术出现的同时,在英国出现了文化研究的学术路径,这不仅使美术被放在视觉文化的地位被考察,而且流行的视觉文化,也成为学术研究关注的对象。从艺术研究和批评的角度看,这也就是从现代到后现代转换的一部分,即重视对视觉文化和图像中的社会、文化和意识形态问题的研究与批评,并且把现代主义艺术关注的形式问题,也从意识形态的角度给予研究。这不仅是从纯艺术向日常生活中的视觉文化的转变,而且也开始从社会学的角度质疑纯艺术的纯粹性。

研究图像的另一立场来自艺术史学本身,即米歇尔所说的潘诺夫斯基的图像学。在美术史研究方法中,图像学与形式主义方法具有对立的性质,因为它更关注视觉艺术作品的题材、内容、形象、风格与历史、文化、哲学之间的关联,而不是艺术形式本身。就此而言,潘氏的图像学,尽管以阐释古实艺术,特别是具有宗教、哲学、风俗、文化含义的艺术为主要对象,但在方法论上,它与20世纪后半叶兴起的以研究当代流行图像的视觉文化研究是一致的。

三、 当代艺术中的图像转向及其矛盾

从艺术创作的角度,图像转向主要发生在当代艺术领域,它表现为如下几种形态:

一、 现代制造影像的复制技术,如摄影、摄像、电脑设计制造的图像,作为新的艺术媒介和语言,被当代艺术家广泛使用,形成了一类新的,不同于传统的手工技巧创作出来的视觉艺术,如录像艺术、图片等。当然在当代艺术中,对图像复制技术的运用是不同于它在商业和大众传媒领域的,最主要的特征在于它是反思性和观念化的。

二、 自杜尚改写达芬奇的《蒙娜丽莎》之后,一切视觉艺术,特别是那些艺术史上伟大而又家喻户晓的美术作品,都开始具有了图像的含义,成了可利用的资源和反思的对象。当然,从根本上说,这之所以可能,同样依赖现代复制技术对历史上的名作给予复制和广泛传播的现实。从某种意义上说,正是杜尚对《蒙娜丽莎》的改写开创了图像利用的全新方法,为后来图像在艺术创作中的广泛运用开辟了道路。其中影响最大的莫过于波普艺术。不同于杜尚的是,波普艺术所利用的图像主要来自大众流行文化,而不是艺术史上大师们的作品。在此意义上说,正是杜尚开创的挪用和拼贴的方法,为视觉艺术中的图像转向奠定了基础。

三、 在当代艺术中,图像转向还表现在绘画自身的图像化倾向上。在中西美术史上,造型艺术通过漫长的历史发展,形成了相对稳定的语言系统和审美趣味。并通过学院教学世代相传。进入后现代之后,被经典化的传统绘画语言受到了电视、电影、摄影、动漫等现代图像类型的冲击,并导致一部分艺术家开始借用现代图像的视觉感受创作作品,从而在架上艺术上,特别是绘画领域中,形成了图像化倾向,改变和消解了传统绘画的语言方式和审美特征。

然而,值得注意的是,当代艺术中的图像化倾向,或者说图像转向是充满了内在矛盾的。这一点主要表现在视觉主义和反视觉主义的关系上。从视觉主义的角度看,从杜尚的《蒙娜丽莎》,到英美的波普艺术,以及后来盛行的当代录像艺术和图片艺术,几乎都可证明图像受到越来越多的艺术家的重视,我们无疑可以把这种重视看成是重视视觉的视觉主义倾向。不过从反视觉主义的角度看,我们则又能发现与视觉主义相反的情形:反视觉主义。对此,我们可以从三个角度来理解:一是当代艺术中的图像化倾向,实际上是与概念化、观念化、哲学化的倾向相伴随的。这一点同样开始于杜尚的《蒙娜丽莎》,因为在这一作品中,最重要的并不是达芬奇的作品本身,而是在杜尚的改写介入之后,《蒙娜丽莎》在分类、人物身份、作品归属、艺术概念等方面的一系列的观念变化。换言之,杜尚的《蒙娜丽莎》几乎不是拿来看的,而是让人思考的。这一倾向也体现在马格利特的《这不是一支烟斗》这一作品之中,它通过可视的图像与可述的言语之间的相互否定,开辟了供人们思考的空间,而不是可视的图像本身的价值。二是反视觉主义表现在对图像的恐惧和抵制上,这不仅发生在米歇尔所说的哲学和文化批判领域,而且也发生在当代艺术的图像化的自身领域之中,然而其立场则与米歇尔所说的哲学和文化批判领域中对图像的恐惧和抵制极其类似,那就是在图像化的当代艺术中,受到抵制和批判的是由文化工业生产出来的大众文化中的图像,如商业广告,电影明星,流行画报中的美女等,英美的波普艺术就是其典型,并且它也是最大限度地呈现了视觉主义和反视觉主义矛盾的艺术类型。三是图像成为一种概念,成为推论和思考一切图像的意义的工具。换言之,用图像思考图像,成为当代艺术中“图像转向”的重要倾向。

通过上面的阐释,我得出的结论是:一、在当代社会的流行和消费文化中,“图像转向”表现为图像的泛滥和无所不在,体现了对视觉享乐主义的肯定和迎合;二、在当代艺术,也即后现代艺术中,“图像转向”表现为对第一种图像,也即流行和消费文化中“图像转向”的批判和质疑;同时,在当代艺术中,图像作为一种理性的工具,从一开始就具有反图像、反视觉的概念化、观念化和哲学化的性质。[3]

四、 图像的胜利,谁的胜利?

在本文的最后,我想问的一个问题是:图像的胜利,谁的胜利?

阿莱斯・艾尔雅维茨在前文提到的“图像转向”的演讲中说:“图像转向的观念应该放在这种资本主义体制之中进行讨论。但是,即使这样,图像转向也与1960年代产生的消费文化有着内在的关联,在当时,消费文化主要是美国的一种文化现象。”阿莱斯・艾尔雅维茨的说法启示我们,图像(即消费文化中的图像)的胜利,说白了就是美国文化的胜利,从全球化的角度看则是以美国为代表的资本主义的胜利。

而从当代艺术的“图像转向”看,波普艺术的出现也是与二战后美国的大众文化、消费文化开始影响全球同步的。最早发生在英国的波普艺术,正是在美国的大众文化和消费文化的刺激下产生的,也许是由于这一点,艺术史家更愿意把波普艺术看成是典型的美国艺术。就此而言,当代艺术中的图像化倾向,或者说图像的胜利,也无疑属于美国。这与艺术史家认为二战后艺术中心从巴黎转到了纽约的看法相一致。

在中国当代艺术中,图像化的倾向已经愈演愈烈,面对这一现实,我以为图像的胜利属于谁,仍然是我们在自身的历史情境中,必须追问的一个问题。

注释:

[1] (美)W.J.T>米歇尔著:《图像理论》中文版,北京大学出版社2006年9月第1版,第3至4页。

图像法论文篇4

在服饰史的研究中,常用资料可分为三种,包括文献资料、图像资料和实物资料。在文献资料和实物资料丰富的情况下,这两类资料可以为服饰研究提供佐证。而图像资料,对于服饰史研究也具有重要的作用。本文以文艺复兴时期婚礼服饰研究为例,讨论图像在服饰研究中的应用。

由于文艺复兴时期的服饰实物留存非常少。将图像资料作为主要资料非常有必要。艺术图像中包含着丰富的信息。比如,通过图像的观察,我们可以发现,在婚礼前后或者当天新郎新娘如何穿着,服装的面料是怎么样,色彩构成如何;新娘的嫁妆中包含的各种精美奢侈的服装,是不是新娘婚礼的服饰,是怎么样被艺术家表现或者创作的等等。

1、图像的研究理论――以图证史

图像资料对于历史研究非常重要。在西方,将图像作为视觉材料进行阅读是艺术史特有的理论传统。有学者认为,图像学是研究文艺复兴的图像资料最合适的理论。潘诺夫斯基在《视觉艺术的意义》一书中指出,对艺术作品的研究可以分为三个层次:前图像志,即对图像进行单纯的形式分析;图像志分析,即对于特定主题的传统意义进行分析;图像学分析,即根据对于特定题材和概念的研究发现图像的内在含义。图像学的研究方法,打破了对于图像研究限于形式和风格的障碍,能够还原视觉艺术与文化的真正意义。

尝试将图像学运用到服饰史研究中,不仅能够使图像研究有据可依,而且,在分析图像中服饰的过程中,可以先从形式分析人手,再发现服饰图像特定题材的共性,然后对当时服饰的深层次含义进行解读。

2、图像为主要研究资料优缺点及研究方法

以图像为主要研究资料,最大的优点就是直观。通过观察比较,可以看出腰线的高低、服饰面料的厚薄、图案和纹样,也可以看出模特如何与服装互动的。图像资料也具有一定的迷惑性。不同时代的艺术品风格,是在社会大环境的影响下的形成、在时代的艺术环境下生长的。艺术家对于创作的看法,赞助人的意图也使图像资料更加复杂。《以图证史》指出,对于图像的史料考证,在任何时候都是必要的。曹意强《可见之不可见性》缪哲《以图证史的误区》也提到图像研究理论需要与其他的理论结合使用。在研究时,要灵活运用服饰史、艺术史的各种可能应用的理论。

为了有效的利用图像直观的特点,一定程度上排除其不确定,得到较为真实可信的结论,以图像为主的文艺复兴时期婚礼服饰的研究方法主要如下:

2.1挑选图像

首先,将收集的图像资料进行集中,对图像进行常规判断,如创作年代、题材和写实程度等。从中挑选真实程度较高的有代表性的图像作为研究重点。

2.2比较印证

将选出图像与同时代相关图像、文献和实物资料相印证,证明其可信程度。同时,将服装图案、面料、形制、结构、剪裁、配饰等蕴含在图像中的信息挖掘出来再与实物、文献等资料相互印证。

2.3视觉表现

将图像中的婚礼服饰以效果图的形式做以总结,得出文艺复兴图像研究中婚礼服的结论。

3、研究资料

不同图像有不同的研究和考证方法,不同图像的能够被利用的程度也不同。同样就以婚礼服饰研究为例,图像资料可以按照形式、功用、表现服饰的程度分类。

3.1按形式分类

按照形式分类,应用的图像材料可分为:壁画、油画、蛋彩画、版画、手稿等。

版画和手稿,如文艺复兴时期画切萨雷在《文艺复兴时期的服装》记录当时新娘服饰的印刷品,这类图像材料通常是由生活在当时代的人为了记录服装或者历史并流传下来的,具有较高的真实性。但由于材料是黑白印刷,当时的印刷技术又存在一定的局限性,这类图像对于研究细节和服饰的色彩有局限。

壁画油画和蛋彩画。这类图像材料通常是画家出于各种目的,表现宗教题材的或者世俗生活的绘画。其中婚嫁箱作为婚姻的必备品,绘制有许多与婚姻、道德有关的图像,是非常重要的研究资料。文艺复兴时期作为西方艺术的一个高峰,当时的绘画技巧与之前相比有了很大的的进步,所以此类图像资料具有较高的研究价值。

3.2按功用分类

根据题材和功用的不同,文艺复兴时期图像还可以分为,宗教与巫术、政治、私人领域和快乐的艺术四种。

宗教与巫术通常是根据圣经的内容和使徒的故事绘画的,具有教育和说教的作用,是中世纪和文艺复兴时期最多的图像;政治功用的图像是指为了表现教皇和大家族的政权成就、宣扬政治而绘制的一类图像;私人领域指描绘私人领域的图像,如结婚生育和死亡等。在15世纪以后,描绘肖像婚姻等世俗化图像数量逐渐增多;快乐的艺术是指出于个人喜好和欣赏而绘制的一类图像。这类图像常常会带有赞助人的偏好等干扰因素。

在用图像做服装史的研究时,这几类图像都具有一定的复杂性,比如绘画中是否存在程式化的表现方法,艺术家的动机是要真实的反应世界还是把可见的世界想象化。所以,在研究图像时,需要分析各种图像资料的可信度和真实性,并加以论证。

3.3按表现服饰程度分类

图像法论文篇5

0 引言

近年来,随着国民经济与科学技术的飞速的发展,在医学、工业、科研等领域对细微物体的精密测量技术提出了越来越高的要求。在众多的测量技术中,图像识别与处理技术具有检测速度快、精度高、重复性好,且检测具有非接触性等特点,已成为当前细微粒度测量研究的一个热点和发展趋势。然而,典型的图像识别与处理技术很难满足高精度的测量要求,因此,如何提高微小型物件的测量精度已成为该技术领域的主要研究方向之一。本文以提高微小型物件的测量精度为背景,研究摄像机标定的相关技术和方法,从中探究矫正图像畸变的优化方法,为精确建立起三维空间物体与二维图像间的对应关系提供可靠方案。

1 摄像机畸变原理

针孔成像模型是摄像机成像模型中最常用到的基本模型,但它每次只能通过一束光线,这导致实际应用中摄像机曝光不足图像生成缓慢,因此并不适用于实际的成像系统,于是,人们在针孔模型的基础上使用弯曲的透镜,使得大量光束收敛聚焦到投影点上,加快了图像的生成速度,但却引入了畸变。此外,在实际成像过程中,由于CCD等的加工装配误差,也会使投影点偏离投影几何中心形成畸变。

1.1 径向畸变

径向畸变是由于透镜的工艺缺陷造成的,它使得摄像机的透镜总是在成像仪的边缘产生显著的畸变,比如筒形畸变和枕形畸变,如图1所示:

(a)是筒形畸变,(b)是枕形畸变,光线在偏离透镜中心时会比靠近中心的地方畸变更加明显。对于径向畸变来说,成像仪的中心(光心)畸变可以视为0,因此,它们是相对光心对称的。以r=0展开泰勒级数,可以表示为如下形式:

3 结果分析

本文在摄像机标定技术的基础上,使用经过参数优化的摄像机模型对测试图片进行畸变矫正,由于本文使用高清摄像机,因此图像畸变现象并不明显,为便于观察实验效果,本文利用图片处理工具对其中一幅图像进行畸变加强,然后用本文阐述的方法对已经严重畸变的图像进行畸变校正,最终得到的效果如图2所示:

图2(a)为矫正前的畸变图像,图2(b)为经过畸变矫正后的新图像,从图中可以观察到本文使用的畸变矫正方法矫正效果显著,且二元全区间插值平滑,图像灰度没有发生明显跳变现象。

为减少冗余数据量,本文选择观察图像中角点的位置迁移情况,但由于图像中的角点数为144个,因此本文只截取少量数据列于表1。

表1比较了原始图像、畸变图像及其对应矫正图像的角点位置情况,从表中数据可以看出,即使图像发生了严重畸变,但经过本文矫正方法矫正后,依然可以恢复到几乎未发生畸变的情况。此外,通过与原始图像对比,可以推测,若摄像机理论成像模型与真实成像模型间的误差越小,畸变矫正的效果会越好。为验证该结论,本文将原始图片分别置于OpenCV计算得到的理论模型以及经过遗传算法优化后的理论模型中矫正畸变,然后计算矫正图像中每个角点的投影误差,误差结果如图3所示:

根据图3结果可以得出两个结论:第一,图中角点位置越接近光心,畸变值越小,几乎为0;越靠近边缘,畸变越明显,甚至可达光心点处畸变值的50倍以上,符合畸变映射原理。第二,经过遗传算法参数优化,所有角点的投影误差都在1个像素以下,而未经过优化处理的图像,误差接近10个像素,这不仅说明了遗传算法能有效提高摄像机的标定精度,而且也验证了畸变矫正的准确度与成像模型真实度之间成正比关系。

4 结论

本文研究了摄像机几种主要畸变的成因,并对畸变矫正算法做出了改进,引入了二元全区间插值法,该方法不仅解决了畸变矫正后的点不能落在实际图像像素点上的问题,还使插入的值更加平滑、连续,为后续颗粒测量工作提供了更精准的理论数据。

【参考文献】

[1]胡占义,吴福朝.基于主动视觉摄像机标定方法[J].计算机学报,2012,25(11): 1149-1156.

[2]陈天飞,马孜,吴翔.基于主动视觉标定线结构光传感器中的光平面[J].光学精密工程,2012,20(2):256-263.

[3]孟晓桥,胡占义.摄像机自标定方法的研究与进展[J].自动化学报,2012,4(1): 110-124.

[4]A.Y. I. Abdel-Aziz, H. M. Karara. Direct Linear Transformation into Object Space Coordinates in Close-Range Photogrammetry[C]. The Symposium on Close-Range Photogrammetry, Urbana, Illinois, USA,1971:1-18.

图像法论文篇6

中图分类号:TP399 文献标志码:A 文章编号:1006-8228(2014)10-76-02

Discussion and practice on "image processing technology"

Zhang Yongmei, Ma Li, He Li

(School of Information Engineering, North China University of Technology, Beijing 100144, China)

Abstract: The disadvantages, the characteristics and the content of the current teaching for "Image Processing Technology" are analyzed. Four teaching procedures including the selection of textbooks and expansion materials for initiative learning, application of modern teaching models and methods, strengthening teaching practice and reforming appraisal methods have been discussed and practiced. The result shows that it has obtained better teaching effects, improved the students' interest in learning and motivation to participate in scientific research, as well as the ability to solve practical problems.

Key words: teaching content; teaching method; assessment way; teaching practice

0 引言

图像信息是获取信息的重要来源,图像处理研究对于科学理论研究和工程应用有重要影响。研究图像处理和通信是导向智能计算机、智能机器人或多媒体通信系统的必由之路。现有的图像处理技术在很多方面给人们生活、学习、工作带来极大的便利,如:视频广播、遥感图像、医学图像(计算机X射线断层扫描技术CT,以及核磁共振成像MRI)等,计算机的发展使处理更复杂的图像成为可能。

图像处理是计算机应用领域中的一个重要方面,是模式识别、计算机视觉、图像通讯、多媒体技术等学科的基础,是一门涉及多领域的交叉学科。在图像处理技术课程的教学中,不但要让学生掌握其基本概念和原理,还要让不同层次的学生能够理解和掌握图像处理在其应用领域的最新发展,故传统的常规教学已经不能满足课程的发展要求。目前的教学不足之处主要体现在:传统的图像处理技术教学大多数偏重于理论,缺乏图像处理技术与实践相结合的环节。本文结合计算机学科的特点和多年的教学经验,对图像处理技术课程的教学模式与实践进行了探讨。

1 课程特点和教学内容分析

人类通过眼、耳、鼻、舌、身接受信息,感知世界。约有75%的信息是通过视觉系统获取的。图像处理是利用计算机处理所获取视觉信息的技术[1]。图像处理技术的理论基础涉及了众多学科,包括数学、物理、信号处理和计算机科学等多个学科的知识,其内容广泛,理论抽象,不易理解。图像处理技术还有很强的实用性,因此理论和实践的结合是本课程的关键,注重基础理论和技术的教学,以及加强学生实践能力和课题研究能力的培养是本课程的主要教学目的。

图像处理技术已经成为众多高校的一门重要课程,该课程主要介绍图像的数学描述、图像的数字化、图像变换、图像增强、图像恢复、图像编码、图像重建、图像分割与边缘提取、图像的分析和识别等基本的图像处理方法,使学生能熟练地掌握图像处理的基本过程,并能应用这些基本方法开发图像处理系统。通过这样的内容设置,使学生能够真正掌握图像处理技术的基本思想和技术,为深入学习打下坚实基础[2]。

2 教学环节的探讨和实践

2.1 教材的选用和自主学习扩充性资料的选用

图像处理技术发展日新月异,虽然该课程已经有很多可选教材,但大部分教材内容比较陈旧,许多新的算法,新的思想都没有提到,学生无法从这些教材中获取图像处理最新的技术和发展趋势,因此我们选择了章毓晋编著、清华大学出版社的《图像工程》系列教材。该教材全面介绍了图像工程的第一层次――图像处理,图像工程的第二层次――图像分析,图像工程的第三层次――图像理解的基本概念、基本原理、典型方法、实用技术以及国际上相关研究的最新成果。同时我们要求学生将国外的经典图像处理的书籍作为参考书目,如:Rafael C Gonzalez主编的《Digital Image Processing》,并建议学生关注图像处理的一些重要期刊和国际会议,如:IEEE Transactions on Medical Imaging、IEEE Transactions on Pattern Analysis and Machine Intelligence、IEEE International Conference on Image Processing、电子学报、CT理论与应用研究、模式识别与人工智能等。这样学生能熟悉一些专业术语,了解最新的前沿动态,并具备一定的英文文献阅读能力,为今后的科研和工作打下了坚实基础。

要求学生自主学习一些最新方法和技术,例如,深入分析中华人民共和国设计制造的玉兔号月球车的结构,给出玉兔号月球车如何通过全景相机、测月雷达、粒子激发X射线谱仪、红外光谱仪等仪器,对月表进行三维光学成像、红外光谱分析,开展月壤厚度和结构科学探测,对月表物质主要元素进行现场分析等探测的原理和方法。又例如,探讨将遥感图像应用于5.12汶川大地震的方法,2008年5月14日上午,中国科学院的两架高性能遥感飞机飞赴汶川,对地震灾区开展遥感监测和灾情评估工作,这两架飞机可分别提供高分辨率光学和雷达图像,具有全天候快速获取大面积灾情数据的能力,探讨如何根据汶川地震前、后图像,给出建筑物、河流、山体等关键区域的变化检测结果,为国务院和相关部门的抗震救灾工作提供咨询服务和决策依据。

2.2 采用现代化教学模式与方法

为了使复杂的算法和抽象的知识更加形象化,便于学生理解和提高学习兴趣,我们充分运用现代电子技术、工具和方法,采用多媒体形式进行课堂教学,利用VC、MATLAB编写一些典型的图像处理程序,并在课堂上演示这些程序,增加了课堂的信息量,提高了学生的学习兴趣,激发了学生自主学习,同时也为实验环节的开展奠定了一定的编程基础[3]。

此外,我们深入分析MOOCs、SPOCs以及“翻转课堂”教学模式等国际流行教育新概念,尝试开展图像处理技术的MOOCs,包括从课堂教学、学生学习进程、学生的学习体验、师生互动过程等教与学过程的完整系统在线实现。MOOCs是一个改变学习方式的时代产物,受到全球各地的重视。国内教育部三个教指委(计算机类专业、软件工程专业、计算机课程)2013年底专门召开会议研讨MOOCs。我们建立了校内MOOCs平台并对学生开放,将其作为课堂外学习的有效补充,这样可以方便学生随时随地学习,或者进行预习和复习。我们尝试了结合图像处理技术的MOOCs,探索创新教学模式与方法,稳步提高教学质量。

2.3 加强实践教学

图像处理技术可以广泛应用于数字电视、视频通话、宇宙探测、自然灾害预测、环境污染的监测、气象云图等应用领域,而教材一般只涉及到理论知识和算法,或者是对应用的简单介绍,对其设计实现介绍得很少,所以必须加强实践教学,将理论与实践结合起来,使理论指导实践,实践加强理论[4-5]。要求学生利用VC或者MATLAB进行实际程序设计,培养学生分析问题、解决问题的能力,具备图像处理系统的开发能力。

根据课程的教学要求设置了四个课外实验。①图像变换实验。要求对输入的图像,分别采用傅里叶变换、离散余弦变换、小波变换进行图像变换,分别给出变换前后的图像,并分析图像变换前后的视觉效果。②图像增强实验。将给定的图像进行增强处理,要求至少使用线性变换增强、对数变换增强、指数变换增强以及伪彩色增强处理,分析增强后的视觉效果。③图像编码实验。将给定的图像进行压缩处理,要求采用 Huffman编码方法,并计算压缩比。分析图像压缩后的视觉效果,并对图像压缩效果进行客观评价。④图像分割与边缘提取实验。分别利用边缘检测法、阈值分割法进行图像分割;分析图像分割后的视觉效果。学生完成所有实验后,我们安排了实验指导课,解决学生在实验中遇到的问题,进一步提高学生的算法设计能力和编程能力。

在课程教学中,我们还安排了三次专题讨论课,由教师指定具体题目,学生通过查阅相关文献,深入分析基本原理和方法,设计相应的算法,编程实现,并给出实验结果及分析,充分调动学生学习的积极性,提高学生利用理论知识解决实际问题的能力。三次专题讨论课分别是:

⑴ 数字图像表示及其处理专题讨论课。题目为:用VC或者Matlab实现常见图像文件格式的显示;常见的图像文件格式,以及用VC或者Matlab实现图像格式转换;给出国内外先进的图像处理系统软、硬件,名称、作用,以及先进性的体现。

⑵ 图像变换专题讨论课。题目为:给出小波变换常用的小波基的基本原理、具体应用,以及用VC或者Matlab的具体实现;给出小波变换、脊波变换、子波变换的基本原理、具体应用,用VC或者Matlab的具体实现;给出小波变换以及小波变换在图像处理中的具体应用,以及用VC或者Matlab的具体实现;给出快速傅里叶变换算法的具体内容,以及时间复杂度或者运行时间的分析。

⑶ 图像编码专题讨论课。题目为:给出小波变换图像编码的基本思想与特点,编码中需要解决的问题,实验结果及分析;给出基于感兴趣区域的小波图像编码方法的基本思想,具体步骤,实验结果及分析;给出几种图像编码质量评价方法,具体实现,实验结果及分析;给出基于子波变换的图像编码基本思想与特点,具体步骤,实验结果及分析。

此外,鼓励学生积极参与本校教师主持的科研项目,如国家自然科学基金、863项目、科技支撑计划,以及北京市自然科学基金等项目。这些项目涉及到视音频检索、视音频理解、视音频处理、网络信息分析、文字处理、信息检索、网络行为分析、图像识别等研究方向。通过参与项目,系统地锻炼了学生的科研能力和思维创新能力,也为今后的科研工作打下了坚实基础。

2.4 改革考核评价方式

考核是对学生学习成果的检验,考核目标不仅要检验学生对课堂教学内容的掌握程度,而且要对提高学生发现问题、思考问题、解决问题的能力起到作用。为了避免出现平时不努力,考前突击的情况,我们对传统的考核方式进行了改革。本课程的考核由两部分组成:平时成绩(占30%)和期末考试成绩(70%)。将平时的上课出勤、作业、实验和专题讨论成绩列入平时成绩。在整个教学过程中,严格要求学生,使学生重视教学的各个环节。

3 结束语

随着信息技术的不断发展和完善,图像处理技术也越来越多地运用在各个领域,因此图像处理技术的课程教学也应该不断发展。本文对图像处理技术课程的教学内容、教材选择、教学方法和考核方式进行了探讨,提高了学生学习的兴趣和参与科研的积极性,以及解决实际问题的能力,为学生学习图像处理新方法奠定了理论基础,为他们进一步开展相关方向的研究和应用打下了良好基础。今后将进一步研究图像处理技术的教学方法,并将理论与实践紧密联系起来。

参考文献:

[1] 章毓晋.图像工程(上册):图像处理(第3版)[M].清华大学出版社,

2012.

[2] 黄朝兵,杨杰.图像处理课程教学体系的探索与实践[J].电气电子教

学学报,2012.34(2):17-19

[3] 李向群,王书文.《数字图像处理课程》的教学改革[J].微计算机信息,

2010.26(3):212-214

[4] 陈青.“数字图像处理”教学中思维能力培养的实践[J].上海理工大学

图像法论文篇7

    医学图像处理技术包括很多方面,如:图像恢复、图像重建、图像分割、图像提取、图象融合、图象配准、图像分析、图像识别等等。进行医学图像处理的最终目的是实际应用于医学辅助、工业区生产、科学研究等方面,所以其具有较广泛的应用价值和研究意义。医学图像处理的对象是各种不同模态的医学影像。在医学临床的使用中,医学影像主要有超声波(UI)、X-射线(X-CT)、核磁共振成像(MRI)、核医学成像(NMI)等。随着计算机技术的发展,医学影像技术已成为一门新兴交叉学科,目前是计算技术与医学结合技术中发展最快的领域之一。借助有力的医学图像处理技术手段,极大的改善了医学影像的质量和显示方法,其成果使临床医生能更直接、更清晰地观察人体内部组织及病变部位,确诊率也得到了提高。这不仅使医学临床诊断水平在现有的医疗设备的基础上得到极大地提高,并且能使医学研究与教学、医学培训、计算机辅助临床外科手术等实现数字化应用,从而为医学研究与发展提供坚实的基础,在医学应用中具有不可估量的实用价值。

    医学图像与普通图像相比,具有以下几方面的特点(1)医学图像具有灰度上的含糊性。表现为两方面:一方面是由于成像技术上的原因带来的噪声扰,往往使物体边缘的高频信号被模糊化;另一方面,由于人体组织的螺动等现象会造成图像在一定程度上产生模糊效应。(2)局部体效应。处于边界上的像素中,通常同时包含了边界和物质,使得难以精确地描述图像中物体的边缘、拐角及区域间的关系,加之假如出现病变组织,则其会侵袭周围正常组织,导致其边缘无法明确界定。

    1.2论文的研究目标及工作

    1.2.1论文主要涉及的三方面基础理论

    论文主要涉及马尔科夫随机场(MRF)理论、模糊集理论及Dempster-shafe证据理论三个方面的基础理论,下面分别作介绍:1)马尔科夫随机场(MRF)理论基于随机场的图像分割方法是一类考虑像素点间的空间关联性的统计学方法。其实质是从统计学的角度出发,将图像中各像素点的灰度值看作是具有一定概率分布的随机变量,从而对数字图像进行建模。Cristian Lorenz等人,在医学图像分割中提出了一种可应用于任意拓扑结构的新型统计模型。根据马尔科夫随机场图像模型,利用最大后验概率准则(MAP),提出一种迭代松弛算法。MRF模型能够区分不同纹理的分布,其特别适用于纹理图像的分割。但使用MRF模型进行分割的关键问题在于参数估计,所以分割的效果往往取决于对参数估计的准确度。为此通常在分割与参数估计间进行轮流迭代计算,例如:先初始化参数,在此基础上分割,再利用分割的结果对参数进行进一步的估计,然后再分割,如此直到满足收敛条件。然而此类方法只能利用单一的图像信息,不能综合利用多种图像信息。

    第二章马尔科夫随机场(MRF、理论及其应用

    马尔科夫随机场简称,是英文Morkov Random Fields的缩写。它包含了两层意思:一个是马尔科夫(Morkov)性质;一个是随机场性质。它是基于统计学的分割方法在医学图像分割的应用中,最为常用的一种方法。图像具有高度的空间信息相关性,而马尔科夫随机场(肿)恰好具有有效描述空间信息相关性的特点,加之其具有完善的数学理论和性质,所以广泛的被应用于图像的处理中,如:图像的恢复、纹理的提取、模板的匹配和图像的分割等。娜于图像的分割,对噪声有很好的抑制作用;同时是基于模型的方法,所以容易与其它方法结合是它的优点。在本文中主要用于脑部—图像的预处理及前期的分割。下面介绍马尔科夫随机场(MRF )的基本理论及其在本文中的应用。

    2.1马尔科夫随机场CMRF )基本理论

    2.1.1一维马尔科夫(MARKOV)随机过程

    过程(或系统)在Zg时刻(即? = /q)的状态己知,若过程在/Q后面的时刻,即的状态与过程在时刻之前(即

    2.2图像中马尔科夫随机场、MRF )模型的建立

    2.2.1邻域系统与势团(Cliques)

    由本文2.1.2小节中马尔科夫随机场(娜)的定义中,任何满足条件1)非负性的概率都由条件2)中的描述马尔科夫(MARKOV)性的条件概率所唯一确定。条件2)中的条件概率所描述的也称为随机场F (本文中也即数字图像)的局部特性。而条件2)中的条件概率的直接求得是很困难的,由概率论中条件概率的公式可知要求的尸C/i    需要知道即需要知道随机场的联合分布,而马尔科夫随机场)是用条件概率来定义的,不能很好反映的联合分布。也就意味着由马尔科夫随机场(MRF )的局部特性来定义整个场的全局特性是存在困难的。以上问题的解决要归功于Hammersley-Clifford定理,该定理给出了马尔科夫随机场随机场(MRF )与吉布斯随机场(GRF )的等价关系,从而可以用吉布斯(Gibbs)分布来求解中的概率分布问题。

    1.1论文研究的目的和意义………………1

    1.1.1医学图像处理的特点及重要性………………       1

    1.1.2医学图像分割中存在的问题、现状及发展………2

    1.1.3医学图像分割的方法………………

    1.2论文的研究目标及工作………………6

    1.3本文组织结构………………9

    第二章马尔科夫随机场(MRF、理论及其应用………………11

    2.1马尔科夫随机场、MRF )基本理论………………    11

    2.2图像中马尔科夫随机场QMRF )模型的建立………12

    2.3估计准则与优化算法………………16

图像法论文篇8

中图分类号:j0 文献标识码:a

2012年6月在南京举办了“图像与表演国际学术研讨会”。与会者就图像与表演之间的关系各自做了主题发言和探讨。这是一个基于艺术学理论的实践研究主题的学术会议,目的在于探讨不同艺术门类之间的关系,以及探讨不同门类艺术的共同规律,并以此寻求艺术的本质与艺术原理。当代各种媒体视屏的传播功能,使人们感到图与图像在传播中的“读图时代”是不可抗拒的。但是如何理解“读图时代”中“图”的概念和含义,是图还是图像,如何区别,一些学者试图把戏剧戏曲和影视中截取的“图”作为“图像”,并以此探讨“图像与表演”的课题。但问题也就随着学者们的探讨出现了。图与图像,我们究竟作何理解。它们仅是概念不同而内涵一样吗?显然,由于一些学者把图与图像混用,或看成没有区别的视觉文化,因而探讨结果依然是表演艺术范畴之内的问,题,并没有涉及到图像——造型艺术的问题。表演艺术与造型艺术之间的关系和规律没有得到有效的解决。因此,“图像与表演”或者说造型艺术(美术学),与表演艺术(戏剧戏曲影视学)的关系,需要依赖艺、术学理论的原理来思考图与图像的概念与内涵等问题,并以此解决好这两种艺术门类之间的学理关系。

一、图与图像

“读图时代”似乎成为我们这个时代的一个显著特征。实际上,“图”与“图像”是两个完全不同的概念,其内涵也不同。所谓读图时代的“图”并非都是图像,故此人们才感受到读图时代越来越简单与平面化。读图时代的“图”多是一种后文化时代的产物,其特征是简单、浮躁、肤浅、无深度、游戏性,最大限度的碎片化。“碎片化”是“图”的总体特征,我们也可以将“图”称为“图片”,但不可称为“图像”。图像,具有独立性、完整性、自足性和系统性的特征,它不是偶然的符号集合。图像的“孕育性”具有图像学和叙事学的意义,可阐释,可叙事,包含了某种意义(象征、隐喻等),是“图”与“像”的整合,具有独立意义的传播功能。中国传统文化中的治学方法是“左图右史”。即“置图于左,置书于右;索像于图,索理于书。”(郑樵《通志略·图谱略》)“图”指的是图形,“像”指的是图形中深藏的含义。《说文解字》云:“像,似也”。段玉裁注:“然韩非之前或只有象字,无像字。韩非以后小篆即作像。许断不以象释似,复以象释像矣。系辞日,爻也者,效此者也。象也者,像此者也。又日,象也者,像也。……盖象为古文,圣人以像释之。虽他本像亦作象。然郑康成、王辅嗣本非不可信也。凡形像、图像、想像字皆当从人,而学者多作象,象行而像废矣。”段注提到了“图像”,意在解释“像”的出处与来历,像与爻辞功能大体一致,故圣人以像释之。《易·系辞上》云:“仰以观于天文,俯以察于地理,是故知幽明之故。”《易·系辞下》又云:“仰则观象于天,俯则观法于地”。“观天文”实为观天象(像),与“索图于像”,说明了二者合二为一的“图像”,自有深妙的玄机。《易·系辞上》所指的“河出图,洛出书,圣人则之”的“图”,当为“图像”理解,很有玄机可阐释。当今“图像”与西说融合,基本上属于美术学(造型艺术)意义的范畴,有独立的自足的编码符号系统。即显示了母题、主题、意象、形象、结构以及相关联的系统,这与西方图像志与图像学有关分析和阐释的对象——图像的理论有关。因此,图像一系列的编码符号(图像逻辑)隐藏有深刻的含意,具有阐释学和叙事学的意义。不仅如此,作者(艺术家)赋予给图像的精神与情感是丰富的和完整的。当然,一些折射了历史、文化、民族、社会等价值的具有可阐释性、叙事性的摄影作品,也因此可作为图像来分析和

阐释。

图不具有上述所说的图像的编码符号与意义。图是时间过程中一瞬间截取的片段,是非独立性、非自足性和非系统性的时间碎片,不孕育整个时间过程,其精神和情感也是散碎的。因而,图不具有图像学的意义,也无叙述性。如一些出现在影视、戏剧戏曲或舞蹈表演中一个画面的截取图——剧照,不具有图像学的意义。也就是说,无法从图像志的辨析到图像学的阐释,没有叙事的性质。如同连环画中每一页都是图,不完整,没有独立性,不可阐释。概言之,图的碎片特性,缺乏图像逻辑的系统。正因为如此,连环画的图才配以文字,并且由众多的图构成一本可阐释的、可解读的具有完整性的连环画。连环画的每一页仅仅是孤立的图,而不是图像。影视、戏剧戏曲和舞蹈等中截取出来的图——剧照,仅仅是图而已,而不是图像。今日流行的动漫(学科上归属影视戏剧戏曲学)、网络上流传的照片,等等,皆为图,非图像。正是应为这些“图”充满了我们的视觉世界,我们才惊呼读“图”时代的来临。但仅仅是“图”的到来,而非真的“图像”的到来。因为我们的视觉文化大都是图,所以我们感到今天的“读图时代”越来越简单,越来越觉着肤浅。而真正的图像却受到图的冲击,使我们难以辨认,或根本没有认识到图像本身到底是什么。于是有的学者认为图像与表演无法辨分:图像就是表演,表演就是图像。这种认识是值得商榷的,主要问题在于把图与图像混同了。

图像包含了最基本的单位或元素——母题、主题、意象、结构以及与之相关联的符号等。人们通过对母题的分析与辨认,最后进行图像学对主题的阐释与研究,这是对图像的基本研究路径和研究手段。这就涉及到图像的符号以及编码问题。19世纪西方产生的图像学理论主要是对古希腊和中世纪宗教艺术的图像进行研究的一种方法,并由此使艺术史研究进入到人文主义的学科中。法国艺术学家埃米尔·马勒所著的《图像学:12世纪到18世纪的宗教艺术》便可使我们了解图像学研究的对象,并由此也了解西方“图像”一词所指的含义了。图像学成为艺术史学家对图像隐藏的某种文化、思想、宗教或历史最完美的解释。阐释和研究的这些图像本身有这样几种特征:其母题或主题隐含或象征了某种意义,显现了它的历史性、社会性、政治性、宗教性和叙事性的特征。西方最早被认可为图像的不是别的,正是那些被今天称为宗教的和古典的“艺术”。它们是由“艺术家”依据某种意图而创作的。某个艺术(图像)体现了某个“艺术家”思考和表达的意图,或者表现了他者(教会或赞助者)的意图。“在12和13世纪意大利和法国艺术中我们可以找到许许多多类似的例子,即,艺术家直接和精心地从古典的母题中借用了母题,却把异教的题材改变成基督教题材。”母题、主题、意象等,都是经过艺术家或赞助者的意图来编译符号构成了图像不可缺少的元素并由此产生了意义,从这个层面上说,图像还具有符号学的意义。结构是图像隐含的内容之一,是符号系统的编码程序。如何构图画面,如何取舍母题或意象,并从各种构成关系中产生某种特定的主题,这就是创作者所要思考的结构要素。西方中世纪的宗教图像,是创作者与赞助人(教会组织)共同完成的艺术(图像)形态。当代学者研究与阐释它们,提出了图像学的研究方法,同时还提出了一个肖像学(圣像学)的概念,“肖像学是艺术史中研究与艺术形式相对的艺术题材或含义的一个分支。”正是因为这些中世纪的艺术(图像)具有象征意义、为现代人难以知晓的隐喻,以及它们隐藏的事件和某种可叙事的关联情节,才被研究者称为图像。在西方,图像显然包含了中世纪的宗教绘画与雕刻,通过运用图像学方法研究,揭示这些图像在中世纪宗教文化系统中的现象和宗教文化的形成与变迁,以及图像所暗示出来的宗教思想与其它观念。图像学研究不仅仅是针对宗教艺术图像的研究,也包含对古希腊艺术(图像)的研究,其实际目的还是因为中世纪宗教艺术中,借用了古典艺术的母题,但因某种主题的需要而使母题发生了变异。图像学正是要阐释这种变异而叙事新主题的含义。因此,图像学研究和阐释的是,西方各个时期图像所显示的文化形成和变迁,以及这些图像隐藏的文化、社会、宗教、思想与政治的意义。西方现代图像学转向对所有图像领域的研究与阐释,因为图像中最要的是它包含了思想与观念,显示了图像中某种历史与观念。

不难理解,图像就是我们今天说的造

艺术,是空间艺术的概念,非时间艺术的概念,是艺术家的独立创作的作品(图像)。艺术家在创作作品(图像)时,都有自己的思路、观念和企图,这就是我们说的一整套艺术构思和技术,也可以说是“编码系统”,故此自成独立的系统。一些摄影作品,由于摄影师有意识地选取某些重大的事件进行抓拍,使其作品本身具有了叙事性因素,随着时间的推移成为将来历史中的某个重要事件,再经过一些艺术化形式的处理,如构图剪裁、光线等暗房技术的处理,使摄影作品成为可阐释和可叙述的图像。还有一些摄影作品,经过摄影者后期制作处理,即后期编码,使其成为图像。当代一些广告摄影作品,之所以也可以称为图像,是因为这些广告被摄影师按照商家和市场(客户)的消费观念的需求,以及时代文化时尚包括审美属性等,即我们通常说的“设计意图”,进行了“观念”的处理,做了后期编码制作,使其突出商业与市场价值的效应并体现了设计师的设计理念,体现了“我消费,故我在”的当代消费文化时代的观念,具有独立的意义。当然广告这类图像比起我们前面描述的图像来讲,因为广告图像注重的是商业价值和商业效应,它缺少叙事学的意义,即使阐释也是单向的,隐含的人文思想较少。总之,广告设计经过“编码系统”的处理,较多的是体现了某个阶段的时尚设计观念或创意理念,自身也构成了独立的、可解读的和阐释的价值体系。

质言之,图像应该具有这样几个术语来指向它的全部意义:形式、形象、母题、主题、意象与象征(寓言)。

图或图片,无上述我们说的这些基本元素。之所以说“读图时代”是肤浅的、无深度的,甚至是游戏性的,就在于“读图时代”的图没有独立性,没有编码的符号系统,缺乏隐含的历史性独特含义,没有叙事的结构。这就是造成我们今天焦虑读“图”时代肤浅的根本原因。尤其是今日的各种媒体在传播过程中的视觉文化现象,基本上是贴“图”视觉现象。因此,才被认为当今是“读图时代”。也有西方后现代文化理论家认为媒体与语言发生的词与物的关系,使当代的视觉文化现象具有“图像转向”的意义。但是,“不管图像转向什么,应该清楚的是,它不是回归到天真的模仿、拷贝或再现的对应理论,也不是更新的图像‘在场’的形而上学,它反倒是对图像的一种后语言学、后符号学的重新发现,将其看作是视觉、机器、制度、语言、身体和比喻之间复杂的互动。它认识到观看(看、凝视、观察实践、监督以及视觉快感)可能是与各种阅读形式(破译、解码、阐释等)同样深刻的一个问题,视觉经验或‘视觉读写’不能完全用文本的模式来解释。”这里我们看到了,即使西方后现代文化理论阐释图像并使图像转向成为后现代文化阐释,图像依然脱离不了上述的“术语”。不是任何“图”都是可以作为“图像”来认识的。

二、表演艺术中的碎片影像

表演是时空艺术,它包含了造型元素,又必须需要时间完成叙事。它包括了早期传统的舞蹈、戏剧戏曲和后来工业社会的电影电视。这些是不同历史阶段的表演艺术形式和现象,虽有差异,但其艺术的本质和规律是不变的。时间艺术是需要在一段时间内展现其叙事的结果,它不暗示某种未完结的内容或含义。因此,“时间”就是表演艺术的主要叙事方式。然而作为空间艺术的那些图像,它们的叙事是在阐释者的阐释中完成的,故此阐释(破译、解码等)是空间艺术的主要叙事方式。表演艺术的“时空”也是它的存在的方式;作为造型艺术的图像的“空间”是它存在的方式。艺术分类学依据艺术的存在方式分类,把艺术分为时间艺术与空间艺术,表演一类的同时具有时间与空间性质,故为时空艺术。也正应为如此,表演某些性质又复杂一些。在一般人的心理上,读图看似比较简捷和容易,一眼望去尽收眼底。现代人们的生活方式越来越紧张,时间越来越“少”,人们沟通的方式依赖电脑等多媒体视屏技术,视觉文化便在各种媒体上呈现。“读图时代”正是这种社会生活现状中产生的。“读图时代”的中的“图”的概念是混杂的,事实上是包含了“图”与“图像”。但是,表演艺术中截取下来的图(剧照或还不如剧照的图),以及动漫作品中截取下来的图,只能是图,或称为影像碎片,不能作为图像。这种影像碎片的图,貌似成为了空间艺术,其实不然。原因就在于它不可阐释,不可叙事。它阐释的符号是乱码,叙事的主要方式——时间没有了。也不是空间的艺术,因为它是

从时间艺术中抽离出来的瞬间碎片的影像,没有经过编码系统的过程,不具有自足性的独立特征。

在南京举行的“图像与表演”主题的国际学术会议,主办方是中国艺术学理论(原艺术学)学科的发源地、全国唯一的“艺术学理论”重点学科的东南大学艺术学院,也是全国首家艺术学理论的博士点授予权单位和全国首家艺术学理论博士后流动站单位。其举办“图像与表演”会议的宗旨与目的不言而喻,就在于探讨造型艺术(图像)与表演艺术(影视戏剧戏曲)之间的某些关系。这是一个基于艺术学理论实践层面研究课题的国际学术会议。一些研究者把注意力放在了表演艺术中的图与表演本身的研究视野中。他们几乎都把图与图像混淆了,以至于有的学者认为,当今的图像与表演无法分清。造成这种误读的根本原因,就是没有打通最关键的三个门类艺术——美术学、音乐学与舞蹈学,缺乏研究和架构艺术学理论的学术能力,错把“图”当作“图像”了。因而,所研究的图像与表演之间的学理问题,实际上依然是表演艺术自身的问题。即用戏剧戏曲影视中截取下来的图片,探讨戏剧戏曲和电影自身的问题,与造型艺术的图像没有关联。甚至一些与会者,还把一些采用社会学方法收集的一手资料图片,作为图像来理解。这些一手资料的图片对于帮助和了解研究者考察某个民族的传统文化习俗,具有资料性的考证意义和价值。但仅是图片资料,非图像资料。

艺术学理论学科的重要创始人张道一先生,很早就对从事艺术学理论研究者提出了要求,他指出研究者必须将美术、音乐与舞蹈这三门打通,这是从事艺术学理论研究者所必须具备的基本要求和学术能力。张道一先生在“艺术三要素”中,始终反复强调了研究者要打通艺术的“三大块”:美术、音乐与舞蹈,掌握它们、了解它们共同规律和基本原理。不仅如此,张道一先生还强调要抓住艺术的“三要素”:思维、载体、技巧,才能抓住艺术的真谛,“可以说思维、载体、技巧是创作艺术的三条腿,三足鼎立不但站得稳而且走得远。”张道一先生的“艺术三要素”分别从艺术创作与艺术理论两个方面探讨了艺术“三大块”与“三要素”的关系问题。目的就是阐明艺术学理论研究的基本原理和基本理论必须建立在打通美术、音乐与舞蹈三门学科基础上,建立在艺术实践中对艺术的思维、载体和技术的掌握的基础上。一个从没有从事过造型艺术创作的艺术学理论研究者,对图与图像的理解自然难度很大。他无法理解“图像”为什么是独立的系统,为什么“图”就不是独立的系统。艺术离不开思维,这是最基本的。造型艺术的图像首先是需要艺术家的思维,他要在作品中表达自己的思想、观点、看法和态度,使作品具有某种意义。载体是艺术呈现的物质形式,没有物质这个载体,艺术永远不能够实现物质化,艺术品无法产生,艺术家的思想、观念、看法和态度等,都只能装在他的头脑中,表达不出来。选择什么物质作为承载艺术的载体,是艺术的本体问题,物质关系到艺术的语言、表达和技术等艺术的本体问题。但是,有了思维和载体,不等于就有了艺术作品。艺术家如何表现他的思想和观念等,还必须依赖于艺术的技巧。如果一个造型艺术家(画家、雕塑家),没有掌握一定的艺术技巧,再好的思想或想法也是无法表现出来的,或者创作不出来好的艺术品。艺术技巧的好坏不但影响到艺术家思想观念的表达,也影响到艺术作品的品质和艺术价值。这三者是相互叠加与印证作品(图像)的自足系统的,使艺术作品(图像)产生了独立的、完整的图像学与叙事学的意义,具有文化与艺术的价值和意义。  表演艺术中截取某个瞬间的图,仅仅是整个时空艺术中的一个“碎片影像”。对这样的碎片影像作完整的描述,只能将无数碎片影像叠加起来还原到时间的方式逻辑系统中才能做到。这样做实际上依然还原为表演艺术的形态,或者就是连环画的形态。把电影转换为“连环画”的这种形态,是上世纪70年代我国很流行的一种阅读方式,用碎片影像组成一组一组的画面,图片的下面配上一段文字说明,这就是“电影连环画”。我把这种阅读形式称为看“静态电影”。这就说明了“图”不是“图像”。我们不能把影视戏剧戏曲中截取的影像——图,这些乱码碎片,当作图像并试图进行阐释。企图对碎片影像这样的图作图像学的阐释和叙事学的文本诠释,其结果都是无法进行的。即便试图对这些影像图进行阐释与诠释,阐释或诠释者也是依据已知的表演

艺术的过程与结果作某种诠释性的“复制”工作。即使像米歇尔这样的后现代文化理论者,在其《图像理论》中也说,“不管图像转向什么,应该清楚的是,它不是回归到天真的模仿、拷贝或再现的对应理论”。图的不可阐释性和不可叙事性,使其图本身不具有深刻性,不具有孕育事件前后的延续性,图的乱码和碎片性决定它自身的肤浅,无深度、戏谑性以及无风格等特征。也许正是因为图的这些特征,恰恰碰巧对应了后现代主义的文化理论,人们才开始意识到“读图时代”的“图”之浅薄。

图像法论文篇9

 

1.前言

图像压缩是数字图像压缩的简称,图像压缩又称为图像压缩编码或图像编码。在数字图像的存储、处理和传送过程中,采用高效的图像压缩技术可以节省传输资源、降低传输时间、提高传输效率。科技论文。图像压缩要解决的问题是尽量减少表示数字图像时需要的数据量[1]。科技论文。论文参考。

目前应用较为广泛的图像压缩方法有统计编码、预测编码、变换编码、分形图像压缩编码、利用神经网络的图像编码等。近年来,奇异值分解方法在图像压缩编码上的应用得到了重视[2-3]。本文在介绍奇异值分解原理的基础上,以512×512的Lena图像为例,给出了算法的Matlab程序,并对算法进行了评价。

2.奇异值分解的图像压缩原理

矩阵A的奇异值定义如下[4]:设(r>0),且AHA的特征值为

(1)

则称(i=1,2,…,n)为A的奇异值。

设Σ=diag(σ1,σ2,…,σr),由式(1)可知,σi(i=1,2,…,r)为A的非零奇异值。科技论文。U为m阶酉矩阵,V为n阶酉矩阵,若满足

(2)

则称式(2)为A的奇异值分解[4]。若U写成U =[u1,u2,…,um]的形式,V写成V=[v1,v2,…,vn]的形式,则式(2)可写成如下形式:

(3)

由于大的奇异值对图像的贡献大,小的奇异值对图像的贡献小,所以可以从r个奇异值生成矩阵中选取前k个(k<r)近似表示图像A,即取:

(4)

近似表示图像A。

存储图像A需要mn个数值,存储图像Ak需(m+n+1)k个数值,若取

(5)

则可达到压缩图像的目的,比率

(6)

称为压缩率。论文参考。论文参考。

3.奇异值分解图像压缩的Matlab实现

Lena的图像矩阵共有512个非零奇异值,其奇异值特征曲线如图1所示,随着i的增加,σi迅速减小。σ1=64519,当i≥36时,σi<1000。

图1 图像Lena的奇异值特征曲线(512×512)

采用奇异值分解对该图像进行压缩,Matlab代码如下:

infile='Lena.bmp';

outfile='Lena2.bmp';

k=40;

A=imread(infile);

A=double(A);

[u,s,v] = svds(A,k);

im = uint8(u * s* v');

imwrite(im,outfile);

figure;imshow(im);

原始图像的文件名为Lena.bmp,将压缩后的图像命名为Lena2.bmp,程序的第6行计算矩阵A的最大k个奇异值与相关的奇异向量,得到u=[u1,u2,…,uk],s=diag(σ1,σ2,…,σk),v=[v1,v2,…,vk]。在使用svds函数时,需要先将A的数据类型转换为double型(程序第5行),这里k取40(程序第3行)。程序第7行对应公式(4),变量im存放压缩后的图像A40,程序第8行将A40保存为文件Lena2.bmp.

4.结果与讨论

在公式(4)中,k的取值不同时,矩阵Ak表示的图像效果有所不同,如图2所示(a)为原始图像,(b)、(c)、(d)、(e)、(f)分别为A40、A80、A120、A160、A200所表示的图像。从图(2)可知,k的取值越大,压缩后的图像效果越好,但同时压缩率越小。对图像Lena而言,k取80时,压缩后的图像A80已非常接近原图像。

(a)(b)(c)

(d)(e)(f)

图2 k取值不同时图像Lena基于奇异值分解压缩的效果

不同的k值下,Lena图像的压缩率和峰值信噪比(dB)如表1所示:

表1 不同k值时Lena图像的压缩率和峰值信噪比(dB)

 

图像法论文篇10

 

1.前言

图像压缩是数字图像压缩的简称,图像压缩又称为图像压缩编码或图像编码。在数字图像的存储、处理和传送过程中,采用高效的图像压缩技术可以节省传输资源、降低传输时间、提高传输效率。科技论文。图像压缩要解决的问题是尽量减少表示数字图像时需要的数据量[1]。科技论文。论文参考。

目前应用较为广泛的图像压缩方法有统计编码、预测编码、变换编码、分形图像压缩编码、利用神经网络的图像编码等。近年来,奇异值分解方法在图像压缩编码上的应用得到了重视[2-3]。本文在介绍奇异值分解原理的基础上,以512×512的Lena图像为例,给出了算法的Matlab程序,并对算法进行了评价。

2.奇异值分解的图像压缩原理

矩阵A的奇异值定义如下[4]:设(r>0),且AHA的特征值为

(1)

则称(i=1,2,…,n)为A的奇异值。

设Σ=diag(σ1,σ2,…,σr),由式(1)可知,σi(i=1,2,…,r)为A的非零奇异值。科技论文。U为m阶酉矩阵,V为n阶酉矩阵,若满足

(2)

则称式(2)为A的奇异值分解[4]。若U写成U =[u1,u2,…,um]的形式,V写成V=[v1,v2,…,vn]的形式,则式(2)可写成如下形式:

(3)

由于大的奇异值对图像的贡献大,小的奇异值对图像的贡献小,所以可以从r个奇异值生成矩阵中选取前k个(k<r)近似表示图像A,即取:

(4)

近似表示图像A。

存储图像A需要mn个数值,存储图像Ak需(m+n+1)k个数值,若取

(5)

则可达到压缩图像的目的,比率

(6)

称为压缩率。论文参考。论文参考。

3.奇异值分解图像压缩的Matlab实现

Lena的图像矩阵共有512个非零奇异值,其奇异值特征曲线如图1所示,随着i的增加,σi迅速减小。σ1=64519,当i≥36时,σi<1000。

图1 图像Lena的奇异值特征曲线(512×512)

采用奇异值分解对该图像进行压缩,Matlab代码如下:

infile='Lena.bmp';

outfile='Lena2.bmp';

k=40;

A=imread(infile);

A=double(A);

[u,s,v] = svds(A,k);

im = uint8(u * s* v');

imwrite(im,outfile);

figure;imshow(im);

原始图像的文件名为Lena.bmp,将压缩后的图像命名为Lena2.bmp,程序的第6行计算矩阵A的最大k个奇异值与相关的奇异向量,得到u=[u1,u2,…,uk],s=diag(σ1,σ2,…,σk),v=[v1,v2,…,vk]。在使用svds函数时,需要先将A的数据类型转换为double型(程序第5行),这里k取40(程序第3行)。程序第7行对应公式(4),变量im存放压缩后的图像A40,程序第8行将A40保存为文件Lena2.bmp.

4.结果与讨论

在公式(4)中,k的取值不同时,矩阵Ak表示的图像效果有所不同,如图2所示(a)为原始图像,(b)、(c)、(d)、(e)、(f)分别为A40、A80、A120、A160、A200所表示的图像。从图(2)可知,k的取值越大,压缩后的图像效果越好,但同时压缩率越小。对图像Lena而言,k取80时,压缩后的图像A80已非常接近原图像。

(a)(b)(c)

(d)(e)(f)

图2 k取值不同时图像Lena基于奇异值分解压缩的效果

不同的k值下,Lena图像的压缩率和峰值信噪比(dB)如表1所示:

表1 不同k值时Lena图像的压缩率和峰值信噪比(dB)

 

图像法论文篇11

本文介绍讨论了几种目前广泛应用的图像边缘检测、图像阈值分割的各种算法,并给出了对比分析;对遗传算法的基本概念和研究进展进行了综述;给出了标准遗传算法的原理、过程、实验结果及分析. 实验结果表明,本文提出的遗传分割算法优于传统分割算法。

第一章 绪论 1.1  图像分割综述

图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。这里所说的特性可以是灰度、颜色、纹理等,而目标可以对应单个区域,也可以对应多个区域。图像分割是数字图像处理中的一项关键技术,它使得其后的图像分析,识别等高级处理阶段所要处理的数据量大大减少,同时又保留有关图像结构特征的信息。而且,在数字图像处理工程中,一方面,图像分割是目标表达的基础,对特征测量有重要的影响;另一方面,图像分割是自动目标识别的关键步骤,图像分割及其基于分割的目标表达、特征提取和参数测量等将原始图像转化为更抽象更紧凑的形式,分割中出现的误差会传播至高层次处理阶段,因此分割的精确程度是至关重要的。只有通过细致精细的图像分割,才能使得更高层的图像分析和理解成为可能。因此,图像分割是由图像处理进到图像分析的关键步骤,在图像工程中占据重要的位置。

1.2  图像分割的研究意义与发展现状

作为计算机视觉和图像处理中的难点和热点之一,图像分割的研究受到了研究工作者的高度重视,对图像分割进行了深入、广泛的研究。作为一种重要的图像技术,图像分割在不同领域中有时也用其它名称:如目标轮廓(object delineation)技术,阈值化(thresholding)技术,图像区分或求差(image discrimination)技术,目标检测(target detection)技术,目标识别(target recognition)技术,目标跟踪(target tracking)技术等,但这些技术本身或其核心实际上也就是图像分割技术。图像分割作为图像处理、分析的一项基本内容,其应用非常广泛,几乎出现在有关图像处理的所有领域,并涉及各种类型的图像。在工业自动化、在线产品检验、生产程控、文件图像处理、遥感图像、保安监视、以及军事、体育、农业等行业和工程中,图像分割都有着广泛的应用。例如:在遥感图像中,合成孔径雷达图像中目标的分割、遥感云图中不同云系和背景分布的分割等;在医学应用中,脑部 mr 图像分割成灰质(gm)、白质(wm)、脑脊髓(csf)等脑组织和其它脑组织区域(nb)等;在交通图像分析中,把车辆目标从背景中分割出来等;在面向对象的图像压缩和基于内容的图像检索中将图像分割成不同的对象区域等。在各种图像应用中,只要需对图像目标进行提取,测量等都离不开图像分割。

自 20 世纪 70 年代至今,已提出上千种各种类型的分割算法。如:门限法、匹配法、区域生长法、分裂-合并法、水线法、马尔可夫随机场模型法、多尺度法、小波分析法、数学形态学等。随着新理论、新技术的发展,一些新的图像分割方法也随之出现,但这些分割算法都是针对某一类型图像、某一具体的应用问题而提出的,并没有一种适合所有图像的通用分割算法。通用方法和策略仍面临着巨大的困难。另外,还没有制定出选择适用分割算法的标准,这给图像分割技术的应用带来许多实际问题。

1.3 本论文所作的工作

据此,在本论文中只对常用的、并在实践中行之有效的边缘检测方法和阈值分割方法进行深入的了解,并对阈值分割方法中的灰度直方图双峰法和基于遗传算法的最大类间方差法进行详细的讨论,同时用matlab对上述两种方法进行验证并给出结果。

1.4 本论文的论述内容

本文对图像分割的整个过程中的一些常用的,经实践检验行之有效的算法进行了讨论和 改进。全文共七章。第一章为绪论,主要介绍了现阶段图像分割技术的发展现状和研究意义。其他六章分别在以下几个方面介绍了本文所做的工作:

1.对本文所采用的试验测试工具matlab 进行简介。

2.简介数字图像的基础问题。概述了数字图像的基本概念和特点,简介了各种图像格式的特点和应用,为全文的讨论作一铺垫。

3.详细讨论了图像分割中的基于阈值的图像分割方法,给出了直方双峰法的算法和验证结果,并简要介绍了普通最大类间方差法的算法过程。

4.对遗传算法理论进行简介。详细讨论了遗传算法的定义和标准遗传算法的流程和要素。为应用此方法对最大阈值进行迭代寻优打下基础。

6.应用遗传算法改进了最大类间方差法。给出了整个遗传操作的使用函数与具体进程,并对实例图片进行处理,得到处理结果并得到迭代最优阈值m。

本文研究了图像分割的相关理论和常用技术,并对遗传算法进行了介绍,对遗传算法应用于图像分割进行了验证.

 

第二章  matlab简介 2.1  matlab的概况和产生背景 2.1.1   matlab的概况

matlab是矩阵实验室(matrix laboratory)之意。除具备卓越的数值计算能力外,它还提供了专业水平的符号计算,文字处理,可视化建模仿真和实时控制等功能。matlab的基本数据单位是矩阵,它的指令表达式与数学,工程中常用的形式十分相似,故用matlab来解算问题要比用c,fortran等语言完相同的事情简捷得多.

当前流行的matlab包括拥有数百个内部函数的主包和三十几种工具包(toolbox).工具包又可以分为功能性工具包和学科工具包.功能工具包用来扩充matlab的符号计算,可视化建模仿真,文字处理及实时控制等功能.学科工具包是专业性比较强的工具包,控制工具包,信号处理工具包,通信工具包等都属于此类.开放性使matlab广受用户欢迎.除内部函数外,所有matlab主包文件和各种工具包都是可读可修改的文件,用户通过对源程序的修改或加入自己编写程序构造新的专用工具包.

2.1.2   matlab产生的历史背景

在70年代中期,cleve moler博士和其同事在美国国家科学基金的资助下开发了调用eispack和linpack的fortran子程序库.eispack是特征值求解的foetran程序库,linpack是解线性方程的程序库.在当时,这两个程序库代表矩阵运算的最高水平.到70年代后期,身为美国new mexico大学计算机系系主任的cleve moler,在给学生讲授线性代数课程时,想教学生使用eispack和linpack程序库,但他发现学生用fortran编写接口程序很费时间,于是他开始自己动手,利用业余时间为学生编写eispack和linpack的接口程序.cleve moler给这个接口程序取名为matlab,该名为矩阵(matrix)和实验室(labotatory)两个英文单词的前三个字母的组合.在以后的数年里,matlab在多所大学里作为教学辅助软件使用,并作为面向大众的免费软件广为流传。1983年春天,cleve moler到standford大学讲学,matlab深深地吸引了工程师john little.john little敏锐地觉察到matlab在工程领域的广阔前景.同年,他和cleve moler,steve bangert一起,用c语言开发了第二代专业版.这一代的matlab语言同时具备了数值计算和数据图示化的功能.1984年,cleve moler和john little成立了math works公司,正式把matlab推向市场,并继续进行matlab的研究和开发.

在当今30多个数学类科技应用软件中,就软件数学处理的原始内核而言,可分为两大类.一类是数值计算型软件,如matlab,xmath,gauss等,这类软件长于数值计算,对处理大批数据效率高;另一类是数学分析型软件,mathematica,maple等,这类软件以符号计算见长,能给出解析解和任意精确解,其缺点是处理大量数据时效率较低.mathworks公司顺应多功能需求之潮流,在其卓越数值计算和图示能力的基础上,又率先在专业水平上开拓了其符号计算,文字处理,可视化建模和实时控制能力,开发了适合多学科,多部门要求的新一代科技应用软件matlab.经过多年的国际竞争,matlab以经占据了数值软件市场的主导地位.

在matlab进入市场前,国际上的许多软件包都是直接以fortranc语言等编程语言开发的。这种软件的缺点是使用面窄,接口简陋,程序结构不开放以及没有标准的基库,很难适应各学科的最新发展,因而很难推广。matlab的出现,为各国科学家开发学科软件提供了新的基础。在matlab问世不久的80年代中期,原先控制领域里的一些软件包纷纷被淘汰或在matlab上重建。

时至今日,经过mathworks公司的不断完善,matlab已经发展成为适合多学科,多种工作平台的功能强大大大型软件。在国外,matlab已经经受了多年考验。在欧美等高校,matlab已经成为线性代数,自动控制理论,数理统计,数字信号处理,时间序列分析,动态系统仿真等高级课程的基本教学工具;成为攻读学位的大学生,硕士生,博士生必须掌握的基本技能。在设计研究单位和工业部门,matlab被广泛用于科学研究和解决各种具体问题。在国内,特别是工程界,matlab一定会盛行起来。可以说,无论你从事工程方面的哪个学科,都能在matlab里找到合适的功能。

2.2 matlab的语言特点

一种语言之所以能如此迅速地普及,显示出如此旺盛的生命力,是由于它有着不同于其他语言的特点,正如同fortran和c等高级语言使人们摆脱了需要直接对计算机硬件资源进行操作一样,被称作为第四代计算机语言的matlab,利用其丰富的函数资源,使编程人员从繁琐的程序代码中解放出来。matlab最突出的特点就是简洁。matlab用更直观的,符合人们思维习惯的代码,代替了c和   fortran语言的冗长代码。matlab给用户带来的是最直观,最简洁的程序开发环境。以下简单介绍一下matlab的主要特点。

1. 语言简洁紧凑,使用方便灵活,库函数极其丰富。matlab程序书写形式自由,利用起丰富的库函数避开繁杂的子程序编程任务,压缩了一切不必要的编程工作。由于库函数都由本领域的专家编写,用户不必担心函数的可靠性。可以说,用matlab进行科技开发是站在专家的肩膀上。 更为难能可贵的是,matlab甚至具有一定的智能水平,所以用户根本不用怀疑matlab的准确性。

2. 运算符丰富。由于matlab是用c语言编写的,matlab提供了和c语言几乎一样多的运算符,灵活使用matlab的运算符将使程序变得极为简短。

3. matlab既具有结构化的控制语句(如for循环,while循环,break语句和if语句),又有面向对象编程的特性。

4. 程序限制不严格,程序设计自由度大。例如,在matlab里,用户无需对矩阵预定义就可使用。

5. 程序的可移植性很好,基本上不做修改就可以在各种型号的计算机和操作系统上运行。

6. matlab的图形功能强大。在fortran和c语言里,绘图都很不容易,但在matlab里,数据的可视化非常简单。matlab还具有较强的编辑图形界面的能力。

7. matlab的缺点是,它和其他高级程序相比,程序的执行速度较慢。由于matlab的程序不用编译等预处理,也不生成可执行文件,程序为解释执行,所以速度较慢。

8. 功能强大的工具箱是matlab的另一特色。matlab包含两个部分:核心部分和各种可选的工具箱。核心部分中有数百个核心内部函数。其工具箱又分为两类:功能性工具箱和学科性工具箱。功能性工具箱主要用来扩充其符号计算功能,图示建模仿真功能,文字处理功能以及与硬件实时交互功能。功能性工具箱用于多种学科。而学科性工具箱是专业性比较强的,如control,toolbox,signl proceessing toolbox,commumnication toolbox等。这些工具箱都是由该领域内学术水平很高的专家编写的,所以用户无需编写自己学科范围内的基础程序,而直接进行高,精,尖的研究。

9. 源程序的开放性。开放性也许是matlab最受人们欢迎的特点。除内部函数以外,所有matlab的核心文件和工具箱文件都是可读可改的源文件,用户可通过对源文件的修改以及加入自己的文件构成新的工具箱。

2.3 matlab 遗传算法工具箱简介

  鉴于matlab强大的扩展功能和影响力,各个领域的专家相继突出了许多基于matlab的专用工具箱。本文所采用的遗传算法工具箱,就是由英国谢菲尔德(sheffield)大学设计推出的。相对于其他版本的遗传算法工具箱,如:美国北卡莱罗纳州立大学推出的遗传算法优化工具箱gaot(genetic algorithm optimization toolbox),以及mathworks公司最新发布的一个专门设计的matlab遗传算法和直接搜索工具箱(genetic algorithm and direct search toolbox),本工具箱的出现最早,影响较大且功能较为完备。文中所采用的所有遗传操作函数大部分出自本工具箱。 第三章  数字图像基础简介

 图像处理的首要一步,就是要了解图像的基本性质与特点。只有充分了解和掌握了所要处理得图像的特点和性质,才能在接下来的处理中根据图像的特点获取所需的信息,并对其进行相应的处理。

本章将介绍数字图像的基础知识,以及图像在计算机处理中的信息表达形式,并对几种常用的图像文件格式bmp, jpeg以及png等做简要的介绍。

3.1  图像的基本概念及其特点

要对图像进行处理,必须清楚图像的概念。一般来说,二维或三维景物呈现在人眼中的样子就是图像。图像具有以下三个方面的特点:

①图像带有大量的信息,一幅图像顶得上千言万语;

②图像种类繁多,包括照片、绘图视频图像等;

③人类从外界获得的大部分信息来自视觉系统。

人们看到的任何自然界的图像都是连续的模拟图像。其形状和形态表现由图像各位置的颜色来决定。可以用f(x, y)表示一幅模拟图像,其中x, y表示空间坐标点的位置,f表示图像在点(x, y)的某种性质的数值,如亮度、颜色等,f、x、y可以是任意的实数。而把连续空间的图像在坐标空间(x, y)和性质空间f都离散化,以便于计算机进行加工处理的离散化的图像则称为数字图像。数字图像用i (r, c)来表示,其中:r=row为行,c = col为列,表示空间离散点的坐标,i表示离散化的图像f。i, r, c都是整数。实际中仍习惯用f (x, y)表示数字图像。图像存储画面的形式为栅格结构:即将图像划分为均匀分布的栅格(像素),显式的记录每一像素的亮度和颜色;而将像素的坐标值规则地隐含起来,其位置排列规则,通常为矩形排列。

3.2 图像的格式

组成数字图像的基本单位称为像素(pixel),把像素按不同的方式进行组织和存储,就得到不同的图像格式;把图像数据存为文件就得到图像文件。图像文件按其格式的不同一般具有不同的扩展名。常用的图像文件格式有位图文件、jpeg文件、gif文件、png文件等。每一种格式都有它的特点和用途,在选择输出的图像文件格式时,应考虑图像的应用目的以及图像文件格式对图像数据类型的要求。下面我们介绍几种常用的图像文件格式及其特点。

3.2.1 bmp图像格式

这是一种dos和windows兼容计算机系统的标准图像格式。bmp格式支持索引色、灰度等色彩模式。图像存储为bmp格式时,每一个像素所占的位数可以是1位、4位、8位或32位,相对应的颜色数也从黑白一直到真彩色。对于使用windows格式的4位和8位图像,可以指定采用rle压缩。bmp图像文件含文件头、调色板数据和图像数据三个层次。其中文件头由定义文件标识、大小即图像数据偏移量的bitmapf工leheader以及指定bmp图像自身的若干参数的bitmapinfoheader两部分组成。这种格式在pc机上应用非常普遍。

3.2.2 jpeg图像格式

jpeg是由联合照片专家组(jiontphotographic experts group)开发的一种图像文件格式。它采用有损压缩方式去除冗余的图像和彩色数据,在获取极高的压缩率的同时也能展现十分丰富生动的图像。也就是说,可以用较少的磁盘空间得到较好的图像质。另外,jpeg还是一种比较灵活的格式,当将图像保存为jpeg格式时,允许用户用不同的压缩比例对文件进行压缩,就是可以指定图像的品质和压缩级别。

3.2.3 tiff图像格式

tiff文件主要由三部份组成,包括文件头、标识信息区和图像数据区。t工ff文件的图像数据区以行扫描的方式存取图像,存储图像前先将图像分割成若干部分,压缩后再存储。存储时,单色图像一个字节存储8个点,16色图像一个字节2个点,而256色图像就是一个字节存储一个点。tiff图像格式是一种应用非常广泛的位图图像格式,几乎被所有绘画、图像编辑和页面排版应用程序所支持。tiff格式常常用于在应用程序之间和计算机平台之间交换文件。

3.2.4 gif图像格式

cif是graphics interchange format(图形交换格式)的缩写,是由computerserve公司推出的一种图像格式。该种图像格式的特点是压缩比高,可以极大地节省存储空间。最初的gif只是简单的用来存储单幅静止图像,后来可以同时存储若干幅静止图像从而形成连续的动画;同时,gif格式支持透明背景,可以较好地与网页背景融合在一起。因此,gif常常用于保存作为网页数据进行传输的图像文件,成为网络和bbs上使用频率较高的一种图像文件格式。但是gif最多只能处理256种色彩,不能用于存储真彩色的图像文件。

3.2.5 png图像格式

这种格式称为可移植网络图像文件格式(portable network graphics),由thomas boutell, tom lan。等人提出并设计。其特点是:①支持48位真彩色图像、16位灰度图像和颜色索引数据图像;②主要面向网络图像传输和图像编辑,其提供的二维交叉存储机制使用户在图像网络传输过程中能更快的观察到接近真实的近似图像;③对用户完全透明且无专利限制,用户可以从internet上随时下载与png文件格式配套的图像数据压缩算法源程序代码:④ 具有比gif高5-20%的压缩效率;⑤ 具有可扩展性。

作为目前最不失真的图像格式, png格式图像吸取了gif和jpeg二者的优点。它可以把文件压缩到极限以利于网络传输,但由于采用无损压缩方式来减少文件大小,png格式能保留所有与图像品质有关的信息。同时,png支持图像背景透明,显示速度快。

本文的所有图像的处理都是对由jpg格式图像通过图像格式转化得来的bmp格式的索引色图像进行的,其具体转换程序参见附录[一]。

第四章  图像分割 4.1 图像分割算法的定义与分类

在图像的研究和应用中,人们往往只对一幅图像中的某些部分感兴趣,这些感兴趣的部分一般对应图像中特定的、具有特殊性质的区域(可以对应单个区域,也可以对应多个区域),称之为目标或前景;而其它部分称为图像的背景。为了辨识和分析目标,需要把目标从一幅图像中孤立出来,这就是图像分割要研究的问题。所谓图像分割,从广义上来讲,是根据图像的某些特征或特征集合(包括灰度、颜色、纹理等)的相似性准则对图像象素进行分组聚类,把图像平面划分成若干个具有某些一致性的不重叠区域。这使得同一区域中的象素特征是类似的,即具有一致性;而不同区域间象素的特征存在突变,即具有非一致性。从集合的角度出发,图像分割定义如下:

设整个图像空间为一集合r 。根据选定的一致性准则p ,r 被划分为互不重叠的非空子集(或子区域):{r1, r2,l, rn},这些子集必须满足下述条件:

(1) r = 

(2) 对于所有的i和j ,当i ≠ j,  =空集

(3) p(ri) = true ,对所有的i

(4) 所有i ≠ j;ri ,rj相邻,p(ri u rj) = false

(5) 对i =1,2,l,n, ri是连通区域

其中:p(ri)为作用于ri 中所有象素的形似性逻辑谓词,i, j =1,2,l,…n。上述条件

(1)指出分割后的全部子区域的总和应包含图像中的所有元素,或者说分割应将图像中每个象素都分进一个子区域中。

(2)指出各个子区域相互不重叠。

(3)指出分割后得到的属于同一区域中的元素应该具有某种相同特性。

(4)指出对于分割后得到的属于相邻两个区域中的元素具有某种不同的特性。(5)要求同一个子区域内的元素应当是连通的。

其中分割准则p 适用于所有象素,由它来确定各区域元素的相同特性。上述数学条件说明了图像分割算法的一些特点,凡不符合以上特点的图像处理算法则不能称为图像分割算法。

目前,在己提出的多种类型的分割算法中,大致可以分为基于边缘检测的方法和基于区域的方法。而在实际应用中,这些方法主要又可划分为三种类型: 边缘检测型、阈值型和区域跟踪型。本文的讨论正是基于阈值型图像分割方法展开的。

4.2 基于阈值的分割 4.2.1方法定义与特点

基于阈值的分割方法是一种应用十分广泛的图像分割技术。所谓阈值分割方法的实质是利用图像的灰度直方图信息得到用于分割的阈值。它是用一个或几个阈值将图像的灰度级分为几个部分,认为属于同一个部分的象素是同一个物体。它不仅可以极大的压缩数据量,而且也大大简化了图像信息的分析和处理步骤。因此,在很多情况下,是进行图像分析、特征提取与模式识别之前必要的图像预处理过程。它特别适用于目标和背景占据不同灰度级范围的图像。阈值分割方法的最大特点是计算简单,运算效率高,在重视运算效率的应用场合,它得到了广泛的应用。

4.2.2阈值的分割的描述

设(x,y)是二维数字图像的平面坐标,图像灰度级的取值范围是g= {0,  1,  2,…l-1 }(习惯上0代表最暗的像素点,l-1代表最亮的像素点),位于坐标点(x, y)上的像素点的灰度级表示为f (x,  y)。设t∈g为分割阈值,b= {b0, b 1}代表一个二值灰度级,并且b0, b1∈b。于是图像函数f 1(x,y)在阈值t上的分割结果可以表示为:

阈值分割法实际就是按某个准则函数求最优阈值t的过程。域值一般可写成如下的形式:

t=t[x,y,  f (x,y),p (x,y)]                    

其中f (x,  y)是在像素点(x, y)处的灰度值,p(x,y)是该点邻域的某种局部性质。4.3.3阈值分割方法的分类

通过上文的讨论,结合所给公式,可以将阈值分割方法分为以下3类:

1)      全局阈值:t=t[p(x,y)〕,即仅根据f(x,y)来选取阈值,阈值仅与各个图像像素的本身性质有关。

2)      局部阈值:t=t[f(x,y),p(x,y)],阈值与图像像素的本身性质和局部区域性质相关。

3)      动态阈值:t=t[x,y,f(x,y),p(x,y)],阈值与像素坐标,图像像素的本身性质和局部区域性质相关。

   全局阈值对整幅图像仅设置一个分割阈值,通常在图像不太复杂、灰度分布较集中的情况下采用;局部阈值则将图像划分为若干个子图像,并对每个子图像设定局部阈值;动态阈值是根据空间信息和灰度信息确定。局部阈值分割法虽然能改善分割效果,但存在几个缺点:

1)      每幅子图像的尺寸不能太小,否则统计出的结果无意义。

图像法论文篇12

【关键词】压缩感知 重构算法 图像去噪 稀疏表示

1 图像去噪介绍

1.1 图像去噪意义

图像去噪结合了信号处理、传感器、人工智能和计算机等现代高科技技术,其原理是:将获得和输入过程中受到各种噪声污染的图像,利用有关计算机的一定算法去除噪声并且尽可能多的保留原始图像主要特征,更重要的是保护边缘和细节信息,输出一幅更适合于人眼观察或计算机能够进一步研究的去噪图像。去噪后的图像可信度更高,图像更清晰,更适合人眼检测和计算机识别,分析。目前图像去噪技术在遥感图像、自动识别、医学图像处理、计算机视觉等更多领域发挥着重要作用。

1.2 图像去噪的研究现状

近年来,国内外对图像去噪的研究算法有很多种,现在主要的方法是稀疏分解去噪方法,稀疏分解去噪原理是把带噪信号在过完备原子库上进行稀疏表示,仅用若干个较大的表示系数重构原信号,而屏蔽了部分小系数包含的噪声成分,从而实现信号的去噪。稀疏分解使信号更加简洁、自适应的表示成若干基的线性组合,更加全面详细地表示信号涵盖的某些特征,更加有效地将信号和噪声分离开来。基于稀疏表示的图像去噪方法是根据所研究对象是否为图像的稀疏成分把图像中的有用信息和噪声进行区分。图像中的有用信息一般具有一定结构,稀疏表示过程中选取的原子能够表示这些特定结构;然而图像中的噪声是随机的,且没有结构的,因此无法用字典中的原子表示。这样就可以将图像与噪声相区别,以达到去除噪声的目的。

2 压缩感知的理论

压缩感知(CS)是一种利用信号的可压缩性或者稀疏性对信号进行重构的技术。压缩感知的优势是降低了采样率,直接获得稀疏的信号表示,大大缩减了数据信息的获取时间和存储空间。图1给出了压缩感知的理论过程。

压缩感知包括三个方面:

2.1 信号的稀疏表示

文献[10]给出了稀疏表示的数学定义:信号X在正交基Ψ下的变换系数向量为=ΨTX,假如对于0

如何找到信号最合适的稀疏系数向量?这是压缩感知理论的基本和前提,只有找到最佳的基表示,才能确保信号的稀疏度,从而确保信号的恢复精度。而信号的稀疏化是由稀疏系数 的衰减速度决定的,衰减的越快表示信号的稀疏性越好,其满足以下式子:

其中r=1/p 1/2,0

除了标准正交基之外,冗余字典法是现在研究的另外一个热点。它是由一组正交基构成的超完备的冗余字典,该方法能够稀疏的表示信号。如何构造一组最佳的某类信号的正交基,以求得信号的最稀疏表示,有利于进一步研究。

2.2 观测矩阵的设计

设计观测矩阵在压缩感知理论中起着至关重要的作用,如何设计测量矩阵是压缩感知中的一个难点。

信号的稀疏化是由稀疏系数t决定的。所以,选取一个大小为M×N(M

y= Φx (2.1)

而 ,则得

y= Φx=Φψt=t (2.2)

其中Φ为测量矩阵,大小为M×N。=Φψ为M×N的矩阵,叫作投影矩阵,y被叫做t在投影矩阵下的测量值,大小为M×1,则压缩感知的测量过程如图2所示。

目前,如何设计观测矩阵是压缩感知理论的一个重要方面。在该理论中,对观测矩阵的束缚是比较松弛的,Donoho给出了构成观测矩阵的三个条件,并指出大多数一致分布的随机矩阵都具有这三个条件,都可作为观测矩阵,如:部分Fourier集、部分Hadamard集、一致分布的随机投影(uniform Random Projection)集等,这与RIP性质进行研究得出的结论相一致.但是,使用上述各种观测矩阵进行观测后,都仅仅能保证以高概率去恢复信号,而不能完全地精确的重构信号。对于任何一个稳定的重构算法是否存在一个真正的确定性的观测矩阵仍是一个有待探讨的问题。

2.3 信号重构

对于压缩感知理论的信号重构问题,首先定义向量X={x1,x2,…xn}的p-范数

(3.1)

当p=0时得到0-范数,它表示的是x中非零项的个数。

因此,在信号x压缩或稀疏的条件下,对欠定方程组Y= Φ=ΦψTX的求解问题就转化为最小0-范数问题:

s.t. Y= Φ=ΦψTX (3.2)

但是,它需要找出X中所有非零项位置的 种可能的线性组合,才能求得最优解。因此,式(3.2)数值计算的求解是很不稳定的。所以,Chen,Donoho和Saunders提出,求解一个更加简易的l1优化问题会产生同样的解(要求Φ与Ψ不相关):

s.t. Y= Φ=ΦΨTX (3.3)

细微的差别就将问题变成了一个凸优化问题,于是可以化简为线性规划问题。而基于1-范数的重构经典算法有内点法(Basis Pursuit,BP)和梯度投影法(Gradient Projection for Sparse Reconstruction,GPSR)。由于1-范数下的算法速率慢,因此,新的快速贪婪算法被逐渐使用,如匹配追踪法(MP)、正交匹配追踪算法(OMP)、压缩采样匹配追踪算法(CoSaMP)、正则正交匹配追踪法(ROMP)和迭代阈值(IHT)等。

3 基于压缩感知的去噪方法

与传统的去噪方法相比,基于压缩感知的去噪方法能够充分发挥稀疏表示的优点,灵活的适应实际问题,降低采样率和数据处理的成本,获取较好的去噪效果。

3.1 基于压缩感知并运用OMP算法的椒盐去噪

椒盐噪声是图像处理中一种十分常见的噪声,其特点是噪声点匀称分散于整幅图像,由于椒盐噪声只破坏了图像结构的一部分,其他大部分的图像信息都是精确的,因此,可以充分利用这部分精确的数据,通过求解最优化问题,重构原图像。

在传统去噪模型 subject to 下,提出了一种椒盐噪声检测的采样,利用阶梯观测矩阵良好的0稀疏定位能力,并利用OMP算法的低复杂性和稳定性,来对信号进行重构。

算法步骤:(1)已知原始含噪信号Z;(2)噪声检测采样,构造阶梯观测矩阵,首先检测信号Z中噪声的位置, 然后将对应的行删除作为阶梯观测矩阵ΦZ;(3)将DCT基作为稀疏变换基;(4)采用OMP算法进行重构。

椒盐去噪算法流程图如1:

3.2 基于压缩感知并运用K-SVD算法的图像去噪

3.2.1 K-SVD算法

为了逼近的得到式(信号yi,最稀疏的解的表示xi和未知字典A),的解,训练一个字典A能够稀疏表示数据 。初始化k=0,并且初始化字典:构建 ,要么使用随机的条目进行计算,要么使用m随机选择的例子来进行计算。标准化A0的数组。k每次增加1,然后开始迭代,并最终得到结果A(k),此过程如图3所示。

稀疏编码阶段:采用一个追求算法来逼近下式的解

s.t. (3.1)

得到了在1≤i≤M下的稀疏表示,它们构成了矩阵X(k)。

更新阶段:使用下面的步骤来更新字典的数组并得到A(k),j0=1,2,…,m对 重复以下步骤:

(1)定义使用原子aj0的例子的组合 (3.2)

(2)计算剩余矩阵,其中xj是矩阵X(k)的j列 (3.3)

(3)约束Ej0,使其选择的数组与Ωj0相一致,并得到 ;

(4)应用SVD分解,通过 来更新字典原子aj0=u1。

停止规则:如果 中的改变足够的小,则停止,否则继续迭代。

3.2.2 去噪算法步骤

(1)将零均值的高斯白噪声加入原始的干净图像中;(2)对X进行初始化,假设X=Y, D=DCT字典;使用OMP算法对每一小块图像求出近似解;(3)对字典进行升级,用K-SVD算法找到最优的D,并求出近似原始图像的稀疏表示;(4)通过OMP算法重构恢复出原始图像,噪声去除。

3.3 基于压缩感知并运用TV重建算法的图像去噪

3.3.1 图像去噪的基本原理

为了得到图像去噪,首先将含有噪声的图像X进行稀疏域变换(X+z)= ψs,式中z为加性噪声。然后对变换后稀疏系数向量s进行测量,即y=Φs。

3.3.2 TV重建算法

重建就是在满足观测值的基础上寻找最稀疏解的过程:s.t Af=p 但是上式是个非凸优化问题,是一个典型的NP-hard问题,不易求解。因此Candes和Donoho提出用1-范数l1来代替0-范数l0进行求解。图像重建问题中,f代表离散化的图像的灰度。这里,我们用fs,t表示图像s行,第t列像素的灰度值,则图像的TV可以表示为:

(3.5)

图像的TV就是其梯度图像的l1范数(一幅图像的l1范数就是图像中每个像素的值的绝对值之和)。在实际的TV范数计算中,式(3.5)对于求导运算不太容易,大多采用l2范数来近似l1范数,并引进一个正的较小的参数τ,以防对TV(f)求导后为无穷大。

(3.6)

式(3.6)对某个像素fs,t求导,得(3.7)式:

(3.7)

通过测量向量y来实现图像X的重建和去噪,实现重建的一个重要前提是信号为稀疏的。图像绝大多数是稀疏的,但是噪声在常规域下是不稀疏的。通过压缩感知理论对噪声进行稀疏变换,然后对变换后的系数进行M维向量,使得多数噪声已经被去除,仅含有M维的噪声向量。如果M值越小,将会有更多的噪声信息被去除。通过对测量的M维噪声向量进行重建,去除混有的少量噪声,同时可以精准重建具有稀疏性的图像,从而达到去除图像中混有的噪声。

3.3.3 去噪算法步骤

(1)对含有噪声的图像X进行DCT变换,获得变换后的稀疏系数s,表示为(X+z)=ψs。(2)构造M× N维测量矩阵Φ,该测量矩阵Φ与稀疏基矩阵ψ是不相干的。然后,通过测量矩阵Φ实现对部分稀疏系数s的测量,获得测量向量y,表示为y=Φs。(3)对测量向量y进行TV重建算法来恢复图像信号x'。

4 小结与研究展望

本文首先介绍了图像去噪和压缩感知的相关理论,并将压缩感知运用到图像去噪中,基于压缩感知,提出了三种去噪方法:基于压缩感知并运用OMP算法的椒盐去噪;基于压缩感知并运用K-SVD算法的图像去噪;基于压缩感知并运用TV重建算法的图像去噪。压缩感知压缩感知的突出优点是降低了采样率,直接获得稀疏的信号的表示,大大减少了数据信息的获取时间以及存储空间,以获取较好的去噪效果。

压缩感知在应用于图像去噪时,应该将重建算法继续加强改进,另外可以将测量矩阵构造和重建算法的构建同时进行改进;同时压缩感知中的观测矩阵绝大多数是随机矩阵,如何用一个稳定的确定性的矩阵来得到观测矩阵,以此来达到更好的去噪效果;此外压缩感知是门新兴的技术,如何进一步的应用到更多的领域也是以后要研究的问题。

参考文献

[1]曹殿元.压缩感知理论及其算法[D].南京邮电大学硕士学位论文,2013.

[2]屈冉.压缩感知算法及其应用研究[D].南京邮电大学硕士学位论文,2013,5.

[3]李博.压缩感知理论的重构算法研究[D].吉林大学硕士学位论文,2013,5.

[4]樊立.压缩感知在图像去噪中的应用研究[D].北方工业大学硕士学位论文, 2013,5.

[5]赵彦孟,宋建新.一种基于压缩感知全变差算法的图像去噪方法[J].电视技 术,2014,38(5).

[6]赵可,潘晋孝,孔慧华.一种改进的自适应TV图像重建算法[J].核电子学与 探测技术,2013,33(10).

[7]史久根,吴文婷,刘胜.基于压缩感知的图像重构算法[J].计算机工程, 2014,40(2).

[8]石光明,刘丹华,高大化等.压缩感知理论及其研究进展[J].电子学报, 2009,37(5).

[9]刘钢.基于压缩感知和稀疏表示理论的图像去噪研究[D].电子科技大学硕士 学位论文,2013,5.

[10]D L pressed sensing[J].IEEE Trans.On Information Theory.2006,52(4):1289-1306.

[11]E pressive Sampling[A].Proceedings of the International Congress of Mathematicians[C].Madrid,Spain,2006,3:1433-1452.

作者简介

友情链接