图像分析论文合集12篇

时间：2023-03-15 14:56:21

图像分析论文

图像分析论文篇1

文化是一个非常复杂的概念，为了教学的需要，根据美国人类学传统，将其定义为“一群人共有的理解世界、并用符号表达这一理解的方法”。由此定义不难发现，海报是文化的重要载体，许多文化研究都选择海报作为切入点；关于文化的教科书也常常提到从分析海报入手理解一国文化。这种思路虽有意思，但在教学实践中却存在一个问题：以英语为外语的学生，要怎样才能可靠地找出海报所反映的观念，而不致让自己的解读沦为主观臆断呢？要回答这一问题，一个能解释海报工作原理的分析框架不可或缺。沿着这一思路，本研究在实践中尝试用不同的图像分析框架，包括著名的“图像语法”，来分析海报通过图像反映出的价值观，结果却发现这些框架均不能很好地实现这一目的。究其原因，似乎是因为现有图像分析框架过于注重图像系统的内在结构而忽视了图像与受众间的联系，直接导致它们无法解释海报如何做到通过图像实现其社会目的。鉴于此，本研究主研人开展了海报图像符号分析系统的相关研究工作，最终提出了一个简单有效的分析框架，用以解释海报通过图像系统推广新理念的机制在教学中，首先通过一组简单的例子说明图1所示的图像分析框架。然后，通过小组讨论的形式跟学生一起分析两组文化背景不同的海报，确保学生理解海报通过图像说服受众接受某一理念的机制。在此基础上，引导学生通过该框架发现不同文化符号表征间的同质性，并以此作为检验该分析框架可靠性和合理性的证据。

（二）数据来源

本研究的数据来源之一是学生的书面作业。按照课程要求，学生需选择感兴趣的话题进行研究，并在此基础上撰写相应的书面研究报告；具体到本话题，学生需要运用所学原理以学习小组为单位独立设计一份海报，并以书面报告的形式说明：（1）该海报的预期读者群及其特征；（2）海报设计的基本原理；（3）海报设计的效度评估。最终，超过一半的学生（56人）选择了上述题目作为研究话题。这些书面报告构成了本研究的原始数据。本研究的另一个数据来源就是有针对性的结构性访谈。为了更好地理解学习过程，在期末作业评分结束后，要求每一位选择该话题的学生带着自己作业来与教师面谈五分钟；研究者在访谈开始前明确告知学生本访谈不会影响成绩，要求他们诚实作答。面谈包括如下内容：（1）学生在完成本作业过程中的学习体验；（2）了解学生未在书面报告中展示的学习过程细节，如对基本理论的理解等。所有访谈内容都在征求学生同意的前提下被录制下来，并按照研究的一般程序进行分类和标注，供后续研究分析之用。

二、分析和讨论

在各国高等教育普遍重视创新能力培养的大环境下，与之相关的研究方兴未艾，大批专门测量创新能力的标准化量表相继问世，如常用的“Torrance测试”。遗憾的是，目前很少有量表能直接测量学生图像符号创新能力。尽管如此，已有研究对创新能力测量提出了一些原则，这些原则当能应用到本研究的分析中。经整合，本研究主要从以下两个方面衡量学生的图像符号创新能力：（1）图像符号系统的原创性；（2）图像符号原创性与思维过程间的因果关系。

图像分析论文篇2

中国是人口大国,文化大国,也是移民大国。当我们站在有着“移民城市”之称的深圳特区的土地上,思考移民现象和移民文化这一论题时,会很自然地感受到:古代的移民和当今的移民,虽然其发端已经和今天远隔千年,但是正像一根红线始终贯穿着中国历史一样,不同时代、不同背景的大批移民,一直推动着中华文明的发展。

人口众多、历史悠久的中国,曾经创造了灿烂的文化奇迹。人们在考察其博大精深而又充满奇幻的文化演进的过程中,清楚地看到了它与人口迁移———即移民现象的紧密联系。自西汉以来,北方人口大批南下,边疆的少数民族就大举内迁,形成了一幅蔚为壮观的移民画卷。明清以后,汉族人口再次大举从黄河和长江流域这些原本是汉族人口的核心分布地区广泛向西南、东北乃至台湾等边疆地区迁移和拓展。需要指出的是,中国人口的国际迁移,也同样引人注目。可以说,中国海外移民规模之大、分布之广,早就产生了巨大而深远的影响。正是在这种历史的回顾中,我们发现移民文化在当代图像中所呈现出的新取向。对于移民文化进行研究,是文化现代化建设中的一个重大课题。

一、移民的产生及移民概念的理解

关于移民产生的时间,目前在学术界已几乎不存在争议,就是“古已有之”。由著名学者葛剑雄、曹树基、吴文弟先生合著的《中国移民史》(六卷本)和《中国移民简史》等著作,均已对此作了十分详尽的权威解说。就是说,移民现象既是一个世界现象,也是一个历史现象,它不是近现代社会特有的产物。

早期人们的迁徙使人类遍布于全球,只不过当时的移民是自发的,是自然选择的结果。就世界范围而言,人类进入文明社会之后,移民开始受到国家政权的控制,人员流动的随意性降低。这个时期的移民主要发生在各个国家范围内,不仅受到自然因素的影响,而且还受到政治、经济、社会风俗的影响。随着资本主义生产方式的出现,由于它需要把原料产地和销售市场扩大到世界范围,人员的流动也更趋活跃和扩大,几乎遍及全世界。在这种条件下,由于各国各地区都逐渐被纳入到了世界资本主义经济体系,所以,移民形成的原因和去向也跟着复杂起来。这种流动绝不是随意的,而是资本主义经济在全世界范围内的活动所促成的。对于这种现象,国外的一些学者将其称为“越境移民”现象。对此现象的研究,不但包括了移民国的人士,而且也包含了移居国的人士。就拿美国来说,在移民大量涌入的20世纪20年代、50年代以及1965年以后,都曾出现了大批关于移民问题研究的著作。

据日本广田康生《移民和城市》等书介绍,二战后的日本,由于其经济的快速发展,在1990年也修改了移民法,即“出入境管理法及难民资格认定法”。随之而来,流入日本社会的各国移民也急剧增加。其中包括日裔巴西人、秘鲁人,以及越南、泰国等亚洲各国的越境移民。由于大量移民的产生,对于移居国的经济、文化发展都产生了较大的影响;同时,移民和移居国居民之间的关系也是一个不可忽略的问题。所以对移民问题的研究,也就逐渐在丰富和深化,国内外的大量著作,显示出对上述问题的认真探索和研究。

在谈到“移民”这一概念的含义时,人们很容易联想到“流动人口”、“流民”、“迁移人口”等词语。应该说,它们之间的区别还是很明显的。从现代汉语的研究角度,“移民”这一概念,兼有动词和名词两种词性:“作动词时,‘移民’指一部分人口从原居地迁移至其他地方居住;作为名词,‘移民’则指进行迁移行动的人。”[1]所以,有的专家指出:作为“移民”的定义应该有了两个基本要素:即长距离的迁移和具有法律结果的迁移。所谓“法律结果的迁移”,主要指入了居住地的户籍。这样,未取得户籍的人,即使在居住地已居住了较长的时间,也不能算“移民”。[1]应该说上述研究是有一定道理的。但这种定义并不完全适用于历史时期中国移民史的研究。[1]即使从近年来我国的移民现象来看,特别是深圳的移民现象来说,上述对“移民”概念的定义也显得狭窄了一点。就深圳这个城市而言,实际的居住人口已经超过了1千万,而取得户籍者,仅为170余万。其余的八九百万人,确有相当多人属于“一般的流动人口”,但似乎也不能简单地一刀切。已经有一半以上的人虽然暂时还未取得该地的户籍,但他们已经对移居地具有了一定的归属感,而且对当地的语言、文化等状况也有了一定的适应性,并力趋使自己能主动地融入到当地的社会生活中。这些特点,正是“移民”与“一般流动人口”的不同点。一般的流动人口只是把移居地当作赚钱或其他功利性目的的地点,一旦目的达到,或是又发现了更好的移居地,他们就会很快离开,根本谈不到对移居地的归属感。虽然他们所带来的文化也会对移居地产生一定的影响,然而流动人口自身却保留着他们原有的文化。正因为这样,我们说深圳是个“移民城市”,其“移民”的概念不但包含着已入了户籍的人口,而且还包含着那些已经在深圳生活多年、来自较远地区、对深圳已经产生了归属感的人们。这些人虽然也属于“流动人口”这个大范围,但他们确实已经是“移民”了。他们和“深圳人”一样,已经把特区看作是自己的“家园”和“第二故乡”,他们和移居地的人们一道,在共同的家园里创造着共同的移民文化。

二、移民文化是一种创新文化,具有独特的魅力

一个时代、一个国家和一个地区文化的形成,需要历史沉积,而且有着诸多复杂的人文、物质成因。而随着人口迁移所产生的移民文化,对于一个时代、一个国家和地区的文化建设,具有不可忽视的意义。也就是说,就实质而言,移民文化对原有文化来说,乃是一种创新的文化。荷兰学者彼得•李伯庚在《欧洲文化史》中指出,不但大量流动人口会对移居地的文化产生很大的影响,就连本国旅行都会引起某种文化的演变(更不要说跨国旅行了)。作者在该书中写道:“不仅出国旅行,即使在本国旅行,也能引起文化的演变。例如,长期的贸易往来带来了语言上的交流,丰富了欧洲语言的词汇和思想。西班牙在穆斯林统治下700年,西班牙语中自然吸收了许多阿拉伯词汇。意大利和土耳其的贸易使意大利语言中吸收了土耳其词汇。当荷兰的航海事业达到了顶峰时,荷兰的船运词汇也为其他语言(包括俄语)所吸收。旅行也使人们对不同地区的地理、经济、政治、道德、风俗等有所了解。最后一点,旅行使各国知识界联系起来,形成世界性的各族文化是一个重要因素”。[2]在建设一代新文化的过程中,尽管时间漫长,因素甚多,但是各种文化形态的冲撞和影响,彼此的冲突和融汇,对于形成一种多元的具有包容性的主流文化,即创新文化而言具有重要的意义。这在中国文化数千年的发展史中,可以得到明证。

首先,让我们来看游牧文化与农耕文化的冲突和融汇。宋代自立国之始,就因外患之忧,长期与辽、西夏与金等游牧民族的政权相对峙。双方战争频仍,的确让老大的宋王朝饱受被动挨打之苦。然而,在那种战乱的年代,却使彼此所代表的游牧文化和农耕文化的冲突产生了奇妙的双重效应:一方面让契丹、党项、羌、女真等北方游牧民族从汉文化中吸取了丰富的营养,正如王世贞在《归潜志序》中所说,北方中国竟奇迹般地创立了一个“人物文章之盛,独能颉颃宋、元之间”的文化天地。另一方面,北方剽悍的草原游牧民族的凛然之气,也深刻地震撼了细腻丰满的宋文化。范仲淹与王安石所推行的变法,正是在这种文化大背景下孕育产生的。[3]

其次,我们再来看一下中国文化与外域文化的交汇。张岱年、方克立指出:“中国文化不仅在内部各族文化的相互融汇、相互渗透中得到发展,而且在与外部世界的接触中,先后受容于中亚游牧文化、波斯文化、印度佛教文化、阿拉伯文化、欧洲文化。中国文化系统或以外来文化作补充,或以外来文化作复壮剂,使整个肌体保持旺盛的生命力。外域文化系统也在中国文化的广泛接触中汲取营养,滋润自身的肌体”。[3](P120)梁启超认为,中外文化的第一次大交汇是在晋唐间。[4]但从汉代开始,中国的本土文化就开始了与西域(即中亚和西亚)文化及南亚次大陆文化的交汇。正是这种交汇,极大地丰富了中国文化,同时也在让外来文化“本土化”的过程中,促进了外来文化的发展。像佛教哲学传入中国,固然大大提高中国哲学的思辨等能力,而中国传统哲学中的孟轲、庄周等人的思想融入佛教,也使佛学宗派吸收了丰富的华夏营养,得到了新的发展。我们对移民文化的认识,也应立足于这一高度。

由于不同的移民承载不同的文化,而移民又是文化最活跃的载体,所以,如果一个地域的移民来源多,那么移民文化就丰富。移民的类型不同,也会影响到移民文化的构成。具体来说,移民文化因受如下因素的影响而具有新的文化特征。

1.由于对移民文化的认识离不开对移民类型和移民本身的了解;又由于移民与移民文化的密不可分,所以,不同的移民类型(这里会涉及到移民的社会政治背景,以及移民本身的素质)以及移居地移民的数量和他们居住时间的长短等,都会影响到移民文化的特点。

2.由于移民文化是多种文化的相互冲击、融汇而成,一般具有多元性和包容性,甚至会形成一种完全不同于移居地原来文化的新文化。美国当代历史学家奥斯卡•汉德林先生就曾说过:“我一想到要写一部美国移民史,立即发现移民原来就是美国的历史”。[5]这可说是一个很生动的例子。

3.大量移民聚集在移居地以后,会让此时产生的移民文化较少包袱,较少框框,具有较大的开拓性和开放性,比较容易接受新生物,比较容易进行新的探索和实验,这正是移民文化独具的魅力。马克思主义的创始人曾举美国社会为例,指出:“美国是由那些为了建立纯粹的资产阶级社会而从欧洲的封建制度下逃出来的小资产者和农民建立起来的”。由于这是一个“现代的,资产阶级的”社会,[6]即一个比之过去的封建社会来说是一个全新的社会,因此才有了很多历史上较少出现过的奇迹。例如通过个人的勤俭奋斗,发财致富,终于走到富人或资本家的行列。与过去的社会相比,也才最容易接受新事物,最容易产生发明创造。而在改革开放以后的中国,更在这方面创造了举世震惊的巨大奇迹。

4.由于移民文化具有极为丰富的内涵,因此它所表现出来的特征也是丰富多彩、不拘一格的。这里,需要特别强调的是移民文化所具有的创新性。早在一个多世纪以前,著名学者和教育家蔡元培就指出:“综观历史,凡不同的文化互相接触,必能产生出一种新文化。如希腊人与埃及及美琐波达米诸国接触,所以产出雅典的文化。罗马人与希腊文化接触,所以产出罗马的文化⋯⋯就在中国,印度文化接触后,产出十世纪以后的新文化,也是这样”。

关于移民文化的创新问题,应该说是一个很大的题目,这里包含着极为丰富的内容。从国内目前已经发表的大量移民文化研究的著作来看,有不少是注意到这一问题了,但是对于这个问题的研究,我们认为仍需要加以改进。

一是关于“史论结合”的问题。从国内目前对移民文化的研究来看,对移民文化的“史”的研究成果偏多,而对于“论”的方面,似感不足。包括对移民与文化的互动,移民文化究竟如何有力地促进文化的创新,特别是这个新文化又将如何适应未来的发展、适应市场经济的发展,如何更好地建设一种面向世界、面向未来、面向现代化的、民族的、科学的、大众的社会主义新文化等问题,都很值得探讨。还有就是如何从总体上认识移民文化的发展趋势以及“经济全球化”所带来的“文化全球化”对移民文化的影响等,也都需要进一步深入探讨。

二是关于“外为中用”的问题。近几十年来,随着国外对“越境移民”等问题的日益重视,各国不但出台了很多政策(尤其是日本、澳洲、加拿大、英国等国),而且出版了大量的有关移民文化的论著。这些论著有不少把移民问题和社会变迁、现代化等问题相结合,从而对移民文化的内容有了很大的丰富。很值得我国学者的关注、评论乃至借鉴。

此外,对于“移民文化”本身的探讨也需要不断加以深化。正如美国有代表性的人类学家克鲁伯(A.L.Kroeber)和克罗孔(ClydeKluckhohn)等人合著的一本论述文化的专著中所罗列的从1871年到1951年80年间关于文化的定义,便有164条不同的说法;而冠上“移民”之后,当然就更为丰富了。如何进行分析,加以全面理解,就不仅仅是个理论问题,而且具有明显的现实意义。

三、深圳的移民文化之魂

作为在移民潮中诞生的深圳特区,可以说是在滚滚移民大潮中飞溅的一朵极为耀眼的浪花。深圳的移民现象和移民文化,的确给当代中国的移民潮涂上浓抹重彩的一笔。当人们站在深圳的地王大厦等许多经典建筑物旁时,怎能想到二十几年前,这里还是荒滩一片的一个边陲小镇!历史就是这样地借助移民的航舷,让20世纪80年代乘风破浪的中华民族大舒了一口久已想抒的豪气!

由于深圳是中国改革开放的试验田和排头兵,是中国改革开放的总设计师邓小平同志亲自扶持的典型,因此,它的成长历程和成功奇迹,就有特别重要的历史意义和现实意义。再加上深圳毗邻香港,成为香港文化向内地辐射的中转站,在香港与内地的文化交流中占据特殊地位,这也增添了对深圳的移民文化研究的重大意义。从对深圳移民城市文化的现实考察中我们发现,深圳的移民文化至少具有这样几个特色:

(一)在南北文化的交融中,凸现中原文化的风貌,却又不失“岭南文化”之“根”

与香港的移民不同(香港的移民不但包括大陆人,还包括英国人、日本人、菲律宾人、澳大利亚人、美国人、法国人等等,可以称为国际化的移民),深圳的移民主要是大陆人,或者说是“大陆的北方人”。这种“北方文化”虽然与“岭南文化”同为一个国度,但却具有明显的反差。当然,“影响深圳的北方文化并不就是铁板一块的”,“这其中包括楚湘文化、巴蜀文化、燕赵文化、齐鲁文化、东北文化、吴越文化等等”。[7]正是这个原因,随着北方移民的愈益增多,“来自北方中原地带的母体文化正逐渐抵销香港文化的过极影响”,[7]在这种情况下,来自内地的“务实作风、利益趋向、风水观念、理想精神等等,这些颇有代表性的文化因素在深圳文化的成长中”就起了巨大的催化作用。[7](P93)日本学者广田康生指出:“所谓移民就是指一个过程,在此过程中,一种文化向另一种文化进行整体流动,并往往引发一些问题”。[8]这里有两点值得我们注意:一个是“整体的流动”,另一个就是“引发一些问题”。

我们认为,所谓“整体的流动”,既有移民原有的文化向移居地的流动,也有移居地的“土著文化”对移民所带来的文化的“反流动”。正是在这种相互影响、相互冲撞之中,产生了新的“移民文化”。非常明显,这种“移民文化”的生成,或者说新的“移民文化”的主流成分的构成,其结果必然是:或者是移民所带来的文化占上峰,或者是移居地的“土著文化”占上峰。由于深圳的移民人口占绝对优势,所以移民所带来的文化,当然构成了新的移民文化的主流成分。只是值得注意的是:包孕有潮汕文化和客家文化等丰富内涵的“岭南文化”特有的“根”,对新的移民文化也打上了深深的烙印。

人们知道,岭南文化是中华民族文化色分明、有着巨大影响的文化之一。它既不同于有悠久华夏文明的老北京文化,也不同于江浙文化和巴蜀文化,而是自成一体,影响深远,带有浓厚南国特色的地域文化。岭南文化的灿烂丰富、多姿多彩,早为世人所称道。这不仅是因为这里地处南国,有着特有的丰富物产,像苏轼的诗中所说的“曰啖荔枝三万颗,不辞长做岭南人”,而是在于它确实在文化的方方面面上都毫不逊色。例如,驰名世界的饮食文化,岭南的宗教文化、客家的民俗文化,以及在古老而又年轻的潮汕平原上活跃的海内外贸和人们的商品意识,久负盛名的潮州瓷器及刺绣等等。值得人们关注的还有因海外潮人的数量之多、影响之广(约在千万人以上,遍布世界60多个国家)而形成的特有的文化特色。人们已经把“海外潮人”看成是岭南文化的一道亮丽的风景线。这些岭南文化的特色,显然对凸现中原文化风貌的深圳移民文化产生了较大的影响。超级秘书网

现在要说到深圳的移民文化所“引发的一些问题”,突出表现在大多数移民者在刚刚踏上深圳这块热土时,难免会产生某种“陌生感”乃至“危机感”,需要有一个“重新调整”和“个体认同”的过程。如果能顺利完成这个过程,当然很好。许多来深圳的创业者们从艰辛的奋斗到最后的成功,就是明证。然而也有一些带着盲目性闯深圳的人,到达深圳以后,有的因为生计的不易,工作的艰辛,加之难以获得令人满意的待遇,往往是或拂袖而去,或铤而走险,这也给年轻的深圳带来了诸如治安、卫生等问题,这是应当引起人们严重注意的。只有充分地认识到了这些问题,才能更好地建设深圳的移民文化。

(二)在物质的、观念的,尤其是制度层面上的文化特色印度文化接触后,产出十世纪以后的新文化,也是这样”。

参考文献:

[1]范春玉.移民与中国文化[M].桂林:广西师范大学出版社,2005.9-10.

[2]彼得•李伯庚.欧洲文化史[M].上海:上海社会科学院出版社,2004.339-340.

图像分析论文篇3

当今的计算机设备都在追求高速性和高通用性，尤其在进行图像数据处理和传输时，数据的大指、高速、实时性对计算机与外设的接口提出了更高的要求。

目前新型总线接口有两种：USB和1394接口。它们都支持即插即用，具有易扩展、使用方便、成本低等特点。但在任何USB系统中，只能有一个主机，最多可接127个外设，在全速模式下的传输纺为500kbps～10Mbps。而相比之下1394显得更胜一筹。它支持点到点的传输，消除了主机处理器/内存瓶颈，具有可升级性，支持400Mbps、200Mbps和100Mbps传输率，单一总线支持63个节点，由于1394总线的高速性和独立于主机的操作能力，使它成为高多媒体设备接口的首选。

11394技术

IEEE1394起源于苹果公司，又名FireWire，是为家用电器研制的一种高速串行总线标准，其目的是为了解决对速度要求很高的宽带设备的传输问题。1995年12月，IEEE1394-1994高速总线标准正式被IEEE标准委员会批准。

1.11394的主要特点

a.支持点对点传输。串行总线设备能自主执行事务，而不需要主机CPU的干预。

b.可扩展总线。可以将新的串行设备连接入总线节点提供的端口从而扩展串行总线。

d.热插拔。不需要系统断电就可以动态地加入或删除设备。

e.即插即用。每次加入或删除设备时，总线节点会自动配置，并且配置时不需要主机系统的干预。

f.巨大的映射至内存的地址空间。每个节点拥有256T字节的地址空间，每条总线上有16P字节地址空间。

1.21394原理

1394原理主要定义了以下几点：

a.1394总线的拓扑结构。1394串行总线的拓扑结构可以分为两种环境：底板环境和电缆环境。不同环境间总线的连接需要总线桥。电缆环境下的物理拓扑结构是无环网络结构，由电缆连接各节点间的端口，呈分支扩展，形成树状或状的网络拓扑。底板环境中物理拓扑是多点接入（multidrop）的总线，总线上分布着多个连接器，允许节点直接插入，通过仲裁使各节点享用总线。

b.1394的物理接口。1394设备通过标准的六芯线缆来传输信号，如图1所示。其TPA/TPA*和TPB/TPB*为一对差分模式的信号线。VP、VG提供8～40V的电源，可以通过它们给其它的节点供电。

c.1394总线协议。在1394传输中，支持等时传输和异步传输事务，并将每次传输分解为一系列的小事和，有效地利用总线带宽。异步事务需要数据确认，总线协议要复杂些，它包括三种基本事务类型：读取、写入和锁定。每个事务由请求子事务和响应子事务组成。由于等时应用程序的性质，相关的总线事务十分简单，等时事务每隔125μs向目标节点发送数据并且需要任何回热。1394总线一共定义了12种事务类型的包格式，采用循环冗余校验（CRC）进行数据差错控制，有相应硬件和软件处理各类传输事务。

d.1394电源管理。电源管理涉及到单独节点或节点中元件的电源状态控制。1394定义了4种电源状态以及相应的CSR寄存器和ROM配置项，支持挂起/恢复机制，使节点在软件控制下处于低功耗。

2系统硬件设计

2.1图像传输系统总体设计

系统采用冗余备份的双路1394高速总线将数据传送给大容量存储器、数据加密器和信道编码器，如图2所示。

由于本地系统中普通采用PCI接口，为了最大限度地利用现有硬件资源，缩短开发周期，研制了1394-PCI的转接卡，来实现基于1394高速图像传输系统。该转接卡主要通过物理层和链路层控制芯片组实现，其中链路层控制芯片采用TI公司的TSB12LV23，支持开放主机控制器接口（OHCI）的PCI接口芯片。

2.2TSB12LV23/TSBAB03芯片组

TSB12LV23提供主机接口和物理层接口，实现CRC校验以及同步服务。在芯片中集成了中断寄存器、传送/接收FIFO和DMA通道。TSBAB03芯片完成1394总线协议中的物理层功能，实现仲载机制，对收发信号进行编码/解码。

链路层和物理层芯片的连接电路图如图3所示。

3系统软件设计

系统软件包括1394设备驱动程序、动态链路库和应用程序。

3.11394设备驱动程序开发

Windosw驱动模型（WDM）定义了驱动程序分层，以适应即插即用系统。1394系统驱动程序采用分层结构模型，其设备栈如图4所法。设备驱动位设备栈顶，通过发IRP给IEEE1394总线驱动来与设备通信。IEEE1394总线驱动为1394总线提供了独立于硬件的接口，并将一部分IRP传向端口驱动程序。

在分层模型中，1394总线驱动负责管理1394设备驱动程序与1394控制器之间的通信；加载及卸载设备驱动程序。设备驱动程序在功能层工作，它们不需要任何低层硬件资源，只需对总线驱动程序发请求，由总线驱动程序访问硬件来完成这些请求。

用DDK设计的1394设备驱动由4个模块组成：初始化模块、即插即用模块、电源管理模块以及I/O模块。

初始化模块提供设备驱动的入口点，从而将不同的IRP请求发向相应的执行模块。

即插即用模块用于实现1394设备的热插拔和动态配置。当总线驱动程序在加电或者添加/删除时检测到新设备，从设备中取出一个或多个标识符，用于检查所有可用的安装文件，发现合适的设备驱动程序。驱动程序被装入，调用AddDevice入口点，告诉它发现一个新设备，并创建功能设备对象（FDO）。总线驱动程序或者安装文件详细描述设备所需的硬件资源，使用仲裁器为每个设备分配资源。

电源管理模块负责设备的挂起和恢复。

I/O模块完成I/O请求的大部分工作。该模块定义了所需的I/O控制代码，从而为应用程序提供了调用系统驱程序的接口。

3.2动态链接库的设计

由于Windows具有与设备无关的特性，不提倡与机器底层的东西打交道。如果直接用Windows的API函数或I/O读写指令进行访问和操作，程序运行时往往就会产生保护模式错误甚至死机，更严重的情况会导致系统崩溃。用DLL技术可以方便地解决上述问题。而且DLL没有自己的堆栈，与调用它的应用程序采用有相同的堆栈式，减少了编程设计上的不便；一个DLL在内存中只有一个实例，使之能高效经济地使用内存；DLL的代码封装怀使得程序简洁明晰。

在1394API动态链接库中封装了所有的1394请求命令，如异步读/写、等时读/写等，从而可以很方便地在应用级实现1394传输。通过调用DeviceIoControl向设备发请求，由I/O管理器构造一个1394请求块传给总线驱动程序；由总线驱动程序完成该请求或者请求进一步传给端口驱动程序，然后返回执行状态。

3.3应用程序设计

图像分析论文篇4

在我们的快速JPEG 2000图像尺寸缩小转换方法中，首先将原始JPEG 2000图像经EBCOT解码以及反量化步骤解出图像的频率域编码信息后，再透过频率域图像尺寸缩小转换方法，直接在频率域里缩小图像尺寸，最后再通过量化与EBCOT编码等步骤，将图像尺寸缩小后的图像频率域编码信息编成JPEG 2000图像。

本文所提的JPEG 2000图像尺寸缩小转换方法与空间域图像大小转换方法相比，所提的方法省掉反向小波转换、反向色彩转换、后置处理、前置处理、正向色彩转换、以及正向小波转换等六个步骤。由于所提的方法不需将频率域编码信息转成空间域图像，因此本论文所提的方法除了可更快速的转换图像大小外，也可省下存放空间域图像内容所需的存储空间以及减少所需的计算量。

1 简化JPEG 2000压缩与解压缩流程

在快速JPEG 2000图像尺寸缩小转换方法中，保留了EBCOT解码、反量化、量化与EBCOT编码等四个部分，主要原因说明如下：

1.1 EBCOT编/解码 JPEG 2000编码后的图像会储存成封包的格式，但封包并非以子频带为单位储存，所以要取得各子频带的内容，必须先经过EBCOT解码才行。再者本文的方法有可能需要对子频带再进行小波转换，因此EBCOT编/解码过程不可省略。

1.2 量化与反量化保留量化与反量化步骤的主要原因在于图像经由正向小波转换后，会产生不同大小的子频带频率信息，不同子频带频率信息使用不同的量化步长值进行量化。

子频带与量化步长值这两者有相对应关系，换句话说以具有7个子频带的JPEG 2000图像而言，必须要有7个相对应的量化步长值。而子频带与量化步长值所产生的数目与小波转换的层数有关，对于一个经过m层小波转换的影像，所具有的子频带数目Nsubbands计算公式为：Nsubbands=3×m+1，图2所示为图像经由二次小波转换后所产生的七个不同的子频带。

每个子频带的量化步长值都是由一组独立的控制参数（ε，μ）决定，该组控制参数必须记录于JPEG 2000码流头部，供译码端还原量化步长值使用。图3所示为一张图像经过三次小波转换后所产生的频率域情况。

本文所提的频率域图像尺寸缩小方法会改变原本图像的小波转换层数，进而影响到量化步长值与子频带的对应关系。当使用不同小波转换层数时，每个子频带的量化步长值会不同。所以，当图像在进行尺寸缩小前，先使用原本JPEG 2000图像的量化步长值对图像进行反量化，还原频率域信息，当图像尺寸已调整缩小后，再用新的量化步长值来量化频率域信息，即可解决量化步长值与子频带不一致的问题。

在我们所提的方法中，分别会遇到小波层数足够与小波层数不足的情况。假设一张JPEG 2000图像小波层数为m层，欲要将图像尺寸缩小为原来的（1/2n×1/2n）大小时，假如n

若n=m发生，也就是小波层数不足。首先经EBCOT解码后，产生不同的子频带信息。针对不同的子频带信息使用反量化，接着进行图像缩小的工作，将不需要的外频信息去除，保留的频率信息因小波层数不足（小波层数需为1层以上），要对保留的频率信息再进行小波转换。产生出来的小波频率域尺寸大小超过欲转换尺寸，可将外频的小波频率信息去除，保留LL子频带。此时图像大小虽已符合转换所需大小，但JPEG 2000规定图像至少要有一层小波转换，所以必须再做一次小波转换，得到一张小波转换层数为1的JPEG 2000图像，最后再经量化与EBCOT编码，得到尺寸缩小后的JPEG 2000图像。

2 频率域图像尺寸缩小转换方法

图1中间的频率域图像尺寸缩小转换方法主要工作包括缩小频率域图像尺寸与修改JPEG 2000图像码流主标头相关参数等步骤，详细步骤如下：

2.1 括缩小频率域图像尺寸

①小波转换层数足够的作法。假设当图像的小波层数为m层，欲将图像尺寸缩小为（1/2n×1/2n）大小时，若n 首先使用EBCOT解出频率域信息，再对需保留的频率域信息作反量化动作，接着将整张图像的尺寸缩小，并且丢弃不需要的外频频率信息，最后将所保留的频率域信息再重新经过量化与EBCOT编码，即可得到图像尺寸缩小后的JPEG 2000图像。

②小波转换层数不足的作法。假设当图像的小波层数为m层时，欲将图像尺寸缩小为（1/2n×1/2n）大小时，若n=m，就是小波层数不足，则除了丢弃m个外层的中高频信息外，还需要将原来最内层的低频信息，进行（n-m）+1次小波转换，再将所产生的（n-m）层的中高频信息丢弃。由于以上的（n-m）次小波转换后的中高频信息最终将被丢弃，因此在进行以上小波转换时可直接省略许多计算工作，不必进行完整的小波转换。此法为本文提出的快速小波转换方法。

2.2 修改JPEG 2000图像码流主标头相关参数 JPEG 2000图像码流主标头记录原始图像大小、块状（tile）大小、小波层数、各子频带的量化步阶值参数（ε和μ）等数据信息。在我们所提方法中，并没有将图像解回空间域，而是在频率域信息缩小图像尺寸后，直接进行量化和EBCOT编码，产生新的JPEG 2000图像。新的JPEG 2000图像码流主标头数据无法像空间域转换方法由JPEG 2000压缩方式设定，而必须自行修改JPEG 2000图像码流主标头内的相关参数。

3 小结

JPEG 2000具有的多种特性使其有着广泛的应用前景。目前许多图形图像公司如Pegasus，Aware等在开发的图像软件中集成了JPEG 2000图像压缩技术；有的公司如ImagePower等已开发出JPEG 2000的DSP芯片。JPEG 2000将取代JPEG在图像压缩领域发挥重要作用。本论文提出一个新的快速图像压缩方法，可大幅降低使用空间域转换时的处理时间，以及所需存储空间，但是本文所提方法只针对静态图像实现固定大小的缩小转换，无法对图像作任意大小转换，对图像作任意大小转换是一个很好的发展方向，需作进一步研究。

参考文献：

图像分析论文篇5

1 引言

以系统功能语言学理论为基础的多模态话语分析（multimodal discourse analysis）始于20世纪90年代，主要应用于图像、音乐、语言等其他符号上。由于这些符号对语篇意义的构建有着重大作用，因此，它们具有系统性、功能性（即同时具有概念功能、人际功能和语篇功能）及层次性。

Kress和van Leeuwen分析视觉图像的语法框架为多模态话语分析提供了理论依据和分析方法。本文主要通过运用社会符号学与Kress和van Leeuwen的多模态话语相结合的分析方法，以2012年伦敦奥运会会徽图像为例，探讨图像这一特殊的社会符号和语言共同作用构建意义的手段和方法。

2 多模态话语分析及其理论基础

2.1 多模态与多模态话语

作为有生命的人，人的感知渠道主要有五种，视觉、听觉、触觉、嗅觉和味觉五种感知渠道，这五种感觉就构成了五种交际模态：视觉模态、听觉模态、触觉模态、嗅觉模态和味觉模态。人们在现实的社会交流中，通常选择采用两种或两种以上的模态来构建意义，多种符号形式就构成多模态（multimodality）。多模态指除了文本以外，还带有图像、图表等的复合话语，或者说任何一种以上的符号编码实现意义的文本。

多模态话语是一种融合了多种交流模态（如声音、文字等）来传递信息的语篇。多模态性是现代社会人们在交际中使用的各种语篇的一个重要特征。国内很多学者也对多模态进行了探索。李战子认为多模态是除了文本之外，还带有图像、图表等的复合话语，或者说任何由一种以上的符号编码实现意义的文本；朱永生则将之定义为同时使用两种或两种以上模态的话语。目前多模态话语分析深受系统功能语言学和符号学影响，故朱永生将此类研究称为“系统功能符号学”。

2.2 多模态话语分析的理论基础

O’Toole 将 Halliday的系统功能语法应用于视觉艺术分析，而后 Kress 和 van Leeuwen 首次对视觉语法进行理论分析，全面建立了视觉交流基于社会符号学的多模态理论基础，具有开创性意义。多模态话语分析把语言信息和非语言信息结合，重新将其融入到全新的理论分析框架中，打破了以往的传统话语分析中单一言语形式的局限。

其分析理论从根本上说主要是以Halliday的功能语法为基础的社会符号学分析，认同语言是社会符号的观点，认为语言系统中有三个用来表示功能意义的纯理功能，叫概念功能、人际功能和语篇功能。概念功能指语言对人们在现实世界（包括内心世界）中各种经历加以表达的功能；人际功能是讲话者运用参加社会活动的功能；语篇功能指各种语言用于组织信息的功能，延伸到除语言外的其他符号，认为语言及其他各种符号既具相对独立性又有相互联系性。

多模态话语分析理论的主要观点即语言和视觉两大体系产生交际。Kress和van Leeuwen创建的多模态话语的社会符号学分析理论是以系统功能语言学为理论基础，主张图像也是社会符号，打破语言分析和图像分析的界限，将功能语法扩展到包括视觉模态和空间物体在内的多模态语篇，从再现功能、互动功能和构成功能三个方面，尝试用一种对语言和图像都适用的语法来对研究对象进行分析。

Kress和van Leeuwen认为所谓的模态（视觉的、姿态的、动作的），像语言一样，在社会使用过程中形成社会资源的模态，所以符号资源都具有社会意义。因此，在将图像看做社会符号的前提下，Kress和van Leeuwen根据Halliday的语言纯理功能创建了分析图像的视觉语法，其核心内容包括再现意义，互动意义和构图意义。

3 2012年伦敦奥运会会徽的多模态话语分析

3.1 会徽的意义

本文以2012年伦敦奥运会会徽为例，该会徽语篇是由图像文字和颜色构成，在结构上具有一定的代表性，对会徽语篇的分析有助于把握其它多模态语篇的整体意义构建。图1是2007年6月4日在伦敦正式经国际奥委会批准的2012年伦敦奥运会会徽以及对它的解释性文字。该会徽以数字“2012”为主体，包含了奥林匹克五环及英文单词London。这一设计清晰地传达出――“伦敦2012年奥运会将是所有人的奥运会、所有人的2012。”伦敦奥运会会徽是由图像（中国字“之”字和艺术数字2012）、文字（London）和颜色（粉色、橙色、蓝色和绿色）按照一定的方式所构成的。

3.2 会徽的多模态话语分析

第一，图像的再现意义。

多模态话语分析的再现意义对应于Halliday功能语法的概念功能。Kress 和 van Leeuwen 在再现意义上，根据图像的特点，将其分为叙事的和概念的两大类。其中叙事的再现包括行为过程、言语过程和心理过程，而概念的再现包括关系过程和存在过程。

伦敦奥运会会徽图案以数字“2012”为创意原形，并与奥林匹克五环及英文单词London巧妙组合，相得益彰，表达了英国人民举办一届属于世界的、多元文化融合的奥运会的强烈愿望。在伦敦奥运会会徽标图像的意象中，英文单词London图形展现了举办城市，又隐含着行动过程的动作者。由不规则几何图形组成的会徽可以拆分出来或者变形应用在不同场合，形成了多元文化的大聚会。伦敦奥运会会徽中的大胆的色块组合，仿佛一群张扬着运动精神的年轻人，踏着摇滚的节奏，带着闪电般的速度，尽情释放着人类的激情、活力与时尚，展望着梦想与未来，表达了2012年伦敦奥运会的实质，即鼓励全世界的年轻人参加体育运动，体现了奥运价值。

第二，图像的互动意义。

对应于功能语法的人际意义，在多模态话语中体现为互动意义。互动意义可以看成是观看者和图像世界中的一种互动，图像的各方面的构成直接影响图像解读者对图像的理解。图像设计者通过图像与观看者进行互动来提示观看者对所再现的景物应持的态度。图像的互动意义相对应的是功能语法的人际功能，在此层面上，主要关注图像中参与者之间的社会关系、制图者的交际目的以及图像解读者本身对图像内容的介入程度。在实现互动意义时，可以从距离、接触、视点和情态四个方面来对图像进行解读。基于深圳大运会会徽所体现情态的多样性，本文主要从情态这一角度来解构其互动意义。

接触指图像中参与者通过目光的指向与观看者之间建立起来的一种想象中的接触关系。很明显，该会徽图像属于提供信息类，传达了活力、现代和灵活的信息。社会距离是图像中参与者与观看者之间的亲疏关系，它可以远景、近景和中景等取景方式来实现。会徽图像既没有传达冷漠的社会关系，也没有透露出图像参与者与受众的亲密关系。伦敦奥运会会徽图像的平视视角表明了2012年伦敦奥运会属于每个人。作为互动意义的一个重要组成部分，情态有高、中、低情态之分。Kress 和 van Leeuwen主要从色彩饱和度、色彩区分度、色彩调和度、语境化、再现、深度、照明和亮度等八个视觉标记探讨了图像中情态的现实意义量值的高低，换言之，是我们队关注的世界所作出的陈述的真实度和可信度，其体现资源在图像中非常丰富。同在功能语言学中一样，情态被归纳为高、中、低三类。伦敦奥运会会徽图像中，粉色、橙色、蓝色和绿色四种颜色表现出一种愉悦的情感意义，具有高情态。图像中的文字部分位于平淡的大背景之上，白色的文字和其它颜色形成对比，充分体现了奥运会的宣传主旨。此外，图像中各种颜色的搭配非常协调，深浅有致，蕴含着深厚的文化意义，象征着清新、明晰的蓝色，象征着生命、文明和生命力的绿色，象征着力量、智慧与繁荣的橙色，几种色彩相加，动中有静，静中有动，表达出英国人民举办一届真诚、热情、激情向上的大家齐欢共舞的奥运会的强烈愿望。

第三，图像的构成意义。

多模态话语的构图意义即对应于功能语法的语篇意义。构图意义有三种资源：信息值、取景和显著性。信息值是通过元素在构图中的放置实现的。任何特定的元素在整体中的角色取决于它是被放置在左边还是右边，中间还是边缘，或者图片空间的上方还是下方。在Kress和van Leeuwen看来，上方与下方具有不同的信息值。如果某些因素被放置于上方，而其他因素被放置于下方，那么置于上方的是“理想值”，而置于下方的是“真实值”。“理想的”指它是信息的理想化的或概括性的实质，因此，它是信息的最显著的部分。“真实的”指更特定的信息，如细节等，或者说更实际的信息。伦敦奥运会会徽的设计，把“五环”嵌入会徽的右上半部分，给人一种活力、开放、自由的感觉，从而显现出世界多元文化和谐融合的意境，传达出的信息值是“理想”值。同时它扬弃一种单纯象征意义的运动形式，回归到它的本真――现代奥林匹克精神，旨在让大众积极参与，分享快乐，共同点燃奥运的激情与梦想。在Kress和van Leeuwen看来，元素在图像中程度不同的位置、背景、尺寸、色彩、鲜明度也不同程度地影响观者的注意力。显著性即为上述因素在吸引观者注意力时体现出的不同显现程度。在伦敦奥运会徽标图像中“2012”四个数字形状并不规则，其实这些不规则的形状有章可循，几乎都带有中国字“之”字的韵味，这使整个图案看似松散却有非常强烈的结构感。此外，这样的结构使得会徽看起来非常奔放、现代，给人阳刚的感觉，与奥林匹克运动的精髓相契合。奥运五环标志左下方的白色英文字母“London”属于“真实”值，给人真实可信的感觉。总之，伦敦奥运会会徽涵盖了2012年伦敦奥运会的实质，体现英国的多样化和欢迎精神。

4 结语

多模态话语分析不仅仅从言语层面对话语进行解读，而且也关注图像、声音、动画等其他构成意义的符号系统。它丰富了话语分析的视角与方法，对促进话语分析的发展起着重要作用。本文以Hailliday的系统功能语法为理论基础，以多模态话语的社会符号学分析理论为理论框架，以伦敦2012年奥运会会徽标的图像及文字说明为例，将功能语法的概念、人际和语篇意义与图像的再现、互动和构图意义相结合，探讨了图像和文字作为社会符号在多模态话语语篇中的相互作用。本文的分析在某种程度上具有一定的局限性和片面性。但是随着人们对多模态话语认识的不断深入，多模态的分析方法一定会得到进一步发展和完善。

参考文献：

[1]李战子. 多模态话语的社会符号学分析[J].外语研究，2003（5）：1-8.

[2]Kress，G. & Van Leeuwen，T. Multimodal Discourse[M].London：Arnold，2001.

[3]李战子.多模式话语的社会符号学分析[J].外语研究，2003，（5）：1-8.

[4]朱永生.多模态话语分析的理论基础与研究方法[J].外语学刊，2007，（5）：82-86.

[4]O’Toole，M. The Language of Displayed Art[M]. London：Leicester University Press，1994.

图像分析论文篇6

Zhang Yongmei， Ma Li， He Li

（School of Information Engineering， North China University of Technology， Beijing 100144， China）

Abstract： The disadvantages， the characteristics and the content of the current teaching for "Image Processing Technology" are analyzed. Four teaching procedures including the selection of textbooks and expansion materials for initiative learning， application of modern teaching models and methods， strengthening teaching practice and reforming appraisal methods have been discussed and practiced. The result shows that it has obtained better teaching effects， improved the students' interest in learning and motivation to participate in scientific research， as well as the ability to solve practical problems.

Key words： teaching content； teaching method； assessment way； teaching practice

0 引言

图像信息是获取信息的重要来源，图像处理研究对于科学理论研究和工程应用有重要影响。研究图像处理和通信是导向智能计算机、智能机器人或多媒体通信系统的必由之路。现有的图像处理技术在很多方面给人们生活、学习、工作带来极大的便利，如：视频广播、遥感图像、医学图像（计算机X射线断层扫描技术CT，以及核磁共振成像MRI）等，计算机的发展使处理更复杂的图像成为可能。

图像处理是计算机应用领域中的一个重要方面，是模式识别、计算机视觉、图像通讯、多媒体技术等学科的基础，是一门涉及多领域的交叉学科。在图像处理技术课程的教学中，不但要让学生掌握其基本概念和原理，还要让不同层次的学生能够理解和掌握图像处理在其应用领域的最新发展，故传统的常规教学已经不能满足课程的发展要求。目前的教学不足之处主要体现在：传统的图像处理技术教学大多数偏重于理论，缺乏图像处理技术与实践相结合的环节。本文结合计算机学科的特点和多年的教学经验，对图像处理技术课程的教学模式与实践进行了探讨。

1 课程特点和教学内容分析

人类通过眼、耳、鼻、舌、身接受信息，感知世界。约有75%的信息是通过视觉系统获取的。图像处理是利用计算机处理所获取视觉信息的技术[1]。图像处理技术的理论基础涉及了众多学科，包括数学、物理、信号处理和计算机科学等多个学科的知识，其内容广泛，理论抽象，不易理解。图像处理技术还有很强的实用性，因此理论和实践的结合是本课程的关键，注重基础理论和技术的教学，以及加强学生实践能力和课题研究能力的培养是本课程的主要教学目的。

图像处理技术已经成为众多高校的一门重要课程，该课程主要介绍图像的数学描述、图像的数字化、图像变换、图像增强、图像恢复、图像编码、图像重建、图像分割与边缘提取、图像的分析和识别等基本的图像处理方法，使学生能熟练地掌握图像处理的基本过程，并能应用这些基本方法开发图像处理系统。通过这样的内容设置，使学生能够真正掌握图像处理技术的基本思想和技术，为深入学习打下坚实基础[2]。

2 教学环节的探讨和实践

2.1 教材的选用和自主学习扩充性资料的选用

图像处理技术发展日新月异，虽然该课程已经有很多可选教材，但大部分教材内容比较陈旧，许多新的算法，新的思想都没有提到，学生无法从这些教材中获取图像处理最新的技术和发展趋势，因此我们选择了章毓晋编著、清华大学出版社的《图像工程》系列教材。该教材全面介绍了图像工程的第一层次――图像处理，图像工程的第二层次――图像分析，图像工程的第三层次――图像理解的基本概念、基本原理、典型方法、实用技术以及国际上相关研究的最新成果。同时我们要求学生将国外的经典图像处理的书籍作为参考书目，如：Rafael C Gonzalez主编的《Digital Image Processing》，并建议学生关注图像处理的一些重要期刊和国际会议，如：IEEE Transactions on Medical Imaging、IEEE Transactions on Pattern Analysis and Machine Intelligence、IEEE International Conference on Image Processing、电子学报、CT理论与应用研究、模式识别与人工智能等。这样学生能熟悉一些专业术语，了解最新的前沿动态，并具备一定的英文文献阅读能力，为今后的科研和工作打下了坚实基础。

要求学生自主学习一些最新方法和技术，例如，深入分析中华人民共和国设计制造的玉兔号月球车的结构，给出玉兔号月球车如何通过全景相机、测月雷达、粒子激发X射线谱仪、红外光谱仪等仪器，对月表进行三维光学成像、红外光谱分析，开展月壤厚度和结构科学探测，对月表物质主要元素进行现场分析等探测的原理和方法。又例如，探讨将遥感图像应用于5.12汶川大地震的方法，2008年5月14日上午，中国科学院的两架高性能遥感飞机飞赴汶川，对地震灾区开展遥感监测和灾情评估工作，这两架飞机可分别提供高分辨率光学和雷达图像，具有全天候快速获取大面积灾情数据的能力，探讨如何根据汶川地震前、后图像，给出建筑物、河流、山体等关键区域的变化检测结果，为国务院和相关部门的抗震救灾工作提供咨询服务和决策依据。

2.2 采用现代化教学模式与方法

为了使复杂的算法和抽象的知识更加形象化，便于学生理解和提高学习兴趣，我们充分运用现代电子技术、工具和方法，采用多媒体形式进行课堂教学，利用VC、MATLAB编写一些典型的图像处理程序，并在课堂上演示这些程序，增加了课堂的信息量，提高了学生的学习兴趣，激发了学生自主学习，同时也为实验环节的开展奠定了一定的编程基础[3]。

此外，我们深入分析MOOCs、SPOCs以及“翻转课堂”教学模式等国际流行教育新概念，尝试开展图像处理技术的MOOCs，包括从课堂教学、学生学习进程、学生的学习体验、师生互动过程等教与学过程的完整系统在线实现。MOOCs是一个改变学习方式的时代产物，受到全球各地的重视。国内教育部三个教指委（计算机类专业、软件工程专业、计算机课程）2013年底专门召开会议研讨MOOCs。我们建立了校内MOOCs平台并对学生开放，将其作为课堂外学习的有效补充，这样可以方便学生随时随地学习，或者进行预习和复习。我们尝试了结合图像处理技术的MOOCs，探索创新教学模式与方法，稳步提高教学质量。

2.3 加强实践教学

图像处理技术可以广泛应用于数字电视、视频通话、宇宙探测、自然灾害预测、环境污染的监测、气象云图等应用领域，而教材一般只涉及到理论知识和算法，或者是对应用的简单介绍，对其设计实现介绍得很少，所以必须加强实践教学，将理论与实践结合起来，使理论指导实践，实践加强理论[4-5]。要求学生利用VC或者MATLAB进行实际程序设计，培养学生分析问题、解决问题的能力，具备图像处理系统的开发能力。

根据课程的教学要求设置了四个课外实验。①图像变换实验。要求对输入的图像，分别采用傅里叶变换、离散余弦变换、小波变换进行图像变换，分别给出变换前后的图像，并分析图像变换前后的视觉效果。②图像增强实验。将给定的图像进行增强处理，要求至少使用线性变换增强、对数变换增强、指数变换增强以及伪彩色增强处理，分析增强后的视觉效果。③图像编码实验。将给定的图像进行压缩处理，要求采用 Huffman编码方法，并计算压缩比。分析图像压缩后的视觉效果，并对图像压缩效果进行客观评价。④图像分割与边缘提取实验。分别利用边缘检测法、阈值分割法进行图像分割；分析图像分割后的视觉效果。学生完成所有实验后，我们安排了实验指导课，解决学生在实验中遇到的问题，进一步提高学生的算法设计能力和编程能力。

在课程教学中，我们还安排了三次专题讨论课，由教师指定具体题目，学生通过查阅相关文献，深入分析基本原理和方法，设计相应的算法，编程实现，并给出实验结果及分析，充分调动学生学习的积极性，提高学生利用理论知识解决实际问题的能力。三次专题讨论课分别是：

⑴ 数字图像表示及其处理专题讨论课。题目为：用VC或者Matlab实现常见图像文件格式的显示；常见的图像文件格式，以及用VC或者Matlab实现图像格式转换；给出国内外先进的图像处理系统软、硬件，名称、作用，以及先进性的体现。

⑵ 图像变换专题讨论课。题目为：给出小波变换常用的小波基的基本原理、具体应用，以及用VC或者Matlab的具体实现；给出小波变换、脊波变换、子波变换的基本原理、具体应用，用VC或者Matlab的具体实现；给出小波变换以及小波变换在图像处理中的具体应用，以及用VC或者Matlab的具体实现；给出快速傅里叶变换算法的具体内容，以及时间复杂度或者运行时间的分析。

⑶ 图像编码专题讨论课。题目为：给出小波变换图像编码的基本思想与特点，编码中需要解决的问题，实验结果及分析；给出基于感兴趣区域的小波图像编码方法的基本思想，具体步骤，实验结果及分析；给出几种图像编码质量评价方法，具体实现，实验结果及分析；给出基于子波变换的图像编码基本思想与特点，具体步骤，实验结果及分析。

此外，鼓励学生积极参与本校教师主持的科研项目，如国家自然科学基金、863项目、科技支撑计划，以及北京市自然科学基金等项目。这些项目涉及到视音频检索、视音频理解、视音频处理、网络信息分析、文字处理、信息检索、网络行为分析、图像识别等研究方向。通过参与项目，系统地锻炼了学生的科研能力和思维创新能力，也为今后的科研工作打下了坚实基础。

2.4 改革考核评价方式

图像分析论文篇7

DOI：10.3969/j.issn.1008-0821.2013.11.023

〔中图分类号〕G254 〔文献标识码〕A 〔文章编号〕1008-0821（2013）11-0100-08

图像检索是信息检索的重要组成部分，从20世纪70年代开始，很多学者都对图像检索技术进行研究，先后提出基于文本的图像检索、基于内容的图像检索以及基于语义的图像检索技术。传统的文字搜索主要是以关键词匹配为基础，着重优化搜索路径算法，加强建立学习和反馈模型，比如百度和谷歌都取得了巨大的成功。但图像检索与文字检索存在很大的区别，存在很多问题，如图像内容描述、语义理解鸿沟、特征提取复杂等。这些问题制约着图像检索研究领域的进一步发展，也是图像检索研究的热点问题。

本文以CNKI近十年来发表的图像检索文献为研究对象，以文献关键词为研究载体，以共词分析方法为研究基础，采用聚类分析、多维尺度分析、社会网络分析等方法，结合可视化软件Ucinet，绘制近十年来图像检索研究图谱。笔者研究目的在于通过这篇研究论文，图像检索研究领域的学者或者是对图像检索感兴趣的人可以很清晰的发现近十年来图像检索研究领域过去的关注点、现在的热点以及未来的发展趋势。

1 文献来源及研究方法

1.1 研究文献来源

为了确保检索的文献符合笔者的分析需求，笔者检索条件设置为：数据来源为CNKI（中国学术文献网络出版总库），检索时间为2003-2012年，关键词中包含“图像检索”，检索策略为“精确”进行检索，共检索出期刊2 477篇。

1.2 基于研究样本的文献计量情况

论文载文量的变化，在一定程度上反映该学科的理论水平和发展速度[1]。笔者对国内图像检索相关的2 477篇文献进行统计，并利用Excel软件绘制出图像检索文献年代分布折线图，如图1所示。图1的数据表明，图像检索论文数量从总体上来看，是成上升趋势，在2008年达到顶峰。论文增长曲线呈现“S”型。根据普莱斯逻辑增长曲线规律，笔者发现图像检索研究是逐步发展的，并逐渐走向成熟的过程。图1 2003-2012年图像检索研究期刊发文量

1 通过文献计量软件SATI 2.2软件，对检索的2 477篇文章的文章进行统计分析，得到作者的总人数为3 917人（包括第一作者、第二作者等）。经过计算，笔者发现西安电子科技大学多媒体研究所的周利华教授和河南理工大学的孙君顶教授发表的文章最多，同为33篇，根据普莱斯计算公式，核心作者发文数m≈4.31，因此将文章数量为5篇及以上的著者定为核心著者，统计得到核心著者有153人，占全部作者总数的3.9%。笔者筛选出发文数量排名前20的作者及其单位，如表1所示。从表1中，我们发现图像检索研究机构以高校为主，并且相对集中。西安电子科技大学、西北大学、西北工业大学、河南理工大学等。高校是图像检索的主要研究机构，这也表明，图像检索的研究目前以理论研究为主，实际应用并不广泛。

表1 2003-2012年图像检索期刊发文量前20位作者及其单位

1.3 期刊分析

期刊载文分析主要反映学科研究文献的期刊分布情况，期刊的分布也可验证布拉德福定律。由于核心期刊的载文量水平较高，更能反映学科研究水平，因此本文的期刊分析，都以核心期刊为主。表2是排名前20位发文量超过15篇的核心期刊。

表2 载文前20种核心期刊表

1.4 研究主题分析

研究主题变化通过关键词词频变化来揭示。本文对2 477篇图像检索的关键词进行统计，在统计过程中，对一些关键词进行合并处理，如“基于内容的图像检索”、“基于内容”和“CBIR”；“纹理”和“纹理特征”等。为了能够清晰的揭示出研究主题的变化，笔者对每一年的论文关键词分别进行统计，统计结果见表3。

表3 2003-2012年论文关键词词频变化表

随着时间的推移以及研究的深入，图像检索领域的研究热点也在不断的变化中。笔者参考安徽大学储节旺教授将热点关键词进行分类的研究方法，将图像检索领域的热点关键词分为3种类型：恒星关键词、流星关键词和新星关键词[2]。（1）恒星关键词指的是那些一直处于研究热点的关键词，如“图像检索”、“基于内容的图像检索”、“相关反馈”、“特征提取”、“颜色直方图”等，这类关键词也是图像检索的核心内容。（2）流星关键词指的是那些研究一段时间后缺乏持续研究的关键词，如“图像数据库”、“医学图像检索”、“数字图书馆”等。这类关键词研究的内容深度不够，没有涉及到图像检索的核心内容，研究的是图像检索应用研究。图像检索研究本身存在很多技术有待突破，目前主要停留在理论研究层面，这些基于图像检索技术的应用研究明显研究深度和热度。（3）新星关键词指的是那些总体增长比较平稳并且在未来会受到重点研究的关键词，如“图像分割”、“小波变换”、“支持向量机”、“灰度共生矩阵”等。这类关键词涉及到图像检索的核心技术，也是未来提高图像检索速度和效果的关键所在。

1.5 高频关键词的确定

通过文献计量软件，统计得出2 477篇文章中共有关键词3 463个。通过对关键词进行认真分析，将一些表述相近意思的关键词进行合并，如“基于内容的图像检索”、“CBIR”和“基于内容图像索”；“纹理”和“纹理特征”进行合并，取词频大于20的关键词作为高频关键词，共有48个，如表4所示。表4 高频关键词表（部分）

关键词频次关键词频次图像检索1 190直方图48基于内容的图像检索488基于内容44相关反馈261灰度共生矩阵43特征提取210MPEG-743颜色直方图130数字图书馆37纹理特征94相似度37支持向量机86医学图像检索36颜色特征72图像特征35小波变换71图像32图像分割65检索31形状特征58信息检索30相似性度量56图像语义30图像数据库54图像分类29颜色52颜色空间28聚类49不变距27

为了进一步的分析关键词内部之间的联系，对48个高频关键词进行两两检索，形成48×48的共词矩阵，如图2所示。图像检索基于内容的

图像检索相关反馈特征提取颜色直方图纹理特征纹理图像检索1 18910129104814942基于内容的图像检索103876341161916相关反馈12963261238310特征提取1044123210599颜色直方图81168513001图2 高频关键词共现矩阵（部分）

1.6 构造相关矩

通过对共词矩阵进行卡方检验，发现共词矩阵不符合正态分布规律，为了能够用更多的统计方法对数据进行统计分析，需要利用Ochiia系数对共词矩阵进行转换，构造相关矩阵和相似矩阵。用Ochiia系数将共词矩阵转换成相似矩阵，如图2所示。但是相似矩阵中的0值过多，统计时容易造成误差，为了方便进一步处理，用1与全部相关矩阵上的数据相减，得到关键词相异矩阵，部分数据如图3所示[3]。

图像检索基于内容的

在相似矩阵中，数值的大小表明了两个关键词之间距离的远近，数值越大表明关键词之间的距离越近，相关程度越大；数值越小则表明关键词之间的距离越远，相关程度越小。图像检索基于内容的

在相异矩阵中，数值越小表明关键词之间的距离越近，相关程度越大；数值越大则表明关键词之间的距离越远，相关程度越小。

1.7 知识图谱分析

科学知识图谱是显示科学知识的发展进程与结构关系的一种图形。它的悄然兴起，一方面是揭示科学知识及其活动规律的科学计量学从数学表达转向图形表达的产物，另一方面又是显示科学知识地理分布的知识地图转向以图像展现知识结构关系与演进规律的结果。基于社会网络的Ucinet软件，通过构建行动者节点及其联系网络的互动关系，解释社会网络的层次性、等级性、结构性等，并以网络图谱的形式揭示该研究领域的主题热点[4]。图5 关键词共现图谱

分析显示，网络密度为10.95%，中间中心度为19.62%，一致性指数为0.962，上述3个指数表明，关键词共现网络集聚程度不高。其中，图中节点大小由关键词频次决定，线条的粗细，由两个关键词共现的次数决定。线条越粗，表明共现次数越多，反之，表明共现次数越少。节点围绕图像检索、基于内容的图像检索、相关反馈、特征提取形成相对密集的圈层。图5，点的中间中心度排名前15位的分别是图像检索（982.269，1）、基于内容的图像检索（529.658，2）、相关反馈（365.832，3）、特征提取（343.531，4）、颜色直方图（160.999，5）、纹理特征（108.175，6）、支持向量机（95.334，7）、颜色特征（78.884，8）、小波变换（73.287，9）、图像数据库（57.513，13）、形状特征（46.640，11）、相似性度量（45.965，12）、聚类（44.494，15）、医学图像检索（40.030，22）、图像分割（34.788，10），括号内为关键词的中间中心度及频次排序。网络连线的粗细能反映节点的关联度，是识别意义类团的重要特征，如“图像检索——基于内容的图像检索——图像分割——相关反馈——纹理特征”、“图像检索——颜色直方图——颜色特征——兴趣点——颜色量化——特征匹配”、“图像检索——聚类——语义鸿沟——高层语义——图像索引”、“图像检索——特征提取——纹理特征——相似度——图像数据库——医学图像检索——图像检索系统”等。

1.8 多维量表分析

多维量表分析（MDS）是将一组个体间的相异性数据经过MDS转换成空间的构形，且尽可能保留原始数据的相对关系。在SPSS 19中文版中，选择“分析——度量——多维尺度（ALSCAL）”，得到空间二维图，如图6所示。图6 多维尺度分析结果图

从图6可以看出，关键词大体可以分为六大类。第一类，语义图像检索、多媒体数据库、纹理检索、图像匹配、空间关系、高层语义、主色调、纹理谱、位平面、粗糙集、纹理图像检索、商标图像检索、环形颜色直方图；第二类，纹理分析、边缘检测、图像检索技术、图像检索系统、兴趣点、搜索引擎；第三类，视觉特征、半监督学习、相关反馈、流形学习、多示例学习支持向量机、图像检索；第四类，图像特征、不变距语义、语义鸿沟、相似性度量、相似度、图像分类；第五类，数字图书馆、聚类、形状特征、颜色特征、特征提取；第六类，医学图像、图像数据库、医学图像检索、灰度共生矩阵、颜色距、图像语义、MPEG7、图像分割、颜色空间、图像标注等。

2 研究热点分析

通过上文对图像检索研究领域的多维计量分析（知识图谱分析、多维尺度分析）以及关键词词频的变化分析，笔者发现目前国内对图像检索的研究领域比较集中，主要集中在图像检索的算法研究、图像特征研究（如颜色特征，纹理特征，形状特征等）、图像语义研究等。具体分为以下几个方面：

2.1 图像算法研究

图像算法研究是图像检索的研究热点之一，不同的学者从不同的角度提出不同的图像检索算法，来提高图像检索的效果。鲁珂等提出基于支持向量机的理论提出了一种用于图像检索的半监督学习算法[5]。许相莉等提出一种基于粒子群的图像检索相关反馈算法，使得用户对检索目标的理解逐渐清晰，能够有效全面的搜索图片库，同时避免多次反馈造成的算法效率和检索效果之间的矛盾[6]。王崇骏等在IPSM模型对图像的语义分类特征进行描述和提取的基础上，提出并实现了基于高层语义的图像检索算法以及基于高层语义的相关反馈算法[7]。李健提出一种以曲波变换为基础，综合香农熵与频域子带能量特征的图像检索算法。该方法用香农熵进行预分类，用子带图像的能量特征进行相似度度量，并加入检索者的反馈信息，实现图像的精确检索[8]。牛蕾等回顾了早期的启发式相关反馈算法和近期的最优相关反馈算法，对现有的相关反馈算法进行了分析、总结和对比，并提出了今后相关反馈算法的发展方向[9]。因限于篇幅，不一一列举图像检索算法。

2.2 图像特征研究（颜色特征、纹理特征、形状特征、空间关系特征等）特征提取是计算机视觉和图像处理中的一个概念，是图像检索的核心内容。它指的是使用计算机将图像信息进行分解、匹对，决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集，这些子集往往属于孤立的点、连续的曲线或者连续的区域。目前，特征提取算法各种各样，算法计算复杂性和可重复性也非常不同。颜色特征是一种全局特征，描述了图像或图像区域所对应的景物的表面性质，由于颜色特征不能反映颜色信息的空间分布等特点，因此基于颜色特征的图像检索存在一定的缺陷，影响图像检索效果。王向阳等提出一种鲁棒的多特征彩色图像检索新方法，实验结果表明，该方法不仅能够准确、快速的检索出用户所需图像，而且对光照、锐化、模糊等噪声攻击均具有较好的鲁棒性[10]。纹理特征也是全局特征，它和颜色特征不同，纹理特征不是基于像素点的特征，它需要在包含多个像素点的区域中进行统计计算，这样提高了模式匹配的成功率，但光照、反射情况对图像检索存在一定干扰。安志勇等在构造了具有旋转、平移和尺度不变的纹理特征的基础上，提出基于纹理特征的图像检索算法，该算法具有旋转、平移和尺度不变性，与其它方法相比，具有较高的检索率[11]。形状特征有两类表示方法：一类是轮廓特征；另一类是区域特征。图像的轮廓特征主要针对物体的外边界，而图像的区域特征则关系到整个形状区域。形状特征可以比较有效地利用图像中感兴趣的目标来进行检索，但图像形状本身存在容易出现变形的情况，而且人的主观意识对图像形状的判别也存在影响。何姗等提出一种基于兴趣点的图像检索新方法ACSM，利用兴趣点的位置信息，提取兴趣点周围局部区域的颜色矩特征和区域形状不变矩特征，由于将颜色和形状特征有机结合，ACSM算法有效提高了图像检索的准确性[12]。空间关系，是指将一幅图像进行分割，分割出来的多个目标之间的相互的空间位置或相对方向关系（邻接、重叠等关系）。空间关系特征的使用可加强对图像内容的描述区分能力，但空间关系特征常对图像或目标的旋转、反转、尺度变化等比较敏感。张伟等构造了在平移缩放旋转下保持不变的基于度量矩阵特征值的图像空间关系描述子。研究表明这种描述与人的主观视觉心理相一致，在平移缩放旋转下以及小噪声下具有较强的鲁棒性，具有较好的类别可分离性[13]。

2.3 图像语义研究

图像语义研究是图像理解的重点和难点，在现实生活中，人的视觉特征因人而异，人对同一副图像的情感认知也不尽相同，导致不同的人对同一副图像特征提取出现天壤之别。如何对一幅图像的特征（颜色、纹理、形状等）描述与视觉特征相吻合，进行客观的语义描述，实现基于语义的图像检索是国内学者研究的热点之一。图像语义研究包括语义鸿沟、高层语义、底层特征语义等角度。语义鸿沟是图像检索系统广泛存在的问题之一，它是人对图像相似性的判别依据与计算机对相似性的判别依据之间的不同，造成了人所理解的“语义相似”与计算机理解的“视觉相似”之间的“语义鸿沟”的产生。张菁等针对相关反馈和感兴趣区检测在弥补语义鸿沟时存在主观性强、耗时的缺点，提出了视觉信息是一种客观反映图像高层语义的新特征，基于视觉信息进行图像检索可以有效减小语义鸿沟[14]。高层语义主要涉及图像的场景语义、行为语义和情感语义。一般而言，高层的图像语义往往建立在较低层次的语义获得的基础上，并且层次越高，语义越复杂，涉及的领域知识越多，也是图像语义描述的难点之一。吴楠等利用图像的高层语义信息来进行图像检索，在深入研究图像高层语义的低层特征描述的基础上，提出了图像语义的层次划分，并对每个高层语义层提出了语义抽取和检索算法。该检索算法可以有效地对图像高层语义信息进行提取，并可作为新型高效图像检索系统的一个模型[15]。袁薇等指出了应用图像的高层语义特征和底层颜色特征作为图像检索的综合指标，将图像文本和视觉信息融合起来，给出了一种综合语义和颜色特征的图像检索系统的体系架构，以填补多媒体底层特征和高层语义之间的差异[16]。

2.4 图像检索技术研究

图像检索技术的发展是一个不断进化的过程，最初是基于文本的图像检索。基于文本的图像检索是首先对图像的特征进行文本描述，然后利用关键词进行检索图片，费时费力，而且检索效率低下，容易出现错误。为了克服基于文本的图像检索的局限性，提出了基于内容的图像检索系统，通过特征提取和高维索引技术进行检索，通过比较视觉特征的相似度来获得检索结果。洪俊明总结了图像数据库检索技术的发展轨迹和特点，针对基于内容的图像检索技术中的局限性，从计算机底层硬件的角度提出了基于内容检索的流水索引法[17]。但在现实生活中，人们往往习惯于对图像的语义进行检索，而不是图像的特征，如何建立从图像的低层特征到高层语义的映射，获取图像的语义概念，并在此基础上进行语义检索，是图像检索技术的一个新的方向，即基于语义的图像检索技术。陈久军等提出图像语义检索整体框架，系统采用XML技术，将图像内容层式描述、图像语义对象自动获取、图像语义相似测度等功能模块加以融合，实现语义层面的图像检索[18]。

3 结语

国内对图像检索的研究热点主要集中在图像检索的算法研究、图像特征研究（如颜色特征，纹理特征，形状特征等）、图像语义研究等。当然，国内针对图像检索研究的热点还有，比如基于流行学习的图像检索技术、遗传算法、粗糙集理论在图像检索中的应用以及医学图像检索相关技术的研究等等，因限于篇幅，笔者主要列出国内学者研究比较集中的热点问题。通过共词分析法来展现国内图像检索研究的学科热点问题，这类文献基本没有。笔者的目的在于通过这篇研究论文，图像检索研究领域的学者或者是对图像检索感兴趣的人可以很清晰的发现近十年来图像检索研究领域过去的关注点、现在的热点以及未来的发展趋势。本文在研究过程中，也存在不足。在介绍图像检索研究热点问题，因限于篇幅，很多相关热点没有一一展示；在文献选取时，以期刊为检索源，忽略了硕博士论文，对研究结果会有一定的影响；高频关键词的设定、多维量表分析、知识图谱分析等都具有一定的主观性，这些问题是笔者下一步需要完善的地方。

参考文献

[1]张玉双.我国高校图书馆知识管理研究的文献统计分析[J].晋图学刊，2008，（5）：45-48.

[2]储节旺，王龙.近十年国内知识管理研究热点——基于CSSCI数据库的词频分析[J].情报科学，2011，（9）：1425-1429.

[3]Manfred Wettler.Reinhard Rapp Computation of Word Associations Based on the Co-occurrences of Words in Large Corpora[EB/OL].2005-10-09.

[4]（美）林顿·C·费里曼.社会网络分析发展史[M].张文宏，刘军，王卫东，译.北京：中国人民大学出版社，2008：2-3.

[5]鲁珂，赵继东，叶娅兰，等.一种用于图像检索的新型半监督学习算法[J].电子科技大学学报，2005，（5）：669-671.

[6]许相莉，张利彪，刘向东，等.基于粒子群的图像检索相关反馈算法[J].电子学报，2010，（8）：1935-1940.

[7]王崇骏，杨育彬，陈世福.基于高层语义的图像检索算法[J].软件学报，2004，（10）：1461-1469.

[8]李健，牛振山.基于曲波的纹理图像检索系统的设计与实现[J].计算机工程与科学，2011，（3）：62-66.

[9]牛蕾，倪林.基于内容的图像检索中的相关反馈算法[J].计算机工程与应用，2004，（32）：65-70.

[10]王向阳，芦婷婷.一种鲁棒的多特征彩色图像检索新方法[J].中国图象图形学报，2007，（10）：1757-1760.

[11]安志勇，曾智勇，赵珊，等.基于纹理特征的图像检索[J].光电子·激光，2008，（2）：230-232.

[12]何姗，郭宝龙，洪俊标.基于兴趣点颜色形状特征的图像检索方法[J].微电子学与计算机，2006，（3）：40-43.

[13]张伟，何金国，桑佩罗布.基于度量矩阵特征值的图像空间关系描述[J].计算机应用研究，2010，（11）：4376-4378.

[14]张菁，沈兰荪，David Dagon Feng.基于视觉感知的图像检索的研究[J].电子学报，2008，（3）：494-499.

[15]吴楠，宋方敏.一种基于图像高层语义信息的图像检索方法[J].中国图象图形学报，2006，（12）：1774-1780.

图像分析论文篇8

1 模式类区分方法[1]

对于图文混排的复杂度高的文档图像一般采用自底向上的版面分析策略，在通过连通区搜索算法（包括二次分析）获得版面全部连通区信息后即面临文本区域和图像区域的连通区信息区分问题。为方便讨论，依模式识别理论我们称文本区域和图像区域的连通区为不同的模式类对象。由于文本区域和图像区域不能出现交叠（这种交叠情况我们结合后续相同模式类对象合并过程称为合并或聚类风险），但试验表明即使在刚刚获得版面全部连通区信息，即在尚未展开后续合并等处理过程就已经存在文本区域和图像区域交叠的情况，或者说存在合并风险问题。所以有理由说合并风险将是伴随相同模式类对象合并过程始终的。由于问题的复杂性，受二分法思想启发，我们把问题逐步分解，即确立图文分解的方法。

对于一个待分析图像文档，我们将图像中的图像模式类对象：边框线和标题在原图像中滤除，同时将所提取的文字图像部分就其在文档中区域信息（该信息由对原图像的连通区搜索得到）规范化为图像文档，即作为原始文档的伴随图像。由于生成伴随图像，初步排除图像模式类对象的干扰，从而就其文字图像的版面分析的复杂度大为降低[2-3]。

需要说明的是这仅是初步做到图文分解，就是说在伴随图像中仍可能存在图像模式类信息，为此我们采取“渐进合并，特征凸现”的策略在后续处理中解决（对此将作另文详述）；另一方面的关键问题是仍无法保证对不同图像模式类对象（如文字、图像甚至表格）分析的互不干扰性，而这一点正是我们要求系统所能体现出的智能性，它是由聚类稳定性算法保证实现的。

2 辅助功能模块的运用

承前所述，随着并行合并过程进行，由于对模式类对象是采用“渐进合并，特征凸现”的策略，模式类对象的确定要建立在一定前提条件上，即要待其模式类特征从不明显到明显之后，但在此过程完成时会有相互冲突情况产生。尽管上述算法的采用极大提高了系统的版面分析质量，但必须佐以其他功能模块的运用来处理这种更复杂的情形。该模块的功能将分别不同情况实现：1）择取强势特征模块，该情况下将保留取强势特征对象同时舍弃异类对象；2）折中退让，该情况下将根据冲突的情形做单方面的退让，如可以是文本类对象退让图像类对象（简称“文退图”）等，由于该情况较复杂，鉴于篇幅作者只做一般情形解释。

3 结论

对于模式类区分方法可以做策略层面的理解，这对于整个版面分析系统的质量是举足轻重的，但没有其他方法的辅助则很多具体问题仍不可得以完善和解决，因为版面分析要面临很多复杂的模式识别问题。本文正是探讨通过两者的融合从而是系统最终能体现出智能性的特点，进而获得实际应用的价值。

【参考文献】

图像分析论文篇9

在服饰史的研究中，常用资料可分为三种，包括文献资料、图像资料和实物资料。在文献资料和实物资料丰富的情况下，这两类资料可以为服饰研究提供佐证。而图像资料，对于服饰史研究也具有重要的作用。本文以文艺复兴时期婚礼服饰研究为例，讨论图像在服饰研究中的应用。

由于文艺复兴时期的服饰实物留存非常少。将图像资料作为主要资料非常有必要。艺术图像中包含着丰富的信息。比如，通过图像的观察，我们可以发现，在婚礼前后或者当天新郎新娘如何穿着，服装的面料是怎么样，色彩构成如何；新娘的嫁妆中包含的各种精美奢侈的服装，是不是新娘婚礼的服饰，是怎么样被艺术家表现或者创作的等等。

1、图像的研究理论――以图证史

图像资料对于历史研究非常重要。在西方，将图像作为视觉材料进行阅读是艺术史特有的理论传统。有学者认为，图像学是研究文艺复兴的图像资料最合适的理论。潘诺夫斯基在《视觉艺术的意义》一书中指出，对艺术作品的研究可以分为三个层次：前图像志，即对图像进行单纯的形式分析；图像志分析，即对于特定主题的传统意义进行分析；图像学分析，即根据对于特定题材和概念的研究发现图像的内在含义。图像学的研究方法，打破了对于图像研究限于形式和风格的障碍，能够还原视觉艺术与文化的真正意义。

尝试将图像学运用到服饰史研究中，不仅能够使图像研究有据可依，而且，在分析图像中服饰的过程中，可以先从形式分析人手，再发现服饰图像特定题材的共性，然后对当时服饰的深层次含义进行解读。

2、图像为主要研究资料优缺点及研究方法

以图像为主要研究资料，最大的优点就是直观。通过观察比较，可以看出腰线的高低、服饰面料的厚薄、图案和纹样，也可以看出模特如何与服装互动的。图像资料也具有一定的迷惑性。不同时代的艺术品风格，是在社会大环境的影响下的形成、在时代的艺术环境下生长的。艺术家对于创作的看法，赞助人的意图也使图像资料更加复杂。《以图证史》指出，对于图像的史料考证，在任何时候都是必要的。曹意强《可见之不可见性》缪哲《以图证史的误区》也提到图像研究理论需要与其他的理论结合使用。在研究时，要灵活运用服饰史、艺术史的各种可能应用的理论。

为了有效的利用图像直观的特点，一定程度上排除其不确定，得到较为真实可信的结论，以图像为主的文艺复兴时期婚礼服饰的研究方法主要如下：

2.1挑选图像

首先，将收集的图像资料进行集中，对图像进行常规判断，如创作年代、题材和写实程度等。从中挑选真实程度较高的有代表性的图像作为研究重点。

2.2比较印证

将选出图像与同时代相关图像、文献和实物资料相印证，证明其可信程度。同时，将服装图案、面料、形制、结构、剪裁、配饰等蕴含在图像中的信息挖掘出来再与实物、文献等资料相互印证。

2.3视觉表现

将图像中的婚礼服饰以效果图的形式做以总结，得出文艺复兴图像研究中婚礼服的结论。

3、研究资料

不同图像有不同的研究和考证方法，不同图像的能够被利用的程度也不同。同样就以婚礼服饰研究为例，图像资料可以按照形式、功用、表现服饰的程度分类。

3.1按形式分类

按照形式分类，应用的图像材料可分为：壁画、油画、蛋彩画、版画、手稿等。

版画和手稿，如文艺复兴时期画切萨雷在《文艺复兴时期的服装》记录当时新娘服饰的印刷品，这类图像材料通常是由生活在当时代的人为了记录服装或者历史并流传下来的，具有较高的真实性。但由于材料是黑白印刷，当时的印刷技术又存在一定的局限性，这类图像对于研究细节和服饰的色彩有局限。

壁画油画和蛋彩画。这类图像材料通常是画家出于各种目的，表现宗教题材的或者世俗生活的绘画。其中婚嫁箱作为婚姻的必备品，绘制有许多与婚姻、道德有关的图像，是非常重要的研究资料。文艺复兴时期作为西方艺术的一个高峰，当时的绘画技巧与之前相比有了很大的的进步，所以此类图像资料具有较高的研究价值。

3.2按功用分类

根据题材和功用的不同，文艺复兴时期图像还可以分为，宗教与巫术、政治、私人领域和快乐的艺术四种。

宗教与巫术通常是根据圣经的内容和使徒的故事绘画的，具有教育和说教的作用，是中世纪和文艺复兴时期最多的图像；政治功用的图像是指为了表现教皇和大家族的政权成就、宣扬政治而绘制的一类图像；私人领域指描绘私人领域的图像，如结婚生育和死亡等。在15世纪以后，描绘肖像婚姻等世俗化图像数量逐渐增多；快乐的艺术是指出于个人喜好和欣赏而绘制的一类图像。这类图像常常会带有赞助人的偏好等干扰因素。

在用图像做服装史的研究时，这几类图像都具有一定的复杂性，比如绘画中是否存在程式化的表现方法，艺术家的动机是要真实的反应世界还是把可见的世界想象化。所以，在研究图像时，需要分析各种图像资料的可信度和真实性，并加以论证。

3.3按表现服饰程度分类

图像分析论文篇10

中图分类号: TP391.4 文献标志码:A

Texture classification based on

quaternion wavelet transform and multifractal characteristics

GAO Zhi1*, ZHU Zhihao2, XU Yonghong1, HONG Wenxue1

(

1.Institute of Electrical Engineering, Yanshan University, Qinhuangdao Hebei 066004, China;

2.Qinhuangdao Tianye Tolian Heavy Industry Company Limited, Qinhuangdao Hebei 066004, China

)

Abstract:

The paper incorporated the multifractal analysis method into the idea of Quaternion Wavelet Transform (QWT), which took advantage of the rotationinvariant properties and multifractal properties of texture image, and could make up for the lacks of ability to decompose input image into multiple orientation in texture classification when using wavelet transform. The experiment of texture classification using the images from UIUC shows the method has higher classification accuracy and the average correct classification rate is 96.69%. It proves this texture classification method is reasonable and effective.

Key words:

Quaternion Wavelet Transform (QWT); multifractal; texture classification; machine vision;texture image

0 引言

纹理是多数图像的基本特性,在机器视觉和模式识别中起着关键性的作用[1]。纹理分类包含两个重要的基本问题：一是如何描述纹理的特征;二是如何在纹理之间定义合适的距离或相似度测量[2]。基于以上两个问题,纹理图像的特征必须具有旋转不变性,同时还要在有效的内部空间定义纹理。目前针对纹理分析的特征提取及分类方法有很多。然而,这些方法都仅限于在小邻域的单一范围内的空间相互作用分析。因此,这些方法往往只适用于显微纹理的分析,此外这些方法的单分辨率技术也导致了纹理分析结果并不理想。

近年来,小波变换作为一种多尺度分析工具，被应用于纹理分析[3]、基于小波框架的纹理分类[4]等。虽然小波变换在纹理分类中已经取得了显著成果,但小波变换仅仅是把给定图像分解成0°,45°,135°方向上的水平、对角线和垂直方向上的3个定向平滑子带。这就限制了小波变换对于旋转不变纹理图像的分析[5]。

由于2D实值信号可以用四元数表示,因此相对应的四元数小波尺度函数和小波函数的构造就成为分析2D信号的关键。四元数小波变换(Quaternion Wavelet Transform, QWT)理论是四元数理论和小波分析理论相结合产生的,可以为2D图像提供具体的相位信息。相对于传统小波变换,QWT具有旋转不变的特性,并且能对图像进行局部幅值相位分析。这些都可以弥补小波变换在图像处理中的一些不足。目前国内外已有将QWT应用到图像处理上的研究。文献[6]提出了基于QWT理论的图像多分辨率视差估计方法。文献[7]充分利用了QWT的平移不变性、旋转不变性进行图像分析及处理。而文献[8]首次将QWT应用于纹理分类,并证明了其方法的可行性。

图像分析论文篇11

中图分类号：TP391.41

前言：智能图像处理是计算机图形图像处理是为基本内容之后发展的，着重介绍这两者之间的发展和应用，尤其在计算机应用的各种技术，以便了解智能图形图像技术的发展趋势和应用领域。

1图像处理与分析技术

由于计算机硬件计算速度的不断提高和成本的下降，图像处理和分析技术在农业方面尤其是作物领域已变得越来越重要。大量研究表明，利用计算机图像技术可很大的提高测量分析的精度和效率，更改以往作物研究中难于定量化的问题，实现信息采集的智能化和自动化。图像处理主要就在图像之间进行的变换。假如说图像处理是一个从图像到图像的过程，则图像分析是一个从图像到数据的能力。主要是对其中的图像所需要分析的目标进行检测和量定，而我们所获取的客观信息进行对图像的重新描述。然而图像的处理与技术分析将会随着计算机成熟和发展工程中而迅速发展起来的一个重要应用技术领域。

2图形图像数字处理技术

数字图像处理是30年来迅速发展起来的一门技术，由于对图像处理的要求还在不断增加，图像的应用领域还在继续的扩大，因而对图像处理的课题的理论在世界的变化中也处于变化，我们需要对其进行补充和完善。而本文章主要是对图像处理的中所产生的数学问题，学习并研究图像的基本处理中涉及到的数学问题，让大家可以更好的学习掌握图像的微处理技术。

2.1数字图像处理的优点

（1）再现性好。数字图像处理与模拟图像处理的根本不同在于，它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。只要图像在数字化时准确地表现了原稿，则数字图像处理过程始终能保持图像的再现。（2）处理精度高。按目前的技术，几乎可将一幅模拟图像数字化为任意大小的二维数组，这主要取决于图像数字化设备的能力。现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高，这意味着图像的数字化精度可以达到满足任一应用需求。对计算机而言，不论数组大小，也不论每个像素的位数多少，其处理程序几乎是一样的。换言之，从原理上讲不论图像的精度有多高，处理总是能实现的，只要在处理时改变程序中的数组参数就可以了。回想一下图像的模拟处理，为了要把处理精度提高一个数量级，就要大幅度地改进处理装置，这在经济上是极不合算的。（3）适用面宽。图像可以来自多种信息源，它们可以是可见光图像，也可以是不可见的波谱图像（例如X射线图像、射线图像、超声波图像或红外图像等）。从图像反映的客观实体尺度看，可以小到电子显微镜图像，大到航空照片、遥感图像甚至天文望远镜图像。这些来自不同信息源的图像只要被变换为数字编码形式后，均是用二维数组表示的灰度图像（彩色图像也是由灰度图像组合成的，例如RGB图像由红、绿、蓝三个灰度图像组合而成）组合而成，因而均可用计算机来处理。即只要针对不同的图像信息源，采取相应的图像信息采集措施，图像的数字处理方法适用于任何一种图像。小波重构的数据传递示意图如图所示：

（1）图像的编码压缩图像文件是编码压缩技术可减少描述图像的数据量等，用来节省了图像的传输、处理的时间所占用的存储器容量。压缩可以在不失真的前提下来获得，其也可以在允许失真的条件下进行。编码是压缩技术当中最最重要的方法，它在图像处理技术中是发展最早且比较成熟的技术。（2）首先，对于图像的分割技术将会给图像带来某种特殊的意义所表现出来的具有甄别能力。从而对图像的线条、颜色所进行处理，并需要进一步对图像的分割技术进行了解，图像的分割技术目前也是大众中非常流行的解决图像问题的方法。因此，对于图像的研究我们还要不断地进行深入的了解。图像的描述是对于图像所进行的甄别和理解作为前提。作为最简单的二值方法，我们利用它来描述物品的特性。（3）图像在生成和传输过程中常受到各种噪声的干扰和影响，使图像质量下降。为了抑制噪声改善图像质量，必须对图像进行平滑处理，可以在空域或频域中进行。

数字图像的平滑技术分为两大类：1）全局处理，即对噪声图像地整体域大的块进行校正以得到平滑的图像。缺点：计算量大。2）局部算子，仅对某一像素的局部小邻域的一些像素加以运算。优点计算率高。

2.2图像数字化

人类感知外界信息80%以上是通过视觉观察到的，而图像就是人们所获取的一个重要的方面，人们眼睛所获取的图像在大脑中的中枢神经系统中发挥重要的作用，准确的图像也是人们获取彼此信息的来源。其伴随着人们所生活的各个领域。图像处理虽然也可以用模拟技术或者光学方法来实现，但目前主要在我国还是大多数还是通过利用计算机的一些功能来实现，通过对图像的处理，我们能晓得其背后的重要意思，图像也在日常的生活中越来了越广泛。对数字图像的处理目前来说还是一个开始，其主要是在对形态数学、立体学、集合论等方面。因此，图像处理一般是指数字图像处理。

计算机图像处理之前的图像数字化的基本步骤，是把真实的图像转变成计算机使用的存储格式。数字化过程分为量化和采样处理两个步骤。量化的结果是图像能够容纳的颜色总数。采样的结果就是通常所说的图像分辨率。量化是指要使用多大范围的数值来表示图像采样之后的每一个点，这个数值范围包括了图像上所能使用的颜色总数。

3图像测量技术

随着计算机技术的发展和电子成像器件的成熟，图像测量日益受到人们重视，应用范围不断扩展。图像测量技术是以近代光学为基础，融光电子学、计算机视觉原理、图像处理技术等科学技术为一体的现代测试技术，并在军事、医学、资源分析、测绘等领域得到广泛应用，取得了巨大成功。由于算法改进和计算机性能的提高，使开发基于图像处理的啤酒瓶快速检测技术成为可能。

4结束语

随着计算机应用技术的发展，图像与图像技术的应用越来越广泛，除了传统的广告、包装宣传，网站设计等方面的应用。也在航空事业、机电事业、国家的安全部门、政司法科、国家的武器研发，新型导弹的定位，还伴有新型科学药物的研发、在工业上企业是非常重要的一门学科、伴随着计算机的技术与人工智能电子的研发智能图像的作用将会占据很大的部分其今后的发展趋势越来好，越来越广。

图像分析论文篇12

1. 引言

随着时代的发展，电视公益广告凭借其丰富多彩的表现形式和广泛的传播力，在人们日常生活中影响日益深远。在语言学领域，很多学者做出了很有价值的研究（黄国文 2001），更多的学者关注到对公益广告的多模态话语分析（孔亚楠 2009），也有少数学者结合电视公益广告的画面对其进行语篇分析（陈瑜敏 2008）。本文将结合电视公益广告中的图像，声音，颜色，语境，背景音乐等其他意义表现形式，以多模态话语分析为理论框架，对电视公益广告“将爱心传递下去”进行话语分析。

2. 多模态理论与互动意义

多模态话语分析主要基于Halliday创立的系统功能语言学（1985/1994），吸收了语言以外的其他符号系统，如图像，也是社会符号的观点。Halliday（1985/1994）认为语言有，即概念，人际和语篇功能三大功能。基于Halliday的系统功能语言学，Kress & Leeuwen（1996）将三大语言功能理论延伸到视觉模式，创建了视觉语法理论。

在视觉语法框架中，互动意义是关于图像的制作者、图像所表征的事物（包括人）和图像的观看者之间的关系，同时提示观看者对表征事物应持的态度。Kress & Leeuwen（1996）认为影响互动意义的四个要素分别为接触、社会距离、态度和情态。接触是指当图片观看者与图片参与者的目光连接起来所形成的一种矢量。这种运用想象中的直接目光接触的图像被定义为“索取”类图像，即图像参与者直视观看者，表示在向观看者索取什么。当图像参与者与观看者没有形成目光的直视时，图像在向观看者展示着什么，此时这类图像被称为“提供”，即向观看者提供信息。

Kress & Leeuwen的视觉语法框架主要适用于对图片的分析，而O’Halloran（2004）则创立了一个分析电影视觉图像与声响的分析模式：分别从电影的类型、风格，情节、场景、画面、人物去分析电影。本文将基于Kress & Leeuwen（1996）的视觉语法框架与O’Halloran（2004）的分析电影视觉图像与声响的分析模式进行分析。

3. 电视公益广告“将爱心传递下去”的互动意义分析

电视公益广告“将爱心传递下去”2006年在央视播出，受到了观众的一致好评。该广告讲述了日常生活中的一个小片段。故事开端部分，夜幕降临，妈妈在床边给孩子洗脚，边洗边温柔地讲着“小鸭子游啊游……”的故事。孩子上床后，妈妈又去打水为老人洗脚。紧接着，故事到了发展部分，老人爱怜地说：“你也忙了一天啦，歇一会儿吧。”“不累。妈，烫烫脚啊对您的腿有好处。”妈妈微笑答到。此时，孩子在旁边看到了这幅画面，听到了妈妈与奶奶（外婆）的对话。随即，故事的高潮出现，当妈妈继续回房看孩子时，孩子不见了，妈妈转身，只见孩子端着脚盆、步态蹒跚地边走边说：“妈妈，洗脚。”最后，镜头画面一转，发展到结束部分，孩子边为妈妈洗脚边用幼稚的声音说：“妈妈，我也给你讲小鸭子的故事。”同时画外音进入：“其实，父母是孩子最好的老师。”

本文主要探讨接触要素在该公益广告中的作用。想象中的直接目光接触的图像被定义为“索取”类图像，当图像参与者与观看者没有形成目光的直视时，这类图像被称为“提供”，即向观看者提供信息。但是在整个这段广告中，三个主要角色的面目特写都没有与观众形成目光的直接接触，即理论上没有向观众“索取”情感上的共鸣。但是，在这几个特写中，妈妈给奶奶洗脚时温柔的笑容，老人祥和欣慰的笑容，再就是孩子看到妈妈给奶奶洗脚时认真而稚嫩的模样，孩子给妈妈端洗脚水时真诚的面孔，这些画面理论上只是向观众提供信息，即人物的心理变化等。但是，在提供信息的同时，能够让观众反思自己是不是对父母做到了尊敬与孝顺，自己是否为孩子树立了良好的榜样。经过分析，我们可以看出，这些“提供”类图像一方面在很大意义上能够引起观众心理上的共鸣，从而刺激观众思想上的变化进而督促观众采取行动，即在另一方面上也起到了“索取”的作用。

4. 结语

现代社会是一个多模态的社会，本文介绍了多模态话语分析的相关理论，并在此基础上以电视公益广告“将爱心传递下去”为例对其进行多模态话语分析。这则公益广告，经过对一系列意义表现形式，如图像，声音，音乐等符号的生产，处理，理解等一系列转换，以视觉模态为主，声音，文字等模态为辅，用朴素的家庭故事，平凡的人物形象投射出更多的内在含义，达到了宣传尊老爱老的中华民族传统美德的主旨。（作者单位：河北联合大学）

参考文献

[1]Halliday，M.A.K.1985/1994.An Introduction to Functional Grammar（2nd edition）[M].London： Arnold.

[2]Kress，G.R.& T.van.Leeuwen.1996.Reading Images ：the Grammar of Visual Design[M].London and New York： Routledge.

[3]O’Halloran，K.2004.Visual semiosis in film[A].In K.O’Halloran（ed.）.Multimodal Discourse Analysis[M].London： Continuum.109-130.