首页

> 学术发表知识库

首页 学术发表知识库 问题

图像构成研究论文

发布时间:

图像构成研究论文

随着现代化科学技术的快速发展,计算机图形图像处理技术也越来越成熟,为人们的生活、工作和学习提供了极大的便利。然而我们该如何写有关计算机图形图像处理的论文呢?下面是我给大家推荐的计算机图形图像处理相关的论文,希望大家喜欢!

《计算机图形图像处理技术分析》

摘 要:随着现代化科学技术的快速发展,计算机图形图像处理技术也越来越成熟,Photoshop、CAE、CAD等计算机图形图像处理软件被广泛的应用在各个领域,为人们的生活、工作和学习提供了极大的便利。在未来的发展过程中,要不断改进和完善计算机图形图像处理技术,推动计算机图形图像处理技术更加广泛的应用和发展。本文简要介绍了计算机图形图像处理技术,阐述了计算机图形图像处理技术的应用。

关键词:计算机;图形图像;处理技术

中图分类号:TP391.41

计算机图形图像技术以计算机网络系统为平台,实现了人们主观意识中图像和真实存在的图形之间的相互结合,各种各样的计算机图形图像处理软件,为人们的主观处理和操作提供了很多的便利,随着现代化科学技术的快速发展,计算机图形图像处理技术的应用前景会更加广阔。

1 计算机图形图像处理技术概述

1.1 基本含义

计算机图形图像处理技术是指通过几何模型和数据将描述性的形象或者概念在计算机系统软件中进行存储、定稿、优化、修改和显现。计算机图形图像处理技术可以用来设计图形的色彩、做纹理和明暗的贴图处理、对图像进行建模设计和造型、消除图像隐线和隐面、对图形曲线和曲面进行拟合操作、数字化的图像存储、图像分割、分析、编码、增强、复原等操作[1],以及对图像进行形式转换,如投影、缩放、旋转、平移等几何形式。

1.2 基本组成

计算机图形图像处理技术的基本组成主要包括计算机硬件设备和计算机图形图像处理软件。计算机硬件设备性能的好坏对于计算机图形图像处理效果有着直接的影响,计算机图形图像处理软件将终端的显示和计算机结合在一起,由于计算机图形图像处理技术自身具有设计、存储、修改等功能,可以迅速整合图片数据,不仅可以保障计算机图形图像的处理效果,也可以有效地提高计算机中央处理器和计算机图形图像处理软件的运行效果。键盘和鼠标作为终端的输入设备,可以完成对图形的修改和定位,并且利用显示器、绘图仪、打印机等显示设备和输出设备,可以完整的保存计算机图片。

1.3 基本功能

计算机图形图像处理技术主要具有五个基本功能:对话、输入、输出、存储和计算。对话功能是指利用通讯交互设备和计算机显示器实现人机交流。输入和输出功能是指计算机图形图像处理软件可以随时输入和输出相关的图形图像。存数功能是指实时监控计算机的图形图像数据进行有效的检索和维护。计算功能是指计算机图形图像处理软件对相关的图形图像进行必要的数据交换和计算分析。

1.4 计算机图形图像处理技术的运行环境

计算机图形图像处理技术的硬件配置主要包括工作站和微型机,软件配置就是建立在工作站和微型机上的运行软件。计算机图形图像处理技术的工作站软件主要有TDI和Alias两种,工作站的软件主要负责处理计算机工作站中的各种图形图像处理。微型机上的计算机图形图像处理软件主要包括3DStudio、Winimage:morph和Photoshop等,3DStudio是微型机上的一种最主要的图形图像处理软件,被广泛的应用在多个计算机系统中;Winimage:morph是一种常用的二维图形图像处理软件,可以将一个图形或者图像制作成另外一个图形或者图像;Photoshop是一个非常专业的图形图像处理软件,其支持图形图像资料的分色制版,给人们进行图形图像处理带来很多的便利。

2 计算机图形图像处理技术的应用

2.1 用户接口

人们利用计算机系统的用户接口来操作多种计算机软件,计算机图形图像处理技术和用户接口的有效结合,借助于计算机操作系统构建友好的人机交互用户图形界面,极大地提高了计算机图形图像处理的简便性和易用性。近年来,微软公司普及和推广的图像化windows系统,充分发挥了计算机图形图像处理技术和用户接口全面融合的重要作用。

2.2 动画与艺术

随着计算机科学技术的快速发展,计算机硬件设备和计算机图形学也在蓬勃发展,静态的图形图像已经很难再满足人们对高质量、优质的、动态的图形图像的巨大需求,因此近年来,计算机动画技术蓬勃发展,特别是一些美术设计人员,多是依靠计算机图形图像处理软件来进行艺术创作。计算机图形图像处理技术的快速发展,同时推动了艺术设计技术的应用和开发,例如,3DS Studio Max三维设计软件和Photoshop二维平面设计软件[2]。

2.3 可视化科学计算

近年来,我国社会主义市场经济快速发展,各个领域的信息通信越来越频繁,计算机网络技术的广泛应用和普及,使得计算机系统数据库中的信息量日益庞大,计算机数据处理和分析技术面临着严峻的考验。相关的技术操作人员利用计算机数据处理和分析软件,很难准确、快速地从计算机的数据库系统中检索出需要的信息数据,难以总结出数据信息的共性和特征。通过将计算机数据处理技术和计算机图形图像处理技术有效的结合起来,可以通过计算机图形图像技术将大量的复杂结构的信息数据进行归类,操作人员通过计算机数据处理软件可以对有共性特征和本质特征的数据信息进行快速检索,极大地提高了计算机数据处理和分析的效率。可视化的科学计算技术最早出现在美国的科学协会研讨中,目前,可视化的科学计算技术被广泛的应用在气象分析、流体力学、医学等领域中[3],特别是在医学领域,利用可视化的科学计算技术可以实现高精度的远程控制和操作,可以应用在远程的脑部手术中,突破医学难题。在未来的发展过程中,可视化的科学计算技术将会在更多的领域发挥更加重要的作用。

2.4 工业制造和设计

目前,计算机图形图像处理技术在工业制造和设计领域应用的最为广泛,特别是二维三维CAD和CAE等计算机图形图像处理软件,不仅在工业生产的产品制造和产品设计过程中,还有土木工程领域,甚至是集成电路、网络分析和电子线路等电子电工领域都有着广泛的应用。在高精度的工业制造和设计领域中,利用计算机图形图像处理软件,可以在很短的时间内完成高精度的图形图像设计和画图,极大地提高了技术人员的工作效率,同时,标准的计算机图形图像处理程序,提高了工业制造和设计的精确度,有效地降低了设计误差。由于工业产品多是批量化的制造和生产,利用计算机图形图像处理技术,可以极大地提高企业批量化的运行效率和生产质量,降低工业产品的质量检测投入成本,为工业企业带来了更大的经济效益。

3 结束语

计算机图形图像处理技术的广泛应用和快速发展,推动了多个领域的技术革新,充分发挥人们的想象和创造力,创造出很多独特新奇的图形图像效果,丰富人们的日常生活,同时也为企业节约了很多的图形图像处理成本,提高了产品竞争力。在未来的发展过程中,计算机图形图像处理技术的应用前景会更加广阔。

参考文献:

[1]韩晓颖.浅谈计算机图形图像处理技术[J].福建电脑,2011(10):83-84.

[2]和晓娟.计算机图形图像处理技术的探讨[J].信息与电脑(理论版),2013(11):164-165.

[3]王应荣,王静漪.计算机图形图像处理技术[J].天津理工学院学报,2012(03):6-10.

作者简介:刘倩(1981-),女,满族,硕士,讲师,研究方向:图形图像处理与多媒体技术。

作者单位:宁夏大学 数学计算机学院,银川 750001

函数图像的教学研究论文

摘要: 数形结合的思想是数学中一种重要的思想方法,而在函数的教学中把刻画数量关系的数和具体直观的图形有机结合,用代数的语言揭示几何要素及其关系,同时将几何问题转化为代数问题,扬数之长,取数之优,使抽象思维与形象思维珠联璧合,不但可以提高学生对图形世界的直观感知而且可以使学生更好地理解函数,更加快捷准确的求解答案。

关键词: 函数图像 研究

从以往的教学经验来看,学习函数这部分内容要求学生进行数与形相结合的运算,即要求使符号语言、图形语言结合起来,使抽象思维和形象思维结合起来。学生会遇到很多需要“数”与“形”并举或转换的情形。因此,函数的学习是困扰很多学生的难点。作为教师,我们面临的突出问题是:如何在教学中针对学生的思维特点,制定有效的教学策略高质量地完成函数教学任务。笔者从一个数学教师的角度出发浅谈一下自己对函数教学方面的研究以及心得体会。

1加强学生对函数概念的理解

初中课本上运用“变量说”将函数描述为:设在一个变化过程中有两个变量x与y,如果变量y随着x的变化而变化,并对于x在某个变化范围内的每一个值,按照某个对应规则,都有唯一确定的y值和它对应,那么y就是x的函数,x称为自变量,x的取值范围称为函数的定义域,和x的值对应的y值称为函数值,函数值的全体称为函数的值域。高中阶段,运用“对应说”函数被定义为:设A,B是两个非空的数集,如果按某种对应法则f对于集合A中的每一个元素x,在集合B中都有唯一的元素y和它对应,这样的对应叫做从A到B的一个函数记作:y=f(x),x∈A。

以上两种函数的定义,各有各的不同特点。“变量说”是最朴素、最根本的,便于和实际相结合,初学者更容易接受。“对应说”抽象化的`程度较高,对于研究函数的精细性质具有一定的优势。适合在高中阶段介绍给学生。

讲述函数概念时,我们需要注意以下细节问题。

1。1实现由静到动的转变

学生由于长期在常量范围内计算、思维,因此以为变量一直是变,常量永远是不变。在引入函数概念之前,需要完成从常量到变量的转变,这是函数教学的一个重点。

例如“一架飞机每小时飞行1000千米,问5小时此架飞机飞行的距离是多少?”小学生只能给出正确的答案,但很少能够注意到路程S和时间t的关系。对于初中生我们要能引导他得出S=1000t的函数公式。在高中的实际教学中,我们可以把S表示为数轴上的一个定点,而把t看成是一个动点。取自变量t的一系列特定值,列出相应的另一个变量S(t)的对应值,在坐标系上描绘出这些点,这样会使学生能够比较容易地感受到变量的真实意义。

1。2突出变量之间的依赖关系

自变量和因变量之间的依赖关系是函数。通常表示为y=f(x),f表示x和y之间的对应关系。对于定义域内的任意一个x,通过对应关系f,对应唯一的一个y值。我们可以例举生活中的例子,让学生找出自变量x,然后再找出依赖此变量x的变化而变化的因变量y,最后设法找出它们之间的对应关系。从实际事例中寻找函数关系,构造事物变化过程中的具体函数关系,有利于加强学生对函数的理解。

2加强学生对函数图像的应用

在函数的教学中,我们不但要让学生深刻的理解函数的概念。还要不断帮助学生归纳各种初等函数的图形性质,并且教会学生快速画出初等函数的图形,这样在其今后的解题中将会发挥重大的作用。函数一般分为一次函数、二次函数、指数函数、对数函数和幂函数,下面以二次函数为例,来谈一下函数教学的研究体会。

在教学中,我们要引导学生对函数的图像特征进行归纳总结。可以先介绍特殊的二次函数的表达式y=ax2(a≠0),通过赋予x特殊的数值来对其图像进行描绘,进而归纳图像特征:图像形状为抛物线;顶点为原点;对称轴为y轴;a决定其开口方向,a>0时开口向上,a<0时开口向下。进而通过将y=ax2(a≠0)的图像向上下左右平移,引出二次函数的一般表达式y=ax2+bx+c(a≠0),并将其配方为y=a(x+b a="">0时开口向上,a<0时开口向下;(2)函数的对称轴为x=—b c="">0时,图像与y轴交在正半轴,c<0,图像与y轴交在负半轴,c=0,图像与y轴交在原点;(5)△=b2—4ac决定图像与x轴的交点个数,△>0时,图像与x轴有两个交点,△<0时,图像与x轴无交点,△=0时,图像与x轴无交点。

掌握了函数的基本特征后,学生就能对任一个二次函数进行绘制了,进而在一些有关函数的解题过程中就可以通过数形结合进行求解,不仅直观易发现解题途径,而且能避免复杂的计算与推理,大大简化了解题过程。这在解选择题、填空题中更显其尤为重要,因此我们要引导学生加强对函数图形的掌握,培养数形结合的这种思想意识,做到胸中有图,见数想图,以开拓自己的思维视野。

参考文献

[1]吴志鹃。二次函数图像的教学设计[J]。希望月刊(上半月),2007(11):108。

[2]梁小瑜。加强函数图像教学,衔接初高中数学教学[J]。师道·教研,2010(6):27~28。

[3]付尚英。浅谈利用函数的图像特征解题[J]。金色年华(教学参考),2010(12):113。

随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文,欢迎阅读!

图像识别技术研究综述

摘要:随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解,由于图像在成像时受到外部环境的影响,使得图像具有特殊性,复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。

关键词:图像处理;图像识别;成像

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)10-2446-02

图像是客观景物在人脑中形成的影像,是人类最重要的信息源,它是通过各种观测系统从客观世界中获得,具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展,图像处理技术的应用也越来越广泛,并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段,比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等,在这些应用中,都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理,着重强调图像与图像之间进行的交换,主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性,使得图像处理和识别技术成为研究热点。

1 图像处理技术

图像处理(image processing)利用计算机对图像进行分析,以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。

1)图像采集,图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,和文字、图形、声音一起存储在计算机内,显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。

2)图像增强,图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化,数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分,使图像的主体结构更加明确,必须对图像进行改善,即图像增强。通过图像增强,以减少图像中的图像的噪声,改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量,使图像中的物体的轮廓更加清晰,细节更加明显。图像增强不考虑图像降质的原因,增强后的图像更加赏欣悦目,为后期的图像分析和图像理解奠定基础。

3)图像复原,图像复原也称图像恢复,由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,为了提取比较清晰的图像需要对图像进行恢复,图像恢复主要采用滤波方法,从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。

4)图像编码与压缩,数字图像的显著特点是数据量庞大,需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频,那么必须对图像进行编码和压缩。目前,图像压缩编码已形成国际标准,如比较著名的静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。

5)图像分割技术,图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。目前,图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰,使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。

2 图像识别技术

图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述,描述是用数字或者符号表示图像或景物中各个目标的相关特征,甚至目标之间的关系,最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时,可以采用模板匹配模型。在某些具体的应用中,图像识别除了要给出被识别对象是什么物体外,还需要给出物体所处的位置和姿态以引导计算初工作。目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有:

2.1 指纹识别

指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段,主要应用于身份验证。指纹识别是生物特征的一个部分,它具有不变性:一个人的指纹是终身不变的;唯一性:几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前,指纹识别技术与我们的现实生活紧密相关,如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。

2.2 人脸识别 目前大多数人脸识别系统使用可见光或红外图像进行人脸识别,可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下,其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响,但由于红外线不能穿透玻璃,如果待识别的对象戴有眼镜,那么在图像识别时,眼部信息全部丢失,将严重影响人脸识别的性能[4]。

2.3 文字识别

文字识别是将模式识别、文字处理、人工智能集与一体的新技术,可以自动地把文字和其他信息分离出来,通过智能识别后输入计算机,用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档,如银行票据、文稿、各类公式和符号等自动录入,可以提供文字的处理效率,有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样,使得文字识别技术的研究遇到一定的阻碍。

3 结束语

人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事,但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下,图像识别技术取得了一定的成功,但在复杂的环境下,仍面临着许多问题:如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准,以及算法本身存在一定的局限性,这使得图像识别的最终结果不十分精确等。

参考文献:

[1] 胡爱明,周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用,2003,39(7):90—91.

[2] 胡学龙.数字图像处理[M].北京:电子工业出版社,2011.

[3] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.

[4] 晓慧,刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用,2009,1(29):8.

[5] 陈良育,曾振柄,张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用,2005,25(7):1629-1631.

[6] Sanderson C,Paliwal K K.Information Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33,Martigny,Swizerland,2002.

点击下页还有更多>>>图像识别技术论文

图像合成方法的研究论文

由于不同因素之间的复杂作用,在保留原始字体,颜色,大小和背景纹理的同时在场景图像中交换文本是一项具有挑战性的任务。在这项工作中,我们提出了一个三阶段框架SwapText,用于跨场景图像传输文本。 首先,提出了一种新颖的文本交换网络来仅替换前景图像中的文本标签。 其次,背景完成网络来学习以重建背景图像。 最后,通过融合网络将生成的前景图像和背景图像用于生成文字图像。 使用提出的框架,即使出现严重的几何失真,我们也可以巧妙的处理输入图像的文本。 定性和定量结果显示在几个场景文本数据集上,包括规则和不规则文本数据集。 我们进行了广泛的实验以证明我们的方法的有效性,例如基于图像的文本翻译,文本图像合成等。

想象一下,能够在场景图像中交换文本,同时在几秒钟内保持原始字体,颜色,大小和背景纹理,而无需花费数小时进行图像编辑。 在这项工作中,我们旨在通过自动替换场景图像中文本的算法来实现此目标。文本交换的核心挑战在于生成视觉逼真的文本并与原始文本保持一致的样式。

文本交换或文本替换在许多情况下都涉及到,包括文本检测,文本识别,海报中的文本转换和其他创造性应用。 对于文本检测和识别任务,文本交换是一种非常有用的数据增强方法。 见证了深度神经网络(DNN)在各种计算机视觉任务中的巨大成功,获得大量带注释的训练图像已成为训练DNN模型的瓶颈。最简单,使用最广泛的方法是通过几何变换来增加训练图像,例如平移,旋转和翻转等。近来,已经提出了基于图像合成的方法[11、7、39]来训练文本检测和识别模型。这些方法通过结合不同的渲染技术对光和能量的物理行为进行建模来从无文本图像中创建新图像。但是, 合成图像无法与场景中的图像完全融合,这在将合成图像应用于DNN模型训练时至关重要。

近年来,许多图像生成模型,例如生成对抗网络(GAN)[6],可变自动编码器(VAE)[17]和自回归模型[25],为现实的图像生成任务提供了强大的工具。在[9,38,33]中,GAN用于图像补全,可为缺失区域生成视觉上逼真的和语义上合理的像素。 [21,8,28,22]已经利用这些网络生成具有不同姿势或服装的新颖人物图像。

我们的贡献总结如下:

文本图像合成 图像合成已在计算机图形学研究中得到了广泛的研究[4]。文本图像合成被研究为一种数据增强方法,用于训练准确而健壮的DNN模型。例如,Jaderberg等[11]使用单词生成器来生成用于文本识别任务的合成单词图像。Gupta等 [7]开发了一个健壮的引擎来生成用于文本检测和识别任务的合成文本图像。 文本图像合成的目标是将文本插入背景图像中语义上敏感的区域。许多因素都影响合成文本图像的真实相似度,例如文本大小,文本视角,环境光照等。 在[39]中,Zhanet等人通过结合语义连贯,视觉注意力和自适应文本外观这三种设计来实现文本文本图像合成。尽管文本图像合成在视觉上是逼真的,但合成图像与真实图像之间仍存在许多差异。例如, 与真实图像相比,合成图像中文本字体和背景图像非常有限。

在最近,基于GAN的图像合成技术得到了进一步的探索。在[41]中,Zhan等人提出了一种将几何合成器和外观合成器组合在一起的空间融合GAN,以在几何和外观空间中实现合成现实。Yang等人[36]使用双向形状匹配框架通过可调整的参数来控制字形的关键风格。 GA-DAN [40]提出了一项有趣的工作,能够同时在几何空间和外观空间中对跨域移位进行建模。[2]中提出了MC-GAN来实现从A到Z的字母集的字体样式转换。 Wu等人 [34]提出了一个端到端的可训练样式保留网络来编辑自然图像中的文本。

图像生成 随着生成模型(例如GAN [6],VAE [17]和自动回归模型[25])的巨大成功,逼真而清晰的图像生成最近吸引了越来越多的关注。传统的生成模型使用GAN [6]或VAE [17]来将噪声z生成的分布映射到实际数据的分布。例如,GANs [6]用于生成真实面孔[37、3、15]和鸟类[29]。

为了控制所生成的结果,Mirzaet等人[23]提出了有条件的GAN。它们会生成在类别标签上进行分类的MNIST数字。在[12]中,karacanet等。根据语义布局和场景属性(例如日夜,晴天雾天)生成逼真的室外场景图像。 Lassneretal [19]基于细粒度的身体和衣服片段生成了穿着者的全身图像。完整模型可以以姿势,形状或颜色为条件。Ma[21,22]基于图像和姿势生成人图像。在[18]中提出了快速人脸交换,以将输入身份转换为目标身份,同时保留姿势,面部表情和光照。

图像完成 最近,基于GAN的方法已经成为图像完成的一种有希望的范例。 Iizuka等 [9]提议使用全局和局部判别器作为对抗性损失,在其中全局和本地一致性都得到了加强。Yu等人 [38]使用上下文注意力层来显式地参与远距离空间位置上的相关特征补丁。 Wang等 [33]使用多列网络以并行方式生成不同的图像分量,并采用隐式的多样化MRF正则化来增强局部细节。

给定场景文本图像Is,我们的目标是在保持原始样式的基础上基于内容图像Ic替换文本。 如图2所示,我们的框架由文本交换网络,背景完成网络和融合网络组成。文本交换网络首先从Is中提取样式特征从Ic中提取内容特征,然后通过自注意网络合并这两个特征。 为了更好地表示内容,我们使用内容形状转换网络(CSTN)根据样式图像Is的几何属性来转换内容图像Ic。背景完成网络用于重建样式图像Is的原始背景图像Ib。 最后,文本交换网络和背景完成网络的输出被融合网络融合以生成最终的文本图像。

现实情况下的文本实例具有多种形状,例如,呈水平,定向或弯曲形式。 文本交换网络的主要目的是在保留原始样式(尤其是文本形状)的同时替换样式图像Is的内容。 为了提高不规则文本图像生成的性能,我们提出了一个内容形状转换网络(CSTN)将内容图像映射到样式图像的相同几何形状中,然后通过3个下采样卷积层和几个残差块对样式图像和转换后的内容图像进行编码。 为了充分融合样式和内容特征,我们将它们馈入了一个自注意网络。 对于解码,使用3个上采样反卷积层来生成前景图像If。

文本形状的定义对于内容形状的转换至关重要。 受文本检测[20]和文本识别[35]领域中的文本形状定义的启发,可以使用2 K个基准点P = {p1,p2,...,p2K}定义文本的几何尺寸属性,如图3所示。

在对内容和样式图像进行编码之后,我们将两个特征图都馈送到自注意网络,该网络会自动学习内容特征图Fc和样式特征图Fs之间的对应关系。 输出特征图是Fcs,图5(a)给出了自注意力的网络结构。

内容特征Fc和样式特征Fs首先沿其深度轴连接。 然后,我们遵循[42]中类似的自注意力机制来生成输出特征图Fcs。

除了这种单级样式化之外,我们还开发了多级样式化管道,如图5(b)所示。 我们将自注意力网络依次应用于多个特征图层,以生成更逼真的图像。

文本交换网络主要侧重于前景图像生成,而背景图像在最终图像生成中也起着重要作用。为了生成更逼真的文字图像,我们使用背景完成网络来重建背景图像,其结构如表1所示。大多数现有的图像完成方法都是通过借用或复制周围区域的纹理来填充图像的像素。一般的结构遵循编码器-解码器结构,我们在编码器之后使用膨胀卷积层来计算具有较大输入区域的输出像素。通过使用较低分辨率的膨胀卷积,模型可以有效地“看到”输入图像的较大区域。

在此阶段,将文本交换网络和背景完成网络的输出融合以生成完整的文本图像。 如图2所示,融合网络遵循编码器-解码器结构。 类似于[34],我们在融合解码器的上采样阶段将背景完成网络的解码特征图连接到具有相同分辨率的相应特征图。 我们使用Gfuse和Dfuse分别表示生成器和判别器网络。 融合网络的损失函数可计算如下:

为了制作更逼真的图像,我们还遵循样式迁移网络[5,26]的类似思想,将VGG-loss引入融合模块。 VGG损失分为两部分,即知觉损失和风格损失,如下所示:

我们遵循[34]中的类似思想来生成具有相同样式的成对合成图像。我们使用超过1500个字体和10000个背景图像来生成总共100万个狮子训练图像和10000个测试图像。输入图像的大小调整为64×256,批处理大小为32。从权重为零的正态分布初始化所有权重,标准差为0.01。使用β1= 0.9和β2= 0.999的Adam优化器[16]来优化整个框架。在训练阶段将学习率设置为0.0001。我们在Ten-sorFlow框架[1]下实现我们的模型。我们的方法中的大多数模块都是GPU加速的。

我们在几个公共基准数据集上评估了我们提出的方法。

我们采用图像生成中常用的指标来评估我们的方法,其中包括:

在本节中,我们将通过经验研究不同的模型设置如何影响我们提出的框架的性能。我们的研究主要集中在以下方面:内容形状转换网络,自注意力网络和背景完成网络中的膨胀卷积。图6给出了一些定性结果。

自注意力网络 使用自注意力网络来充分结合内容特征和风格特征。根据表2,使用单层自注意力网络,平均l2误差减少约0.003,平均PSNR增加约0.3,平均SSIM增加约0.012。为了使用样式和内容特征的更多全局统计信息,我们采用了一个多层的自注意力网络来融合全局和局部模式。借助多级自我关注网络,所有的度量方法都得到了改进。

膨胀卷积 膨胀卷积层可以扩大像素区域以重建背景图像,因此更容易生成更高质量的图像。 根据表2,具有膨胀卷积层的背景完成网络在所有指标上均具有更好的性能。

为了评估我们提出的方法,我们将其与两种文本交换方法进行了比较:[10]中提出的pix2pix和Wuet等人[34]提出的SRNet。 我们使用生成的数据集来训练和测试这两个模型。根据论文,两种方法都保持相同的配置。

定量结果 在表2中,我们给出了本方法和其他两种竞争方法的定量结果。显然,我们提出的方法在不同语言的所有指标上都有显著改进,平均l2误差减少了0.009以上,平均PSNR增加了0.9以上,平均SSIM增加了0.04以上。第二个最好的方法。

基于图像的翻译是任意文本样式传输的最重要应用之一。在本节中,我们提供一些基于图像的翻译示例,如图7所示。我们在英语和中文之间进行翻译。从结果可以看出,无论目标语言是中文还是英文,都可以很好地保持颜色,几何变形和背景纹理,并且字符的结构与输入文本相同。

在图9中,我们还展示了在场景文本数据集上评估的模型的一些示例结果。根据图9, 我们的模型可以替换输入图像中的文本,同时保留原始字体,颜色,大小和背景纹理。

我们的方法有以下局限性。由于训练数据量有限,因此无法充分利用几何属性空间和字体空间。当样式图像中的文本出现波动时,我们提出的方法将失败,请参见图8(顶部)。图8(底部)显示了使用WordArt中的样式图像的失败案例。

在这项研究中,我们提出了一种健壮的场景文本交换框架SwapText,以解决用预期的文本替换场景文本图像中的文本的新任务。我们采用分而治之的策略,将问题分解为三个子网络,即文本交换网络,背景完成网络和融合网络。在文本交换网络中,内容图像和样式图像的特征被同时提取,然后通过自注意网络进行组合。为了更好地学习内容图像的表示,我们使用内容形状转换网络(CSTN)根据样式图像的几何属性对内容图像进行转换。然后,使用背景完成网络来生成内容图像的背景图像样式图片。最后,将文本交换网络和背景完成网络的输出馈送到融合网络中,以生成更真实和语义一致的图像。在几个公共场景文本数据集上的定性和定量结果证明了我们方法的优越性。在未来的工作中,我们将探索基于字体和颜色生成更多可控制的文本图像。

张玉君史鉴文

(地矿部航空物探总队研究所)

摘要 本文报导了关于深海洋底多金属结核照片的图像复原和图像处理方法技术研究结果。海底照片存在的主要问题是:光照分布不均匀、有时聚焦欠佳、常有铁丝影像、有时有泥浆局部干扰等。本文剖析了光照分布的数学模型,推导了倾斜相机系统和水平相机系统条件下的光照分布及感光光强分布公式。本工作利用图像处理系统研究成功了一套适用于海底照片的图像复原和图像处理技术,给出了详细流程图。做为实例本文附有六幅图片,说明所研究的方法在去除光照不均匀、铁丝干扰、提高反差、增强分辨率、自动分类、科学统计覆盖率等的显著效果,以及通过局部放大研究结核的结构和形态方面的可能性。本文所报导的方法是改善和研究珍贵海底照片的重要工具。

一、前言

地球各大洋海底广泛赋存有锰结核、铁锰结核、多金属结核等丰富宝藏;为了探明其分布和储量,各国在公海正在开展着深海多金属结核的勘探工作,这是一项具有深远意义的造福后代的工作。这种勘探工作所用手段之一是海底照相,根据海底相片估算多金属结核的覆盖率和储量,并对结核的形态进行研究。

深海多金属结核照相由于拍摄环境及装置存在着一系列问题,因此提出图像复原和处理的要求。

在深海洋底照相需要外加光源,数千米深的海水将阳光几乎全部吸收掉了,外加光源与相机的位置相对固定,他们之间的距离大约为20~30cm。相机系统由缆绳绞车控制下降至海洋底,根据重锤触底信号再将相机升起一个高度(1.5~3m),即拍照;这一距离根据海况变化一次下水调整一次。海况是指:海风、洋流、底质等情况。由于洋流的存在,相机系统可能倾斜,拍摄高度随之也有所变化。所获海底多金属结核照片存在一系列影响分辨和研究的问题,主要有:

(1)光照分布不均匀,其中心与照片中心偏离,甚至由于相机倾斜,造成光照分布失去对称规律;

(2)有时聚焦欠佳;

(3)常常出现有铁丝干扰影像;

(4)有时有因重锤搅混海底沉积物而局部模糊。

利用数字图像技术处理深海多金属结核照片的目的在于:

(1)通过图像处理改善照片的质量,主要是图像复原;

(2)通过分类技术分辨裸露核、浅埋及深埋核,并对各类面积进行精确计算,从而得到覆盖率的科学数据;

(3)结核形态研究。

为了达到以上目的首先要对海底照片进行数字化,形成图像数据文件,即可利用数字图像处理系统进行处理。

数字图像处理技术随着计算机技术、遥感科学的发展而在近20年得到极为迅速的发展、成熟与应用。正如图像增强一样,图像复原技术的主要目的,在某种意义上说,是要改善给定的图像。复原是一个过程,这一过程试图利用退化现象的某种先验知识,把已经退化了的图像加以重建或恢复。因此,复原技术是把退化模型化,并运用相反的过程以便恢复原来的图像。

Cannon博士(1983,“Applied Optics”)研究了一种图像复原技术,或称图案去除技术,适用于:规则图形(如纺织品)上手纹处理、散焦图像改善、卫片上探测器与探测间噪声消除、曝光过程中的平移模糊的清晰化等。Srinivasan(1986,“Digital Design”)也阐述了此方法。此技术可分解为明确的三个步骤:

(1)对图像中的“模糊”或“图案”问题进行估计,即分析退化问题的实质;

(2)生成一个近似模型或频率域滤波器,以便准备进行复原或图案去除;

(3)利用威纳(Wiener)滤波器或富里叶(Fouriel)滤波器对图像进行改善。

海底结核图像所存在的具体退化问题有自己的独特性,但Cannon所提出的方法原则仍有重要参考价值。

二、深海多金属结核图像退化问题的剖析

1.光照计算

前言所述噪声中,影响最大的是光照不均匀问题,现将此问题进行数学分析。

已知:光源可认为是点光源;海底假定为一平面,所拍照片对应于abcd四边形;相机底片中心f与光源中心f´之间距离为l,由于相机与光源为硬固定,因此光源永远位于底片平面长对称轴的延长线上;底片中心与abcd四边形的对角线交点o的距离为h;相机倾斜角为α;光源源强为Q,见图1。

求解:写出abcd四边形中任意一点的光照强度函数F=f(Q,h,a,l,x,у)。

解:通过o点作x、y座标轴,任意点g,其座标为x,y,与光源间距离为R。如写出R公式,即求出F方程的表达式。

做h´∥于h,由g点向h´做垂线gK。

张玉君地质勘查新方法研究论文集

光照强度表达示为:当底片平面平行于海底平面时,图1简化为图2,式(4)简化为(5)式。

张玉君地质勘查新方法研究论文集

从图2可见:

图1相机系统倾斜条件下的光照强度计算示意图

图2相机系统水平条件下的光照强度计算示意图

张玉君地质勘查新方法研究论文集

若(5)式中y=0,

则:

张玉君地质勘查新方法研究论文集

(6)式为x轴上各点的光照强度,显然这是一个以о´点为中心的对称曲线,示意于图3。

图3沿x轴光照强度分布曲线

而在abcd平面上光照分布则为一个曲面,它由上图中之曲线,以mo ′为轴旋转而成。

对于式(4),即对于相机系统发生倾斜时,此曲线及曲面显然将变得复杂化,并将失去轴对称性。

2.感光光强计算

在拍照时还要考虑到底片各点感光光强同样与距离有关。

令L为感光光强函数,用与前述类似方法可求出对应于倾斜和水平两种状态L的表达式。

对于倾斜相机系统:

张玉君地质勘查新方法研究论文集

对于水平相机系统,显然公式可较简单:

张玉君地质勘查新方法研究论文集

图像复原的实质是试图用理论的或试验的方法建立起深海结核图像的感光光强分布本底图像,从原图中扣除,便可去除光照不均匀所造成的失真,达到图面基本改善。

从(8)式可知,实际上α角是最大的难点。试图利用底片或照片本身,逆演求解α角也将是十分困难的。故本研究用试验方法建立光强分布本底图像,较好地实现了复原。

三、深海多金属结核图像复原和处理方法流程

经研究,建立了图4所示之方法流程:

图4深海多金属结核图像复原和处理方法流程

流程图由20个步骤组成,其2—8属图像复原,9—20属图像处理,1为准备工作。

数字化使用I2S公司所产C4500扫描仪,将135底片上的短边方向扫成512行,长边方向对中舍去两边。若扫描所获图像不足512行,则进行适当拼接,这是为了减少快速富氏变换时的边界效应。

挖补是为了解决铁丝干扰,否则不仅图面不完整,而且在频率域处理时,干扰范围还会扩大。

在频率域适当选取低通滤波参数,用指数滤波可以获得近似的光强本底分布图像,并适当选取比例因子从原图中扣除,即可得到基础图像。

利用基础图像通过聚类分析,并提取其中对应于裸露核,浅埋核及深埋核三个类别。叠加后,进行邻域滤波,去除零星干扰,便可进行分类统计了。

对于泥浆搅动干扰区,必要时可在统计前挖去,减少这种干扰所带来的误差。

四、图像复原和处理效果

为了开展此项研究,由广州海洋地质调查局提供了三张海底照相底片,其质量分别属于优、中、差三级。通过实验,均获得了成功的结果。现以中等一级的图像复原和处理结果为例,展示方法的效果。

图片1为原始图像,它的主要问题是:反差小,光强不均匀,存在铁丝干扰,行数不足512。

图片2为经过拼接,挖补和增强的图像,图中反差有所改善,消除了铁丝干扰,补足了行数,但光强不均匀问题仍然存在。

图片3为复原后的图像,成功地克服了光强不均匀问题,为计算机自动分类提供了前提。

图片4为分类处理后所提取裸露核(深灰),浅埋核(白色)和深埋核(浅灰)的合成图像。

图片5为对比图像。左上角为三类核的合成图像,右上角为裸露核图像,左下角为浅埋核图像,右下角为深埋核图像。

通过统计和计算,得到各类结核的象元数、全图总象元素及各类结核的覆盖率。见下表:

张玉君地质勘查新方法研究论文集

此外对优质底片,经过上述处理后,还做了局部放大,经四倍放大后的图像(图片6)对于结核形态研究很有用,从图片6可以清晰地看到环形,盘形、菜花形多金属结核的形态和结构。

图片1

图片2

图片3

图片4

图片5

图片6

五、几点结论

本工作所研究的深海多金属结构图像复原方法可以成功地去除光强不均匀造成的干扰,并可消除铁丝影像干扰,增强清晰度,提高反差,效果显著。

经复原后的图像,具备了计算机自动分类处理的条件,经聚类分析成功地提取了裸露核、浅埋核和深埋核信息,并精确地统计了各自的象元数,求出了各类核的覆盖率。

通过局部放大,有可能进一步研究多金属结核的结构以及形态。

本文所研究成功的方法,无疑对于探明数千米以下深海海底蕴藏的丰富矿产资源有着重要意义,希望能投入半生产性批量处理应用。这种方法当然也可以用于其他方面。

本工作得到广州海洋地质调查局王光宇同志、陈邦彦同志、张国祯同志的支持,本所朱月娥同志多次一起商讨,杨星虹同志拍摄了图片,一并向他们致谢。

参考文献

[1]Cannon M.,Lehar A., Preston F.: Background pattern removal by power spectral filtering, Applied Optics, vol.22,No.6,777-779,1983,March.

[2]SrinivasanR.:Software image restoration techinques,Digital Design,Vol.16,No.4,29-34,1986,March.

A STUDY OF IMAGE RECONSTRUCTION AND IMAGE PROCESSING TECHNIQUES FOR PHOTOS OF DEEP-SEA POLYMETALLIC NODULES

Zhang Yu jun,Shi Jian wen

(Institute of Aerogeophysical Survsy,Ministry of Geologyand Mineral Resources)

AbstractThis paper reports the results of research on image reconstruction and image processing techniques for photos of polymetallic nodules from the bottom of deep sea.The major troubles with submarine photos include uneven distribution of illuminance, unsatisfactory focusing,frequent existence of iron wire image, local mud interference etc.The present paper analyses the mathematic model for distribution of illuminance and derives, the formulae for illuminance distribution and light sensitivity distribution under the conditions of inclining camera system and horizontal camera system.Using image processing system,we have successfully developed a suite of image reconstruction and image processing techniques suitable for submarine photos and drawn a datailed flow chart.As examples,four pictures are attached to this paper, which illustrate the obvious effects of our method in such aspects as eliminating uneven illuminance and iron wire interference,raising contrast and resolution power, automatic classification and scientific statistical analysis of coverage, and indicate the possibility of examining textures and shapes of the nodules by means of partial enlargement.The method described in this paper serves as an important tool for improving and studying precious submarine photos.

原载《物探与化探》,1989,No.6。

图像学研究论文

潘诺夫斯基(Erwin Panofsky)(1892年3月30日—1968年3月14日),美国德裔犹太学者,著名艺术史家。在图像学领域做出了突出贡献,影响广泛。 潘诺夫斯基反对沃尔夫林的形式自律原则,主张在思想观念、哲学风格之间建立联系,认为风格的发展是与哲学、文化发展趋向一致的。生平1892年出生于德国的汉诺威。从18岁起开始准备研究丢勒的著作,大学时期撰写的关于丢勒作品受意大利人启发的数学论文荣获柏林大学赫尔曼一格林奖 (Hermann Grimm Prize),1923年又与扎克斯尔合作发表研究丢勒的《忧郁Ⅰ》 (MelencoliaⅠ) ,他曾跟随德国中世纪艺术史学家戈尔德施米特(A.Goldschmidt)和弗格(w.Voge)学习,在他俩的指导下,完成了论丢勒艺术观的博士论文,1914年在弗莱堡获得学位。他对丢勒的兴趣,伴随终生。 1921年在汉堡大学任编外讲师,1926年在该校升任教授。自1931年起往返于大西洋两岸,轮流担任德国和美国的艺术史教授。1933年被纳粹政府解雇,自此留在美国担任纽约大学和普林斯顿大学艺术史教授。当时美国对西方艺术史的研究刚刚起步,由于潘诺夫斯基和其他移民学者的努力,这项研究才得到了长足的发展。从1935年起在享有学术共和国之誉的普林斯顿高级研究所任研究员,1962年退休后又担任纽约大学的教授。他是20世纪伟大的艺术史家之一,是最后一位黑格尔派哲学家,也是20世纪后期的艺术史家应当回归的典范。著作潘氏的主要著作有:《丢勒的艺术理论》(1915)、《丢勒作品中古代人物的姿势》、(1922)、《十字路口上的赫克利斯》(1931)、《圣像学研究》(1939)、《哥特建筑和经院哲学》(1951)、《尼德兰早期绘画》(1953)、《阿尔布雷希特·丢勒》(1954)、《作为艺术评论家的伽利略》(1955)、《文艺复兴与其他文艺复兴》(1960)、《墓地雕刻:从埃及到贝尔尼尼的变化》(1964)以及《视觉艺术的含义》(1955)。其中《图像学研究》(1939)和《视觉艺术的含义》(1955),它们对图像学这一艺术史领域的发展具有深刻的影响。 《电影中的风格和媒介》(Style and Medium in theMotion Pictures)是欧文·潘诺夫斯基发表的唯一的一篇电影论文,可能比他的任何其他论作重印的次数都多。

《图像学:视觉艺术的意义与解释》共分九章。第一章是导论。第二章是对图像意义研究历史的引介与相关课题的陈述。第三章介绍图像学的成立根据,说明早期图像学实践者如何一步步的建立起图像的象征关系。第四章是对传统图像学的核心问题:“象征”意义与“拟人图像”的厘清。第五章开始讨论现代图像学,先以帕诺夫斯基的艺术学为论述主轴。交代了帕诺夫斯基的康德学立场,以及他的艺术学观点和图像学方法。第六章说明他影响深远的图像学阐释方法,第七章讨论当代图像学的发展和图像转向后的各种艺术议题。第八章浅谈新艺术史与图像转向后的艺术史书写与诠释问题,对图像学、图像科学和视觉文化的基本动向提出原则性的区分。第九章当赛伦停止歌唱——图像诠释的起源,企图通过两篇相当经典的卡夫卡笔记,并且随顺着柏拉图、笛卡尔、卡尔维诺到海德格尔的一系列发问,说明图像对当代诠释者所可能产生的挑战 。 现代图像学的研究领域非常广阔 ,重要的3个方面是:①解释作品的本质内容,即帕诺夫斯基所说象征意义。②考察西方美术中的古典传统,古典母题在艺术发展中的延续和变化。③考察一个母题在形式和意义上的变化。现代图像学涉及的学科也非常众多,如形式分析、社会学、心理学和精神分析等,与它们的交叉也是现代图像学的一个特点。常雷摘要:“图像学”是现代视觉艺术研究、实践探索中极其重要的一个理论学科,它起源于十九世纪兴起于西方的传统图像志研究,二十世纪前半叶迅速发展为国际艺术史研究中具有统治地位的学科之一,已衍生为一种全新的艺术史和艺术学的研究方法。随着数码图像技术的高速发展和进步,视觉艺术创作形态正发生着又一场巨大而广泛的变革,令图像艺术与现代图像学在当代的境遇异常勃兴,传统分科方式的视觉艺术形式已无法与之比拟。本文就这一历史进程做了初步的记叙和论述,旨在介绍图像学对于现代视觉艺术学科建设的重要意义,并表明作者对艺术理论构架的一种全新见解。 “图像”一词主要来自西方艺术史译著,通常指image,icon,picture和它们的衍生词。后期图像学论著中表述“图像”的常用词是image,image的几种主要词意可借以理解图像学对“图像”概念的设定:①心像、印象,指图形在观看者心中构成形象认知的心理过程。②塑像、肖像、圣像,也包含有图形程式的意义,与icon同。③映像或翻版、复制、相似的形象,表明图像的传播性能。④在心里对形象的描绘。image的衍生词用法也可以帮助我们更深一层地理解“图像学”的概念:imaginable指可想象到的;imaginary指假想的;imaginative指富于想象力和创造力的。早期“图像”的常用词是icon,iconography为图像志;iconology为图像学。icon的原意指希腊正教的圣像,所以作“图像”用的主体含义为图形程式,故多译为“谱像”,并将iconology译作“谱像学”【1】。picture的名词原意为图画、照片、电影、映像等,指图像的具体物质性存在,如picture book为图画书;picturetube指显像管;picture window指看得见风景的窗子。Picture的用法比较丰富,也有心像、形象、描写、叙述及相似形象的词意,因此常与image混用,但picture的使用常常指称具体的实际形象,停留在视觉图形的表象,而image的用法要更抽象些,多用于探索图像心理范畴的论述,而不仅仅指视觉的。其它一些词在相关使用中也可以统统译为图像,如tableau,representation,view,figure。tableau的原意是如画般动人的场面,延伸意即虚拟图像;representation的原意是象征、表示,指被图像表征的内涵意义;view指图景;figure的原意是数字、计算,因此它指的是图形的性质及符号特征,如三角形triangie figure;圆形cirole figure。中国古人的治学方法是“置图于左、置书于右、索像于图、索理于书”【2】,故“图像”一词在传统文化中亦颇有渊源。“图”指图形,“像”指图形中的含义,是以“图”为媒体的形而上的文化概念。如从太极图哲学义理的认知过程中,我们可以归纳“索像于图”的递进层次:①首先进入视野的是一幅黑白对比的阴阳鱼组合图形,矛盾色交合对比的图案印象即图形存在picture;②它的基本形为圆,以S形曲线分割,这种图形判断结论即图形特征figure;③圆形、曲线均说明图形的基本象征意义为永恒的运动,这是图形的象征意义representation;④“天圆地方”的文化符号学基础使观者联想图形所代表的是“天圆”??宇宙与自然的图像比拟,即图形景象联想view或tableau;⑤太极图引发我们对传统“对立统一”哲学思想的认知和思辩过程就是image,即古人从图形中索得之“像”;⑥这个图形一旦由历史沿传构成一种程式化的图形符号,再经我们理解和熟知后,在我们的头脑中就构成了一个icon,这时无论如何复制、改写、或随意地变形表现,这个icon已不因外在形式的变动而改变了。同时我们还应注意“像”和“理”的区别,即“像”的意义是视觉性的,具有不可言说的特点,有它区别于文字理论的独立价值。二图像学源于19世纪在欧洲美术史研究领域里发展起来的图像志研究【3】,当时图像志是艺术史学科中的一个分支,它所关心的是艺术客体的主题内容以及题材背后延伸的深层喻意,从而自然减少了对艺术作品的形式和表现风格的关注,在这一点上同传统的艺术史研究方法背道而驰。早期的图像志研究基本都是宗教内容的,进入20世纪后图像志的研究领域不断扩展,与其它学科的联系日益密切,进而发展成为一种蓄势取代传统艺术史研究方法的新方法:图像学。1912年,德国的艺术史大师阿比·瓦尔堡[Aby Warburg](1866~1929)在第10届国际艺术史大会上宣读了他的论文《弗拉拉的无忧宫意大利艺术与国际占星术》,在这篇论文中他使用了新词汇“图像逻辑的”[德语ikonologisch]来昭示他准备倡导的一种新生的艺术研究方法??一种脱胎于传统图像志研究的研究艺术史、艺术学的新理论模式【4】。瓦尔堡的新方法关注的是艺术研究过程里作品内容与形式的相互作用,他的目的是引导学者们吸收其他领域的研究成果,使艺术史得以纳入文化史的整体当中。图像学创始人的最初动机是通过这种新方法突破传统美术史研究中各种学科的界限,瓦尔堡的老师历史学家卡尔·兰普雷希特就是一个在史学研究中倡导“大文化史”的特立独行者,他主张把历史看作是一种社会心理科学,政治、经济、法律、艺术、宗教等学科应该视同一体。这种思想上的变革一开始被喻为“侵入者”,它总是在扮演对艺术形式主义批判者角色的同时打破了各个学科之间的封锁壁垒。二十世纪涌现出一大批富有才华的图像学研究者,如欧文·潘诺夫斯基[Erwin Panofsky](1892~1968)、弗里兹·扎克斯尔[Fritz Saxl]、鲁道夫·维特科夫尔[Rudolf Wittkower]、埃德加·温德[Edgar Wind]等,这些赫赫有名的艺术史家用大量勤奋而实际的研究工作为图像学的性质做了系统的设定:即对艺术品母题的象征意义进行全面的、文化的和科学的解释。他们都曾集中在创立于汉堡的瓦尔堡研究院工作(起初为瓦尔堡图书馆),成为以图像学研究闻名于世界的“瓦尔堡学派”的核心力量【5】,这所研究院可以视为全球第一个图像学的科研机构(虽然它不只是一个艺术史的研究机构),并对当代艺术学的发展做出了重大的贡献。二战中研究院迁至伦敦,几乎同时也是为了躲避纳粹迫害的年轻的恩斯特·贡布里希[Ernst Hans Josef Gombrich]从他的故乡维也纳应聘而来,负责整理瓦尔堡遗稿的工作。贡布里希已成为一位身负盛誉的艺术史与艺术理论大师,他对图像学发展的突出贡献是特别努力于图像学阐释方式标准的建立,认为图像学的中心任务应该是重建艺术家本来的创作方案,以此寻至作品的本义。为了科学地解释作品的“本义”,贡布里希主张要充分研究作品主题的初始背景、环境资料、传统惯例以及作者的真实意图,这种主张在很大程度上对已是广为流行的图像学在技术因素上提出了修正和革新的方案。潘诺夫斯基的研究成果标志着图像学一个新的历史阶段,“他将图像学从一种辅助性的研究手段擢升为一门独立而成熟的学术部门,不仅在实践上做出了大量的成绩,而且从理论上对图像学作了相当完备的阐述” 【6】。他也因为战争的原因从30年代开始移居美国并在那里开始了他的艺术教学工作与研究,后来长期执教于纽约大学,把图像学的研究方法带到了美国。随着潘诺夫斯基在汉堡的许多学生移居美国后,德国传统的图像学在美国的影响日益增广,美国本土的学者在经过潘诺夫斯基的教导或与他合作后,开始致力于将潘诺夫斯基的观点、方法与其它的观点、方法加以同化和融汇的工作,向着一个更加宽广、更加深入的方向发展【7】。比如维尔那·霍夫曼[Werner Hofmann]在60年代的研究中开始参照文学、哲学以及课题当时的艺术批评来证实他的阐释,并且开始试图揭示作品中富有象征意义的形式【8】。潘诺夫斯基及其以前的图像学研究仍然以传统图像志研究为基础,因此它仍然是一项艺术史或文化史的专门学科,其课题内容也多数局限于传统艺术品尤其是文艺复兴时期的艺术创作个案。在潘诺夫斯基以后的时期,发轫于传统图像学研究方法的先天缺陷开始日益凸显,其一是它对艺术创作中形式与风格问题的漠视;其二是它对现代艺术创作即艺术学、艺术理论方面现实意义的疏离。后期图像志、图像学的研究者在身份上发生了根本性的变化,他们已不再以专门的传统图像志或图像学家的身份出现,而是挟着图像学方法的启示走向更为综合的现代艺术学研究,如潘诺夫斯基在美国训练出的学生米勒德·迈斯[Millard meiss]、弗雷德里克·哈特[Frederick Hartt]、迈耶·夏皮罗[Meyer Schapiro]。夏皮罗在哥伦比亚大学与学生们一起研究艺术问题时启用了来自心理学、精神分析学、现象学、存在主义等更为广泛的学科术语和概念,他们所研究的课题开始更多地指向现代艺术【9】。这种转折的发生集中于六、七十年代,显然与当时西方现代艺术的突变性发展有着深刻的内在联系。波兰杰出的艺术史家扬·比亚洛斯托基[Jan Bialostock]的研究领域非常广泛,常涉及哲学、艺术史和艺术理论的多方面问题,他在1960年出版的论文集《风格与图像志、艺术学研究》中富有创造性地将哲学方法运用于图像学研究,并且开始关注图像与风格的问题。而贡布里希的触觉敏锐度是超凡的,他在完成了《艺术与错觉》、《秩序感》这两部深入研究绘画和装饰设计艺术的宏篇力著后,在80年代又出版了《图像与眼睛》,在这部书中他的研究课题已经扩展到了图片摄影、制图与广告制作等图像的全部领域。通过贡布里希的著作我们可以发现,他的艺术学术研究系统始终是开放的,可以说从很早开始他的研究就已经像他自己所说的那样“脱离了艺术史这个魔圈”【10】,进入了更富科学哲学精神的艺术学领域。当代,图像学已构成西方艺术史研究领域中具有统治地位的一个分支【11】,其理论模式从艺术史研究转向至艺术理论、艺术实践等更为全方位的艺术学领域,从而形成一个以全新视角、全新方法科学审视当代艺术学术的新学科??“现代图像学”。贡布里希在《象征的图像》【12】这篇论文里已经展示了他超越艺术史和传统图像学的学术抱负,首次将图像与语言相比拟,从哲学的角度探讨图像象征符号作为人类思想传播工具的意义。这是一个非常伟大的创举,可以看作是现代图像学的发端:经过一个多世纪图像志、图像学研究的盛况,几代杰出学者的开拓与积累,人类开始认知到了视觉图像对于人类文化发展的重大意义和价值。而这个认知形成的前提是,必须有一种方法可以帮助我们跨越一切形式与风格的障碍,使我们得以通览全部视觉艺术与文化的含义。也唯如此,我们才不致沉迷于形式主义【13】为我们提供的一个个琐碎的历史片断中,而遗忘了视觉图像被制作的最原初的目的。美国芝加哥大学教授威廉·米歇尔[W·J·T·Michel]是当今比较活跃的现代图像学家代表人物之一,他在八十年代开始出版的几部著作《图像学:图像、文本、意识形态》、《重塑的眼光:后摄影时代的视觉真相》、《图像理论》都是当代非常重要的视觉文化和现代图像学论著文献。米歇尔的学术观点可以说是后现代时期视觉图像文化的典型代表,他所关心的论题早已超越了一般性的艺术现象,而开始更为深刻和具体地讨论图像学与意识形态的关系了。在《图像转向》这篇论文中米歇尔已经把“图像”的地位抬升至文化上的至高点,他紧紧抓住理查·罗蒂关于哲学史所发生的一系列转向的理论,在“17~19世纪的哲学转向关注观念;启蒙的当代转向关注词语”【14】之后,接续为后现代的当代转向为“图像”,论述当代思想正在朝着“可视的意识形态”状态发展的可能性和现实性。米歇尔观点的时代背景是当代社会文化已经一致认同了“图像时代”的来临、人类已经步入了一个崭新的“图像时代”、人们获取信息和交流思想的主要媒体方式已从“语言文字的”转型为“图像的”。1972年出版的英国学者约翰·伯杰[John B]等五人【15】合著的《观看的方式》中开篇就谈到了“观看先于语言”这一观点【16】。他们认为在人类获取信息的方式中,“图像”读取的要优先于“语言文字”的方式。米歇尔更为超越式地谈到了这一点,他认为更重要的现实资料是“图像表征”正在以“前所未有的力度影响着文化的每一个层面,从最为高深精微的思考到大众媒介最为粗俗浅薄的生产制作无一幸免”【17】,而且他认为观看不仅仅是一般性的优于阅读,语言文字实际上无法充分阐释视觉经验,即二者在根本能力上的不平等。因此他指出,图像学重建中的关键举措应是设法超越语言艺术与视觉艺术之间的比较研究,使图像学“进入人类立体的基本构建之中”,而他的目的也正是为了复兴图像学,他认为必须使“图像的理论同意识形态话语批判地相遇”【18】。早期传统图像学研究者对艺术形式的忽视遭受到相当范围的批评和非议,批判图像学性质的维护形式主义的批评仍然时有发言,但由于“图像时代”切实逼近的来临,“图像”已经转型为意识形态传播过程中的主要媒体形式,与之相比那些声音显得淹没无息了。现代图像学的发展,其生命力完全在于它彻底的“开放性和综合性”,即无所不破、无所不合,“图像”是被创造出来的一种可以“任意”冲破传统学科界限并重新组构的研究方法和理论秘钥,其学术内核,正是最具前瞻性和创造性的现代文化科学。正因为出发点是为了突破艺术形式桎梏、研究与艺术形式相对的其它问题,所以图像学者在最初使用“图像”这个词时,对图像的基本概念就是超越一般形式差异的可视作品。即它包括绘画、摄影、影视、装饰设计、建筑园林甚至行为装置等一切可视的艺术作品所表征的视觉内涵。而当代学者在使用“图像”一词时,已经更多地开始指称利用新型科技完成的影像作品,因为这些影像作品比之传统的视觉艺术品,其复制和传播的效率远超千里之距。国内的图像学研究与图像艺术的实践探索发展状况极不平衡,图像学经历了一段时间的译论、试论过程,主要通过有限的几位研究西方美术史的学者来完成,如范景中先生【19】;或引用图像学的成果辅助其它学科的一些课题研究【20】,可以说尚未构成专门的、系统的、具备适当规模的研究体系。而图像艺术实践由于图像技术的飞速发展和图像产品市场的形成,图像艺术人才已经结成了一支可谓庞大的团队。八十年代著名摄影学家龙熹祖先生率先意识到现代图像学与图像艺术在中国推广的意义,在中央民族大学最先创办了图像学的专门科研机构和图像艺术的教育基地??中央民族大学图像研究所。龙先生所推广的“图像”,虽然立足摄影技艺、平面图片编辑与数字图像后期,但决不自拘一格,强调学生要掌握的是一种超越一般形式差异的图像意识,而不仅仅是一两项专业技术。三现代图像学研究的美学价值在于“图像逻辑”这一概念的提出,使各个围绕人类视觉文化的人文学科开始进行整合一体的完整性研究工作,它使艺术家开始摆脱此前那种只关注风格的孤立、狭隘的自我发展空间,有机会从更完整的文化语境条件下来关照创作行为本身。因此,“图像”这个词汇的提出本身就很有意义:与“美术”相对比,它意味着作品的要素首要是“图像的”而非“技术的”或“形式的”。图像学批判的是“形式主义”而不是“艺术形式”,因为图像学认为艺术作品的文本价值与艺术家进行创作(包括一段时期艺术流派群体的创作行为)时的真实意图是统一而密切的,那么创作本身也就不能只关注形式语言风格而忽略作品图像的审美核心。对“图像”一词概念的理解,离不开各个历史阶段对图像学的认知和运用,早期的图像指的是各类图形的传统喻意,即“谱像”;接着是贡布里希为图像增加的新观念,他认为对图像内容的研究也应包括图像作者的实际意图,当然这就不可避免地对部分艺术形式的问题也产生了兴趣;“现代图像学”的突破力度达到了一个高峰,“图像”由“艺术”转型为“文化”,这种发展植根于现代科技的发达,因此现代图像学已不再像传统图像学那样去简单地批判艺术的形式主义了。艺术理论在最初是人们从艺术史的回顾过程中把问题秩序化、理性化的一种结果,人们怎样看待艺术史线索即“艺术史观的建设”,决定着人们将如何确定艺术理论和如何发展艺术和文化。在艺术史的整体进程中,近代以前几乎一直处在技艺决定作品优劣的时代,也就是说谁掌握制作技术,谁就获得“图像产品”市场的主动权,这是由历史上复制与传播技术长期滞后造成的。因此,在相当长的历史阶段中,人们心目中占主导地位的一直是艺术品的原创技艺,而艺术家和大多数理论家最热衷于讨论的也是关于技艺的话题。人文主义文化的兴起促使艺术审美思想的多元化大发展,而初期多不能脱离具体的技艺和形式而建构,所以传统的艺术史研究思路也往往令派生的美学思想不能脱离艺术形式的约束。以中国美术的发展为例:自六朝至宋元,绘画的艺术行为主流发生了从宫廷贵族到文人的转换,但无论是贵族还是文人,其创作主体的阶级烙印都是很明显的,艺术史的发展始终都控制在对制作技艺具有垄断地位的社会群体手中,所谓“院体画”、“文人画”都是技术传播垄断的结果。而这种垄断的形成,主要原因还是复制与传播技术的滞后:粗陋与原始的复制不能完整再现艺术品的原貌;概念化的课徒套路也不能真实地反映大师的艺术精髓。因此在那些时代艺术技术的接代延续只能局限于一定的小范围内,师徒门户成为艺术生命延续的主要形式。在复制与传播技术滞后的时代,从艺术家、收藏家到普通大众所能看到的视觉艺术品都普遍具有特征鲜明的“形式差异”,现代图像学的成功之处就是跨越了一般历史的局限,研究者所关心的审美含义是超越于艺术形式差异的美。根基于“图像”的美学思想,可以看到那些在传统艺术学术研究中所看不到的东西??许多艺术品在技艺和形式上迥异却具备着更多相同的审美因素。传统的艺术史研究也是建立在早期学院派艺术教育的需求上,研究者往往以形式差异作为研究的主线,故我们看到的传统艺术史著作往往是风格流派的演变史或艺术家的传记、编年史。而图像学关注的是艺术品所传达的完整的文化信息,即首先研究的是艺术家在当时当地的审美创作过程中的真实心理、实际目的等,因此对图像作品的复制和传播方式更感兴趣,渴望了解艺术作品的真正用途和社会意义,摸索到艺术史发展的脉络本体,并以复制、传播形态的变化作为艺术史划时代的工具。假如将传统建立于形式差异原则的视觉艺术史重新按照“图像逻辑”来编排一部《图像艺术史》,那么它的本质将是一部视觉艺术的“传播”发展史,它的历史时期划分应以复制技术、艺术品的交流与传播形态发展为主体依据。例如宗教的传教体制在中古时期相当长的时间里一直扮演着视觉艺术传媒的重要角色;而中国明清以降书籍版画的兴旺发展,也正是在城市经济繁荣的促动下市民阶层对文化消费传播需求的市场所造就的。与此同时,版画的兴起导致白描艺术获得了发展的机遇,像陈老莲、任渭长这样的白描大师的作品也能随之被大量的复制,并广泛地传播到社会各阶层。这样,图像艺术史看起来倒更像是一部视觉传播领域里的文化史,它划时代的历史分野正是人类视觉传播方式的五次重大变革:①原始时期??图像程式icon的摹仿式复制、改制 例如岩画、陶器、陶俑等形制规范的仿制行为,图像在此实际已成为部落间、人群间政治、宗教、生活信息的传达工具,同时使部落政治构成了一种具体的富于感染力的形象。②陵墓艺术时期??图像架构、象征意义representation规范的集体认同与建立 这个时期(其时相当于古埃及与中国的三代至秦汉之间)并非只有陵墓丧葬艺术,而是我们只得到了陵墓艺术史的文本,因此用“陵墓艺术”来命名这个时期非常恰当。这时出现了阶级分化,有了奴隶主和奴隶、贵族和平民的区分,而所谓的艺术家在这时基本上都是奴隶。陵墓图像在这时很明显是当时当地人类群体神灵观念、生死观和生活习俗的体现,它所演绎的是墓主人死后的灵界生活,因此图像架构的规范性被严格化了。因为图像在这一时期是阶级身份的象征,于是“符号”的社会意义凸显了出来,这也就是为什么同一种规制的埃及墓室壁画风格可以沿传达一千多年而不变的原因。③宗教时期??图像呈现为某种特定的文化基因形态 图像在宗教传教的程序中作为一种重要的宣传工具而传播至更广阔的地区,并与异类文化基因相融合。例如印度佛教美术对中国六朝隋唐时期美术发展的巨大影响,在这个过程中,爆发了中古时期人类文化史中最为引人注目的重大事件【21】,这些具体事件的形成与宗教的媒介性至关重要。④城市经济发展早期??图像产品的市场开始形成 宗教时期的图像复制、传播主要仍是图像程式的摹写、或原图夹带等,并没有做到“机械复制”的完全还原,而当印刷术发明以后,图像作品开始被大规模地原版复制,其传播质量与效率发生了根本性的突进。⑤数字与信息时代??图像成为经济交流过程中的主要信息媒介 随着技术的发展,图像信息可以被完全复制,人类也掌握了在技术层面上最能再现真实的图像技术??摄影、摄像。在市场力量的推动下,图像由原来的“消费性产品”转化为“视觉信息产业”的角色,图像成为一种产业、一种资本,在社会经济流通中它的价值越来越趋向信息化,图像的直接利润(如古代绘画作品的买卖)相对降低,取而代之的是完成信息传播工作后的间接商业利润。这一转化是随着艺术形态的类似转化同时发生的,艺术作品在数字化复制时代被高效、高质、低成本的无限推广,数字技术的出现令图像制作、复制与传播走上了系统产业化的道路。四图像的文化内涵显然也超越了传统概念中关于审美和艺术问题的界定,当然这种超越是以对一般形式美思想突破为前提的。正因为如此,图像和图像学方法已经作为全方面的文化和科学的研究解释工具而流行于当代学术界,如哲学、心理学、占星学、神学、考古学、文化人类学及民族学等。在当代美术史的研究中,图像一词已经被广泛采用,大有流行之势。如中央美术学院美术史系的贺西林在研究汉代墓室壁画时,大量运用“图像架构”、“图像风格”等词汇。图像架构和图像风格的使用一方面是指艺术形式方面的问题如构成等,同时更注重对题材内容与形式合而一体的思想、审美意识及传统文化形态的标志。例如,一幅汉代墓室壁画的构成格局和造型手段都具备着很强的时代、地域特征,其构成方式的确立和沿传并不是因为它的审美特征(形式上的),而往往是当时当地人们对灵魂、神仙的信仰观念以及完成这些壁画的一些实际目的决定的。也就是说我们看到的形式特征并不是“纯形式”的,而是与一定社会文化意识形态息息相关的。可能有许多人认为没有必要新建“图像学”这样一个学科,或者不必花这么大的力气去推崇它在现代艺术学术中的价值与地位,原因是他们认为图像学的立论主体不过是美学、艺术理论中内容与形式关系的一个翻版。在对某些艺术问题的讨论时,图像学者确实会遇到上述这种窘境。但传统的艺术史和艺术学研究太过注重艺术的形式差异研究,尤其是学院艺术教育形成以来,艺术家对传统艺术形式的研究兴趣远远超过了对新图像作品的创造。正如贡布里希的主张,我们应该了解艺术创作的全部真相,以此作为艺术学的立论基础,而艺术创作亦决不是孤立于社会文化之外的独行者。因此,图像学正是这样一项融合艺术创作与整体社会文化于一体、并力图寻求创作全部真相的工作。不可回避的是,“图像时代”已经很真实地到来了,进入现代人头脑中的图像信息无论是质量还是数量都远远超过了历史上的前辈,其传播工具变革发展的速度是传统思维方式所无法想象得到的。面对这样一个巨变正在进行的时代,相信每个人都在期待着社会文化即将发生的一场天翻地覆的大变革,我们相信,文化巨变的结果意味着更多人将面临更加平等的机遇以及更富有吸引力的挑战。

论文图像对比研究

调查法调查法是科学研究中最常用的方法之一.它是有目的、有计划、有系统地搜集有关研究对象现实状况或历史状况的材料的方法.调查方法是科学研究中常用的基本研究方法,它综合运用历史法、观察法等方法以及谈话、问卷、个案研究、测验等科学方式,对教育现象进行有计划的、周密的和系统的了解,并对调查搜集到的大量资料进行分析、综合、比较、归纳,从而为人们提供规律性的知识.调查法中最常用的是问卷调查法,它是以书面提出问题的方式搜集资料的一种研究方法,即调查者就调查项目编制成表式,分发或邮寄给有关人员,请示填写答案,然后回收整理、统计和研究.观察法观察法是指研究者根据一定的研究目的、研究提纲或观察表,用自己的感官和辅助工具去直接观察被研究对象,从而获得资料的一种方法.科学的观察具有目的性和计划性、系统性和可重复性.在科学实验和调查研究中,观察法具有如下几个方面的作用:①扩大人们的感性认识.②启发人们的思维.③导致新的发现.实验法实验法是通过主支变革、控制研究对象来发现与确认事物间的因果联系的一种科研方法.其主要特点是:第一、主动变革性.观察与调查都是在不干预研究对象的前提下去认识研究对象,发现其中的问题.而实验却要求主动操纵实验条件,人为地改变对象的存在方式、变化过程,使它服从于科学认识的需要.第二、控制性.科学实验要求根据研究的需要,借助各种方法技术,减少或消除各种可能影响科学的无关因素的干扰,在简化、纯化的状态下认识研究对象.第三,因果性.实验以发现、确认事物之间的因果联系的有效工具和必要途径.文献研究法文献研究法是根据一定的研究目的或课题,通过调查文献来获得资料,从而全面地、正确地了解掌握所要研究问题的一种方法.文献研究法被子广泛用于各种学科研究中.其作用有:①能了解有关问题的历史和现状,帮助确定研究课题.②能形成关于研究对象的一般印象,有助于观察和访问.③能得到现实资料的比较资料.④有助于了解事物的全貌.

函数图像的教学研究论文

摘要: 数形结合的思想是数学中一种重要的思想方法,而在函数的教学中把刻画数量关系的数和具体直观的图形有机结合,用代数的语言揭示几何要素及其关系,同时将几何问题转化为代数问题,扬数之长,取数之优,使抽象思维与形象思维珠联璧合,不但可以提高学生对图形世界的直观感知而且可以使学生更好地理解函数,更加快捷准确的求解答案。

关键词: 函数图像 研究

从以往的教学经验来看,学习函数这部分内容要求学生进行数与形相结合的运算,即要求使符号语言、图形语言结合起来,使抽象思维和形象思维结合起来。学生会遇到很多需要“数”与“形”并举或转换的情形。因此,函数的学习是困扰很多学生的难点。作为教师,我们面临的突出问题是:如何在教学中针对学生的思维特点,制定有效的教学策略高质量地完成函数教学任务。笔者从一个数学教师的角度出发浅谈一下自己对函数教学方面的研究以及心得体会。

1加强学生对函数概念的理解

初中课本上运用“变量说”将函数描述为:设在一个变化过程中有两个变量x与y,如果变量y随着x的变化而变化,并对于x在某个变化范围内的每一个值,按照某个对应规则,都有唯一确定的y值和它对应,那么y就是x的函数,x称为自变量,x的取值范围称为函数的定义域,和x的值对应的y值称为函数值,函数值的全体称为函数的值域。高中阶段,运用“对应说”函数被定义为:设A,B是两个非空的数集,如果按某种对应法则f对于集合A中的每一个元素x,在集合B中都有唯一的元素y和它对应,这样的对应叫做从A到B的一个函数记作:y=f(x),x∈A。

以上两种函数的定义,各有各的不同特点。“变量说”是最朴素、最根本的,便于和实际相结合,初学者更容易接受。“对应说”抽象化的`程度较高,对于研究函数的精细性质具有一定的优势。适合在高中阶段介绍给学生。

讲述函数概念时,我们需要注意以下细节问题。

1。1实现由静到动的转变

学生由于长期在常量范围内计算、思维,因此以为变量一直是变,常量永远是不变。在引入函数概念之前,需要完成从常量到变量的转变,这是函数教学的一个重点。

例如“一架飞机每小时飞行1000千米,问5小时此架飞机飞行的距离是多少?”小学生只能给出正确的答案,但很少能够注意到路程S和时间t的关系。对于初中生我们要能引导他得出S=1000t的函数公式。在高中的实际教学中,我们可以把S表示为数轴上的一个定点,而把t看成是一个动点。取自变量t的一系列特定值,列出相应的另一个变量S(t)的对应值,在坐标系上描绘出这些点,这样会使学生能够比较容易地感受到变量的真实意义。

1。2突出变量之间的依赖关系

自变量和因变量之间的依赖关系是函数。通常表示为y=f(x),f表示x和y之间的对应关系。对于定义域内的任意一个x,通过对应关系f,对应唯一的一个y值。我们可以例举生活中的例子,让学生找出自变量x,然后再找出依赖此变量x的变化而变化的因变量y,最后设法找出它们之间的对应关系。从实际事例中寻找函数关系,构造事物变化过程中的具体函数关系,有利于加强学生对函数的理解。

2加强学生对函数图像的应用

在函数的教学中,我们不但要让学生深刻的理解函数的概念。还要不断帮助学生归纳各种初等函数的图形性质,并且教会学生快速画出初等函数的图形,这样在其今后的解题中将会发挥重大的作用。函数一般分为一次函数、二次函数、指数函数、对数函数和幂函数,下面以二次函数为例,来谈一下函数教学的研究体会。

在教学中,我们要引导学生对函数的图像特征进行归纳总结。可以先介绍特殊的二次函数的表达式y=ax2(a≠0),通过赋予x特殊的数值来对其图像进行描绘,进而归纳图像特征:图像形状为抛物线;顶点为原点;对称轴为y轴;a决定其开口方向,a>0时开口向上,a<0时开口向下。进而通过将y=ax2(a≠0)的图像向上下左右平移,引出二次函数的一般表达式y=ax2+bx+c(a≠0),并将其配方为y=a(x+b a="">0时开口向上,a<0时开口向下;(2)函数的对称轴为x=—b c="">0时,图像与y轴交在正半轴,c<0,图像与y轴交在负半轴,c=0,图像与y轴交在原点;(5)△=b2—4ac决定图像与x轴的交点个数,△>0时,图像与x轴有两个交点,△<0时,图像与x轴无交点,△=0时,图像与x轴无交点。

掌握了函数的基本特征后,学生就能对任一个二次函数进行绘制了,进而在一些有关函数的解题过程中就可以通过数形结合进行求解,不仅直观易发现解题途径,而且能避免复杂的计算与推理,大大简化了解题过程。这在解选择题、填空题中更显其尤为重要,因此我们要引导学生加强对函数图形的掌握,培养数形结合的这种思想意识,做到胸中有图,见数想图,以开拓自己的思维视野。

参考文献

[1]吴志鹃。二次函数图像的教学设计[J]。希望月刊(上半月),2007(11):108。

[2]梁小瑜。加强函数图像教学,衔接初高中数学教学[J]。师道·教研,2010(6):27~28。

[3]付尚英。浅谈利用函数的图像特征解题[J]。金色年华(教学参考),2010(12):113。

虚拟现实图形图像研究论文

关于虚拟现实的科技论文1500字篇二 医学虚拟现实技术研究 【摘要】医学虚拟现实技术(MedicalVirtual Reality Technology),作为一门新兴学科目前正在逐步形成之中,它是集医学,生物力学,机械学,材料学,计算机图形学,计算机视觉,数学分析,机械力学机器人等多学科为一体的新型交叉研究领域。而医学虚拟现实技术是一种悄然进入医疗教育领域的全新技术策略,它势将为未来医疗技术的发展提供了更为广泛的前景。 【关键词】数据过滤;数据转换;虚拟视觉环境显示;立体影像 Abstract:Medical Virtual Reality Technology(Medical Virtual RealityTechnology),as an emerging discipline is now being gradually developed.It isa new multi-disciplinary field of cross-over study with aspects in medicine,biomechanics,mechanics,materials science,computer graphics,computer vision,robotics,and mathematical analysis.The medical virtual reality technology isprogressively becoming an essential part the medical field.It is an importantfield that will lead to the discovery of new medical technology. Keywords:data filtering;data conversion;VIVED;stereo image 1.虚拟视觉环境显示(Virtual Visual Environment Display-VIVED) 由美国宇航局约翰逊宇航中心(JSC)等部门,使用虚拟现实技术为人们提供了一个别出心裁的医学教育策略。它集成了所有囊括人类颅骨和心脏的虚拟现实技术,为人们提供了与其他多媒体(音频、视频等)的交互能力[1]。 2.虚拟手术(Virtual Surgery) 作为医学虚拟现实技术领域正在发展起来的一个研究方向,其目的是利用各种医学影像数据,采用虚拟现实技术,在计算机中建立一个摸拟环境,医生借助虚拟环境中信息进行手术计划制定,手术演练,手术教学,手术技能训练,术中引导手术,术后康复等工作,虚拟手术充分体现虚拟现实作为计算机图形学在医学治疗过程的作用。 3.硬件 一台由Silicon Graphics公司生产的Reality Engine计算机,被用来打开计算轴向体层摄影术(CAT/CT)和磁共振成像切片,放入三维容积图像和可产生身体"飞行"观察效果的电影中。在具有16M内存的Macintosh IICX计算机上观看最终的3D图像。之所以先择Mac是因为它的性价比和音像都优于同类PC,另外它在北美各学校系统被广泛使用,可以说它是桌面多媒体的领跑者,并且有各种各样的软件和硬件支持它。而VR电影可以存储在硬盘上,或转移到CD上,并通过红蓝眼镜观看。它也可以使用虚拟现实头戴式显示器(HMD)或双目全方位显示器(臂架系统)查看。最终图像可以存储在CD-ROM或激光视盘上。 4.软件 4.1 文件转换和数据准备 加尔维斯顿提供的厚度为1.5mm的人类头骨CAT/CT切片和心脏的MRI的切片被用于创建3D图像。在对头骨的CT扫描过程中要经过一个泡沫带,因此会有一些无用数据被生成。颅骨扫描的结果是生成一个数据集,其中有超过120片通过颅骨,60片通过下颌骨(下巴),而心脏的MRI扫描可导出200片的数据集。将医学分会创建的数据文件,送至IGOAL公司(集成显卡,操作和分析实验室)。在那里进行扫描和筛选,去除无关数据,且尽可能不丢失任何重要信息。IGOAL公司开发出一种名为“Ctimager”的工具,用于阈值计算,从而把切片中不需要的噪声和无关数据去掉。 4.2 数据过滤和体数据转换为多边形数据 使用被IGOAL称为“dispfly”的开发工具,在稍后可将转换大量的数据直接由计算机显示出来。此工具用于多个过滤算法准备CT和磁共振成像数据转换为多边形的窗体。解剖模型是基于移动的多维数据集算法生成的。滤波处理通常包括阈值化的数据,以消除大部分噪声的。一个低通滤波器被用于最小化,将产生一个不规则的表面凹凸不平,当输入到算法中的高频噪声。这个过程产生相对平滑的表面,其近似扫描样品,并减少产生的噪声的多边形数量。一个独特的过滤器对心脏数据仅平滑扫描之间的数据创建,是不需要其他的过滤[2]。由于心脏和颅骨有大量的数据集切片,几种模式被建立,其中每一个代表一个少量切片。一个网格算法,“meshit”,后来发展到提高显示性能。这种算法转换成高效条状的三角形的原始集合。平均超过100三角形组成每个三角形条带。。 4.3 产生立体图像 建成模型后,立体声序列被渲染。IGOAL公司开发了一种名为OOM(面向对象操纵器)工具,用来把经过渲染的每一帧存储到磁盘上,这些图像用红色和蓝色的色彩分离为代表的立体图像。一旦这些序列被记录到磁盘上,数据的格式就被转换成Macintosh.pict格式,全彩色图像序列的按非立体观看转移到Mac上。 4.4 立体影像及多媒体 对Mac图像进行编辑,以产生所希望的效果,如数字化的尸体覆盖或插入文本描述什么正在被观看。使用Apple的QuickTime扩展,图像被转换为QuickTime电影动画在Mac上。 5.结论 CT扫描头骨的医疗图像,由Macintosh计算机通过处理头盔显示器或臂式系统的信息,最终生成高质量VR图像。目前科学家正试图用磁共振的成像数据生成了一个心脏VR模型。 初步结果显示,可以使用这种类型的成像数据开发出高分辨率模型。而为了保持高质量VR成像目标,大量的数据是用帧序列来描述的,由此会产生一些问题。为了缓解这个问题,科学家们正在探讨替代的硬件和软件解决方案。 另一个问题是该技术针对HMD的显示系统。为保持一个高品质的虚拟现实体验,液晶显示器对分辨率没有要求。在CRT显示器在多种教育平台上都可以满足分辨率的要求,但是成本过高。外科手术模拟可能成为例程,尤其是在制定综复杂和罕见的手术方案时。 6.在VIVED的应用和研究现状 当前的研究,强调创建一个高分辨率的人体虚拟现实模拟器用于教育目的的重要性。而应用这项技术必须充分理解其复杂的三维关系,如在下面的领域:解剖学教育,各类机械设备,生化,病理学研究,外科医生,模拟整形外科和利用内窥镜培训外科医生等。 7.其他应用程序 随着医学虚拟现实技术的发展,新的教育解决方案和策略如雨后春笋般不断出台。如北卡罗莱纳大学教堂山分校利用超声波,MRI和X射线创建的动态影像放射治疗的“预测”模型。达特茅斯医学院创造出人脸和下肢的数学模型,用于研究外科手术的效果评估。绿叶医疗系统在帕洛阿尔托开发出“EVAL”和“手套健谈”系统,作为实现“评估和演示”系统。使用传感器做衬里的数据手套和数据西装获取更大的使用范围,对运动损伤和残疾病人进行行之有效的损伤程度度量。“手套健谈”是帮助病人康复的数据手套的手语装置,让人无需发声(中风或脑性麻痹患者),仅使用计算机能够理解的手势。而使用头盔显示器使得需要康复的病人可以重新学习,如开关门,行走,点或转身的行为[3]。 8.结语 将CT扫描的头骨医学图像在Macintosh电脑上使用一个头盔显示器或臂架系统便可生成高质量的VR图像。目前科学家们正在开发根据磁共振成像数据生成心脏的VR模型。初步的研究结果表明,高分辨率模型可以使用这种方法的成像数据技术来实现。要想维持高质量虚拟现实的目标成像,必须适当调整“飞穿”的帧序列的数据量。而其它文明拟定的硬件和软件解决方案也正是为了探索缓解这一问题。再有就是该技术是针对HMD的显示系统技术。因为在各种医学教育平台中,LCD显示屏不涉及维持高质量的虚拟现实问题,而要实现高分辨率CRT显示器的成本又太高。 参考文献 [1]"NASA TECHNOLOGY TRANSFER Commercial Applications of Aerospace Technology",National Aeronautics and Space Administration,Technology Applications. [2]Porter,Stephen,"Virtual Reality",Computer Graphics World,(March,1992),42-54. [3]Sprague,Laurie A.,Bell,Brad,Sullivan,Tim,and Voss,Mark,"Virtural Reality In Medical Education and Assessment",Technology 2003,December 1993. 通讯作者:娄岩。 看了“关于虚拟现实的科技论文1500字”的人还看: 1. 大学科技论文2000字 2. vr技术论文2000字 3. vr虚拟现实技术论文 4. 计算机仿真技术论文范文 5. 虚拟与现实作文800字

虚拟现实(VR)是一种由计算机和电子技术创造的新世界,是一个看似真实的模拟环境,下面是我为大家精心推荐的关于虚拟现实的科技论文2500字,希望能够对您有所帮助。

直觉交互界面与虚拟现实

摘要:为了研发更高水准的直觉交互界面,有必要引入虚拟现实技术,借助具备沉浸性、交互性和想象性的人机交互环境来获得真正意义上的直觉体验。通过特定的物理器件装置,以及先进的手势识别技术,使用者不必学习专门的操作命令,就可以与计算机进行交流并获得实时的反馈,而独特的沉浸式环境更能创造出人机一体的融合感。结果表明,虚拟现实技术有效地提升了用户的体验度,大大简化了操作的复杂性,而且可以应用于从娱乐到专业制造等各种场合,是直觉交互界面的有力驱动平台。

关键词:直觉交互;人机交互;虚拟现实

中图分类号:J0-05 文献标识码:A

本文是在“人―计算机” 交互(Human-Computer Interaction)的意义上来谈论“交互”。随着计算机技术几十年来突飞猛进的发展,计算机已经完全进入了日常生活的方方面面,其影响无处不在,人机之间的互动操作问题也越发显得重要。由于计算机尚未能摆脱冯・诺依曼体系的根本制约,与人类思维模式之间的鸿沟依然如同天堑,人机交互问题的一个重要着眼点就在于如何尽量地缩小人类使用者的操作模式与计算机的操作模式之间的差别。这意味着我们仍在不断地摸索和探讨,去提供更优秀的交互界面,使人可以顺畅地、高效率地与计算机进行对话。

一直以来,交互设计思维首要强调的就是以人为本,换而言之就是让设计物适应人,而非人适应设计物。这种观点在计算机还是国防机密的年代中显得有些奢侈,人们只能痛苦地训练自己去迎合机器(例如,使用完全机器式的编程语言与计算机交谈)。在当下,相对廉价的个人计算机都可以提供可观的计算能力,因此交互界面的设计原则也就顺应了这样的思路,去尽可能地将界面做得人性化,让人用得舒服,而繁重的计算则交给计算机在幕后默默地处理。

正是在这样的大背景下,“直觉”一词吸引了大家的目光。毕竟相对于日常物件,计算机的交互界面还是太不人性了,依旧保持着冰冷的面孔。如果能将我们习以为常的动作引入与计算机的交互之中,在不知不觉中将完成与计算机的沟通,那么这样的人机界面才能称得上是以人为本。而在呈现直觉界面方面,新兴的虚拟现实技术则提供了最有价值的工具。

本文正是拟探讨直觉交互界面及其与虚拟现实技术间的关系,为了完成这样的任务,首先我们要对人机交互意义上的直觉作出一个明确的定义,它实际上与大众文化中的“直觉”概念有着相当的差别。之后我们将谈论如何将上述意义上的直觉与虚拟现实结合起来,并提供具体的案例分析来支撑我们的探讨。

一、直觉交互界面

直觉(Intuition)这个概念属于大众词汇,但实际上不同的学科对直觉都有着不同的定义。本文研究的对象是人机交互,因此将在“凭着直觉去与计算机进行交互” (interaction with computer by intuition)这个上下文中去探讨它。首先要注意到,交互是双方面的,也即人与计算机在进行着双向的互动,但直觉却是人才能拥有的,也是仅仅用来修饰人的判断与感觉的,因此直觉人机交互关心的是以人为中心的交互场景中各参与元素对人是否直觉。从人的角度考虑交互界面,这实际也就奠定了“以人为本”在理论上的基础性质。

一般而言,人们对直觉的交互有着如下诉求:它不需要经过有意识的思考便能做出。例如在翻动一页书的时候,人不需要去有意识地考虑该用多大的力气,手指该走怎样的空间路线,或有意识地等待书页翻动之后出现的非常规情况并作出反应,等等。在这个意义上,一本实体书的交互界面是直觉的。依据以上诉求,Blackler等人的研究指出,直觉是“基于已往经验的无意识的反应”[1]。这个定义强调了两个要点:基于以往经验和无意识。关于直觉往往是无意识的(下意识的)举动,这一点几乎已成共识,这里就不再展开论述。需要厘清的是“基于已往经验”这一点。

在日常生活中,人们或许并不认为直觉与已往经验之间会有什么关联。相反,许多人会认为,如果不需要经验就能进行某种操作,那么这种操作显然更符合直觉。特别地,中国传统文化中的“直觉”概念充满了反智主义的特征,直接将“直觉”与“本能”联系起来,往往意味着“不需要通过知识或经验便可以下意识地完成”。但这实际上是一种错误的观点,它不但误解了人的本能,而且未能认识到已往经验的真实存在及其影响。事实上,现代理论表明,人类绝大多数行动――简单的或复杂的――都是后天习得的,并非先天刻印于脑中。如果仅凭本能,人几乎无法完成什么人机交互操作:拿按钮这种最简单的人机界面元素来说,如果没有事先通过各种例子认识到存在按钮这种东西并且按下它之后会启动某些关联反应,使用者甚至都无法做出按下按钮的行为。或者用K.R.Popper[2]的话来说,所有行动都承载着理论――后天习得的理论。

将直觉与已往经验联系起来,这不仅揭示了直觉在人机交互中的真正面貌,而且指出了设计人机交互界面时的一条基础准则:由于不同的人有着不同的生活经验与知识水平,那么他们的已有经验也是不同的,这也就意味着每种类型的人都有着他们对“直觉交互界面”的不同衡量标准。有一个简单的例子可以说明这一点。

考虑一款在电脑上运行的收音机软件,它的作用是播放网络上的各类实时音频流(包括传统电台的在线音频流)。图 1模拟半导体收音机的调频指针窗口,从传统眼光而论这样的界面便是直觉的。然而,对于没有用过半导体收音机的新一代年轻人而言,他们由于频繁地接触电脑,反而会觉得图2的界面是直觉的,因为这样的界面使用的是为电脑用户所熟知的UI(User Interface,用户界面)元素,包括菜单、按钮、列表框和滚动条等等。

习惯半导体收音机操作的用户多半用不惯新式界面,而习惯新式界面、没使用过半导体收音机的用户却很可能对传统界面不知所以。这个例子充分说明了,在考虑直觉交互界面的时候,必须考虑用户群体的已往经验,依据不同的已往经验去断定直觉因素。并不存在唯一的、普适的、通用的直觉界面,这给了设计师以极大的挑战,但同时也是极大的创新动力。 此外,虽然直觉的定义没有直接体现对审美的考虑,但审美和直觉显然是互有关联的[3]。由于直觉使用与交互过程中唤起的先前知识有关,那么审美判断作为人类感知过程的起点之一,恰是诱发直觉的重要因素。一个富于美感的界面,可以抵消用户使用过程中的不安感和隔膜感,并在潜意识上促使和鼓励用户做出交互行为并保证交互行为的持续性和统一性。上面的例子也表明,对于传统用户,设计精美、极富质感的模拟界面有效地抵消了传统用户对电脑软件的不适感,方便他们使用,并且大大降低了潜在的学习成本。而对于年轻用户,他们也可以在自己熟悉的控件界面中运作自如,拉近了老技术(传统流媒体)与新技术间的距离。简而言之,具备良好审美特性的直觉界面具有重要的价值与意义,体现了人机交互界面的发展趋势。

二、直觉界面与虚拟现实

自上世纪70年代起,虚拟现实(Virtual Reality)技术的发展异常迅猛,从专业研究到商业应用乃至家用娱乐都可见其身影。从根本上而言,虚拟现实恰是交互界面直觉化的总趋势的一个反映,因为人机交互演进的内在逻辑在于,呈现和交互手段总在致力于让用户以更直观、更自然、更简便的操控方式去获得更丰富、更多态、更实时的数据资源。

简而言之,虚拟现实提供了一个具有沉浸性(Immersion)、交互性(Interaction)和想象性(Imagination)的虚拟数字富媒体环境;用户不仅可以如同设身处地一般沉浸在它所提供的丰富多彩的虚拟环境中,更可以通过各种创新的途径来与环境中的元素进行互动。沉浸性、交互性和想象性,正是虚拟现实的三个基本特征[4]:一是沉浸性,通过各种技术手段让用户产生“身临其境”的感觉,包括视觉(利用人的立体视觉原理产生虚拟的三维纵深感)、听觉(利用立体声产生虚拟物体的方位感)、触觉(通过力觉设备使用户以为在与真实的物理实体打交道)等等;二是交互性,用户可以实时地与虚拟现实系统中的各种物体进行互动操作,用户的操作不再局限于传统的键盘、鼠标或游戏杆,还包括先进的数据手套、穿着式回馈服等等;三是想象性,给用户呈现的虚拟现实场景具有超越现实场景的特殊魅力,真正做到某种意义上的“心想事成”。

从虚拟现实的上述特征可以看出,它的基本出发点就是要超越传统人机交互界面的非人性化的一面,不仅要让用户尽量溶入整个交互场景中(沉浸性),而且要让用户以更直觉的方式去操作计算机(交互性):首先,虚拟现实技术能够有效地将计算机交互界面直觉化,提供与日常场景尽量类似的界面,完全基于人类日常的视觉直觉。其次,虚拟现实技术能够有效地消除人机交互之间的阻隔,让用户能够通过日常的动作和行为与计算机交互。

从上文的概念分析可知,判定直觉程度要看与使用者本身的已知经验,而且使用情境和审美等其他因素也要考虑在内。虚拟现实技术本身提供了多种多样的方法,但具体的构建和应用也要遵循这样的准则。下一节将提供几个应用案例来说明这些,并综合讨论如何真正地利用虚拟现实技术去设计直觉交互界面。

三、应用案例及讨论

以虚拟现实技术为基础的直觉交互界面被广泛应用于各种层次、各种领域的实践应用之中,其目标用户群体不仅包括非专业人士(普通民众),也包括熟悉计算机但希望寻求更直观的交互操作方式的专业人士。对于前者,他们需要能够尽量降低学习和记忆成本、兼或附带娱乐趣味性的人机界面。而对于后者,操控感良好的直觉界面可以大大提升生产率和成品率,并推动整个生产流程的优化。

日本大阪大学人机工程实验室的伊藤雄一等人研发了ActiveCube(动态积木)[5],这个作品将直觉界面引入儿童和青少年认知学习及娱乐之中,并辅以虚拟现实或增强现实设备以提升其应用价值。每个积木都是一个边长五厘米的塑料立方体;积木里面有一块可编程集成电路,控制着一系列可选的感应器或小型设备,包括超声感应器(感知外界物体的接近)、坐标感应器(三维坐标的相对角度)、触觉感应器(最多可装两个,每个可以感应八个方向的触觉)、红外感应器、灯和电动机等。因此,每个积木实际上已经是一个独立的玩具,可以感知环境并产生相应的动态行为。更绝妙的是,这些积木还能彼此连接,连接起来的各个部分之间也可以互相通信,构成整体行为。儿童使用者不需要额外教学就可以通过直觉使用它们。这样的直觉操作界面,很好地避免了其内部的复杂结构对使用者的影响,小学低年级学生就可以独立操作。

ActiveCube的一大特色在于可以在虚拟现实场景里使用。在这种情形中,红外感应器捕捉搭建好的积木形态,并将符合此形态的虚拟物品显示出来。应用了虚拟现实技术之后,规整的积木可以任意变换成为植物、动物、日常器具等,不仅视觉效果有可观的提升,还借此允许用户进行进一步的玩耍和操控。

ActiveCube还可以在虚拟现实场景里使用。在这种情形中,红外感应器捕捉搭建好的积木形态,并将符合此形态的虚拟物品显示出来。由于ActiveCube本身只是一个简单的立方体,其六面自由连接功能限制了表面的装饰性,最后的拼装效果不一定能吸引儿童用户的兴趣。而应用了虚拟现实技术之后,古板规整的积木可以任意变换成为植物、动物、日常器具等,不仅视觉效果有可观的提升,还借此允许用户进行进一步的玩耍和操控。在上面的例子中,外表相对简陋的十字架形积木摇身一变,可成为精美的飞机,并随着积木在实际环境中的位移而在现实设备上呈现相应的飞行轨迹。

另一个实例来自于工业设计领域。当下的设计师一般都有较高的学历和较专业的计算机技能,但进行三维产品建模的时候,复杂的软件界面依然是最重要的阻碍因素,更遑论键盘加鼠标的操控方式根本就与人手的自然行为大相径庭,严重干扰了设计师的思维和创作习惯。荷兰Delft大学工业设计工程团队在这方面进行了大量研究,提出了新的解决方案,其关键就在于引入直观的手势来与计算机交互,于虚拟现实环境中完成建模工作[6-7]。

一般而言,手势比面部表情和眼动更易于捕捉和识别,又比全身姿势更易于实施(特别是在狭小空间中),因此比较受直觉界面研究者的青睐[8]409-420。但手势也分为几个细类,不一定都适合用于人机交互。Hummels指出了三类手势,第一类是从计算机角度去定义的手势,因而非常便于计算机识别,但需要使用者去刻意学习和掌握,称不上直觉。第二类与之相反,指的是人类日常生活中的手势,优点是非常直观,但计算机程序需要特别的设计才能对其进行识别。综合了以上两种类别之优点而又尽量规避其不足的第三类手势称为描述性手势,原本自身也有着应用范围过窄的缺憾,但辅以虚拟现实技术,便可以成为有效的途径以联通设计师和计算机。 为了提高描述性手势的效果,研究人员特地设计了一个虚拟现实实验环境,见图3。在此环境中,普通设计师作为被试,不受拘束地使用他们惯常的手势进行设计创作,而这些以直觉为基础挥舞出来的手势被动作感应器记录下来,最后进行统计分析。通过这样的过程,研究人员能够采集到和分析出最适合虚拟现实环境的直觉手势。最后,对设计师而言非常直觉、对计算机而言又是相当便于识别的手势方案即可得到确定。设计师在此系统中,可以像往常操作日常物体(胶泥或板材等)一样与计算机辅助设计软件进行人机对话,不仅直觉高效,而且得益于虚拟现实环境,整个设计流程形同真实体验,大大提高了设计效率。

四、结论与展望

一直以来,“以人为本”都是人机交互设计领域的核心口号之一。但本文的分析指出,这绝不能是一句抽象的口号,而必须落实到具体的应用情境之中。另一方面,近年来关于“用户体验”的声音不绝于耳[9],它本质上也是“以人为本”的精神的一种体现,但这个提法也存在着过于含糊的缺点,导致了许多不同的理论都以它为逻辑基础。实际上,只要明确了“人”(也即“用户”)的特定性,问题也就解决了。既然不同的人和不同的用户其自身情况多有差异,同样着眼于“以人为本”或“增进用户体验”的产品,也就必须随着人/用户的不同而给出不同的解决方案,提供不同的交互界面,才能在交互过程中让使用者满意。

直觉概念得到了厘清,但这显然并不意味着直觉交互设计的种种问题也就有了答案。如何让某种交互界面更少地占用使用者的逻辑意识(也即做到“无意识地或下意识地被使用”),以及如何明确地定性定量分析特定用户的已往经验,并以之支持交互界面的设计,这依然是非常复杂的问题。幸而在各领域学者的努力下,此领域已有许多成功的理论或实践得以依循。在这方面最重要的一项就是关于直觉交互中的手势问题,它旨在解决人机交互场景中用什么有效的手势去操作计算机。由于手势不受传统输入设备的限制,它天然地与虚拟现实技术结合在一起[8]409-420。此外,针对现在方兴未艾的商业以及家用娱乐虚拟现实应用,直觉交互界面也是其中的研发热点。限于研究的深度及文章篇幅,本文遗憾地未能在这些方面展开论述,希望能在后继研究中逐步展开。

最后要强调的是,随着普适计算(ubiquitous computing)这个概念在强大的计算机硬件的支持下渐渐变为现实,设计和实现各种直觉交互界面已成为人机交互的核心任务。普适计算要求计算机设备可以感知周围环境的变化并执行相应的任务,在这一过程中如果交互界面做不到直觉易用,那么其计算机人性化的核心价值也就无从体现了。由此,直觉交互界面的理论与实践必将日益凸显其无比的重要性和关键性。

[参考文献]

[1] Blackler A,Popovic V,Mahar D.Investigating users' intuitive interaction with complex artefacts[J].Applied Ergonomics,2010,41(1):72-92.

[2] 波普尔.猜想与反驳:科学知识的增长[M].傅季重,纪树立,周昌忠,等,译.杭州:中国美术学院出版社,2003.

[3] Naumann A,Hurtienne J,Israel J H,et al.Intuitive use of user interfaces: defining a vague concept[M]∥HARRIS D.Engineering Psychology and Cognitive Ergonomics.Berlin:Springer-Verlag,2007:128-136.

[4] Alonso M A G,Gutierrez M A,Vexo F,et al.Stepping Into Virtual Reality[M].New York: Springer-Verlag New York Inc,2008.

[5] Watanabe R,Itoh Y,Kawai M,et al.Implementation of ActiveCube as an intuitive 3D computer interface[M]∥Butz A,Olivier P.Smart Graphics. Berlin: Springer,2004:43-53.

[6] Hummels C,Overbeeke C J. Kinaesthesia in synaesthesia:the expressive power of gestures in design[C]∥Design and semantics of form and movement.Eindhoven:Eindhoven University of Technology,2006:34-41.

[7] Hummels C,Smets G,Overbeeke K.An Intuitive T-wo-handed Gestural Interface for Computer Supported Product Design: International Gesture Workshop[C].Bielefeld:Springer Verlag,1998.

[8] Nielsen M,Strring M,Moeslund T B,et al.A procedure for developing intuitive and ergonomic gesture interfaces for HCI[M]∥Gamurri A,Volpe G.Gesture-Based Communication in Human-Computer Interaction.Berlin:Springer,2004:409-420.

[9] Garrett J J.The elements of user experience[M].Berkeley,CA:New Riders,2002.

点击下页还有更多>>>关于虚拟现实的科技论文2500字

相关百科

热门百科

首页
发表服务