与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。 任务分类和应用 根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolated word recognition),关键词识别(或称关键词检出,keyword spotting)和连续语音识别。其中,孤立词识别 的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。另外,根据语音设备和通道,可以分为桌面(PC)语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。不同的采集通道会使人的发音的声学特性发生变形,因此需要构造各自的识别系统。语音识别的应用领域非常广泛,常见的应用系统有:语音输入系统,相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;语音控制系统,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域;智能对话查询系统,根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行服务、股票查询服务等等。 前端前端处理是指在特征提取之前,先对原始语音进行处理,部分消除噪声和不同说话人带来的影响,使处理后的信号更能反映语音的本质特征。最常用的前端处理有端点检测和语音增强。端点检测是指在语音信号中将语音和非语音信号时段区分开来,准确地确定出语音信号的起始点。经过端点检测后,后续处理就可以只对语音信号进行,这对提高模型的精确度和识别正确率有重要作用。语音增强的主要任务就是消除环境噪声对语音的影响。目前通用的方法是采用维纳滤波,该方法在噪声较大的情况下效果好于其它滤波器。处理声学特征 声学特征的提取与选择是语音识别的一个重要环节。声学特征的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程,目的是使模式划分器能更好地划分。由于语音信号的时变特性,特征提取必须在一小段语音信号上进行,也即进行短时分析。这一段被认为是平稳的分析区间称之为帧,帧与帧之间的偏移通常取帧长的1/2或1/3。通常要对信号进行预加重以提升高频,对信号加窗以避免短时语音段边缘的影响。常用的一些声学特征* 线性预测系数LPC:线性预测分析从人的发声机理入手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,从而n 时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方差最小LMS,即可得到线性预测系数LPC。对 LPC的计算方法有自相关法(德宾Durbin法)、协方差法、格型法等等。计算上的快速有效保证了这一声学特征的广泛使用。与LPC这种预测参数模型类似的声学特征还有线谱对LSP、反射系数等等。* 倒谱系数CEP:利用同态处理方法,对语音信号求离散傅立叶变换DFT后取对数,再求反变换iDFT就可得到倒谱系数。对LPC倒谱(LPCCEP),在获得滤波器的线性预测系数后,可以用一个递推公式计算得出。实验表明,使用倒谱可以提高特征参数的稳定性。* Mel倒谱系数MFCC和感知线性预测PLP:不同于LPC等通过对人的发声机理的研究而得到的声学特征,Mel倒谱系数MFCC和感知线性预测 PLP是受人的听觉系统研究成果推动而导出的声学特征。对人的听觉机理的研究发现,当两个频率相近的音调同时发出时,人只能听到一个音调。临界带宽指的就是这样一种令人的主观感觉发生突变的带宽边界,当两个音调的频率差小于临界带宽时,人就会把两个音调听成一个,这称之为屏蔽效应。Mel刻度是对这一临界带宽的度量方法之一。MFCC的计算首先用FFT将时域信号转化成频域,之后对其对数能量谱用依照Mel刻度分布的三角滤波器组进行卷积,最后对各个滤波器的输出构成的向量进行离散余弦变换DCT,取前N个系数。PLP仍用德宾法去计算LPC参数,但在计算自相关参数时用的也是对听觉激励的对数能量谱进行DCT的方法。声学模型语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算。本节和下一节分别介绍声学模型和语言模型方面的技术。HMM声学建模:马尔可夫模型的概念是一个离散时域有限状态自动机,隐马尔可夫模型HMM是指这一马尔可夫模型的内部状态外界不可见,外界只能看到各个时刻的输出值。对语音识别系统,输出值通常就是从各个帧计算而得的声学特征。用HMM刻画语音信号需作出两个假设,一是内部状态的转移只与上一状态有关,另一是输出值只与当前状态(或当前的状态转移)有关,这两个假设大大降低了模型的复杂度。HMM的打分、解码和训练相应的算法是前向算法、Viterbi算法和前向后向算法。语音识别中使用HMM通常是用从左向右单向、带自环、带跨越的拓扑结构来对识别基元建模,一个音素就是一个三至五状态的HMM,一个词就是构成词的多个音素的HMM串行起来构成的HMM,而连续语音识别的整个模型就是词和静音组合起来的HMM。上下文相关建模:协同发音,指的是一个音受前后相邻音的影响而发生变化,从发声机理上看就是人的发声器官在一个音转向另一个音时其特性只能渐变,从而使得后一个音的频谱与其他条件下的频谱产生差异。上下文相关建模方法在建模时考虑了这一影响,从而使模型能更准确地描述语音,只考虑前一音的影响的称为Bi- Phone,考虑前一音和后一音的影响的称为Tri-Phone。英语的上下文相关建模通常以音素为基元,由于有些音素对其后音素的影响是相似的,因而可以通过音素解码状态的聚类进行模型参数的共享。聚类的结果称为senone。决策树用来实现高效的triphone对senone的对应,通过回答一系列前后音所属类别(元/辅音、清/浊音等等)的问题,最终确定其HMM状态应使用哪个senone。分类回归树CART模型用以进行词到音素的发音标注。 语言模型语言模型主要分为规则模型和统计模型两种。统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律,其中N-Gram简单有效,被广泛使用。N-Gram:该模型基于这样一种假设,第n个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。这些概率可以通过直接从语料中统计N个词同时出现的次数得到。常用的是二元的Bi-Gram和三元的Tri-Gram。语言模型的性能通常用交叉熵和复杂度(Perplexity)来衡量。交叉熵的意义是用该模型对文本识别的难度,或者从压缩的角度来看,每个词平均要用几个位来编码。复杂度的意义是用该模型表示这一文本平均的分支数,其倒数可视为每个词的平均概率。平滑是指对没观察到的N元组合赋予一个概率值,以保证词序列总能通过语言模型得到一个概率值。通常使用的平滑技术有图灵估计、删除插值平滑、Katz平滑和Kneser-Ney平滑。 搜索连续语音识别中的搜索,就是寻找一个词模型序列以描述输入语音信号,从而得到词解码序列。搜索所依据的是对公式中的声学模型打分和语言模型打分。在实际使用中,往往要依据经验给语言模型加上一个高权重,并设置一个长词惩罚分数。Viterbi:基于动态规划的Viterbi算法在每个时间点上的各个状态,计算解码状态序列对观察序列的后验概率,保留概率最大的路径,并在每个节点记录下相应的状态信息以便最后反向获取词解码序列。Viterbi算法在不丧失最优解的条件下,同时解决了连续语音识别中HMM模型状态序列与声学观察序列的非线性时间对准、词边界检测和词的识别,从而使这一算法成为语音识别搜索的基本策略。由于语音识别对当前时间点之后的情况无法预测,基于目标函数的启发式剪枝难以应用。由于Viterbi算法的时齐特性,同一时刻的各条路径对应于同样的观察序列,因而具有可比性,束Beam搜索在每一时刻只保留概率最大的前若干条路径,大幅度的剪枝提高了搜索的效率。这一时齐Viterbi- Beam算法是当前语音识别搜索中最有效的算法。 N-best搜索和多遍搜索:为在搜索中利用各种知识源,通常要进行多遍搜索,第一遍使用代价低的知识源,产生一个候选列表或词候选网格,在此基础上进行使用代价高的知识源的第二遍搜索得到最佳路径。此前介绍的知识源有声学模型、语言模型和音标词典,这些可以用于第一遍搜索。为实现更高级的语音识别或口语理解,往往要利用一些代价更高的知识源,如4阶或5阶的N-Gram、4阶或更高的上下文相关模型、词间相关模型、分段模型或语法分析,进行重新打分。最新的实时大词表连续语音识别系统许多都使用这种多遍搜索策略。N-best搜索产生一个候选列表,在每个节点要保留N条最好的路径,会使计算复杂度增加到N倍。简化的做法是只保留每个节点的若干词候选,但可能丢失次优候选。一个折衷办法是只考虑两个词长的路径,保留k条。词候选网格以一种更紧凑的方式给出多候选,对N-best搜索算法作相应改动后可以得到生成候选网格的算法。前向后向搜索算法是一个应用多遍搜索的例子。当应用简单知识源进行了前向的Viterbi搜索后,搜索过程中得到的前向概率恰恰可以用在后向搜索的目标函数的计算中,因而可以使用启发式的A算法进行后向搜索,经济地搜索出N条候选。 系统实现 语音识别系统选择识别基元的要求是,有准确的定义,能得到足够数据进行训练,具有一般性。英语通常采用上下文相关的音素建模,汉语的协同发音不如英语严重,可以采用音节建模。系统所需的训练数据大小与模型复杂度有关。模型设计得过于复杂以至于超出了所提供的训练数据的能力,会使得性能急剧下降。听写机:大词汇量、非特定人、连续语音识别系统通常称为听写机。其架构就是建立在前述声学模型和语言模型基础上的HMM拓扑结构。训练时对每个基元用前向后向算法获得模型参数,识别时,将基元串接成词,词间加上静音模型并引入语言模型作为词间转移概率,形成循环结构,用Viterbi算法进行解码。针对汉语易于分割的特点,先进行分割再对每一段进行解码,是用以提高效率的一个简化方法。对话系统:用于实现人机口语对话的系统称为对话系统。受目前技术所限,对话系统往往是面向一个狭窄领域、词汇量有限的系统,其题材有旅游查询、订票、数据库检索等等。其前端是一个语音识别器,识别产生的N-best候选或词候选网格,由语法分析器进行分析获取语义信息,再由对话管理器确定应答信息,由语音合成器输出。由于目前的系统往往词汇量有限,也可以用提取关键词的方法来获取语义信息。 自适应与强健性 语音识别系统的性能受许多因素的影响,包括不同的说话人、说话方式、环境噪音、传输信道等等。提高系统鲁棒性,是要提高系统克服这些因素影响的能力,使系统在不同的应用环境、条件下性能稳定;自适应的目的,是根据不同的影响来源,自动地、有针对性地对系统进行调整,在使用中逐步提高性能。以下对影响系统性能的不同因素分别介绍解决办法。解决办法按针对语音特征的方法(以下称特征方法)和模型调整的方法(以下称模型方法)分为两类。前者需要寻找更好的、高鲁棒性的特征参数,或是在现有的特征参数基础上,加入一些特定的处理方法。后者是利用少量的自适应语料来修正或变换原有的说话人无关(SI)模型,从而使其成为说话人自适应(SA)模型。说话人自适应的特征方法有说话人规一化和说话人子空间法,模型方法有贝叶斯方法、变换法和模型合并法。语音系统中的噪声,包括环境噪声和录音过程加入的电子噪声。提高系统鲁棒性的特征方法包括语音增强和寻找对噪声干扰不敏感的特征,模型方法有并行模型组合PMC方法和在训练中人为加入噪声。信道畸变包括录音时话筒的距离、使用不同灵敏度的话筒、不同增益的前置放大和不同的滤波器设计等等。特征方法有从倒谱矢量中减去其长时平均值和RASTA滤波,模型方法有倒谱平移。 微软语音识别引擎 微软在office和vista中都应用了自己开发的语音识别引擎,微软语音识别引擎的使用是完全免费的,所以产生了许多基于微软语音识别引擎开发的语音识别应用软件,例如《语音游戏大师》《语音控制专家》《芝麻开门》等等软件。 语音识别系统的性能指标 语音识别系统的性能指标主要有四项。①词汇表范围:这是指机器能识别的单词或词组的范围,如不作任何限制,则可认为词汇表范围是无限的。②说话人限制:是仅能识别指定发话者的语音,还是对任何发话人的语音都能识别。③训练要求:使用前要不要训练,即是否让机器先“听”一下给定的语音,以及训练次数的多少。④正确识别率:平均正确识别的百分数,它与前面三个指标有关。小结以上介绍了实现语音识别系统的各个方面的技术。这些技术在实际使用中达到了较好的效果,但如何克服影响语音的各种因素还需要更深入地分析。目前听写机系统还不能完全实用化以取代键盘的输入,但识别技术的成熟同时推动了更高层次的语音理解技术的研究。由于英语与汉语有着不同的特点,针对英语提出的技术在汉语中如何使用也是一个重要的研究课题,而四声等汉语本身特有的问题也有待解决。
语音识别技术研究让人更加方便地享受到更多的社会信息资源和现代化服务,对任何事都能够通过语音交互的方式。 我整理了浅谈语音识别技术论文,欢迎阅读!
语音识别技术概述
作者:刘钰 马艳丽 董蓓蓓
摘要:本文简要介绍了语音识别技术理论基础及分类方式,所采用的关键技术以及所面临的困难与挑战,最后讨论了语音识别技术的 发展 前景和应用。
关键词:语音识别;特征提取;模式匹配;模型训练
Abstract:This text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to developing prospect ion and application of the speech-identification technology are discussed in the last part.
Keywords:Speech identification;Character Pick-up;Mode matching;Model training
一、语音识别技术的理论基础
语音识别技术:是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生 理学 、心理学、语言学、 计算 机 科学 以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行 自然 语言通信。
不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取。
(一) 语音识别单元的选取
选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种,由具体的研究任务决定。
单词(句)单元广泛应用于中小词汇语音识别系统,但不适合大词汇系统,原因在于模型库太庞大,训练模型任务繁重,模型匹配算法复杂,难以满足实时性要求。
音节单元多见于汉语语音识别,主要因为汉语是单音节结构的语言,而 英语 是多音节,并且汉语虽然有大约1300个音节,但若不考虑声调,约有408个无调音节,数量相对较少。因此,对于中、大词汇量汉语语音识别系统来说,以音节为识别单元基本是可行的。
音素单元以前多见于英语语音识别的研究中,但目前中、大词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成,且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母,这样虽然增加了模型数目,但提高了易混淆音节的区分能力。由于协同发音的影响,音素单元不稳定,所以如何获得稳定的音素单元,还有待研究。
(二) 特征参数提取技术
语音信号中含有丰富的信息,但如何从中提取出对语音识别有用的信息呢?特征提取就是完成这项工作,它对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。对于非特定人语音识别来讲,希望特征参数尽可能多的反映语义信息,尽量减少说话人的个人信息(对特定人语音识别来讲,则相反)。从信息论角度讲,这是信息压缩的过程。
线性预测(LP)分析技术是目前应用广泛的特征参数提取技术,许多成功的应用系统都采用基于LP技术提取的倒谱参数。但线性预测模型是纯数学模型,没有考虑人类听觉系统对语音的处理特点。
Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱,在一定程度上模拟了人耳对语音的处理特点,应用了人耳听觉感知方面的一些研究成果。实验证明,采用这种技术,语音识别系统的性能有一定提高。
也有研究者尝试把小波分析技术应用于特征提取,但目前性能难以与上述技术相比,有待进一步研究。
(三)模式匹配及模型训练技术
模型训练是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。
语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔可夫模型(HMM)和人工神经元 网络 (ANN)。
DTW是较早的一种模式匹配和模型训练技术,它应用动态规划方法成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统,目前已被HMM模型和ANN替代。
HMM模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同描述信号的统计特性,其中一个是隐蔽的(不可观测的)具有有限状态的Markor链,另一个是与Markor链的每一状态相关联的观察矢量的随机过程(可观测的)。隐蔽Markor链的特征要靠可观测到的信号特征揭示。这样,语音等时变信号某一段的特征就由对应状态观察符号的随机过程描述,而信号随时间的变化由隐蔽Markor链的转移概率描述。模型参数包括HMM拓扑结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点,HMM模型可分为离散隐马尔可夫模型(采用离散概率密度函数,简称DHMM)和连续隐马尔可夫模型(采用连续概率密度函数,简称CHMM)以及半连续隐马尔可夫模型(SCHMM,集DHMM和CHMM特点)。一般来讲,在训练数据足够的,CHMM优于DHMM和SCHMM。HMM模型的训练和识别都已研究出有效的算法,并不断被完善,以增强HMM模型的鲁棒性。
人工神经元 网络 在语音识别中的 应用是现在研究的又一 热点。ANN本质上是一个自适应非线性动力学系统,模拟了人类神经元活动的原理,具有自学、联想、对比、推理和概括能力。这些能力是HMM模型不具备的,但ANN又不个有HMM模型的动态时间归正性能。因此,现在已有人研究如何把二者的优点有机结合起来,从而提高整个模型的鲁棒性。
二、语音识别的困难与对策
目前,语音识别方面的困难主要表现在:
(一)语音识别系统的适应性差,主要体现在对环境依赖性强,即在某种环境下采集到的语音训练系统只能在这种环境下应用,否则系统性能将急剧下降;另外一个问题是对用户的错误输入不能正确响应,使用不方便。
(二)高噪声环境下语音识别进展困难,因为此时人的发音变化很大,像声音变高,语速变慢,音调及共振峰变化等等,这就是所谓Lombard效应,必须寻找新的信号分析处理方法。
(三)语言学、生 理学 、心理学方面的研究成果已有不少,但如何把这些知识量化、建模并用于语音识别,还需研究。而语言模型、语法及词法模型在中、大词汇量连续语音识别中是非常重要的。
(四)我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚;其次,把这方面的现有成果用于语音识别,还有一个艰难的过程。
(五)语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决,识别速度、拒识问题以及关键词(句)检测技术等等技术细节要解决。
三、语音识别技术的前景和应用
语音识别技术 发展 到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方 经济 发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、 旅游 、银行信息,并且取得很好的结果。
语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
参考 文献 :
[1]科大讯飞语音识别技术专栏. 语音识别产业的新发展. 企业 专栏.通讯世界,:(总l12期)
[2]任天平,门茂深.语音识别技术应用的进展.科技广场.河南科技,
[3]俞铁城.科大讯飞语音识别技术专栏.语音识别的发展现状.企业专栏.通讯世界, (总122期)
[4]陈尚勤等.近代语音识别.西安: 电子 科技大学出版社,1991
[5]王炳锡等.实用语音识别基础.Practical Fundamentals of Speech Recognition.北京:国防 工业 出版社,2005
[6](美)L.罗宾纳.语音识别基本原理.北京:清华大学出版社,1999
点击下页还有更多>>>浅谈语音识别技术论文
毕业设计基于matlab的图像形状与分类:数字图像处理是一门新兴技术,随着计算机硬件的发展,数字图像的实时处理已经成为可能,由于数字图像处理的各种算法的出现,使得其处理速度越来越快,能更好的为人们服务。数字图像处理是一种通过计算机采用一定的算法对图形图像进行处理的技术。
数字图像处理技术已经在各个领域上都有了比较广泛的应用。图像处理的信息量很大,对处理速度的要求也比较高。MATLAB强大的运算和图形展示功能,使图像处理变得更加的简单和直观。
写设计系统方面的就可以了。之前也是苦于写不出,还是学姐给的文方网,写的《人脸识别系统的研究与实现——图像获取、定位、特征提取和特征识别》,很专业的说人寿保险老业务综合处理系统的设计与实现输油泵机组远程监测及诊断系统设计与实现FORTRAN语言题库管理系统的设计与实现大中型企业网络会计信息系统的设计与实现住房改革管理信息系统的设计与实现DMS-2002型轮机模拟器船舶电力系统故障模拟的研制与实现利用MATLAB基于频率法实现系统串联校正基于红外线检测的停车场智能引导系统研究与实现网络选课系统研究与实现基于人脸识别技术的身份认证系统实现简介基于三维技术的城市工程地质信息系统设计与实现大型烧结机整粒自动控制系统的实现基于B/S模式的药品信息咨询系统的设计与实现使用UML实现学生注册管理系统需求建模基于UML实现三层C/S结构系统的架构基于MuitiGen机载导弹地面训练虚拟现实系统的实现基于Web Service技术实现大型系统集成图书管理系统的设计与实现基于Lucene的电子文档管理系统的设计与实现编组钩计划演示系统设计与实现网络型监控系统的设计与实现热量计多路数据采集系统的设计与实现铁路计量管理信息系统的设计与实现基于ARM的嵌入式绣花机系统的软件实现机载SAR监控系统的设计与实现基于B/S模式的教师信息管理系统的设计与实现一种教学机器人控制系统的设计与实现基于智能Agent的用户个性化检索系统的实现矿井通风实验装置监测监控系统软件的设计与实现基于J2EE的网上考试系统设计与实现基于21554的无主多处理器系统实现列车接近防护系统的设计与实现研究生教育网络管理系统的设计与实现嵌入式电力监控系统的研究与实现博硕士论文远程提交及检索系统功能模块的组成和实现基于Extranet和构件的造纸企业产品数据管理系统设计与实现DVB-C系统中两种滤波器的FPGA实现VC++实现基于工控机与单片机串行通讯的监控系统ERP系统用户权限的全动态配置研究及实现政府宏观决策信息网络系统的设计与实现基于CC1020芯片无线传输系统的设计与实现具有主动功能的连锁经营企业配送中心管理信息系统的设计与实现DLP背投系统的研究及在高速公路监控系统的实现学生评教系统的设计与实现微小型电动无人机动力系统试验台的设计与实现全集成船舶主机遥控系统的研究及实现
网络、网站,或管理系统都可以的
这是我写的程序,参照《模式识别》张学工第9章。 a1=imread(''); a2=imread(''); b1=imread(''); b2=imread(''); a1=rgb2gray(a1); a2=rgb2gray(a2); b1=rgb2gray(b1); b2=rgb2gray(b2); figure,imshow(a1) figure,imshow(a2) figure,imshow(b1) figure,imshow(b2) a1=double(a1); a2=double(a2); b1=double(b1); b2=double(b2); a1_lie=a1(:); a2_lie=a2(:); b1_lie=b1(:); b2_lie=b2(:); c=cat(1,a1_lie',a2_lie',b1_lie',b2_lie'); c_mean=mean(c); X=[a1_lie-c_mean',a2_lie-c_mean',b1_lie-c_mean',b2_lie-c_mean']; R=X'*X; % R是4×4的矩阵 [p,q]=eig(R); u=diag(q); % u是4×1的列向量 u=flipud(u); % flipud(u)实现矩阵的上下翻转, u是4×1的列向量 v=fliplr(p); % fliplr(p)实现矩阵的左右翻转,v是4×4的矩阵 e=zeros(36000,4); for m=1:3 e(:,m)=X*v(:,m)./(u(m)^()); % 参见《模式识别》P226公式9-18 end p1=zeros(200,180); p2=zeros(200,180); p3=zeros(200,180); for m=1:36000 p1(m)=e(m); p2(m)=e(m+36000); p3(m)=e(m+72000); end p1=mat2gray(p1);p2=mat2gray(p2);p3=mat2gray(p3);figure,imshow(p1) % 显示第1特征脸figure,imshow(p2) % 显示第2特征脸figure,imshow(p3) % 显示第3特征脸new=c*e(:,1:3); %分别计算4个训练样本分别在第1、第2、第3、特征脸上的投影 p1=imread(''); %读入一个测试样本 p1=rgb2gray(p1); figure,imshow(p1); p2=double(p1(:)); test=p2'*e(:,1:3);%计算测试样本在3个特征脸上的投影 error=zeros(4,1); for m=1:4 error(m)=norm((new(m,:)-test)); end [distence,index]=sort(error); %将列向量error中的数据按从小到大排列 if index(1)==1 result=1; elseif index(1)==2 result=1; elseif index(1)==3 result=2; elseif index(1)==4 result=2; end result %result为1时表示测试样本属于第1个人,为2时表示测试样本属于第2个人
1、在检测到引用内容时,是否会计算在重复率内?如果论文本身有很多的引用内容而且没有进行标注的话,是会计算在重复率之内的。标注了引用内容,系统也是会检测的,像知网系统,就会将他分为总文字复制比、除去引用复制比等等。 学生在撰写毕业论文时不能盲目增加过多的引用内容,如果引用率过高,超出学校可以规定的适用范围,也会被认为不合格。2、如何选择论文检测系统完成论文后,我们需要找到一个安全性和准确性都比较好的论文检测系统,但是,有些学生根本不会考虑到这一点。因此导致论文检测的结果不准确或者是出现论文被泄露等问题,所以我们才需要在众多论文查重系统中找到安全性和准确性都比较好的查重系统。一些官方检测网站或权威论文检测网站是可以通过多种方式进行识别的,例如:论文检测网站是否有百度声誉评级、是否有官方网站认证、是否有合法资质考察、是否有品牌认证等等。3、要检测的内容有哪些?我们在提交论文时进行检测时要上传的是哪一部分的内容呢?这是大多数学生非常困惑的问题。实际上,我们只要上传整篇论文的全部内容,从论文的标题、目录到结论。有些学校是不需要检测致谢,但是有些是需要的不需要的,具体需要检测的内容还是看自己学校的规定吧!4、如何保证论文检测结果和高校保持一致?在学校所要求的论文检测系统中进行检测。一般情况下,可以提交论文终稿进行最后的检查,这样可以最大限度地保障自己的检查结果与学校的检查检查结果是一致的。因为根据现有的数据来显示,本科毕业论文和硕士毕业论文的抄袭,主要还是以互联网资源为准,而且从现在的论文检测系统中,已经涵盖了现有论文库。
之前也是为论文苦恼了半天,网上的范文和能搜到的资料,大都不全面,一般能有个正文就不错了,而且抄袭的东西肯定不行的,关键是没有数据和分析部分,我好不容易搞出来一篇,结果还过不了审。 还好后来找到文方网,直接让专业人士帮忙,效率很高,核心的部分帮我搞定了,也给了很多参考文献资料。哎,专业的事还是要找专业的人来做啊,建议有问题参考下文方网吧 下面是之前文方网王老师发给我的题目,分享给大家: 基于深度学习的无人机地面小目标算法研究 基于视觉的智能汽车面向前方车辆的运动轨迹预测技术研究 模拟射击训练弹着点检测定位技术研究 基于深度卷积神经网络的空中目标识别算法的研究 基于可见光图像的飞行器多目标识别及位置估计 无人驾驶车辆手势指令识别研究与实现 车载毫米波雷达目标检测技术研究 基于多传感融合的四足机器人建图方法 中老年人群跌倒风险评估的数据采集系统 基于深度学习的视觉SLAM闭环检测方法研究 真实图片比较视觉搜索任务的年龄效应及对策研究 室内复杂场景下的视觉SLAM系统构建与研究 基于双目内窥镜的软组织图像三维重建 学习资源画面色彩表征影响学习注意的研究 毫米波雷达与机器视觉双模探测关键技术的研究 语义地图及其关键技术研究 多重影响因素下的语音识别系统研究 基于卷积神经网络的自主空中加油识别测量技术研究 基于视觉语义的深度估计、实例分割与重建 重复视觉危险刺激——本能恐惧反应的“二态型”调控机制研究 低成本视觉下的三维物体识别与位姿估计 面向非规则目标的3D视觉引导抓取方法及系统研究 基于物体识别地理配准的跨视频行人检测定位技术研究 基于结构光的非刚体目标快速三维重建关键技术研究 基于机器视觉的动物交互行为与认知状态分析系统 关于单目视觉实时定位与建图中的优化算法研究 动态场景下无人机SLAM在智慧城市中的关键技术研究 面向视觉SLAM的联合特征匹配和跟踪算法研究 基于深度学习的显著物体检测 基于平面波的三维超声成像方法与灵长类动物脑成像应用研究 基于物体检测和地理匹配的室内融合定位技术研究 基于多模态信息融合的人体动作识别方法研究 基于视觉惯性里程计的SLAM系统研究 基于语义信息的图像/点云配准与三维重建 基于种子点选取的点云分割算法研究 基于深度学习的场景文字检测与识别方法研究 基于运动上下文信息学习的室内视频烟雾预警算法研究 基于深度学习的垃圾分类系统设计与实现 面向手机部件的目标区域检测算法的设计与实现 电路板自动光照检测系统的设计与实现 基于机器视觉的工件识别与定位系统的设计与实现 基于深度学习的物件识别定位系统的设计与实现 基于视觉四旋翼无人机编队系统设计及实现 基于视觉惯导融合的四旋翼自主导航系统设计与实现 面向城市智能汽车的认知地图车道层生成系统 基于深度学习的智能化无人机视觉系统的设计与仿真 基于知识库的视觉问答技术研究 基于深度学习的火灾视频实时智能检测研究 结构化道路车道线检测方法研究 基于机器视觉的带式输送机动态煤量计量研究 基于深度学习的小目标检测算法研究 基于三维激光与视觉信息融合的地点检索算法研究 动态环境下仿人机器人视觉定位与运动规划方法研究 瓷砖铺贴机器人瓷砖空间定位系统研究 城市街景影像中行人车辆检测实现 基于无线信号的身份识别技术研究 基于移动机器人的目标检测方法研究 基于深度学习的机器人三维环境对象感知 基于特征表示的扩展目标跟踪技术研究 基于深度学习的目标检测方法研究 基于深度学习的复杂背景下目标检测与跟踪 动态扩展目标的高精度特征定位跟踪技术研究 掩模缺陷检测仪的图像处理系统设计 复杂场景下相关滤波跟踪算法研究 基于多层级联网络的多光谱图像显著性检测研究 基于深度结构特征表示学习的视觉跟踪研究 基于深度网络的显著目标检测方法研究 基于深度学习的电气设备检测方法研究 复杂交通场景下的视频目标检测 基于多图学习的多模态图像显著性检测算法研究 基于面部视频的非接触式心率检测研究 单幅图像协同显著性检测方法研究 轻量级人脸关键点检测算法研究 基于决策树和最佳特征选择的神经网络钓鱼网站检测研究 基于深度学习的场景文本检测方法研究 RGB-D图像显著及协同显著区域检测算法研究 多模态融合的RGB-D图像显著目标检测研究 基于协同排序模型的RGBT显著性检测研究 基于最小障碍距离的视觉跟踪研究 基于协同图学习的RGB-T图像显著性检测研究 基于图学习与标签传播优化模型的图像协同显著性目标检测 姿态和遮挡鲁棒的人脸关键点检测算法研究 基于多模态和多任务学习的显著目标检测方法研究 基于深度学习的交通场景视觉显著性区域目标检测 基于生物视觉机制的视频显著目标检测算法研究 基于场景结构的视觉显著性计算方法研究 精神分裂症患者初级视觉网络的磁共振研究 基于fMRI与TMS技术研究腹侧视觉通路中结构优势效应的加工 脑机接口游戏神经可塑性研究 基于YOLOV3算法的FL-YOLO多目标检测系统 基于深度与宽度神经网络显著性检测方法研究 基于深度学习的零件识别系统设计与研究 基于对抗神经网络的图像超分辨算法研究 基于深度学习复杂场景下停车管理视觉算法的研究与实现 镍电解状态视觉检测与分析方法研究 跨界训练对提升舞者静态平衡能力的理论与方法研究 施工现场人员类型识别方法的研究与实现 基于深度学习的自然场景文字检测方法研究 基于嵌入式的交通标志识别器的设计 基于视觉感知特性与图像特征的图像质量评价
按研究问题的大小不同可以把毕业论文分为宏观论文和微观论文。凡届国家全局性、带有普遍性并对局部工作有一定指导意义的论文,称为宏观论文。它研究的面比较宽广,具有较大范围的影响。反之,研究局部性、具体问题的论文,是微观论文。它对具体工作有指导意义,影响的面窄一些。另外还有一种综合型的分类方法,即把毕业论文分为专题型、论辩型、综述型和综合型四大类:1.专题型论文。这是分析前人研究成果的基础上,以直接论述的形式发表见解,从正面提出某学科中某一学术问题的一种论文。如本书第十二章例文中的《浅析领导者突出工作重点的方法与艺术》一文,从正面论述了突出重点的工作方法的意义、方法和原则,它表明了作者对突出工作重点方法的肯定和理解。2.论辩型论文。这是针对他人在某学科中某一学术问题的见解,凭借充分的论据,着重揭露其不足或错误之处,通过论辩形式来发表见解的一种论文。如《家庭联产承包责任制改变了农村集体所有制性质吗?》一文,是针对“家庭联产承包责任制改变了农村集体所有制性质”的观点,进行了有理有据的驳斥和分析,以论辩的形式阐发了“家庭联产承包责任制并没有改变农村集体所有制”的观点。另外,针对几种不同意见或社会普遍流行的错误看法,以正面理由加以辩驳的论文,也属于论辩型论文。3.综述型论文。这是在归纳、总结前人或今人对某学科中某一学术问题已有研究成果的基础上,加以介绍或评论,从而发表自己见解的一种论文。4.综合型论文。这是一种将综述型和论辩型两种形式有机结合起来写成的一种论文。如《关于中国民族关系史上的几个问题》一文既介绍了研究民族关系史的现状,又提出了几个值得研究的问题。因此,它是一篇综合型的论文。
农大学生毕业论文被鸡吃了系虚构,这样的段子能火爆网络除了改编的基础过于真实以外,还有这个段子确实好笑而且轻松。
一、农大学生毕业论文被鸡吃了系虚构
最近云南农业大学的梁同学等两位同学拍了这么一个有趣的段子,那就是梁同学假装自己的毕业设计已经被鸡吃了,最后又含泪把这只鸡给杀了吃了,这一连串的反应让不少人都觉得农业大学生的生活竟然是这么朴实无华。在不少的人质疑这个段子真实性的时候,梁同学等两位同学对外作出了澄清,其实这就是拍摄的一个段子而已,但是确实根据现实生活改编。
二、这样的梗能火的主要原因:段子过于真实
其实这个梗能够火的主要原因是比较简单的,那就是这个段子过于真实,在过去对于农业大学的宣传当中,我们不难发现很多人的毕业设计都是农作物,这也就意味着这种段子本来就具备着社会基础,大家都会觉得很真实。再加上这个梗在拍摄的过程中的流程是比较顺畅的,而且制作团队确实也很强大,最终甚至让不少人信以为真;这自然也就能够让这个梗继续活下去,如果不是这个团队的人对外澄清,估计现在还有不少的人以为就是相应的毕业论文被吃了。
三、这样的梗能火的次要原因:段子确实好笑
其实抛开段子本身过于真实的内容不说,这样的梗能够火起来也是有着重要原因的,那就是这样的段子确实激发了不少人的笑点,同时让许多人看的都捧腹不已。我们许多人本来上班的时候就已经够累的了,下班之后当然想看一些轻松的内容,也正是这种轻松内容的需求,再让这个段子彻底火爆网络,这也算是供需平衡了。
2018年毕业的毕业生,我一点都不恨他,因为那会儿我已经毕业了,而且毕业论文我很顺利的就通过。
主要是因为这样的段子能够吸引大家的注意,引起大家的好奇心,所以就能够爆红网络。
有点拉,部分高校暗降本科论文标准了。1。学生就业压力大 论文拼凑蒙过关完成毕业论文是每个大学生毕业的基本条件,但近年来,毕业生忙着找工作,往往无暇顾及论文,部分毕业论文也出现“东拼西凑”的情况。一些大学教授私下向记者透露,评审论文标准正在悄悄降低。学生:找工作重于写论文4月,正是毕业生找工作的冲刺阶段,也是写毕业论文的时候。而记者发现,相当多的学生还没完成毕业论文。“实在不行,到时候上网多下载点资料,拼拼凑凑也就成”首都经贸大学大四学生小秦告诉记者,他们班目前还有一半同学没有落实工作单位,这段时间都在忙着面试、实习。很多大学生都无法安下心来写论文,因此各种各样的“写法”也就应运而生。在互联网上随意一搜索,就能看到很多代写论文的枪手帖。不少学生都认为,“找个好工作能让我受益一生,毕业论文写得好能怎么样?能过就行了。”教授:拼凑论文无奈评合格“没办法,现在学生就业压力这么大,我们指导老师也不好意思太催他们。毕竟不能耽误孩子找工作啊。”首都师范大学中文系某教授说。记者发现,部分大学暗中降低了对本科毕业论文的要求。某大学教授说,“不少本科生论文一眼就能看出是东拼西凑的,但我也就让他过了,评个‘及格’或是‘良’,不能让这么多孩子都不能毕业吧。”还有一些大学对论文字数要求降低,以前要求10000字,现在8000字就可以了。专家观点建议取消本科毕业论文“与其滥竽充数,东拼西凑,不如取消本科毕业论文。”有些教育学者提出了这样的看法。华中师范大学涂艳国教授建议取消本科毕业论文。“本科毕业论文并非必不可少。在美国,不仅本科生不写毕业论文,连硕士生都不用写毕业论文。高等教育日益大众化,取消本科毕业论文可能是大势所趋。”首都师范大学教授陶东风建议,本科生应该学会写论文,但这种能力可以从平时的教学过程中培养,比如在学期中增加小论文的训练。中国人民大学教授顾海兵认为,毕业论文应该改变形式,比如写调查报告,与社会实践联系得更紧密,这样学生就业也能从中获益。大学老师“百度搜索”发现学生论文是抄的“学生会用百度、GOOGLE,我也会用啊。”上海某大学的刘老师拿着一篇大四学生的毕业论文,一脸无奈。刘老师刚刚看完两篇春季班毕业生的毕业论文,其中一篇论文的选题不在自己的研究领域内,“说实话有些问题我也不太懂,于是就到网上查相关资料,没想到用百度一搜,第一条就是那篇论文的第一章,几乎没什么改动”。后来,刘老师又查了查论文的其他部分,发现还有不少内容也是从网上摘抄的。这让刘老师很为难,因为按照学校规定,毕业论文抄袭的不能毕业,可“总不能因为一篇论文就不让他毕业吧”。最后,在论文答辩的时候,刘老师和另外两位老师一商量,先让这位同学通过,但让他事后再把论文修改一下,“不能直接抄袭”,这位同学也老老实实地承认了抄袭的事实。“现在网络越来越方便,也让很多学生抄袭起来更方便了。不过,即使发现了,顶多也就是警告了事。”刘老师回忆说,其实毕业论文抄袭并不是这几年的事情,“在我们上大学的时候也很普遍,只不过那时候上网还不方便,大家一般都是到图书馆或资料室找一些专业书籍或专业期刊。临近论文答辩的时候,图书馆和资料室都是人满为患,大四的学生很多。为了防止抄袭‘撞车’,有些同学在摘抄了某篇文章之后,还会在上面用笔写上‘此文已用,请勿雷同’的字样;有些同学干脆就把那篇文章撕下来,‘以绝后患’;还有些同学就专门找一些冷僻的期刊,找一些老师都不会看的文章。”要求本科生写论文是标准过于严苛?“学生抄袭论文成习惯,学校要求却越来越高,你说这本科生的毕业论文究竟是不是鸡肋?”刘老师把这个问题抛给了记者。他给记者讲了一个笑话,两个同学偶然在火车上撞见,谈起了各自的论文,A同学说:“唉,糟透了,我的论文几乎全是粘贴过来的。”B同学说:“有什么啊,我的论文除了‘你’、‘我’、‘他’不是抄的外,剩下的全是抄的。”“虽然这个笑话有点夸张,但确实反映了一定的现实情况,让我们老师也没办法。”刘老师叹了一口气。早在2004年3月29日,本报记者的一篇《本科毕业论文掺水严重能否取消》就引起了高教界的一场大讨论,一方认为本科生毕业论文质量低下,抄袭成风,而且本科生就业压力大,教师的时间与精力有限,建议取消本科生毕业论文;而另一方则认为,毕业论文是检验大学四年学习的最好方式,不应该取消。而2005年年底北京大学新出台的《本科考试工作与学术规范条例》又把本科生论文推向争议焦点,该校规定:本科生论文中存在抄袭事实,且抄袭篇幅超过总篇幅50%者;已提交的毕业论文、设计中抄袭篇幅超过总篇幅30%者;被使用的他人观点构成该学术违纪作品的全部、核心或主要观点者;由他人替自己撰写论文和替他人撰写论文者都将被开除学籍。当时有专家在媒体上表示,北大对本科生论文执行的标准过于严苛,在本科教育阶段,学生的任务主要在于掌握和运用基础知识,反映到论文写作上,往往需要引用一些现有的学术理论作为自己的论证依据,有时对于基本理论的引用可能还会占据相当的篇幅,但并不能简单地认定存在抄袭嫌疑。对于大多数普通本科论文而言,能够把观点论证得有理有据,且表述流畅,应当就可以评为合格。本科生写论文,也许更需要有“站在前人的肩膀上”的精神。大学生培养目标不同各校应对毕业论文区别对待记者就本科生毕业论文一事采访了多位正在写论文的大学生和已经毕业的大学生,听到了一些不同的声音。复旦大学医学院预防医学专业大五的张睿正在做本科毕业论文,他列出了毕业论文的三大好处:其一,借论文的实践机会提早进入学校和社会、理想与现实的磨合期;其二,可以将自己的职业和学业关联起来;其三,了解如何进行一件创造性的工作,“论文的写作其实大多数是一个从无到有的创造过程,我们今后工作中的业务、专业,无论和现在的论文有多大的关系,至少其工作步骤、模式、论文写作的格式等是一样的,所以能在老师的专业指导下完成一点东西不是更加好吗?”而至于论文抄袭,张睿认为“那只是一种现象而已”。上海外贸学院的谭老师毕业于复旦大学哲学系,说起自己的本科毕业论文,至今还记忆犹新。大四考研失败后,谭老师边找工作边开始准备毕业论文。由于一直比较喜欢逻辑,喜欢维特根斯坦,就找了系里教《逻辑哲学论》的老师做导师。“开题准备写《逻辑哲学论》的意义,导师说好啊,但题目大了,难。当时不知天高地厚,哪在乎老先生的提醒”。3周后,谭老师拿着洋洋洒洒8000多字的论文去找导师,导师给了12个字:文笔优美,逻辑不清,建议修改。郁闷的谭老师再次询问导师,又得12个字:选题过大,基础不足,最好重写。谭老师当即汗颜,“先生说的是对的。本科四年读下来,学校并没有给自己太多压力,考试也容易过。社会学、政治学等等读了一大堆,却多为泛泛。真的想自己写一份术业专攻的文章,却止于肤浅了。”不过,谭老师也耻于去抄一篇论文。最终,谭老师格式化地写了一下逻辑学的发展历程、各流派贡献、对今日的引领意义,论文算是过了。谭老师说,毕业论文让自己对自身有了新的认识:基础不扎实,学术功底浅,不具备研究的能力,还需要多读多看,“本身是想搞学术的,但毕业论文却给自己一个非常大的打击―――学术来不得虚浮。真的很感谢先生给自己逻辑学论文的评价”。上海师范大学教育技术系的研究生鲍贤清现在正在做硕士生毕业论文,他认为,随着研究生教育的“本科化”,本科教育的“职业化”,“是否应取消本科生毕业论文”这个话题摆在面前也就不奇怪了。“现在流行‘草根’,每个问题就像一株小草。当你提起一株,带出的是很多泥土。而本科毕业论文,带出的是一连串的无奈。”鲍贤清解释,“为缓解就业压力,扩招之举是第一个无奈;生源扩招了,师资力量滞后,难保教育质量是第二个无奈;4年时间一晃而过,升学压力变成了就业压力,此为第三个无奈。”复旦大学副校长周鲁卫教授认为,对本科生毕业论文的要求,说到底是对大学培养不同人才的要求。大学的定位不同,对人才培养的目标也不同,有些是培养精英人才、研究型人才,有些则是培养就业型人才。根据不同的培养目标,对毕业论文的要求也应该有所不同,“不可能让所有的大学生都写出有创新、有学术价值的毕业论文”。周鲁卫教授告诉记者,自己目前还亲自带本科生写论文,确实有些同学会因为就业问题影响做论文的时间,但他认为,本科生毕业论文是大学生从学校到社会中的一个桥梁,无论毕业后是从事研究工作还是到企业上班,都是非常有价值的,“现在经常有人说大学生说话不负责任,做事不负责任,而认真完成一篇毕业论文就可以让他明白如何对自己的事情负责任”。复旦大学新闻学院副院长俞振伟副教授则认为,本科生的毕业论文不能“一刀切”,要根据学校定位、专业特点加以区分,“比如文科专业,很难让一个本科生提出一个非常有价值的学术观点,但却可以做一项非常有意义的调查报告,或者对一个学术流派进行一次梳理,重要的是做论文的这个过程对大学生来说非常有意义。”
==你是本科还是硕士啊论文的话应该主要是算法的研究和改进吧……问题比如:你采用了哪种人脸识别算法你对这种算法的改进在哪里(你不只要说明改进在哪里可能还需要做一些实验收集下数据来对比说明算法在改进后对性能有了提升)新算法比其他算法好在哪里(还是通过实验收集数据对比一下)分析下算法的复杂度(时间复杂度和空间复杂度可能都会要求毕竟图像分析很占空间)然后是怎样进行优化的实验采用的样本是哪些(我们当时用的UCIrvineMachineLearningRepository下面会有CMUFaceImages大家一般都用这个库来作为样本)怎样对实验结果进行量化比较的(标准是什么)如果是模式识别的话还可能关心怎样选的特征值和特征空间(计算量大的话是怎样减少计算量的)训练样本采用的什么算法实验的识别率是多少算法的性能是不是稳定……==我想到的都是本科的问题如果是研究生的话可能还会问的更难
随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。我整理了图像识别技术论文,欢迎阅读!
图像识别技术研究综述
摘要:随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。图像识别是利用计算机对图像进行处理、分析和理解,由于图像在成像时受到外部环境的影响,使得图像具有特殊性,复杂性。基于图像处理技术进一步探讨图像识别技术及其应用前景。
关键词:图像处理;图像识别;成像
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)10-2446-02
图像是客观景物在人脑中形成的影像,是人类最重要的信息源,它是通过各种观测系统从客观世界中获得,具有直观性和易理解性。随着计算机技术、多媒体技术、人工智能技术的迅速发展,图像处理技术的应用也越来越广泛,并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。图像处理正显著地改变着人们的生活方式和生产手段,比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等,在这些应用中,都离不开图像处理和识别技术。图像处理是指用计算机对图像进行处理,着重强调图像与图像之间进行的交换,主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。但是由于获取的图像本事具有复杂性和特殊性,使得图像处理和识别技术成为研究热点。
1 图像处理技术
图像处理(image processing)利用计算机对图像进行分析,以达到所需的结果。图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。这种处理大多数是依赖于软件实现的。其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。
1)图像采集,图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,和文字、图形、声音一起存储在计算机内,显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。
2)图像增强,图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化,数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分,使图像的主体结构更加明确,必须对图像进行改善,即图像增强。通过图像增强,以减少图像中的图像的噪声,改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量,使图像中的物体的轮廓更加清晰,细节更加明显。图像增强不考虑图像降质的原因,增强后的图像更加赏欣悦目,为后期的图像分析和图像理解奠定基础。
3)图像复原,图像复原也称图像恢复,由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,为了提取比较清晰的图像需要对图像进行恢复,图像恢复主要采用滤波方法,从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。
4)图像编码与压缩,数字图像的显著特点是数据量庞大,需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频,那么必须对图像进行编码和压缩。目前,图像压缩编码已形成国际标准,如比较著名的静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。
5)图像分割技术,图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割根据目标与背景的先验知识将图像表示为物理上有意义的连通区域的集合。即对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。目前,图像分割的方法主要有基于区域特征的分割方法、基于相关匹配的分割方法和基于边界特征的分割方法[2]。由于采集图像时会受到各种条件的影响会是图像变的模糊、噪声干扰,使得图像分割是会遇到困难。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。
2 图像识别技术
图像识别是通过存储的信息(记忆中存储的信息)与当前的信息(当时进入感官的信息)进行比较实现对图像的识别[3]。前提是图像描述,描述是用数字或者符号表示图像或景物中各个目标的相关特征,甚至目标之间的关系,最终得到的是目标特征以及它们之间的关系的抽象表达。图像识别技术对图像中个性特征进行提取时,可以采用模板匹配模型。在某些具体的应用中,图像识别除了要给出被识别对象是什么物体外,还需要给出物体所处的位置和姿态以引导计算初工作。目前,图像识别技术已广泛应用于多个领域,如生物医学、卫星遥感、机器人视觉、货物检测、目标跟踪、自主车导航、公安、银行、交通、军事、电子商务和多媒体网络通信等。主要识别技术有:
指纹识别
指纹识别是生物识别技术中一种最实用、最可靠和价格便宜的识别手段,主要应用于身份验证。指纹识别是生物特征的一个部分,它具有不变性:一个人的指纹是终身不变的;唯一性:几乎没有两个完全相同的指纹[3]。一个指纹识别系统主要由指纹取像、预处理与特征提取、比对、数据库管理组成。目前,指纹识别技术与我们的现实生活紧密相关,如信用卡、医疗卡、考勤卡、储蓄卡、驾驶证、准考证等。
人脸识别 目前大多数人脸识别系统使用可见光或红外图像进行人脸识别,可见光图像识别性能很容易受到光照变化的影响。在户外光照条件不均匀的情况下,其正确识别率会大大降低。而红外图像进行人脸识别时可以克服昏暗光照条件变化影响,但由于红外线不能穿透玻璃,如果待识别的对象戴有眼镜,那么在图像识别时,眼部信息全部丢失,将严重影响人脸识别的性能[4]。
文字识别
文字识别是将模式识别、文字处理、人工智能集与一体的新技术,可以自动地把文字和其他信息分离出来,通过智能识别后输入计算机,用于代替人工的输入。文字识别技术可以将纸质的文档转换为电子文档,如银行票据、文稿、各类公式和符号等自动录入,可以提供文字的处理效率,有助于查询、修改、保存和传播。文字识别方法主要有结构统计模式识别、结构模式识别和人工神经网络[5]。由于文字的数量庞大、结构复杂、字体字形变化多样,使得文字识别技术的研究遇到一定的阻碍。
3 结束语
人类在识别现实世界中的各种事物或复杂的环境是一件轻而易举的事,但对于计算机来讲进行复杂的图像识别是非常困难的[6]。在环境较为简单的情况下,图像识别技术取得了一定的成功,但在复杂的环境下,仍面临着许多问题:如在图像识别过程中的图像分割算法之间的性能优越性比较没有特定的标准,以及算法本身存在一定的局限性,这使得图像识别的最终结果不十分精确等。
参考文献:
[1] 胡爱明,周孝宽.车牌图像的快速匹配识别方法[J].计算机工程与应用,2003,39(7):90—91.
[2] 胡学龙.数字图像处理[M].北京:电子工业出版社,2011.
[3] 范立南,韩晓微,张广渊.图像处理与模式识别[M].北京:科学出版社,2007.
[4] 晓慧,刘志镜.基于脸部和步态特征融合的身份识别[J].计算机应用,2009,1(29):8.
[5] 陈良育,曾振柄,张问银.基于图形理解的汉子构型自动分析系统[J].计算机应用,2005,25(7):1629-1631.
[6] Sanderson C,Paliwal K Fusion and Person Verification Using Speech & Face Information[C].IDIAP-RR 02-33,Martigny,Swizerland,2002.
点击下页还有更多>>>图像识别技术论文
网络、网站,或管理系统都可以的
可以。 毕业论文是可以用别人训练出来的,但是自己也要有创新,不能全部使用,不然是不会过的。毕业论文(graduation study)是专科及以上学历教育为对本专业学生集中进行科学研究训练而要求学生在毕业前撰写的论文。毕业论文一般安排在修业的最后一学年(学期)进行,论文题目由教师指定或由学生提出,学生选定课题后进行研究,撰写并提交论文,目的在于培养学生的科学研究能力,加强综合运用所学知识、理论和技能解决实际问题的训练,从总体上考查学生大学阶段学习所达到的学业水平。