与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。 任务分类和应用 根据识别的对象不同,语音识别任务大体可分为3类,即孤立词识别(isolated word recognition),关键词识别(或称关键词检出,keyword spotting)和连续语音识别。其中,孤立词识别 的任务是识别事先已知的孤立的词,如“开机”、“关机”等;连续语音识别的任务则是识别任意的连续语音,如一个句子或一段话;连续语音流中的关键词检测针对的是连续语音,但它并不识别全部文字,而只是检测已知的若干关键词在何处出现,如在一段话中检测“计算机”、“世界”这两个词。根据针对的发音人,可以把语音识别技术分为特定人语音识别和非特定人语音识别,前者只能识别一个或几个人的语音,而后者则可以被任何人使用。显然,非特定人语音识别系统更符合实际需要,但它要比针对特定人的识别困难得多。另外,根据语音设备和通道,可以分为桌面(PC)语音识别、电话语音识别和嵌入式设备(手机、PDA等)语音识别。不同的采集通道会使人的发音的声学特性发生变形,因此需要构造各自的识别系统。语音识别的应用领域非常广泛,常见的应用系统有:语音输入系统,相对于键盘输入方法,它更符合人的日常习惯,也更自然、更高效;语音控制系统,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如工业控制、语音拨号系统、智能家电、声控智能玩具等许多领域;智能对话查询系统,根据客户的语音进行操作,为用户提供自然、友好的数据库检索服务,例如家庭服务、宾馆服务、旅行社服务系统、订票系统、医疗服务、银行服务、股票查询服务等等。 前端前端处理是指在特征提取之前,先对原始语音进行处理,部分消除噪声和不同说话人带来的影响,使处理后的信号更能反映语音的本质特征。最常用的前端处理有端点检测和语音增强。端点检测是指在语音信号中将语音和非语音信号时段区分开来,准确地确定出语音信号的起始点。经过端点检测后,后续处理就可以只对语音信号进行,这对提高模型的精确度和识别正确率有重要作用。语音增强的主要任务就是消除环境噪声对语音的影响。目前通用的方法是采用维纳滤波,该方法在噪声较大的情况下效果好于其它滤波器。处理声学特征 声学特征的提取与选择是语音识别的一个重要环节。声学特征的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程,目的是使模式划分器能更好地划分。由于语音信号的时变特性,特征提取必须在一小段语音信号上进行,也即进行短时分析。这一段被认为是平稳的分析区间称之为帧,帧与帧之间的偏移通常取帧长的1/2或1/3。通常要对信号进行预加重以提升高频,对信号加窗以避免短时语音段边缘的影响。常用的一些声学特征* 线性预测系数LPC:线性预测分析从人的发声机理入手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,从而n 时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方差最小LMS,即可得到线性预测系数LPC。对 LPC的计算方法有自相关法(德宾Durbin法)、协方差法、格型法等等。计算上的快速有效保证了这一声学特征的广泛使用。与LPC这种预测参数模型类似的声学特征还有线谱对LSP、反射系数等等。* 倒谱系数CEP:利用同态处理方法,对语音信号求离散傅立叶变换DFT后取对数,再求反变换iDFT就可得到倒谱系数。对LPC倒谱(LPCCEP),在获得滤波器的线性预测系数后,可以用一个递推公式计算得出。实验表明,使用倒谱可以提高特征参数的稳定性。* Mel倒谱系数MFCC和感知线性预测PLP:不同于LPC等通过对人的发声机理的研究而得到的声学特征,Mel倒谱系数MFCC和感知线性预测 PLP是受人的听觉系统研究成果推动而导出的声学特征。对人的听觉机理的研究发现,当两个频率相近的音调同时发出时,人只能听到一个音调。临界带宽指的就是这样一种令人的主观感觉发生突变的带宽边界,当两个音调的频率差小于临界带宽时,人就会把两个音调听成一个,这称之为屏蔽效应。Mel刻度是对这一临界带宽的度量方法之一。MFCC的计算首先用FFT将时域信号转化成频域,之后对其对数能量谱用依照Mel刻度分布的三角滤波器组进行卷积,最后对各个滤波器的输出构成的向量进行离散余弦变换DCT,取前N个系数。PLP仍用德宾法去计算LPC参数,但在计算自相关参数时用的也是对听觉激励的对数能量谱进行DCT的方法。声学模型语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算。本节和下一节分别介绍声学模型和语言模型方面的技术。HMM声学建模:马尔可夫模型的概念是一个离散时域有限状态自动机,隐马尔可夫模型HMM是指这一马尔可夫模型的内部状态外界不可见,外界只能看到各个时刻的输出值。对语音识别系统,输出值通常就是从各个帧计算而得的声学特征。用HMM刻画语音信号需作出两个假设,一是内部状态的转移只与上一状态有关,另一是输出值只与当前状态(或当前的状态转移)有关,这两个假设大大降低了模型的复杂度。HMM的打分、解码和训练相应的算法是前向算法、Viterbi算法和前向后向算法。语音识别中使用HMM通常是用从左向右单向、带自环、带跨越的拓扑结构来对识别基元建模,一个音素就是一个三至五状态的HMM,一个词就是构成词的多个音素的HMM串行起来构成的HMM,而连续语音识别的整个模型就是词和静音组合起来的HMM。上下文相关建模:协同发音,指的是一个音受前后相邻音的影响而发生变化,从发声机理上看就是人的发声器官在一个音转向另一个音时其特性只能渐变,从而使得后一个音的频谱与其他条件下的频谱产生差异。上下文相关建模方法在建模时考虑了这一影响,从而使模型能更准确地描述语音,只考虑前一音的影响的称为Bi- Phone,考虑前一音和后一音的影响的称为Tri-Phone。英语的上下文相关建模通常以音素为基元,由于有些音素对其后音素的影响是相似的,因而可以通过音素解码状态的聚类进行模型参数的共享。聚类的结果称为senone。决策树用来实现高效的triphone对senone的对应,通过回答一系列前后音所属类别(元/辅音、清/浊音等等)的问题,最终确定其HMM状态应使用哪个senone。分类回归树CART模型用以进行词到音素的发音标注。 语言模型语言模型主要分为规则模型和统计模型两种。统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律,其中N-Gram简单有效,被广泛使用。N-Gram:该模型基于这样一种假设,第n个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。这些概率可以通过直接从语料中统计N个词同时出现的次数得到。常用的是二元的Bi-Gram和三元的Tri-Gram。语言模型的性能通常用交叉熵和复杂度(Perplexity)来衡量。交叉熵的意义是用该模型对文本识别的难度,或者从压缩的角度来看,每个词平均要用几个位来编码。复杂度的意义是用该模型表示这一文本平均的分支数,其倒数可视为每个词的平均概率。平滑是指对没观察到的N元组合赋予一个概率值,以保证词序列总能通过语言模型得到一个概率值。通常使用的平滑技术有图灵估计、删除插值平滑、Katz平滑和Kneser-Ney平滑。 搜索连续语音识别中的搜索,就是寻找一个词模型序列以描述输入语音信号,从而得到词解码序列。搜索所依据的是对公式中的声学模型打分和语言模型打分。在实际使用中,往往要依据经验给语言模型加上一个高权重,并设置一个长词惩罚分数。Viterbi:基于动态规划的Viterbi算法在每个时间点上的各个状态,计算解码状态序列对观察序列的后验概率,保留概率最大的路径,并在每个节点记录下相应的状态信息以便最后反向获取词解码序列。Viterbi算法在不丧失最优解的条件下,同时解决了连续语音识别中HMM模型状态序列与声学观察序列的非线性时间对准、词边界检测和词的识别,从而使这一算法成为语音识别搜索的基本策略。由于语音识别对当前时间点之后的情况无法预测,基于目标函数的启发式剪枝难以应用。由于Viterbi算法的时齐特性,同一时刻的各条路径对应于同样的观察序列,因而具有可比性,束Beam搜索在每一时刻只保留概率最大的前若干条路径,大幅度的剪枝提高了搜索的效率。这一时齐Viterbi- Beam算法是当前语音识别搜索中最有效的算法。 N-best搜索和多遍搜索:为在搜索中利用各种知识源,通常要进行多遍搜索,第一遍使用代价低的知识源,产生一个候选列表或词候选网格,在此基础上进行使用代价高的知识源的第二遍搜索得到最佳路径。此前介绍的知识源有声学模型、语言模型和音标词典,这些可以用于第一遍搜索。为实现更高级的语音识别或口语理解,往往要利用一些代价更高的知识源,如4阶或5阶的N-Gram、4阶或更高的上下文相关模型、词间相关模型、分段模型或语法分析,进行重新打分。最新的实时大词表连续语音识别系统许多都使用这种多遍搜索策略。N-best搜索产生一个候选列表,在每个节点要保留N条最好的路径,会使计算复杂度增加到N倍。简化的做法是只保留每个节点的若干词候选,但可能丢失次优候选。一个折衷办法是只考虑两个词长的路径,保留k条。词候选网格以一种更紧凑的方式给出多候选,对N-best搜索算法作相应改动后可以得到生成候选网格的算法。前向后向搜索算法是一个应用多遍搜索的例子。当应用简单知识源进行了前向的Viterbi搜索后,搜索过程中得到的前向概率恰恰可以用在后向搜索的目标函数的计算中,因而可以使用启发式的A算法进行后向搜索,经济地搜索出N条候选。 系统实现 语音识别系统选择识别基元的要求是,有准确的定义,能得到足够数据进行训练,具有一般性。英语通常采用上下文相关的音素建模,汉语的协同发音不如英语严重,可以采用音节建模。系统所需的训练数据大小与模型复杂度有关。模型设计得过于复杂以至于超出了所提供的训练数据的能力,会使得性能急剧下降。听写机:大词汇量、非特定人、连续语音识别系统通常称为听写机。其架构就是建立在前述声学模型和语言模型基础上的HMM拓扑结构。训练时对每个基元用前向后向算法获得模型参数,识别时,将基元串接成词,词间加上静音模型并引入语言模型作为词间转移概率,形成循环结构,用Viterbi算法进行解码。针对汉语易于分割的特点,先进行分割再对每一段进行解码,是用以提高效率的一个简化方法。对话系统:用于实现人机口语对话的系统称为对话系统。受目前技术所限,对话系统往往是面向一个狭窄领域、词汇量有限的系统,其题材有旅游查询、订票、数据库检索等等。其前端是一个语音识别器,识别产生的N-best候选或词候选网格,由语法分析器进行分析获取语义信息,再由对话管理器确定应答信息,由语音合成器输出。由于目前的系统往往词汇量有限,也可以用提取关键词的方法来获取语义信息。 自适应与强健性 语音识别系统的性能受许多因素的影响,包括不同的说话人、说话方式、环境噪音、传输信道等等。提高系统鲁棒性,是要提高系统克服这些因素影响的能力,使系统在不同的应用环境、条件下性能稳定;自适应的目的,是根据不同的影响来源,自动地、有针对性地对系统进行调整,在使用中逐步提高性能。以下对影响系统性能的不同因素分别介绍解决办法。解决办法按针对语音特征的方法(以下称特征方法)和模型调整的方法(以下称模型方法)分为两类。前者需要寻找更好的、高鲁棒性的特征参数,或是在现有的特征参数基础上,加入一些特定的处理方法。后者是利用少量的自适应语料来修正或变换原有的说话人无关(SI)模型,从而使其成为说话人自适应(SA)模型。说话人自适应的特征方法有说话人规一化和说话人子空间法,模型方法有贝叶斯方法、变换法和模型合并法。语音系统中的噪声,包括环境噪声和录音过程加入的电子噪声。提高系统鲁棒性的特征方法包括语音增强和寻找对噪声干扰不敏感的特征,模型方法有并行模型组合PMC方法和在训练中人为加入噪声。信道畸变包括录音时话筒的距离、使用不同灵敏度的话筒、不同增益的前置放大和不同的滤波器设计等等。特征方法有从倒谱矢量中减去其长时平均值和RASTA滤波,模型方法有倒谱平移。 微软语音识别引擎 微软在office和vista中都应用了自己开发的语音识别引擎,微软语音识别引擎的使用是完全免费的,所以产生了许多基于微软语音识别引擎开发的语音识别应用软件,例如《语音游戏大师》《语音控制专家》《芝麻开门》等等软件。 语音识别系统的性能指标 语音识别系统的性能指标主要有四项。①词汇表范围:这是指机器能识别的单词或词组的范围,如不作任何限制,则可认为词汇表范围是无限的。②说话人限制:是仅能识别指定发话者的语音,还是对任何发话人的语音都能识别。③训练要求:使用前要不要训练,即是否让机器先“听”一下给定的语音,以及训练次数的多少。④正确识别率:平均正确识别的百分数,它与前面三个指标有关。小结以上介绍了实现语音识别系统的各个方面的技术。这些技术在实际使用中达到了较好的效果,但如何克服影响语音的各种因素还需要更深入地分析。目前听写机系统还不能完全实用化以取代键盘的输入,但识别技术的成熟同时推动了更高层次的语音理解技术的研究。由于英语与汉语有着不同的特点,针对英语提出的技术在汉语中如何使用也是一个重要的研究课题,而四声等汉语本身特有的问题也有待解决。
语音识别技术研究让人更加方便地享受到更多的社会信息资源和现代化服务,对任何事都能够通过语音交互的方式。 我整理了浅谈语音识别技术论文,欢迎阅读!
语音识别技术概述
作者:刘钰 马艳丽 董蓓蓓
摘要:本文简要介绍了语音识别技术理论基础及分类方式,所采用的关键技术以及所面临的困难与挑战,最后讨论了语音识别技术的 发展 前景和应用。
关键词:语音识别;特征提取;模式匹配;模型训练
Abstract:This text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to face.Then,the developing prospect ion and application of the speech-identification technology are discussed in the last part.
Keywords:Speech identification;Character Pick-up;Mode matching;Model training
一、语音识别技术的理论基础
语音识别技术:是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生 理学 、心理学、语言学、 计算 机 科学 以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行 自然 语言通信。
不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取。
(一) 语音识别单元的选取
选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种,由具体的研究任务决定。
单词(句)单元广泛应用于中小词汇语音识别系统,但不适合大词汇系统,原因在于模型库太庞大,训练模型任务繁重,模型匹配算法复杂,难以满足实时性要求。
音节单元多见于汉语语音识别,主要因为汉语是单音节结构的语言,而 英语 是多音节,并且汉语虽然有大约1300个音节,但若不考虑声调,约有408个无调音节,数量相对较少。因此,对于中、大词汇量汉语语音识别系统来说,以音节为识别单元基本是可行的。
音素单元以前多见于英语语音识别的研究中,但目前中、大词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成,且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母,这样虽然增加了模型数目,但提高了易混淆音节的区分能力。由于协同发音的影响,音素单元不稳定,所以如何获得稳定的音素单元,还有待研究。
(二) 特征参数提取技术
语音信号中含有丰富的信息,但如何从中提取出对语音识别有用的信息呢?特征提取就是完成这项工作,它对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。对于非特定人语音识别来讲,希望特征参数尽可能多的反映语义信息,尽量减少说话人的个人信息(对特定人语音识别来讲,则相反)。从信息论角度讲,这是信息压缩的过程。
线性预测(LP)分析技术是目前应用广泛的特征参数提取技术,许多成功的应用系统都采用基于LP技术提取的倒谱参数。但线性预测模型是纯数学模型,没有考虑人类听觉系统对语音的处理特点。
Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱,在一定程度上模拟了人耳对语音的处理特点,应用了人耳听觉感知方面的一些研究成果。实验证明,采用这种技术,语音识别系统的性能有一定提高。
也有研究者尝试把小波分析技术应用于特征提取,但目前性能难以与上述技术相比,有待进一步研究。
(三)模式匹配及模型训练技术
模型训练是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。
语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔可夫模型(HMM)和人工神经元 网络 (ANN)。
DTW是较早的一种模式匹配和模型训练技术,它应用动态规划方法成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统,目前已被HMM模型和ANN替代。
HMM模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同描述信号的统计特性,其中一个是隐蔽的(不可观测的)具有有限状态的Markor链,另一个是与Markor链的每一状态相关联的观察矢量的随机过程(可观测的)。隐蔽Markor链的特征要靠可观测到的信号特征揭示。这样,语音等时变信号某一段的特征就由对应状态观察符号的随机过程描述,而信号随时间的变化由隐蔽Markor链的转移概率描述。模型参数包括HMM拓扑结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点,HMM模型可分为离散隐马尔可夫模型(采用离散概率密度函数,简称DHMM)和连续隐马尔可夫模型(采用连续概率密度函数,简称CHMM)以及半连续隐马尔可夫模型(SCHMM,集DHMM和CHMM特点)。一般来讲,在训练数据足够的,CHMM优于DHMM和SCHMM。HMM模型的训练和识别都已研究出有效的算法,并不断被完善,以增强HMM模型的鲁棒性。
人工神经元 网络 在语音识别中的 应用是现在研究的又一 热点。ANN本质上是一个自适应非线性动力学系统,模拟了人类神经元活动的原理,具有自学、联想、对比、推理和概括能力。这些能力是HMM模型不具备的,但ANN又不个有HMM模型的动态时间归正性能。因此,现在已有人研究如何把二者的优点有机结合起来,从而提高整个模型的鲁棒性。
二、语音识别的困难与对策
目前,语音识别方面的困难主要表现在:
(一)语音识别系统的适应性差,主要体现在对环境依赖性强,即在某种环境下采集到的语音训练系统只能在这种环境下应用,否则系统性能将急剧下降;另外一个问题是对用户的错误输入不能正确响应,使用不方便。
(二)高噪声环境下语音识别进展困难,因为此时人的发音变化很大,像声音变高,语速变慢,音调及共振峰变化等等,这就是所谓Lombard效应,必须寻找新的信号分析处理方法。
(三)语言学、生 理学 、心理学方面的研究成果已有不少,但如何把这些知识量化、建模并用于语音识别,还需研究。而语言模型、语法及词法模型在中、大词汇量连续语音识别中是非常重要的。
(四)我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚;其次,把这方面的现有成果用于语音识别,还有一个艰难的过程。
(五)语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决,识别速度、拒识问题以及关键词(句)检测技术等等技术细节要解决。
三、语音识别技术的前景和应用
语音识别技术 发展 到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方 经济 发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、 旅游 、银行信息,并且取得很好的结果。
语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
参考 文献 :
[1]科大讯飞语音识别技术专栏. 语音识别产业的新发展. 企业 专栏.通讯世界,2007.2:(总l12期)
[2]任天平,门茂深.语音识别技术应用的进展.科技广场.河南科技,2005.2:19-20
[3]俞铁城.科大讯飞语音识别技术专栏.语音识别的发展现状.企业专栏.通讯世界,2006.2 (总122期)
[4]陈尚勤等.近代语音识别.西安: 电子 科技大学出版社,1991
[5]王炳锡等.实用语音识别基础.Practical Fundamentals of Speech Recognition.北京:国防 工业 出版社,2005
[6](美)L.罗宾纳.语音识别基本原理.北京:清华大学出版社,1999
点击下页还有更多>>>浅谈语音识别技术论文
网络语言 你明白多少? 出生于上世纪八九十年代的新新人类有着自己与众不同的标志,伊妹儿、小猫、老鼠早已被踢出年轻一代的网络词典,越来越多的新词汇正以迅雷不及掩耳之势蔓延。“偶稀饭粗稀饭”,“晕倒,楼主刚从火星归来?”,“偶8素米女,偶素恐龙的说”,“介素虾米东东?”……这些都是新新人类的网络语言。 网络是个虚拟世界,受网费和网速的限制,为了提高交流沟通的效率和信息含量,属于它自己的“Q言Q语”便应运而生,给日常用语注入一股鲜活的血液。 新新人类都是一些创造力和模仿力都很强的年轻人,善于也乐于接受新鲜事物,也正因此,网络语言才会不断推陈出新。 Q语究竟是古老汉语的一种新时代烙印,还是把纯洁的汉语带入了一个歧途? 网络语言颠覆传统文字习惯 几家欢喜几家愁“周末,读大学的GG(哥哥)回来,给我带了很多好东西,都系‘偶’(我)非常‘稀饭’(喜欢)的。就‘酱紫’(这样子),‘偶’(我)就答应GG陪他去逛街吃KPM(肯德基、比萨饼、麦当劳)……”相信很多人看了这段文字都会不知所云,但这却是天津市某中学生作文里的一段文字。时下,这些时髦的网络“新语言”已成为不少青少年挂在嘴边的常用语。走进各所大中学校,我们随处可以听见“恐龙”“青蛙”“灌水”“BF(男朋友)”“MM(妹妹)”等这样的网络语言,有的学生甚至把它们当作书面语言,在作文中使用。这就给我们提出了一个问题:网络语言究竟是新新人类的文字游戏,还是现代汉语的积极发展?我们应该如何看待这种现象? 学生时髦有趣干吗不用? 天津新华社消息,天津市43中学的高一女生李某在接受记者采访时说,网络语言活泼幽默,用起来非常方便也很时髦,很受同学们的欢迎。她还告诉记者说,谁要是在网上一本正经地和别人聊天,是会被人家挖苦取笑的。 也有一些学生对记者说,语言的使用本就应该不拘一格,生动有趣的网络语言其实和相声、小品一样,也是语言魅力的体现。很多畅销的网络小说如《第一次亲密接触》、《猪八戒日记》里充斥了“美眉”“青蛙”这样的网络语言,读起来让人耳目一新,如果把这些词换成正统的表达,它的可读性就差很多。 记者登录了几家国内网站的论坛和聊天室,满眼充斥着让人看得似懂非懂的网络语言:“蛋白质”指“笨蛋、白痴、神经质”,“尴尬”一定要说成“监介”,网络新手被称作“菜鸟”,在网上乱留言叫“灌水”,“很S”形容的是说话拐弯抹角,而最常见的TAXI(出租车)在网络语言却变成了“太可惜”…… 老师认为网络语言冲击语文教学 家住天津市和平区的许女士无意间发现女儿的日记中有这样的文字:“……没想到我最要好的朋友竟欺我,TMD(他妈的),7456(气死我了),我恨不得一脚TST(踢死她)。”许女士看后不知所云,直到女儿一番解释她才明白过来。许女士无奈地对记者说:“这是什么话呀,日记本成了密码本,根本看不明白!看来我和孩子之间已经有了‘网络沟’。” 家住天津南开区的小楠在上小学时擅长写作文。入中学后,小楠开始迷上了网络。近日,老师在一次家长会上说,小楠写的作文让他有些看不懂,什么“PF(佩服)”、“BT(变态)”、“4242(是啊)”都用进去了。小楠的母亲翻开女儿的作文一看,到处是老师用红笔画的圈圈杠杠,都是“看不懂”的网络语言。 也有的家长认为,要让孩子不受网络语言的影响,就要让孩子们远离网络。可孩子们都反映,网络世界丰富多彩,利用网络可以获取很多知识,这令家长们左右为难。 专家宽容比扼杀更重要 有关专家表示,网络语言也是一种语言实践,能在学生中间风靡,就说明它是有生命力的。但是,如果用网络语言写出来的东西大部分人都看不懂,影响了沟通,也就失去了语言的意义。同时,老师和家长应该用宽容和理解的心态看待这种现象。 王辛铭说,在语言的长期发展中会出现一些新的词汇,有一部分有生命力,有一些会被淘汰,这些新出现的网络词汇中有些可能成为汉语的新词汇。网络语言是年轻人的一种调侃语言,它也有个生命力的问题。对网络语言我们要有个去伪存真、去粗取精的过程。对网络语言的出现不要大惊小怪,视为洪水猛兽。 天津师范大学文学院教授汤吉夫认为,社会发展越快越迅猛,语言就会不断地被丰富被更新。对于出现的网络流行语言不能简单地判断对错,它进入人们的生活需要一个逐步被接受的过程,因此对网络语言宽容比扼杀更重要。现在很多老师和家长会担心作文中大量使用网络语言会影响孩子的考试成绩,这种想法其实是不科学的。在我国大力提倡全面进行素质教育的今天,素质教育取代应试教育是一个必然趋势,一些有鲜活生命力的语言将不再成为高考作文的禁忌。 天津市社会科学研究院舆情研究所所长王来华说,网络语言作为一种灵活变通的表达方式与常规语言相比具有新奇、简单、有幽默感的特点,我们应当对它报以一种宽容的态度。同时,我们应当加强对网络语言的研究,分清楚哪些是健康的哪些是不健康的,并加强对学生的正面引导,促使其使用规范性的语言文字,毕竟传统的语言有其深厚的文化底蕴和历史内涵。 天津市求真高级中学高级教师王辛铭说,因受网络语言的影响,有同学在作文里会冷不丁地冒出个网络上的词语。一些年纪大的老师根本搞不清是什么意思。在平时教学中,我们要求学生写作文尽量用口语化的语言,可将学生作文收上来一看,还是有些学生会使用诸如“酷毙”、“卡哇依”之类的词。他认为,对此若不加以引导,学生极有可能会养成不规范使用语言文字的坏习惯。 天津市求真高级中学高级教师王义明指出,学生面临考试、升学的压力,在这样的现实条件下,如果一味地使用网络语言只会给自己带来“不安全因素”。阅卷老师对网络语言一般都不会买账,这样会直接影响他们的分数。 网络语言生成另类文化?时下,网络交流已日益成为人们生活中的一部分。随着网络交流的普及,一些新兴的网络语言正逐步影响着人们的生活。如果你不了解网络语言,就很难被视作网民中的真正一员,就像不懂英语很难与世界接轨一样。 网络的另类声音 在网上,如果你称呼漂亮姑娘为美女,肯定会让网友们喷饭———太俗了。网上美女的称呼叫“美眉”。发明这个称呼的网虫一定具有相当丰富的艺术细胞,因为姑娘的眉毛可是构成美貌的关键因素之一。 在中国的传统词汇中,东施是丑女的代名词,谁叫她效颦来着。可若是在网上,丑女们有着更令人胆战心惊的称呼:“恐龙”!如果再在前边加上3个字:肉食性。那可就彻底玩完了———谁也不敢惹长相丑陋的“泼妇”。 以上只是网络语言的一类,它来源于中国的传统词汇,但被网虫们赋予了新的含义。通常都非常形象,通俗易懂。“伊妹儿”、“美眉”是第一批伴随网络诞生的词汇。 此外,新词汇的诞生还有很多归功于网民们自己的创造。例如米国,并不是指生产大米的国家,而是指美国。网民打招呼的时候,通常不会说“我来了”、“我要去吃饭了”之类没品位的大白话。 在网上,数字语言更不可小觑。倘若你初涉网络,除非有破译密码的天才,否则是绝对弄不明白数字语言代表的真正含义。很多现实生活中的爱情高手就是这样栽在网上的。 网络语言还包括很多拼音或者英文字母的缩写,起初主要是网虫们为了提高网上聊天的效率而采取的方式,久而久之就形成特定语言了。比如说,“BB”的意思就很复杂了,它可能是宝贝、孩子,情人,也可能是和你说分手———BYE—BYE。 如果你愤怒,你可以选出一个横眉竖目的脸谱发过去,心情好时则可以选择哈哈大笑的卡通形象。还有许多符号都代表着不同的含义。网络语言种类繁多,很难一一列出,其中的意味、酸甜苦辣就得网民们自己去慢慢品了。 网络语言冲击语文教学 一位小学教师来电说,现在的学生开口“哇噻”闭口“酷MAN”的,让人不知所云。更可怕的是,有些学生在作文,尤其是日记、周记里面充斥着大量的类似语言。据了解,学生们都是从网上学来的。这位老师呼吁,现在学生上网的越来越多,而学生们又正处于打基础的时候,如果对网络语言不加以控制,很可能会对传统正规语言的学习产生负面影响。 北京小学副校长李明新在接受记者采访时说,应当客观地来看待网络语言对学生的影响,不能将其一棍子打死。语言反映了一定的社会现象,如果一个新的语言产生已经得到了社会的公认,而且对社会产生积极影响的话,我们就不能也不可能人为地去阻止它。比如说一些大众俚语、俗话就有很强的生命力,事实证明,这些语言对社会只有好处而没有弊端。倘若是些类似江湖黑话等不健康的语言,就应当坚决制止。 白云路小学教师张金芳认为,传统的语文教学比较正规,语法、词汇的运用都非常讲究。可是网络语言却不一样,随意的成分太大。如果单纯拒绝网络语言也不明智,毕竟它在某种程度上是很多学生内心世界的真实写照。但如果一味地放任自流也不行。这其间有个度的把握问题。比如说我的学生的文章出现个别网络语言,我不会去责怪他们,而是应该去了解它的真实含义。毕竟,对待新类型的语言,我们采取的方式不应该是逃避而是去学会如何面对。 面对教师们的忧虑,很多身处其中的学生们却不以为然。一位绰号“甲克虫”的小网民对记者说,我们打小就爱看卡通漫画、电视、现在又迷上了网络。我们知道自己需要什么样的语言。那些罗嗦乏味的文字我最讨厌,明明一个单词或者一副图片就能说明白的干吗要拐弯抹角来表达呢。 语言发展不能拒绝网络 记者从国家新闻出版署了解到,对于报纸、期刊、杂志上出现的文字,国家都有相应的规定。而对于兼具媒体性质的网络语言还没有出台专门的规定,有关部门也正在商讨相应的措施。另据国家语言文字工作委员会有关人士向记者透露,是否规范网络语言并不是非常重要,关键是看它是否具有生命力。语言是活的、变化的、一直处于发展中的。网络上冒出的新词汇主要取决于它自身的生命力。如果那些充满活力的网络语言能够经得起时间的考验,约定俗成后我们就可以接受。毕竟它们在一定程度上是我们这个网络时代的反映,同时,它也能丰富中国的语言文字。有一些专家就专门从事收集新词汇的工作。 一位语言学专家认为,人们应当以更加积极的态度去对待网络语言。纵观历史,人类的每一种新文化的兴起都会带来一些新的词汇。远的不说,比如近年国内兴起的股民专用术语,熊市、牛市等单词已经远远超出了股市的运用范围。现在的小孩,都是从读图时代长大的,他们需要更加简单、形象的交流工具。网络语言的产生与其说是为了迎合新一代的需要,倒不如说是语言发展史的必然。网络语言对网民心理的折射摘要] 随着以网络为媒介的交流的增多,网络语言应运而生,网络语言目前主要有四类:“新造网语”、“数字网语”、“缩略网语”以及“符号网语”。网民赋予网络语言形象生动、标新立异的特点, 折射出特定人群在特定时期的心理状况。[关键词] 网络语言;类型;特点;心理折射 前言 从20世纪90年代起,一场以网络化、数字化为特征的信息革命已经深入到了社会的各个领域,随之而来的是以国际互联网为媒介的人际交流越来越普遍。但在现有的网络环境下,大部分的网上交流仍采用字符的形式,同时占网民比例最大的人群是代表社会中坚力量的年轻人。因此在这种交流过程中,语言的运用方式也显示出了一些独有的特点,这造就了一种新的语言形式“网络语言”。广义的网络语言大体上可以分为三类:一是与网络有关的专业术语,如硬件、软件、鼠标、病毒、宽带、登陆、在线、聊天室、局域网、防火墙、浏览器等。二是与网络有关的特别用语,如网民、网吧、触网、黑客、短信息、第四媒体、基准网民、电子商务、政府上网、中国概念股、虚拟空间、注意力经济、信息高速公路等。三是网民在聊天室和BBS上的常用词语和符号,如美眉、大虾、斑竹、恐龙、菜鸟、公鸡、东东、酱紫、瘟都死等。狭义的网络语言仅指第三类,是指网民们在网络交流这一新兴文化中所使用的新的语言。本文所要描述的正是这一类别。作为一种新兴的语言模式,网络语言文字活泼、自由、亲切、幽默,特别贴近生活,同时却又鱼龙混杂,泥沙俱下,这些语言现象的出现都有一定的社会心理基础。透过这些语言现象,能够看出与之相适应的特定人群在特定时期的心理状况。 网络语言的类型 目前中文环境中的网络语言(以下简称网语)种类繁多,新词新语漫天飞舞,词语的构成也比较复杂。具体说来,按其组成方式可分为四大类: 1、新造网语。年轻而时尚的网民们为了在网络世界引领潮流、标新立异,不断创造出一些生动活泼、充满怪异情趣的新词,或推陈出新,或旧词换新意。新造网语主要呈现四种形式:(1)“旧词义变”,即根据具体交流的需要给旧有的词汇赋予新的意义。如“帖子”是对网络论坛中所发表文章的称呼,是从“写着字的小纸片”的含义而来;“楼上”和“楼下”在网络论坛中指“上面的帖子”和“下面的帖子”,因为在网上文章按照其发表的先后顺序而呈由上而下的排列;“青蛙” 是指不受欢迎的丑陋男孩,而不是在说青蛙王子或吹牛大王;甚至有人用“偶像”指称呕吐的对象,用“天才”指称天生的蠢材。(2)“旧词音形变”,是指对旧有词语的读音、字形加以变化,进而产生新词的现象。例如,“妹妹”变成“美眉”, “青筋”变成请进, “大侠”变成“大虾”,“版主”变成“斑竹”,“气疯”变成“弃轰”等等。(3) “音译借词”。这里的“借词”概念借自传统的语言学:“借词也叫外来词,它指的是音与义都借自外语的词。” [1]最典型的莫过于把E-mail(电子邮件)称作“伊妹儿”、Windows称作瘟都死 、homepage(个人主页)称作烘培机。(4)“新新词汇” 是指由汉字构成的新词。比如“菜鸟”是对网络新手的戏称;“东东”就是指东西,仿佛出自幼儿之口,女孩子对此词情有独钟;“灌水”是让你发表意见、写文章,与之相应的还有“造砖”,前者是指随便写没价值的东西,后者是用心写好文章,两者相映成趣。 2、数字网语。抽象的数字经过想象力的排列组合,产生的效果出乎人们意料。这种数字化语言往往意蕴无穷而表意诙谐活泼,充满生活情趣。数字网语大体有三种表达方式:(1)数字与汉语谐音。比如最常用的886表示“拜拜了”;7456表示“气死我了”;770表示“亲亲你”;5555是“呜呜呜呜”,象声词,意即哭泣;1314520是温情脉脉地向对方表白“一生一世我爱你”等等。(2)数字与外语谐音。如88表示bye-bye; 74表示kiss;3166表示“撒优那拉”(日本语)再见的意思等等。(3)“数字密码”。是指通过阿拉伯数字的特别组合来表示某种寓意,有人在网上称你是286,他是在说你“脑子转得慢,像台286电脑一样”。又如“007”是指“我有秘密”; “123”是指“木头人”; “10”或“100”是指完美; “1775”是“我要造反了”,因为1775年美国独立战争爆发;“13579”表示“此事真奇怪”,因为这5个数字都是奇数,而在英语中“奇数”与“奇怪”是同一个词“odd”;“010”是指“孤独”;“0001000”又指“我真的好孤独”,“1”表示一个人,“0”表示空乏,取数字的象形意味等等。 3、缩略网语。网民们将英语或汉语变形而为缩略语,这种语言起初只是网民为了提高网上聊天的效率而采取的一种应对方式,久而久之就形成较为固定的网上用语了。它所遵循的原则只有便捷,目的就是把一样复杂或不便表达的东西用一个或几个简单的字母表示出来。缩略网语主要有两种形式:(1)规则的字首缩略语。又有英语和汉语拼音字首缩略语之分。比如BTW是by the way(顺便说)的英文缩略; “请有空就E我”,这E字是缩略语E-mail的再缩略;“BB”是Bye-Bye(再见)的英文缩略;“VG”是Verygood(非常好)的英文缩略;“PM”是Pardon me(原谅我)的英文缩略。又如汉语拼音首字母的缩略,如果你在网上被人呼为GG、DD、JJ、MM或PLMM,那就是一种非常亲昵的称谓了,指的是哥哥、弟弟、姐姐、妹妹或漂亮妹妹,这给原本冷冰冰的虚拟网络世界平添了一份亲切的感觉。当然,还有一些拼音缩略是平常不易出口的骂人话,如TMD就是“他妈的”的缩略,BT是“变态”的缩略,PMP是“拍马屁”的缩略,不一而足。(2)不规则的缩略语。如3KU和B4分别是thank you和before的汉英合璧的缩略; “HRU”是Howareyou(你好吗?)的英文缩略;“CU”是Seeyou(再见)的英文缩略等等。 4、符号网语。由于在网上网民大都采用字符的形式进行交流, 彼此看不到对方的表情和体姿语,这便影响语言交流的准确性和形象性,网民们由此特意创造了一系列具有感情意义和形象色彩的符号。这些符号都是由键盘中现有的特殊符号、字母和数字组成,是一种非常形象直观而且简约生动的语言表达方式,从某种程度上说比汉字更具表现力。比如,∶-)表示最普通、最基本的一张笑脸,常用在句尾或文章结束之处;∶-D表示非常开心地咧嘴大笑;∶-(表示正在生气或悲伤;^-^可以用来表示男士温和礼貌的笑脸,那么^.^自然代表女士含蓄优雅的笑容了;T-T表示哭泣的脸上双泪长流;^0^表示惊讶,^!^表示赞许;“:—P”(吐舌头的鬼脸); “:”表示接吻;“:%)%”表示满脸的青春痘,……丰富的表情符号能给人一种眉目传情的感觉,区区数画所传达给对方的信息往往会超过文字。 从网络语言的特点看网民的心理 第十三次CNNIC(2004年1月)调查结果显示,网民中18-24岁的年轻人所占比例最高,达到34.1%, 35岁以下的网民占82.2%,网民在年龄结构上呈现低龄化的特点。网民中受教育程度为高中(中专)的比例最高,占到29.3%,其次是大专(27.4%)和本科(27.1%)。从用户职业看,学生所占比例最多,达到了29.2%。[2]尤其活跃在聊天室和BBS的人群,其年龄、学历和职业结构使其具备了与其他社会群体不同的文化特征:他们更有知识,更易接受新鲜事物,更具创新能力,他们也最具个性和反叛精神一、网络语言的生动形象对网民心理的折射 从上述网络语言类型分析中可看出网络语言最显著的特征是生动形象。网络语言的生动形象主要表现在两个方面:一是新造网语的生动形象;二是符号网语的眉目传情。网络语言中的所有表达方式其实都是可以用传统的表达方式来表达的,可为什么网民们还要费劲心思创造出这些生动形象的网络语言呢?我认为这要从网民的年轻化来看,现在网民中的大多数都是高学历、高素养的、年龄在35岁以下的年轻人。他们正在显示特有的智慧与才情, 他们思维活跃、新潮,他们机智俏皮、妙语连珠。他们所创造的生动形象的语言是炫耀自己身上“闪耀着的智能的光辉”,他们所创造的幽默诙谐的语言是对平庸、枯燥、刻板生活的温和打击。例如网语“菌男”“霉女”是指相貌很丑的男女,因“菌”“霉”的使用能立刻使人想到过期、变质的食物,所以具有很强的反讽意味;“灌水”“造砖”在网络上都是指写文章,但“灌水”只是指随便写写,“造砖”则指潜心创作,带有很强的比喻色彩;“菜鸟”和“大虾”是网络新生和超级网虫的网上称呼,“菜鸟”是方言“笨”和“差劲”的意思,形容网络新手显得活泼、诙谐,而超级网虫经常坐在电脑前敲打键盘,日久天长,弓腰如虾,比喻十分生动形象。所有这些都让枯燥的计算机生动起来,成为交流情感的一方乐土,让人流连忘返。 陈原先生在他的《社会语言学》中说到:“现代社会生活的某种特殊情境,不能使用或不满足于使用语言(有声语言或书写语言)作为交际工具,常常求助于能直接打动(刺激)人的感觉器官的各种各样的符号,以代替语言,以便更直接,更有效,并能更迅速地作出反应。” [3]的确如此,中文表达本身存在一定的缺憾,在网络这个个性飞扬膨胀的特殊情境里不足以使年轻网民的思想得以尽情宣泄,于是符号网语在这个寸秒寸金的世界出现了。这种符号是现代标点的重新运用。既是抽象的,又是形象的;既是牵强附会的,又是妙不可言的。如:“Zhizhi同志昏倒在电脑前,以至于第二天上班都迟到了。:-(” [4]其中的“:-(”表示“苦笑”这种表情。如果我们把这个符号竖起来看的话,就会有形象生动的新感觉。网民通过这些符号传递他们特有的机智和创意。 敬一丹在做客新浪网时也谈到:“至于说年轻人当中出现的语言现象,我认为根本不需要大惊小怪”,“我觉得,他多半不是特别排斥正规的语言,而是追求一个修辞的效果。” [5]可见网民之间的交流用形象有趣的语言,是他们社会互动的一种特殊形式,曲折地表达了他们对社会、人生的一般态度。。 二、网络语言的标新立异对网民心理的折射 网络语言的标新立异表现在两个方面。一方面常常用异化的、情绪化的语言来宣泄某种平日里不能或不敢表达的情感。比如,用那些隐晦的数字表达出别样的感情, 770(亲亲你), 1314520(一生一世我爱你)恰到好处地表达了不好意思用语言直接表达的思想感情,既简洁实用,又显得幽默含蓄。又如把“东西”称为“东东”的“童语现象”,很难想象会在网络以外的任何交流环境中出现。这表现了在现今这个高压力快节奏的社会里,人们对无忧无虑的童年生活的向往。而在平日的现实生活中,表现出这样的情绪无异于向竞争对手、向社会示弱,所以在网上这个虚拟社会中,没有人知道你的性别和年龄,没有人与你形成真正意义上的竞争,网络便成了宣泄感情、显示“本我”的最佳地点。有一位心理学家曾就此发表过自己的观点,他认为:“从心理学角度来看,现代社会人的压力越来越大,人与人之间需要沟通、理解,网络成了情感宣泄窗口。”“由于网络具有隐蔽性,在网上聊天的人就更容易将平时鲜有机会表露的‘本我’显示出来,所以虽然目前网民中85%以上都是大专以上文化程度,但在聊天室里的表现往往比较‘初级’。” [6] 标新立异表现在另一方面常常视传统语法于不顾,表现出完全的随心所欲来。例如网上有一篇题为《小女子评说四方男人》的文章中写到:“只有爱上之后,才发现有点鸡肋。”还有这样一个句子:“还满腹生活常识地给太太充当购物顾问……” 。[7]网上还常常将“给你打电话”说成“电话你”,甚至连“气死我了”也说成“气死我乐”这种经常出现反常搭配的情况,都是从常用词语中翻出新意,网络语言显得越来越随意,越来越讲究冲破束缚。年轻人标新立异和叛逆的精神跃然纸上,折射出他们渴望被社会注意、理解和认同的迫切心情,着意与传统文化的含蓄、严谨和精致相疏离且乐此不疲,希望成为具有社会话语权力的主体的积极努力,愿意直接表达对社会和生活的理解和批评的率真性情。 “因此,他们常以出格的表达来达到一种放松,并企望以此体验一种快意。言辞的出轨、观念的冒险,是青年人经常采用的一种炫耀性的社会互动行为。” [8] 总之,任何一种语言,只要还被人们使用,就必然会不断地发展。创新是事物的生命力所在,只有创新,才能推动语言的发展。分析和理解年轻人在网络语言上的创新和突破,可以更真切地了解年轻人的生活方式、价值观念以及心态史的演变过程。 走出对网络语言的认识误区网虫”们有着自己与众不同的网络“词典”,越来越多的网络新词汇正在迅速蔓延。对此,厦门大学中文系教授、语言专家李如龙深感到担忧,他认为,网络语言对汉语是一种污染,是“一个不健康的苗头”。(新华社12月19日)对于层出不穷的网络新词语,人们向来有着不同的认识,李如龙教授的观点具有一定代表性。然而,与一些正统语言专家回避甚至鄙视网络语言形成鲜明对比的是,这些由敲起键盘来劈里啪啦的网上“高手”们制造出来的新奇词语,却为众多网民所熟悉和喜爱。在笔者看来,对于网络语言,一些人还存在以下三个方面的认识误区,走出这些误区,是正确看待和引导网络语言的关键。
248 浏览 3 回答
102 浏览 2 回答
108 浏览 3 回答
125 浏览 3 回答
260 浏览 3 回答
138 浏览 2 回答
316 浏览 2 回答
277 浏览 2 回答
140 浏览 3 回答
126 浏览 2 回答
210 浏览 2 回答
194 浏览 2 回答
295 浏览 2 回答
235 浏览 4 回答
116 浏览 2 回答