语音合成技术给我们带来了很多惊喜,你知道自己每天都在与它们打交道吗?而开车时的导航就是语音合成的一种。虽然目前的"它们"只会相对机械的朗读文章,但可以肯定的是,语音合成技术已经走出实验室,开始商用,其潜在的巨大市场已露出曙光。
我们的身边总是人声鼎沸。
婴儿牙牙学语,男女互诉爱意。在肺部、气管和声带的共同作用下,声音出现,喉内肌肉协调作用下,我们说出能够代表自己想法的字符,再赋予其愤怒或喜悦或悲伤的 情感 ,人类的语音就此形成。
18世纪末,一个因土耳其行棋傀儡的将在多年后臭名昭著的发明家沃尔夫冈·冯·肯佩伦,花费了人生最后20年的时间,试图模拟人类的语音。他做了一个布满孔洞的空箱,空箱连接着一个奇异形状的鼓风机,鼓风机被压动后将使得内置的簧片振动,这一过程模拟了人类的发声,也确实发出了声音,而这也成就了人类最早的语音合成机械之一。
让机器更像人类,是无数科学家的梦想。这样的梦想被多方位的推进,从机器的外形上、内核的思考运算上,以及对外表达的说话上。
如今,电子设备取代了空盒子,算法则比簧片更能够协调发声。在技术发展下,声音的波动被计算机捕捉、计算、指引,最终发出声音。这一项带着前人梦想的技术,不再单单出现在电影和小说里,也承载起了巨大的市场走进千家万户,这就是语音合成。
从Siri开始的热潮,语音合成潜力无限
同时,Siri的热潮也拉开了语音合成技术运用的大门。
2014年微软推出了"小娜"与"小冰",这是将Siri所拥有的语音识别技术及语音合成技术分开来,小娜负责理解复杂的口语指令并进行执行,而小冰主要能够和人类友好地聊天。
随后,这样的运用逐步增多:2014 年底,亚马逊发布了 Echo 智能音箱,语音助理 Alexa也随之亮相;一年半后,Google 也发布了第一代智能音箱 Google Home 和语音助手 Google Assistant。
国内的巨头也不遑多让,京东叮咚智能音箱、天猫精灵智能音箱、小爱系列智能音箱、小度智能音箱,也纷纷进入了国人的家居生活。
Siri的热潮同步开启的,不仅仅是语音合成技术在硬件上的应用,也包括一系列更具想象力的交互场景,带来了巨大的商机。
2015年春节,本就搭载了语音导航的高德地图与郭德纲合作,推出了高德地图欢笑版。用户打开高德地图,不仅能够听到导航播报,还能听到郭德纲的极具特色的段子。这一次尝试,让高德地图一度跃至苹果App Store榜单第2名。
在今年新冠肺炎疫情期间,"宅经济"大行其道,"听书"市场也快速爆发,有声阅读成为新的阅读潮流。
除此以外,短视频中的AI配音,让视频内容者省去大量配音时间;对已故知名艺人的声音采集,实现过去与现在的交互,圆了一代粉丝的梦想……
我们可以看到,语音合成技术的未来拥有巨大的想象空间,根据赛迪智库数据,预计到2021年智能语音市场规模将达195亿元。在这其中,智能语音就由语音识别技术(ASR)和语音合成技术(TTS)共同组成。
而这两项技术也正在被头部企业迅速推进,市场之下,语音合成已经不仅仅代表人类过去的梦想,更是代表着更"大一统"的 科技 格局,毕竟,这一技术改变着人类与机器的交互方式,也将改变未来人类的机器使用习惯,代表着全新的机会与入口。
从过去到现在,语音合成技术一览
1773年,俄国科学家、在哥本哈根生活的生理学教授克里斯蒂安·克拉特齐斯坦(Christian Kratzenstein)制造了一个特别的设备,通过共鸣管和风琴管的连接,几乎可以完美的发出 a、e、i、o、u 这五个元音。
十多年后,前文提到的沃尔夫冈·冯·肯佩伦也制造了一台类似的机械声学语音机器。随后,多位发明家基于这一机器进行改进,都是试图通过物理机模拟人说话发音。
这样的尝试已经令人难以想象,不过,即使这样的物理机发展得登峰造极,也无法模拟出我们说出的每一个音节、无法拥有人说话的音质,也无法停顿、无法带有情绪。
因此,另一种方式出现——拼接系统,让说话人录制语音存入系统,在合成语音时选择对应的片段进行拼接、合成。这样的拼接系统能够相比物理机极大地接近人声,虽然拼接处的瑕疵难以消除,但是随着如今大数据时代的来临,大语料库的出现,让拼接出的语音逐步真人化,直至如今依然有商业系统在使用。
基于参数的合成技术的诞生背景则是基于神经网络架构的深度学习方法的飞速进展。当时,对语音的识别不再是识别一个简单的词和短词组,而是基于统计的方法,运用声学模型帮助计算机认知每个音素单元的声学特征、运用语言模型帮助计算机实现对人类用词习惯的认知,最终给到用户最高可能性的连接。在这其中,典型的模型是隐含马尔可夫模型(HMM),用来描述如何在可变长的时序特征序列上打词标签。
2017年3月,行业的引领者Google 提出了一种新的端到端的语音合成系统:Tacotron。端到端语音合成是在参数合成技术上演进而来的,把两段式预测统一成了一个模型预测,即拼音流到语音特征流的直接转换,省去了主观的中间特征标注,克服了误差积累,也大幅度提高了语音合成的质量。
然而,为了实现真正像人一样的发音,语音合成系统必须学会语调、重音、节奏等表达因素,这一问题,Tacotron也并未解决。
谷歌曾共享了两篇新论文试图解决这一问题,第一篇论文《Towards End-to-End Prosody Transfer for Expressive Speech Synthesis with Tacotron》介绍了"韵律学嵌入"(prosody embedding)的概念。论文中为 Tacotron 增加了一个韵律学编码器,该嵌入捕捉包括停顿、语调、语速等在内的音频特征可根据一个完全不同的说话者的声音生产语音。
第二篇论文《Style Tokens: Unsupervised Style Modeling, Control and Transfer in End-to-End Speech Synthesis》则在上一篇论文的架构上进一步展开,并且创新性地提出了一种建模潜在语音"因素"的无监督新方法。这一模型之下,学习的不再是时间对齐的精确的韵律学元素,而是较高层的说话风格模式,并且可以迁移于任意不同的短语之中。
如果论文提到的模型实现,那么我们便可以迫使 Tacotron 使用特定的说话风格,不需要参考语音片段,并能创造出语音长度多样化的不同语句,并带有情绪。
在不远的将来,或许我们就将听到,来自机器的人类声音。
国内:积极商用,进展瞩目
在语音合成的重要研究中,因为国内起步较晚,所以我们很少看到突破性的技术发展。但是,即便停留在艰难的 探索 初期,巨头们之于语音合成仍旧趋之若鹜。
我们也惊喜地看到,不少企业在近期通过语音合成的商用落地,展现出了自己的技术实力。
① 京东数科:AI主播"小妮"上岗
京东数科基于京东多年在人工智能、大数据、云计算等领域的技术沉淀,在2018年就开始组建机器人的团队,研究覆盖生命科学、传感器材料乃至运动力学与人机交互。
在全面的机器人开发体系下,今年5月,京东数科推出了令人瞩目的AI主播"小妮",这是京东数科自主研发的AI虚拟数字人产品首次亮相。
小妮的真实是全方位的,在听感、表情、头部动作乃至口型上,小妮都极像真人。从文字到语音,小妮通过自研的轻量级对抗语音合成技术进行转化;而小妮特色鲜明的声音及极具真实性的呼吸和停顿,则是来源于在多人数据上结合深度神经网络进行个性化建模……
更为重要的是,小妮的出现打通了语音、图像、视频,在语音生成视频的阶段,她的形象同样真实。因为京东数科AI实验室利用对抗生成网络来还原更真实的表情,通过3D模型运动追踪技术来确保AI主播在说话时口型准确、表情细腻、头部运动自然。
而除了主播领域以外,AI虚拟数字人还可以用智能客服及招聘领域。在未来,我们可以预见到,AI虚拟数字人在其他高重复性场景的更多运用可能性。而伴随着京东数科全面的机器人体系研发技术的进展,或许也将出现超乎我们想象的AI运用。
② 科大讯飞:为多家企业提供底层技术支持
早在之前,科大讯飞就推出了讯飞录音笔、智能鼠标、阿尔法蛋等涉及语音交互的产品。今年,来自科大讯飞地一款彩色墨水屏阅读器正式面世,一方面,阅读器可以进行常见的新闻播报、语音读书,满足用户的基础要求;另一方面,阅读器结内置了神秘AI主播,可以对话用户、助力用户解决问题。同时,科大讯飞也为多家企业提供底层技术支撑,覆盖智能手机、智能 汽车 等多个领域。
③ 腾讯云:语音累计音色种类达24种
而对于拥有国内最大流量池——微信、QQ的腾讯而言,这家企业则选择为内容创业者提供服务。
今年9月,腾讯云语音合成团队正式开放面向全量用户的合成音频平台,该平台能够帮助用户在零门槛的情况下实现语音合成技术的运用,用户只需要直语音合成控制台上生成和下载文本对应的音频文件即可。该功能的侧重点是帮助内容创作者在公众号、短视频、小视频等内容上更简单、快捷地插入对应所需的音频文件。同时,腾讯云还发布了全新地11种音色,其中甚至包括粤语这样的方言在内,目前累计音色种类达24种。
④ 百度:百度大脑开放全栈语音引擎能力
作为将AI作为战略进行投入的百度,在语音合成上的推进也不容小觑。
去年,已经开放三年的百度发布了语音引擎。这是一套非常全面的系统,覆盖内容非常广泛,包括硬件模组、开发板以及语音交互场景解决方案等。在这其中,百度也专门围绕语音合成的成功进行了发布,推出了6个在线语音合成精品音库和5个离线语音合成精品音库。
未来语音合成将更接近人类的语言
立足现在,我们不禁畅想,未来的语音合成将是什么样,又将出现在哪些地方?
在技术上,毫无疑问,未来的语音合成将更接近人类的语言。一个理想的语音合成系统由三部分组成:文本分析、韵律生成和合成语音,而在这三方面,行业的发展都还有待提高。
在这其中,韵律生成是行业面临的共同问题,如何可以让语音合成更像人类?更具表达力?作为声学模型,还有大量个性化、 情感 化的变化因素需要学习。而值得一提的是,语音合成技术的复杂度也需要降低,从而实现更广度地运用。我们也相信,随着大量语料的有效使用,这一切问题也都将解决,未来,语音合成必将更加"传神"。
而随之而来的,我们的生活也将被改变。
一方面,在 科技 带来革新的同时,传统也将受到冲击。在上文中,小妮被运用与客服以及招聘的部分环节,那么很明显,在不远的未来,具有重复性的语音性质的工作将受到巨大影响。
而另一方面,更为智能的未来也将到来,在将来,人与机器的交互方式或许将被彻底改变,到那时,全新的商业机会也将藏于其中。
为了迎接这一时代,巨头趋之若鹜,而普通人也同样该砥砺前行。
#智能语音##语音合成#
这篇博客的主要内容是对语音合成 (text to speech)的背景知识进行介绍。 希望可以让读者通俗易懂的了解语音合成的工作原理, 并对为了理解state-of-the-art text to speech 的算法做基础。这个简介主要基于这篇论文 “Wavenet: a generative model for raw audio”的附录介绍的。 论文链接如下: , 以及stanford CS224S的课程, 链接如下 语音合成是通过文字人工生成人类声音, 也可以说语音生成是给定一段文字去生成对应的人类读音。 这里声音是一个连续的模拟的信号。而合成过程是通过计算机, 数字信号去模拟。 这里就需要数字信号处理模拟信号信息,详细内容可参考 [1]。 图片1, 就是一个例子用来表示人类声音的信号图。 这里横轴是时间, 纵轴是声音幅度大小。声音有三个重要的指标, 振幅(amplitude) , 周期(period) 和 频率(frequency) 。 振幅指的是波的高低幅度,表示声音的强弱,周期和频率互为倒数的关系, 用来表示两个波之间的时间长度,或者每秒震动的次数。 而声音合成是根据声波的特点, 用数字的方式去生成类似人声的频率和振幅, 即音频的数字化。了解了音频的数字化,也就知道了我们要生成的目标函数。 音频的数字化主要有三个步骤。 取样(sampling) :在音频数字化的过程,采样是指一个固定的频率对音频信号进行采样, 采样的频率越高, 对应的音频数据的保真度就越好。 当然, 数据量越大,需要的内存也就越大。 如果想完全无损采样, 需要使用Nyquist sampling frequency, 就是原音频的频率2倍。 量化 (quantization) : 采样的信号都要进行量化, 把信号的幅度变成有限的离散数值。比如从0 到 1, 只有 四个量化值可以用0, , , 的话, 量化就是选择最近的量化值来表示。 编码 (coding ):编码就是把每个数值用二进制的方式表示, 比如上面的例子, 就可以用2bit 二进制表示, 00, 01, 10, 11。 这样的数值用来保存在计算机上。 采样频率和采样量化级数是数字化声音的两个主要指标,直接影响声音的效果。 对于语音合成也是同样, 生成更高的采样频率和更多多的量化级数(比如16 bit), 会产生更真实的声音。 通常有三个采样频率标准 1. 采样, 用于高品质CD 音乐 2. 采样, 用于语音通话, 中品质音乐 3 . 采样, 用于低品质声音。 而量化标准一般有8位字长(256阶)低品质量化 和16位字长(65536阶)高品质量化。 还有一个重要参数就是通道(channel), 一次只采样一个声音波形为单通道, 一次采样多个声音波形就是多通道。 所以在语音合成的时候,产生的数据量是 数据量=采样频率* 量化位数*声道数 , 单位是bit/s。 一般声道数都假设为1.。 采样率和量化位数都是语音合成里的重要指标,也就是设计好的神经网络1秒钟必须生成的数据量 。 文本分析就是把文字转成类似音标的东西。 比如下图就是一个文本分析,用来分析 “PG&E will file schedules on April 20. ” 文本分析主要有四个步骤, 文字的规范化, 语音分析, 还有韵律分析。 下面一一道来。 文本分析首先是要确认单词和句子的结束。 空格会被用来当做隔词符. 句子的结束一般用标点符号来确定, 比如问号和感叹号 (?!), 但是句号有的时候要特别处理。 因为有些单词的缩写也包含句号, 比如 str. "My place on Main Str. is around the corner". 这些特别情况一般都会采取规则(rule)的方式过滤掉。 接下来 是把非文字信息变成对应的文字, 比如句子中里有日期, 电话号码, 或者其他阿拉伯数字和符号。 这里就举个例子, 比如, I was born April 14. 就要变成, I was born April fourteen. 这个过程其实非常繁琐,现实文字中充满了 缩写,比如CS, 拼写错误, 网络用语, tmr --> tomorrow. 解决方式还是主要依靠rule based method, 建立各种各样的判断关系来转变。 语音分析就是把每个单词中的发音单词标出来, 比如Fig. 3 中的P, 就对应p和iy, 作为发音。 这个时候也很容易发现,发音的音标和对应的字母 不是一一对应的关系,反而需要音标去对齐 (allignment)。 这个对齐问题很经典, 可以用很多机器学习的方法去解决, 比如Expectation–maximization algorithm. 韵律分析就是英语里的语音语调, 汉语中的抑扬顿挫。 我们还是以英语为例, 韵律分析主要包含了: 重音 (Accent),边界 (boundaries), 音长 (duration),主频率 (F0). 重音(Accent) 就是指哪个音节发生重一点。 对于一个句子或者一个单词都有重音。 单词的重音一般都会标出来,英语语法里面有学过, 比如banana 这个单词, 第二个音节就是重音。 而对于句子而言,一样有的单词会重音,有的单词会发轻音。 一般有新内容的名词, 动词, 或者形容词会做重音处理。 比如下面的英语句子, surprise 就会被重音了, 而句子的重音点也会落到单词的重音上, 第二个音节rised, 就被重音啦。 英语的重音规则是一套英语语法,读者可以自行百度搜索。 I’m a little sur prised to hear it cha racterized as up beat . 边界 (Boundaries) 就是用来判断声调的边界的。 一般都是一个短语结束后,有个语调的边界。 比如下面的句子, For language, 就有一个边界, 而I 后面也是一个边界. For language, I , the author of the blog, like Chinese. 音长(Duration) 就是每个音节的发声长度。 这个通俗易懂。 NLP 里可以假定每个音节单词长度相同都是 100ms, 或者根据英语语法, 动词, 形容词之类的去确定。 也可以通过大量的数据集去寻找规律。 主频率 (F0 )就是声音的主频率。 应该说做傅里叶转换后, 值 (magnitude) 最大的那个。 也是人耳听到声音认定的频率。一个成年人的声音主频率在 100-300Hz 之间。 这个值可以用 线性回归来预测, 机器学习的方法预测也可以。一般会认为,人的声音频率是连续变化的,而且一个短语说完频率是下降趋势。 文本分析就介绍完了,这个方向比较偏语言学, 传统上是语言学家的研究方向,但是随着人工智能的兴起,这些feature 已经不用人为设计了,可以用端到端学习的方法来解决。 比如谷歌的文章 TACOTRON: TOWARDS END-TO-END SPEECH SYNTHESIS 就解救了我们。 这个部分就比较像我们算法工程师的工作内容了。 在未来的博客里, 会详细介绍如何用Wavenet 和WaveRNN 来实现这一步骤的。 今天这个博客就是简介一下算法。 这里说所谓的waveform synthesis 就是用这些 语言特征值(text features)去生成对应的声波,也就是生成前文所说的采样频率 和 振幅大小(对应的数字信号)。 这里面主要有两个算法。 串接合成(concatenative speech synthesis) : 这个方法呢, 就是把记录下来的音节拼在一起来组成一句话,在通过调整语音语调让它听起来自然些。 比较有名的有双音节拼接(Diphone Synthesis) 和单音节拼接(Unit Selection Synthesis)。这个方法比较繁琐, 需要对音节进行对齐(alignment), 调整音节的长短之类的。 参数合成 (Parametric Synthesis) : 这个方法呢, 需要的内存比较小,是通过统计的方法来生成对应的声音。 模型一般有隐马尔科夫模型 (HMM),还有最近提出的神经网络算法Wavenet, WaveRNN. 对于隐马尔科夫模型的算法, 一般都会生成梅尔频率倒谱系数 (MFCC),这个是声音的特征值。 感兴趣的可以参考这篇博客 去了解 MFCC。 对于神经网络的算法来说, 一般都是生成256 个 quantized values 基于softmax 的分类器, 对应 声音的 256 个量化值。 WaveRNN 和wavenet 就是用这种方法生成的。 下面是我学习语音合成的一些资料, 其中stanford cs224s 是强力推荐的,但是这个讲义讲的逻辑不是很清楚, 要反复看才会懂。 UCSB Digital Speech Processing Course 课程, 声音信号处理的基础。 建议读一遍, 链接如下, Stanford CS224S WaveRNN, 音频的数字化,
普通话对英语语音的迁移作用摘 要: 本文在论述语言迁移理论本质的基础上,分析了影响迁移的因素,对汉英两种语言对比,从音素、音位、声调/语调语言、重音和节奏等层面分析了普通话对英语学习的负迁移作用,以便更好地帮助学生克服普通话的负迁移影响,促进英语语音的学习。关键词: 普通话;英语语音;语言迁移;对比研究The Transferring Effect of Mandarin on English PhoneticsLin YuhangDepartment of Foreign Languages and Literatures, Zhangzhou Teachers College 01021225Abstract: This paper is meant to help the Chinese English-learners to overcome the negative phonetic transfer and promote the study of English phonetics by dealing with language transfer theories, analyzing the factors affecting language transfer, comparing and analyzing some phonetic features of the Chinese and English languages, such as phone, phoneme, tone/intonation language, stress and words: Mandarin; English phonetics; language transfer; comparative analysis语音过关是英语学习的关键,同时也是难点。然而,外语界对语音教学问题的探讨却明显少于其他领域,这难免有些“避重就轻”之嫌。将英汉两种语音进行对比研究,对比教学,不失为一种良策,如张凤桐教授编著的《英国英语语音学和音系学》就是按照这一指导思想编写的教材。对比研究的理论基础是语言迁移,同时,对比研究和教学是正视语言迁移作用的科学方法和手段。然而就在将两种语音进行对比教学的过程中,产生了一些似是而非的说法,例如“普通话好,英语语音就好”是其中最具代表性的。这一说法过分夸大了语际间的正迁移作用,而忽略了负迁移作用。应该说这一问题的答案是不确定的。世界上有各种各样的语言,虽然各种语言有其相通的一面,但每一种语言都有其特有的语音体系,并有自己独特的发音规律。要全面正确地了解普通话对英语语音的迁移作用,就应该在认识语言迁移的本质和产生语言迁移因素的基础之上,将英汉语音、音位相关的方面作科学的对比研究。一、 语言迁移概念及其实质奥苏伯尔的认知结构迁移理论代表从认知的观点来解释迁移的一种主流倾向,然后有符号性图式理论、产生式理论、结构匹配理论与情境性理论等迁移理论。根据奥苏伯尔的认知结构迁移理论,“迁移是一种认知活动,体现了个体主动的心理加工过程”[1]。但也存在分歧,一些研究者着眼于各理论在更高层次上的概括,将迁移概括为“一种学习中习得的经验对其他学习的影响,是新旧经验的整合过程”[2],这种整合过程可以通过同化、顺应与重组三种方式实现,其实质是原有认知结构与新学习的相互影响、相互作用,从而形成新的认知结构的过程。迁移(transfer)作为一个心理术语,是指已获得的指示、技能、方法等对学习新知识、技能的影响。迁移是人类认知的一个普遍特征。在外语学习中,迁移“指的是人们已经掌握的知识在新的学习环境中发挥作用的心理过程”[3],主要是母语及母语学习经历对学习新语言的影响。语言迁移可分为正迁移(positive transfer)和负迁移(negative transfer)。如果某个外语结构在母语中有对应结构,或母语对外语的学习起促进作用,在学习中就会出现正迁移现象。但是如果某个结构在母语中没有对应的结构,或者两种语言中的对应结构有差异,也就是说,母语对外语的学习起干扰或抑制作用,就会产生反面的迁移,从而影响外语的学习,这就是学习中的负迁移现象。系统的语言迁移研究可追溯到上个世纪四五十年代的语言学家弗赖伊斯()和雷多()。他们从斯金娜()的行为主义心理学理论出发,认为“学习是刺激与反应的强化,是习惯的形成,是新旧知识的联结。因而在外语学习中,母语这种先前语言学习的习惯会对新的外语学习产生迁移作用”[4]。基于这一观点,他们认为“外语学习的主要困难是由两种语言的差异引起的,学习的主要任务就是找出并克服这种差异”[4],据此他们提出了对比分析假说(contrastive analysis hypothesis),即“将学习者的母语(mother tongue/native language)与目标语(target language)进行各方面的比较分析,找出两者的差异,解释或预测外语学习中已经或将要出现的困难与错误,并以此为指导教材的编写和教学活动。”[4]20世纪60年代末,乔姆斯基提出了语言习得机制( language acquisition device)假说和普遍语法 (universal grammar)理论。他认为:“人类语言结构存在着普遍性(language/linguistic universals),这种语言的普遍性反映了人类的经验过程,反映了人类获得新知识能力的普遍性”[5]。也就是说,人类生来就有自然学习语言的能力,它植根于人的内在机制,即语言习得机制。格林伯格( )通过对跨语言调查(cross-linguistic surveys)特别是对语序的分析来研究和证明语言的普遍性。总之,无论是强调母语迁移作用的对比分析假说,还是强调人类语言的普遍性而忽视母语迁移现象的普遍语法理论,都从不同的方面说明了正是各种语言具有一定的共性,母语才会对外语学习产生积极影响的正迁移作用,同时每种语言所具有的特殊性又使母语迁移对外语学习产生一定的负面影响,即负迁移。二、语言迁移产生的因素语言迁移绝非简单的母语与外语或第二语言间的迁移,也不是两种语言间的相似性或共同性就能决定迁移的程度。相反,它涉及各种不同类型的迁移,也涉及不同的主客观因素。任何迁移形式的产生都受到许多主客观因素的制约。影响英语语音学习迁移的因素很多,包括学习材料间的共同因素、对材料的理解程度、知识经验的概括水平、定势作用、认知结构的清晰性和稳定性及知识的运用等。奥苏伯尔认为,认知结构的3个变量影响新的学习或迁移的发生。认知结构即学生头脑中的知识结构,从广义上讲,它是学生已有观念的全部内容及其组织;从狭义上讲,它是学生在某一特殊领域中的观念的全部内容及其组织。认知结构变量就是学习者应用他的原有知识同化新知识时,原有认知结构在内容和组织方面的特征。影响陈述性知识迁移的变量是:可利用性、可辨别性和稳定性。此外,有学者认为以下问题与语言迁移密切相关。首先,情境特征引起的关注。情境包括最初的学习情境和后来的迁移情境,两种情境是否相似影响迁移水平。研究发现,物理的和社会的场景也是整个学习中重要的、有意义的组成部分。不同的场景或情境,其学习与迁移可能不同。因此,真实的英语学习情境,如外语角等,有助于将学得的语言知识与语言技能迁移到实际情境中去。其次,强调迁移的主动性与通达性。通达体现了学习者的主观能动性,意味着学习者可在迁移机会出现时,顺利地提取有关的经验或可利用的资源。有效的学习者有强烈的内部动机来调节自己的语言学习活动,如主动识别先前的语言学习与目前任务的相关性,识别恰当的语言使用和语言迁移情境,主动提取可利用的资源等,这些都是语言迁移产生的必要条件。三、 对比研究中普通话对英语语音的迁移作用对比研究是建立在美国学者雷多(R. Lado) 1957年提出的“对比分析(contrastive analysis)”基础上的一种语言分析方法。雷多的对比研究是一种在语音、语法和文化层次上对第一语言和第二语言进行严格的、逐一比较的体系。该对比研究的理论基础和焦点是语言迁移。语言的对比研究有助于人们认识语言间的区别和联系。李庭芗先生指出,“英、汉语在语音方面有哪些相同和相异的地方,是每个英语教师所必须了解的。英、汉对比的知识能帮助教师根据英、汉语的异同,预见学生在学习中的难点和重点,从而在教学方法上采取相应措施,以提高英语教学的质量”[6]。要学好英语语音,首先要了解哪些音是汉语中没有的,哪些音容易受汉语语音的干扰,英、汉语音之间怎样互相干扰的。普通话学习者在英语语音学习中产生的迁移,虽然不完全是具体知识的迁移,却是普通话发音习惯、发音部位的迁移,也是一种发音技能的迁移。对两者进行音素(phone)、音位(phoneme)及音节(syllable)等方面作系统的对比研究,无疑会促进找准正迁移作用的条件,而减少负迁移产生的干扰,有助于英语语音的学习。语音的最小单位是音素,但是在言语交际中能区别意义的最小语音单位是音位。音位分为音段音位(segmental phonemes)和超音段音位(super-segmental phonemes)两种,前者包括元音、辅音,元音与辅音、辅音与音在词中的组合,即音位组合或音节;后者则指重音(stress),音程(length),节奏(rhythm),音调(tone),语调(intonation)及音渡(juncture)等。以下是两种语言音位的对比分析和迁移作用的情况:1. 元音、辅音和声母和韵母属于印欧语系日耳曼语族的英语有20个元音、28个辅音。英语的音位是区别词义的最小单位。属于汉藏语系汉语的音位和英语一样,也是区别词义的最小单位。普通话是汉语的代表语言,有辅音音位,即声母22个,韵母31个。声母一般位于音节的开头,韵母是声母后的一部分,一般由元音或元音加辅音/n、n^/构成,如/B、o、Bi、en、uBn^/等韵母。英语元音分为单元音和双元音;普通话的元音分为单韵母和复韵母。英语的单元音数量比普通话的单韵母要多,而且分得细。普通话里只有6个单韵母;英语有12个单元音,而且分为前、中、后元音。其中/I、U、e、A、Q/等单元音在普通话中找不到近似的音,很难说普通话说得好的人一定就能发好这些音和包含这些音位的单词和句子。而在普通话中 能找到的近似音如/i、u/,前者发音的舌位比英语更靠前,后者则更靠后[7]。另外,普通话的复韵母/ei、Bi、Bo、ou/和英语的双元音/eI、aI、au、EU/虽都以强元音为主,向弱元音方向滑动。但是,普通话滑动较快,而且并没有达到弱元音的位置,念起来两音浑然一体;英语的双元音滑动较明显,两者相对独立,普通话较好的人很容易将like误念成/lak/或/lek/。值得注意的是两者在发音的部位和口形上都存在差异。发复韵母/ei、Bi、Bo、ou/的口形张得小于发双元音/eI、aI、aU、[U/,但舌位略靠后[7]。当然,能掌握汉语中的渐强复韵母,如/iB、ie、uB、uo/的学习者更容易发好英语中的双元音/I[、Z[、U[/。普通话和英语里都有三元音,其发音方法各不相同:发普通话三元音的方法是由弱到强,再由强到弱,中间的元音紧张度强,形成一个音节,如/iBo、uBi、ioU、iBo/等;英语的三元音由双元音加/[/组成,但不是出现在同一个音节里,其发音方法是由强到弱,再由弱到次强。普通话和英语的辅音音位也存在异同。英语的辅音多数是清浊成对的,如 /p、b/,/t、d/,/k、g/等;而普通话的辅音多数分为送气和不送气的清辅音,如/p、b、t、d、k、g、j、q、x、zh、ch、sh、z、c、s/等,浊辅音只有/r、m、n、l、ng/5个。汉语的送气和不送气区别意义;英语的清浊可以区别词义,影响元音的长度和同化相邻的辅音,如/lIt/中的/I/就发得比/lId/中的/I/短促,浊音能延长前面带的元音。又如元音/R:/在 caw,cord,caught三个单词中的音程不同,在caw中发音最长,在cord中次之,caught中则最短。此外,英语中的辅音根据所处的位置不同和所连接的音位的关系,产生音位变体(allophone)。如音位/t/在不同的发音环境中,它的发音是不一样的,在top中是送气的(aspirated);在stop中是不送气的(unaspirated);在certain中是鼻腔爆破(nasalized plosive);在little中是舌边爆破(lateral plosive);在that kid中是不完全爆破(incomplete plosive);在that day中是失去爆破(loss of plosive)。这些现象是英语中特有的,普通话再好,如果没有具备该语音知识,也学不好英语语音。诚然,普通话语音系统中的一些音位与英语的某些音位无大差别。比如,鼻辅音(nasal)在两种语音系统中构成一个自然类,可以用同样的区别特征加以描述,/m/,/n/,/N/可分别描述为〔+辅音性,+鼻音性,-后部性,+双唇性〕;〔+辅音性,+鼻音性,-后部性,+齿龈性〕;〔+辅音性,+鼻音性,+后部性,+软颚性〕。能发好普通话鼻辅音的学习者,语言的正迁移作用就能让他正确发好英语的鼻辅音。但学习者更应关注的那些和普通话发音的部位和方法有差异的近似音和汉语中根本没有的音位,如/W、T/,/F、V/,/tF、dV/等,不管普通话说得多地道的学习者,不加强练习,也不容易发好齿摩擦音(dental fricative)/W、T/,颚龈摩擦音(palato-alveolar fricative)/F、V/和颚龈塞擦音(palato-alveolar affricate)/tF、dV/。特别值得注意的是以下辅音在普通话和英语中的不同描述:/s、z/在英语中为齿龈摩擦音(alveolar fricative);在汉语中前者为齿摩擦音(dental fricative),后者为齿塞擦音(dental affricate)。/h/在英语中为喉擦音(glottal fricative);在汉语中为软颚摩擦音(velar fricative)。/r/在英语中为无摩擦延续音(approximate);在汉语中为卷舌摩擦音(retroflex fricative)[7]。2.音位组合—音节对比音节既是语音学中的一个概念,也是音位学中的重要概念。对音节的定义说法不一。就其结构而言,“音节是由一个或一系列音位构成的语音结构”[7](P20)。音节通常由起音(onset),领音(peak)和收音(coda)构成,领音一般是元音(vowel),起音和收音常常是辅音(consonant)。英语音节构成形态要比普通话音节构成复杂得多。具体形态如下:英语音节:V-VV-VVV-CV-CVV-CVVV-VC- VCC-CCVV-CVC-CVVC-CCV-VCCC-CCVC-CC CVC-CCCVVCC-CCCV-CCVVC-CCVVCC-CCVCC C-CCVCCCC-CVCC-CVCCC-CVCCCC汉语音节:V-VV-VVV-CV-CVV-CVVV-VC-CVC- CVVC从以上对比中可看出,普通话的音节结构比较简单,通常是单辅音加元音;英语音节的首、尾常常出现辅音群(consonant clusters)如 must tempt texts thousandths等。换言之,普通话中只有单辅音型的音节,没有辅音群型的音节。辅音群型的音节成为中国学习者,包括能说标准普通话学习者的语音难点。学习者习惯于在读英语辅音群中夹带元音,如把green念成/^[ri:n/。另外升调时容易从词尾的辅音开始,试图把它拉的很长,因而很费力,发出的音也很不规范。这是因为汉语的音节除/n/和/ng/两个鼻辅音外,都以元音结尾,即为开音节,而且节峰前最多只有一个辅音;而英语的音节节峰前最多可有三个辅音,如/sprIt/等,而节峰后最多可有四个。由于两种语言的音节系统不同,学生易将汉语的音节特征转移到英语学习中。3.语调语言(intonation language)和声调语言(tone language)汉语中的每一个字(或音节)都有一个区分字义作用的声调, 如/mā/妈,/má/麻,/mǎ/马,/mà/骂,/mB/吗,语音学家称汉语为声调语言;然而在英语中,单词的音调不改变它的词义,如book/buk/在读成平调、升调或降调时始终是“书”的意思,但英语的单词被用于句子时,就要赋予它一定的语调,来表达说话者的态度、语气等,这种语调的核心一般放在语句的末尾,所以语音学家把英语叫做语调语言。如:This is your↘seat.句未的降调表示肯定的语气,但 This is your ↗seat?表示疑问的口吻,以求取得对方的证实。汉语句子的语调也常常落在句未的重读字上,但由于这个重读字本身又有固定的声调,其实际语调必然受到该字本身的声调和所需语调的共同影响,即在原来字调的基础上,按所需语调去稍加调制、改变,使它既不完全失去原来的声调,又符合所需语调的要求。如:“这是我的球↘。”句中的“球”字本身是升调(阳平),而句末要求用降调,实际话语中只能采取折衷的办法,把“球”字的升调上升幅度减少一些。又如:“你的书↗,还是他的?”句中“书”字原本是高平调(阴平),而句子中间需要升调,语言实践中只能是把“书”字在原来的高平调后面接着稍微升高一些,成为高平调加升调。可见,由于汉语语调受字调的限制,升降规则比英语复杂,升降的幅度也要小。中国学生由于受汉语的这种声调、语调的负迁移影响,讲英语时往往语调平平,抑扬不太分明,升降起伏较小,很难学会英语那种梯级下降型的语调。近年来,语音学家趋向于更加强调英语语调的重要性,认为元音辅音是英语本身,而语调是英语的灵魂。假如元音辅音念得很准,而语调不对,听起来就不像英语。相反,假如元音辅音读得有些毛病,但语调正确,听起来还像英语。既然英语语调这样重要,那么我们要学好英语就必须注意汉语和英语在语调上的区别,努力在说英语时克服汉语语调的影响,勤学苦练,逐步掌握英语语调。4.其他语音方面的负迁移英语单词没有辨义的声调,重音是重要的语音要素,有区别词义的作用,如:´converse(名词,相反的事务),con´verse(动词,交谈)。在汉语词组中起辨义作用的是声调而不是重音,声调比重音在话语中具有更加重要的作用,除词尾含有虚词的词组(如桌子、木头等)和个别词组(如爸爸、妈妈等)外,大部分词组中的每个字都读成同样的轻重程度,如教师、电话、汽车、天气等。这种母语特点迁移到英语学习中,常常使初学者读多音节英语单词是重读、轻读音节不明甚至重音错位,如把´diligent读成´di´li´gent,di´ligent或dili´gent。在节奏和韵律方面,汉英之间的差别也很大。汉语是以音节(字)为计时单位的,而英语则以重音为计时单位的。汉语中,音节(字)的数目是韵律的基础,除了一些助词念得较快较含糊外,一般每个字所占用的时间大致相等,读得也清清楚楚。例如古诗中总是根据每行的字数来决定它的韵律或节奏,如柳宗元的《江雪》:千山鸟飞绝,万径人踪灭。孤舟蓑笠翁,独钓寒江雪。即使音节(字)有思想表达上所需的轻重之分,也不像英语那么明显、分明,所以,一般字较多的一句话所占用的时间,要比字较少的一句话占用的时间长,如“他有汽车。”和“他有一辆上海产的汽车。”但在英语中,重音和轻音是交替出现的,而重读音节才是节奏的基础、主体。重读音节总是声调较高,响度较大,发音清楚,所占时间较长;而轻读音节则声调较低,响度小,读得快而含糊,所占时间较短。所以,重音与重音之间总是保持大致相等的实际距离。重音之间的轻读音节越多,就读得越快越含糊。如:“Ann ´found the ´book she ´lost at ´last.”和“E´lizabeth ´found the ´article she was ´studying at the ´library.”前一个句子有8个音节,后一句却有19个音节,但两个句子同样只有5个重读音节。为了保持每两个重读音节之间所用时间大致相等,重读音节之间的轻读音节所占用的时间就不完全相同。后句话中,第一和第二个重读音节之间,第二和第三个重读音节之间分别由2个和1个轻读音节,而第三和第四个重读音节之间,第四和第五个重读音节之间各有4个轻读音节,为了保持5个重读音节之间大致相等的时间距离,第三至第五重读音节之间的轻读音节就要读得轻而快。中国学生对英语的这一特点较难把握,往往是按汉语习惯把每个音节(字)说得都很清楚,而不习惯把几个轻读音节压缩在一起,快速而含糊地读出来,因而听起来不是很自然。另外,在音节的衔接(juncture)方面,英语有汉语中所没有的连读(liaison)现象,也会给初学者带来一定的困难。在英语学习中,许多人可以发好一个单词的音,却说不出流畅、连贯的句子;能听懂英语单词,却听不懂连贯的句子。这种现象,我认为,主要原因之一就是他们没有掌握好英语中的连读。英语中有许多词是以辅音结尾的,在与紧接他们后面的一个词词首的元音连起来念,就产生了连读现象。但实际上汉语中也存在这种连读,只是我们平常没有意识到。汉语的连读一般出现在感叹句中,如:我的天哪! Wo de tiBn B好苦哇! HBo ku B然而汉语的连读范围不像英语连读现象那么普遍,而且大多数字以韵母结尾,使连读受到很大限制,所以学生在碰到英语连读时就会感到非常困难,同时也极大地限制了学生的听力发展。同化现象也是英语中最常见的一种音变现象,在连贯的说话或朗读中,音与音之间的相互影响是很自然的。其实,在汉语中也存在着类似的现象,如:面包 miBn-bBo → miBm-bBo难免 nBn-miBn → nBm-miBn这里的“面”和“难”都以/n/结尾,但因为受后面音/b/和/m/(双唇音)的影响,因此,“面”、“难”后面的/n/音就同化为双唇音/m/了。音渡指语音结构中两个音段界限之间的停顿过渡。普通话和英语两种语言中,音渡都有辨义功能,普通话好的学习者,一般能够注意英语音渡,但要完全掌握,仍然需要大量实践。四、结束语普通话和英语在发音的特征与规律、音位的数量与性质等方面都存在异同,而且差异性大于相似性,在二者相似性较强的方面,正迁移作用较为明显;二者差异表现明显的方面,负迁移作用却占了上风。既然普通话在英语语音学习中有“正迁移”和“负迁移”两方面的双重作用,因此,在英语语音教学中教师应与学生一起,尽量克服普通话对英语语音学习的干扰,促进普通话对英语语音学习的积极作用。在教学中教师帮助学生克服干扰时要突出要害,使学生深刻理解两种语言在发音方法以及语言表达方式上的异同。根据对比分析的理论观点,通过描写、选择、对比、预测对比分析的步骤,对普通话和英语进行科学的结构分析,找出两者之间的区别,以及区别程度的大小。通过这种有意识地对英汉语音系统进行对比分析,帮助学生做出有意义的概括,培养学生英汉语音系统差异的敏感性。正如吕淑湘在《中国人学英语》一文中指出:对于中国学生最有用的帮助就是让他认识英语和汉语的差别,对每一个具体问题,都尽可能用汉语的情况来跟英语作比较,让他通过这种比较得到更深刻的体会。中国学生必须认识到汉语、英语的差异,警惕汉语的干扰,尽量在英语学习中克服,避免汉语的干扰,这样才能更有效全面地学习英语。通过以上的讨论,很难说普通话好的学习者,英语语音就一定好;也不能说普通话不好的学习者英语语音就一定不好。影响英语语音学习迁移的因素很多,包括普通话和英语之间的异同因素、个体对异同因素的理解程度、知识经验的概括水平。此外,情境也参与迁移活动;学习者的主观能动性、个体特征等都是语言迁移得以产生的必要条件。普通话对英语语音的迁移作用绝非是单一的,两种语言之间的相似性也不能决定迁移的程度,它涉及多种不同的主客观影响因素,应综合考虑。孤立地研究某一因素或某一类型的迁移,不利于真正揭示迁移的本质,对英语语音学习也无实质性的助益。普通话好,只能说从语言学习的态度、方法等方面具备了发生语言迁移的可能性,但是否能克服语言负迁移的影响,真正发挥语言正迁移的作用于英语学习,还需要学习者发挥主体作用,了解一定的英语语音、音位理论知识,按照英语的语音、音位规律,掌握发音技巧,通过大量的训练,才能有较好的英语语音,说地道的英语。参考文献:1. D. .Educational Psychology:A Cognitive View〔M〕.New York:Holt,Rinehart and Winston,1968.2. 冯忠良.结构—定向教学的理论(上)[M].北京:北京师范大学出版社,1992.3. 蒋祖康.第二语言习得研究[M].北京:外语教学与研究出版社,. . Linguistic Across Culture[M].Ann Arbor: University of Michigan Press,. . Syntactic Structure[M].The Huge:Mouton,. 李庭芗.英语教学法[M].北京:高等教育出版社,. 张凤桐.英国英语语音学和音系学[M].成都:四川大学出版社,1998.8. 秦秀白.英语通论[M].武汉:华中师大出版社,1988.
什么意思???
利用谐音乱改成语一点也不好。 成语是汉语中定型的词汇,体现着传统文化的一大特色。成语中很大一部分都来源于古代传承,许多成语本身就是一个很有寓意的典故。这样的文化瑰宝,却要肆意篡改,这就是对传统文化的亵渎。 我们来看那些被胡乱改过的成语。这里我只凭记忆列举,不一一分类。有口皆杯、食全食美、一步到胃,无胃不治、咳不容缓、衣衣不舍、洗出望外、随心所浴、默默无蚊……等等,这些被篡改的面目全非的东西遍布于大街小巷,就在那些醒目的招牌上,有些就直接印在你手里的购物袋上,你使用的生活物品上。在那些轰响的宣传音响里,不停地往耳朵里钻。改了四字还嫌不过瘾,还要改八个字的,如大石化小,小石化了。真有点挖空心思无所不用其极。 这样的胡改,说白了就跟无良商家的掺杂使假别无二致,他们打出这样的招牌,搞出这样的宣传,不就是要昧着良心获取最大的利益吗? 这些人丝毫没有考虑对文化的戗害,对我们的孩子们的影响。有个孩子就在课堂上举手给老师正确的成语纠错,老师写的是“随心所欲”,那个孩子振振有词的说,老师不对,我在哪哪看见的就是“随心所浴”,这让人苦笑不得的背后,该有多少隐忧! 如今人们追求物质金钱利益的最大化无可厚非,但如果非要以牺牲传统文化为代价,那又有什么意义? 恰如其分的宣传产品,还是要用真正的文化创意去构思。多看看成功的案例,就会获得启示。比如宣传打字业务的“不打不相识”,还有医疗广告如“难言之隐,一洗了之”,这样浑然天成的借用成语,就很客观实际,也不会引起人们的反感。 弘扬中华文化任重道远,希望我们每个人都能从正确使用祖国文字开始。
近年来,随着网络的发展和语言的日益多元化,谐音字在我们的日常生活中越来越普遍。谐音字指的是音同而意不同的汉字,例如“苹果”和“平谷”,“蛋糕”和“旦考”。
谐音字历史悠久,早在古代就已经出现。在《康熙字典》中,就记载了不少谐音字。这些字大多是因为古代语言的变化和方言的差异而产生的。例如,“燕”(yàn)和“咽”(yàn),在古代是有区别的。但随着时间的推移,这两个字的发音逐渐趋同,从而产生了谐音的现象。在现代社会,谐音字的使用已经成为一种文化现象。在商业领域,许多公司和产品的名称都采用了谐音字。例如“六必居”(寓意“祸从口出”)、“必胜客”(寓意“必胜客户”)等等。这些名称不仅有助于品牌宣传,同时也能增加顾客的记忆度和口碑效应。然而,谐音字的使用也有一些负面的影响。一些人为了追求谐音而忽略了字义的准确性,导致出现语义混乱的情况。此外,一些谐音字的使用也存在着不合适的风险。例如,在法律和金融领域中,使用谐音字可能会给交流带来误解和纠纷。
总之,谐音字在我们的日常生活中发挥着重要的作用。通过对谐音字的深入研究和合理使用,我们可以更好地利用它们来丰富我们的语言文化。
谐音字研究报告围绕问题的提出,调查方法,调查结果和研究结论四方面来写。
1、问题的提出。汉字的谐音非常有趣,它在我们的生活中随处可见。于是我决定对于谐音进行一些调查。
2、调查方法。观察生活和查阅书籍,了解汉字中歇后语、对联、诗词中的谐音现象。以及上网浏览,查资料,了解现代社会中一些广为人知的汉字谐音现象。
3、调查结果。在生活中观察到,汉字谐音更多的是出现在广告和店面招牌名上。主要原因是能快速的吸引眼球,达到商家想要的宣传效果。
4、研究结论。汉字谐音给商家带来了丰厚的利润,所以我们购物的时候要知道不看广告,要看疗效。汉字谐音还经常出现在我们小学生的试卷里,让我们很是苦恼。汉字谐音还可以给我们带来无限的快乐,相信很多爱看书的人都深有体会。
谐音字的坏处
1、容易使学生写错别字。
2、不利于社会语言文字的规范。
3、对成语或词语原意的理解产生误导。
4、一味用谐音容易使得广告语创作肤浅化局限化幼稚化。
语音识别技术研究让人更加方便地享受到更多的社会信息资源和现代化服务,对任何事都能够通过语音交互的方式。 我整理了浅谈语音识别技术论文,欢迎阅读!
语音识别技术概述
作者:刘钰 马艳丽 董蓓蓓
摘要:本文简要介绍了语音识别技术理论基础及分类方式,所采用的关键技术以及所面临的困难与挑战,最后讨论了语音识别技术的 发展 前景和应用。
关键词:语音识别;特征提取;模式匹配;模型训练
Abstract:This text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to developing prospect ion and application of the speech-identification technology are discussed in the last part.
Keywords:Speech identification;Character Pick-up;Mode matching;Model training
一、语音识别技术的理论基础
语音识别技术:是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生 理学 、心理学、语言学、 计算 机 科学 以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行 自然 语言通信。
不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取。
(一) 语音识别单元的选取
选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种,由具体的研究任务决定。
单词(句)单元广泛应用于中小词汇语音识别系统,但不适合大词汇系统,原因在于模型库太庞大,训练模型任务繁重,模型匹配算法复杂,难以满足实时性要求。
音节单元多见于汉语语音识别,主要因为汉语是单音节结构的语言,而 英语 是多音节,并且汉语虽然有大约1300个音节,但若不考虑声调,约有408个无调音节,数量相对较少。因此,对于中、大词汇量汉语语音识别系统来说,以音节为识别单元基本是可行的。
音素单元以前多见于英语语音识别的研究中,但目前中、大词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成,且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母,这样虽然增加了模型数目,但提高了易混淆音节的区分能力。由于协同发音的影响,音素单元不稳定,所以如何获得稳定的音素单元,还有待研究。
(二) 特征参数提取技术
语音信号中含有丰富的信息,但如何从中提取出对语音识别有用的信息呢?特征提取就是完成这项工作,它对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。对于非特定人语音识别来讲,希望特征参数尽可能多的反映语义信息,尽量减少说话人的个人信息(对特定人语音识别来讲,则相反)。从信息论角度讲,这是信息压缩的过程。
线性预测(LP)分析技术是目前应用广泛的特征参数提取技术,许多成功的应用系统都采用基于LP技术提取的倒谱参数。但线性预测模型是纯数学模型,没有考虑人类听觉系统对语音的处理特点。
Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱,在一定程度上模拟了人耳对语音的处理特点,应用了人耳听觉感知方面的一些研究成果。实验证明,采用这种技术,语音识别系统的性能有一定提高。
也有研究者尝试把小波分析技术应用于特征提取,但目前性能难以与上述技术相比,有待进一步研究。
(三)模式匹配及模型训练技术
模型训练是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。
语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔可夫模型(HMM)和人工神经元 网络 (ANN)。
DTW是较早的一种模式匹配和模型训练技术,它应用动态规划方法成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统,目前已被HMM模型和ANN替代。
HMM模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同描述信号的统计特性,其中一个是隐蔽的(不可观测的)具有有限状态的Markor链,另一个是与Markor链的每一状态相关联的观察矢量的随机过程(可观测的)。隐蔽Markor链的特征要靠可观测到的信号特征揭示。这样,语音等时变信号某一段的特征就由对应状态观察符号的随机过程描述,而信号随时间的变化由隐蔽Markor链的转移概率描述。模型参数包括HMM拓扑结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点,HMM模型可分为离散隐马尔可夫模型(采用离散概率密度函数,简称DHMM)和连续隐马尔可夫模型(采用连续概率密度函数,简称CHMM)以及半连续隐马尔可夫模型(SCHMM,集DHMM和CHMM特点)。一般来讲,在训练数据足够的,CHMM优于DHMM和SCHMM。HMM模型的训练和识别都已研究出有效的算法,并不断被完善,以增强HMM模型的鲁棒性。
人工神经元 网络 在语音识别中的 应用是现在研究的又一 热点。ANN本质上是一个自适应非线性动力学系统,模拟了人类神经元活动的原理,具有自学、联想、对比、推理和概括能力。这些能力是HMM模型不具备的,但ANN又不个有HMM模型的动态时间归正性能。因此,现在已有人研究如何把二者的优点有机结合起来,从而提高整个模型的鲁棒性。
二、语音识别的困难与对策
目前,语音识别方面的困难主要表现在:
(一)语音识别系统的适应性差,主要体现在对环境依赖性强,即在某种环境下采集到的语音训练系统只能在这种环境下应用,否则系统性能将急剧下降;另外一个问题是对用户的错误输入不能正确响应,使用不方便。
(二)高噪声环境下语音识别进展困难,因为此时人的发音变化很大,像声音变高,语速变慢,音调及共振峰变化等等,这就是所谓Lombard效应,必须寻找新的信号分析处理方法。
(三)语言学、生 理学 、心理学方面的研究成果已有不少,但如何把这些知识量化、建模并用于语音识别,还需研究。而语言模型、语法及词法模型在中、大词汇量连续语音识别中是非常重要的。
(四)我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚;其次,把这方面的现有成果用于语音识别,还有一个艰难的过程。
(五)语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决,识别速度、拒识问题以及关键词(句)检测技术等等技术细节要解决。
三、语音识别技术的前景和应用
语音识别技术 发展 到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方 经济 发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、 旅游 、银行信息,并且取得很好的结果。
语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
参考 文献 :
[1]科大讯飞语音识别技术专栏. 语音识别产业的新发展. 企业 专栏.通讯世界,:(总l12期)
[2]任天平,门茂深.语音识别技术应用的进展.科技广场.河南科技,
[3]俞铁城.科大讯飞语音识别技术专栏.语音识别的发展现状.企业专栏.通讯世界, (总122期)
[4]陈尚勤等.近代语音识别.西安: 电子 科技大学出版社,1991
[5]王炳锡等.实用语音识别基础.Practical Fundamentals of Speech Recognition.北京:国防 工业 出版社,2005
[6](美)L.罗宾纳.语音识别基本原理.北京:清华大学出版社,1999
点击下页还有更多>>>浅谈语音识别技术论文
这篇博客的主要内容是对语音合成 (text to speech)的背景知识进行介绍。 希望可以让读者通俗易懂的了解语音合成的工作原理, 并对为了理解state-of-the-art text to speech 的算法做基础。这个简介主要基于这篇论文 “Wavenet: a generative model for raw audio”的附录介绍的。 论文链接如下: , 以及stanford CS224S的课程, 链接如下 语音合成是通过文字人工生成人类声音, 也可以说语音生成是给定一段文字去生成对应的人类读音。 这里声音是一个连续的模拟的信号。而合成过程是通过计算机, 数字信号去模拟。 这里就需要数字信号处理模拟信号信息,详细内容可参考 [1]。 图片1, 就是一个例子用来表示人类声音的信号图。 这里横轴是时间, 纵轴是声音幅度大小。声音有三个重要的指标, 振幅(amplitude) , 周期(period) 和 频率(frequency) 。 振幅指的是波的高低幅度,表示声音的强弱,周期和频率互为倒数的关系, 用来表示两个波之间的时间长度,或者每秒震动的次数。 而声音合成是根据声波的特点, 用数字的方式去生成类似人声的频率和振幅, 即音频的数字化。了解了音频的数字化,也就知道了我们要生成的目标函数。 音频的数字化主要有三个步骤。 取样(sampling) :在音频数字化的过程,采样是指一个固定的频率对音频信号进行采样, 采样的频率越高, 对应的音频数据的保真度就越好。 当然, 数据量越大,需要的内存也就越大。 如果想完全无损采样, 需要使用Nyquist sampling frequency, 就是原音频的频率2倍。 量化 (quantization) : 采样的信号都要进行量化, 把信号的幅度变成有限的离散数值。比如从0 到 1, 只有 四个量化值可以用0, , , 的话, 量化就是选择最近的量化值来表示。 编码 (coding ):编码就是把每个数值用二进制的方式表示, 比如上面的例子, 就可以用2bit 二进制表示, 00, 01, 10, 11。 这样的数值用来保存在计算机上。 采样频率和采样量化级数是数字化声音的两个主要指标,直接影响声音的效果。 对于语音合成也是同样, 生成更高的采样频率和更多多的量化级数(比如16 bit), 会产生更真实的声音。 通常有三个采样频率标准 1. 采样, 用于高品质CD 音乐 2. 采样, 用于语音通话, 中品质音乐 3 . 采样, 用于低品质声音。 而量化标准一般有8位字长(256阶)低品质量化 和16位字长(65536阶)高品质量化。 还有一个重要参数就是通道(channel), 一次只采样一个声音波形为单通道, 一次采样多个声音波形就是多通道。 所以在语音合成的时候,产生的数据量是 数据量=采样频率* 量化位数*声道数 , 单位是bit/s。 一般声道数都假设为1.。 采样率和量化位数都是语音合成里的重要指标,也就是设计好的神经网络1秒钟必须生成的数据量 。 文本分析就是把文字转成类似音标的东西。 比如下图就是一个文本分析,用来分析 “PG&E will file schedules on April 20. ” 文本分析主要有四个步骤, 文字的规范化, 语音分析, 还有韵律分析。 下面一一道来。 文本分析首先是要确认单词和句子的结束。 空格会被用来当做隔词符. 句子的结束一般用标点符号来确定, 比如问号和感叹号 (?!), 但是句号有的时候要特别处理。 因为有些单词的缩写也包含句号, 比如 str. "My place on Main Str. is around the corner". 这些特别情况一般都会采取规则(rule)的方式过滤掉。 接下来 是把非文字信息变成对应的文字, 比如句子中里有日期, 电话号码, 或者其他阿拉伯数字和符号。 这里就举个例子, 比如, I was born April 14. 就要变成, I was born April fourteen. 这个过程其实非常繁琐,现实文字中充满了 缩写,比如CS, 拼写错误, 网络用语, tmr --> tomorrow. 解决方式还是主要依靠rule based method, 建立各种各样的判断关系来转变。 语音分析就是把每个单词中的发音单词标出来, 比如Fig. 3 中的P, 就对应p和iy, 作为发音。 这个时候也很容易发现,发音的音标和对应的字母 不是一一对应的关系,反而需要音标去对齐 (allignment)。 这个对齐问题很经典, 可以用很多机器学习的方法去解决, 比如Expectation–maximization algorithm. 韵律分析就是英语里的语音语调, 汉语中的抑扬顿挫。 我们还是以英语为例, 韵律分析主要包含了: 重音 (Accent),边界 (boundaries), 音长 (duration),主频率 (F0). 重音(Accent) 就是指哪个音节发生重一点。 对于一个句子或者一个单词都有重音。 单词的重音一般都会标出来,英语语法里面有学过, 比如banana 这个单词, 第二个音节就是重音。 而对于句子而言,一样有的单词会重音,有的单词会发轻音。 一般有新内容的名词, 动词, 或者形容词会做重音处理。 比如下面的英语句子, surprise 就会被重音了, 而句子的重音点也会落到单词的重音上, 第二个音节rised, 就被重音啦。 英语的重音规则是一套英语语法,读者可以自行百度搜索。 I’m a little sur prised to hear it cha racterized as up beat . 边界 (Boundaries) 就是用来判断声调的边界的。 一般都是一个短语结束后,有个语调的边界。 比如下面的句子, For language, 就有一个边界, 而I 后面也是一个边界. For language, I , the author of the blog, like Chinese. 音长(Duration) 就是每个音节的发声长度。 这个通俗易懂。 NLP 里可以假定每个音节单词长度相同都是 100ms, 或者根据英语语法, 动词, 形容词之类的去确定。 也可以通过大量的数据集去寻找规律。 主频率 (F0 )就是声音的主频率。 应该说做傅里叶转换后, 值 (magnitude) 最大的那个。 也是人耳听到声音认定的频率。一个成年人的声音主频率在 100-300Hz 之间。 这个值可以用 线性回归来预测, 机器学习的方法预测也可以。一般会认为,人的声音频率是连续变化的,而且一个短语说完频率是下降趋势。 文本分析就介绍完了,这个方向比较偏语言学, 传统上是语言学家的研究方向,但是随着人工智能的兴起,这些feature 已经不用人为设计了,可以用端到端学习的方法来解决。 比如谷歌的文章 TACOTRON: TOWARDS END-TO-END SPEECH SYNTHESIS 就解救了我们。 这个部分就比较像我们算法工程师的工作内容了。 在未来的博客里, 会详细介绍如何用Wavenet 和WaveRNN 来实现这一步骤的。 今天这个博客就是简介一下算法。 这里说所谓的waveform synthesis 就是用这些 语言特征值(text features)去生成对应的声波,也就是生成前文所说的采样频率 和 振幅大小(对应的数字信号)。 这里面主要有两个算法。 串接合成(concatenative speech synthesis) : 这个方法呢, 就是把记录下来的音节拼在一起来组成一句话,在通过调整语音语调让它听起来自然些。 比较有名的有双音节拼接(Diphone Synthesis) 和单音节拼接(Unit Selection Synthesis)。这个方法比较繁琐, 需要对音节进行对齐(alignment), 调整音节的长短之类的。 参数合成 (Parametric Synthesis) : 这个方法呢, 需要的内存比较小,是通过统计的方法来生成对应的声音。 模型一般有隐马尔科夫模型 (HMM),还有最近提出的神经网络算法Wavenet, WaveRNN. 对于隐马尔科夫模型的算法, 一般都会生成梅尔频率倒谱系数 (MFCC),这个是声音的特征值。 感兴趣的可以参考这篇博客 去了解 MFCC。 对于神经网络的算法来说, 一般都是生成256 个 quantized values 基于softmax 的分类器, 对应 声音的 256 个量化值。 WaveRNN 和wavenet 就是用这种方法生成的。 下面是我学习语音合成的一些资料, 其中stanford cs224s 是强力推荐的,但是这个讲义讲的逻辑不是很清楚, 要反复看才会懂。 UCSB Digital Speech Processing Course 课程, 声音信号处理的基础。 建议读一遍, 链接如下, Stanford CS224S WaveRNN, 音频的数字化,
语音合成技术给我们带来了很多惊喜,你知道自己每天都在与它们打交道吗?而开车时的导航就是语音合成的一种。虽然目前的"它们"只会相对机械的朗读文章,但可以肯定的是,语音合成技术已经走出实验室,开始商用,其潜在的巨大市场已露出曙光。
我们的身边总是人声鼎沸。
婴儿牙牙学语,男女互诉爱意。在肺部、气管和声带的共同作用下,声音出现,喉内肌肉协调作用下,我们说出能够代表自己想法的字符,再赋予其愤怒或喜悦或悲伤的 情感 ,人类的语音就此形成。
18世纪末,一个因土耳其行棋傀儡的将在多年后臭名昭著的发明家沃尔夫冈·冯·肯佩伦,花费了人生最后20年的时间,试图模拟人类的语音。他做了一个布满孔洞的空箱,空箱连接着一个奇异形状的鼓风机,鼓风机被压动后将使得内置的簧片振动,这一过程模拟了人类的发声,也确实发出了声音,而这也成就了人类最早的语音合成机械之一。
让机器更像人类,是无数科学家的梦想。这样的梦想被多方位的推进,从机器的外形上、内核的思考运算上,以及对外表达的说话上。
如今,电子设备取代了空盒子,算法则比簧片更能够协调发声。在技术发展下,声音的波动被计算机捕捉、计算、指引,最终发出声音。这一项带着前人梦想的技术,不再单单出现在电影和小说里,也承载起了巨大的市场走进千家万户,这就是语音合成。
从Siri开始的热潮,语音合成潜力无限
同时,Siri的热潮也拉开了语音合成技术运用的大门。
2014年微软推出了"小娜"与"小冰",这是将Siri所拥有的语音识别技术及语音合成技术分开来,小娜负责理解复杂的口语指令并进行执行,而小冰主要能够和人类友好地聊天。
随后,这样的运用逐步增多:2014 年底,亚马逊发布了 Echo 智能音箱,语音助理 Alexa也随之亮相;一年半后,Google 也发布了第一代智能音箱 Google Home 和语音助手 Google Assistant。
国内的巨头也不遑多让,京东叮咚智能音箱、天猫精灵智能音箱、小爱系列智能音箱、小度智能音箱,也纷纷进入了国人的家居生活。
Siri的热潮同步开启的,不仅仅是语音合成技术在硬件上的应用,也包括一系列更具想象力的交互场景,带来了巨大的商机。
2015年春节,本就搭载了语音导航的高德地图与郭德纲合作,推出了高德地图欢笑版。用户打开高德地图,不仅能够听到导航播报,还能听到郭德纲的极具特色的段子。这一次尝试,让高德地图一度跃至苹果App Store榜单第2名。
在今年新冠肺炎疫情期间,"宅经济"大行其道,"听书"市场也快速爆发,有声阅读成为新的阅读潮流。
除此以外,短视频中的AI配音,让视频内容者省去大量配音时间;对已故知名艺人的声音采集,实现过去与现在的交互,圆了一代粉丝的梦想……
我们可以看到,语音合成技术的未来拥有巨大的想象空间,根据赛迪智库数据,预计到2021年智能语音市场规模将达195亿元。在这其中,智能语音就由语音识别技术(ASR)和语音合成技术(TTS)共同组成。
而这两项技术也正在被头部企业迅速推进,市场之下,语音合成已经不仅仅代表人类过去的梦想,更是代表着更"大一统"的 科技 格局,毕竟,这一技术改变着人类与机器的交互方式,也将改变未来人类的机器使用习惯,代表着全新的机会与入口。
从过去到现在,语音合成技术一览
1773年,俄国科学家、在哥本哈根生活的生理学教授克里斯蒂安·克拉特齐斯坦(Christian Kratzenstein)制造了一个特别的设备,通过共鸣管和风琴管的连接,几乎可以完美的发出 a、e、i、o、u 这五个元音。
十多年后,前文提到的沃尔夫冈·冯·肯佩伦也制造了一台类似的机械声学语音机器。随后,多位发明家基于这一机器进行改进,都是试图通过物理机模拟人说话发音。
这样的尝试已经令人难以想象,不过,即使这样的物理机发展得登峰造极,也无法模拟出我们说出的每一个音节、无法拥有人说话的音质,也无法停顿、无法带有情绪。
因此,另一种方式出现——拼接系统,让说话人录制语音存入系统,在合成语音时选择对应的片段进行拼接、合成。这样的拼接系统能够相比物理机极大地接近人声,虽然拼接处的瑕疵难以消除,但是随着如今大数据时代的来临,大语料库的出现,让拼接出的语音逐步真人化,直至如今依然有商业系统在使用。
基于参数的合成技术的诞生背景则是基于神经网络架构的深度学习方法的飞速进展。当时,对语音的识别不再是识别一个简单的词和短词组,而是基于统计的方法,运用声学模型帮助计算机认知每个音素单元的声学特征、运用语言模型帮助计算机实现对人类用词习惯的认知,最终给到用户最高可能性的连接。在这其中,典型的模型是隐含马尔可夫模型(HMM),用来描述如何在可变长的时序特征序列上打词标签。
2017年3月,行业的引领者Google 提出了一种新的端到端的语音合成系统:Tacotron。端到端语音合成是在参数合成技术上演进而来的,把两段式预测统一成了一个模型预测,即拼音流到语音特征流的直接转换,省去了主观的中间特征标注,克服了误差积累,也大幅度提高了语音合成的质量。
然而,为了实现真正像人一样的发音,语音合成系统必须学会语调、重音、节奏等表达因素,这一问题,Tacotron也并未解决。
谷歌曾共享了两篇新论文试图解决这一问题,第一篇论文《Towards End-to-End Prosody Transfer for Expressive Speech Synthesis with Tacotron》介绍了"韵律学嵌入"(prosody embedding)的概念。论文中为 Tacotron 增加了一个韵律学编码器,该嵌入捕捉包括停顿、语调、语速等在内的音频特征可根据一个完全不同的说话者的声音生产语音。
第二篇论文《Style Tokens: Unsupervised Style Modeling, Control and Transfer in End-to-End Speech Synthesis》则在上一篇论文的架构上进一步展开,并且创新性地提出了一种建模潜在语音"因素"的无监督新方法。这一模型之下,学习的不再是时间对齐的精确的韵律学元素,而是较高层的说话风格模式,并且可以迁移于任意不同的短语之中。
如果论文提到的模型实现,那么我们便可以迫使 Tacotron 使用特定的说话风格,不需要参考语音片段,并能创造出语音长度多样化的不同语句,并带有情绪。
在不远的将来,或许我们就将听到,来自机器的人类声音。
国内:积极商用,进展瞩目
在语音合成的重要研究中,因为国内起步较晚,所以我们很少看到突破性的技术发展。但是,即便停留在艰难的 探索 初期,巨头们之于语音合成仍旧趋之若鹜。
我们也惊喜地看到,不少企业在近期通过语音合成的商用落地,展现出了自己的技术实力。
① 京东数科:AI主播"小妮"上岗
京东数科基于京东多年在人工智能、大数据、云计算等领域的技术沉淀,在2018年就开始组建机器人的团队,研究覆盖生命科学、传感器材料乃至运动力学与人机交互。
在全面的机器人开发体系下,今年5月,京东数科推出了令人瞩目的AI主播"小妮",这是京东数科自主研发的AI虚拟数字人产品首次亮相。
小妮的真实是全方位的,在听感、表情、头部动作乃至口型上,小妮都极像真人。从文字到语音,小妮通过自研的轻量级对抗语音合成技术进行转化;而小妮特色鲜明的声音及极具真实性的呼吸和停顿,则是来源于在多人数据上结合深度神经网络进行个性化建模……
更为重要的是,小妮的出现打通了语音、图像、视频,在语音生成视频的阶段,她的形象同样真实。因为京东数科AI实验室利用对抗生成网络来还原更真实的表情,通过3D模型运动追踪技术来确保AI主播在说话时口型准确、表情细腻、头部运动自然。
而除了主播领域以外,AI虚拟数字人还可以用智能客服及招聘领域。在未来,我们可以预见到,AI虚拟数字人在其他高重复性场景的更多运用可能性。而伴随着京东数科全面的机器人体系研发技术的进展,或许也将出现超乎我们想象的AI运用。
② 科大讯飞:为多家企业提供底层技术支持
早在之前,科大讯飞就推出了讯飞录音笔、智能鼠标、阿尔法蛋等涉及语音交互的产品。今年,来自科大讯飞地一款彩色墨水屏阅读器正式面世,一方面,阅读器可以进行常见的新闻播报、语音读书,满足用户的基础要求;另一方面,阅读器结内置了神秘AI主播,可以对话用户、助力用户解决问题。同时,科大讯飞也为多家企业提供底层技术支撑,覆盖智能手机、智能 汽车 等多个领域。
③ 腾讯云:语音累计音色种类达24种
而对于拥有国内最大流量池——微信、QQ的腾讯而言,这家企业则选择为内容创业者提供服务。
今年9月,腾讯云语音合成团队正式开放面向全量用户的合成音频平台,该平台能够帮助用户在零门槛的情况下实现语音合成技术的运用,用户只需要直语音合成控制台上生成和下载文本对应的音频文件即可。该功能的侧重点是帮助内容创作者在公众号、短视频、小视频等内容上更简单、快捷地插入对应所需的音频文件。同时,腾讯云还发布了全新地11种音色,其中甚至包括粤语这样的方言在内,目前累计音色种类达24种。
④ 百度:百度大脑开放全栈语音引擎能力
作为将AI作为战略进行投入的百度,在语音合成上的推进也不容小觑。
去年,已经开放三年的百度发布了语音引擎。这是一套非常全面的系统,覆盖内容非常广泛,包括硬件模组、开发板以及语音交互场景解决方案等。在这其中,百度也专门围绕语音合成的成功进行了发布,推出了6个在线语音合成精品音库和5个离线语音合成精品音库。
未来语音合成将更接近人类的语言
立足现在,我们不禁畅想,未来的语音合成将是什么样,又将出现在哪些地方?
在技术上,毫无疑问,未来的语音合成将更接近人类的语言。一个理想的语音合成系统由三部分组成:文本分析、韵律生成和合成语音,而在这三方面,行业的发展都还有待提高。
在这其中,韵律生成是行业面临的共同问题,如何可以让语音合成更像人类?更具表达力?作为声学模型,还有大量个性化、 情感 化的变化因素需要学习。而值得一提的是,语音合成技术的复杂度也需要降低,从而实现更广度地运用。我们也相信,随着大量语料的有效使用,这一切问题也都将解决,未来,语音合成必将更加"传神"。
而随之而来的,我们的生活也将被改变。
一方面,在 科技 带来革新的同时,传统也将受到冲击。在上文中,小妮被运用与客服以及招聘的部分环节,那么很明显,在不远的未来,具有重复性的语音性质的工作将受到巨大影响。
而另一方面,更为智能的未来也将到来,在将来,人与机器的交互方式或许将被彻底改变,到那时,全新的商业机会也将藏于其中。
为了迎接这一时代,巨头趋之若鹜,而普通人也同样该砥砺前行。
#智能语音##语音合成#
我不懂你什么意思...说明白点
浅谈汉语典故成语的翻译 代写论文 摘要:本文分析了典故成语的特点和它隐合的比喻意义。同时阐述了它与文化和翻译之间的关系。由于目的语中存在文化空缺现象,为了使翻译的交际目的成功实现,从跨文化角度翻译典故成语时,归化优于异化。关键词:典故成语 文化翻译文化空缺 归化 异化 引言习语足某一语言在使用过程中形成的独特的固定的表达方式,它包含成语、谚语、歇后语、典故等。英汉两种语言历史悠久,都包含着大量的习语。至今为止,国内外的外语类学刊发表了不少有关英汉习语(idoms)的文章,但就汉语典故成语(idiom with allusion)的英译来说,还没有学者单独地谈论过它的翻译方法。本文将从跨文化的角度来探讨翻译汉语中的典故成语, 归化和异化孰优孰劣的问题。一、典故成语1.定义和特点典故成语是习语中比较特殊的语言群体, 是固定的四字结构,它不仅言简意赅,而且形象生动、趣味横生、意义深远,如“东施效颦” “名落孙山” “叶公好龙” “邯郸学步”等等,翻译过程中译者往往习惯性地把英语习语(idom)和汉语成语联系起来。成语承载着中华民族特有的文化,它与中图文化传统紧密相连, 它是“熟语” 的一种,是习用的固定词组,在汉语中多数由四个字组成。2.隐含的比喻意义典故成语的定义使我们知道,在使用中我们通常注重的足它的比喻意义,而不是从字面上看出的意思。例如:水落石出(苏轼 后赤壁赋》)字面含义是水落F去,水底的 头就露出来了。在具体使用时比喻事情的真相完全显露出来。“于是焉, 河伯始旋其面目,望洋向若而叹。”( 庄子》)现在, “望洋兴叹”比喻做事力量不够或缺乏条件而感到无可奈何。出自《史记·项羽本纪》中的“四面楚歌”现在比喻孤立无援, 四面受敌的处境。要想确切地弄清楚典故成语的这种比喻义,译者必须具备深厚的文化知识,了解中国悠久的历史文化。二、文化和翻译1.定义英罔人类文化学家爱德华·泰勒在《原始文化》(1 871)一书中首次把“文化”作为一个概念提了出来,并表述为: “文化是一种复杂的集合体,它包括知识、信仰、艺术、道德、法律、风格以及其在社会上习得的能力与习惯。” 可见文化的覆盖面很广,它是一个复杂的系统,语言作为文化的组成部分,反映一个民族丰富多彩的文化现象。虽然中国文化和英国文化有很大不同,在典故成语英译时有很大困难,但不是说中两方人无法互相沟通,翻译架起了跨文化交际的桥梁。美国著名的翻译理论家,尤金·奈达(Eugene ANida),对翻译作了如下定义: “Translation consists inreproducing in the receptor language the closest naturalequivalent of the source language,first in"terms of mean ingand secondly in term s of style.”(Eugene A Nida,Charles RTaber:“The Theory and Practice of Translation”,1969)翻译过程不仅涉及两种语言, 而且涉及到两种文化, 它是通过语言机制的转换连接或沟通目的语文化(Target Culture)和源本语文化(Source Culture)的桥梁, 足具有不同语言文化背景的人们互相交际的媒介。他 时强调“翻译中,意义是最重要的, 形式次之,对应的形式会丢失源文本(the source text)的文化意义,这是源文本的交际特点, 这样会阻碍跨文化交流”(Nida,The Sociolinguistics of InterlingualCommunication,1996)。翻译是一种交际活动,为了使人们互相沟通,源文本的意义应该被清楚地传达,翻译主要是释义,从这个意义上说,翻译典故成语时,归化应是最主要的策略。2.异化、归化所谓异化、归化是就翻译中所涉及的文化转化而言,前者以源文化为归宿(source language cultureoriented,i.e.culture oriented),后者以目的语文化为归宿(target language culture oriented,i.e.culture oriented)。即“异化”提倡泽文 。1尽量去适 、照顾源语的文化及原作者的遣训用字习惯,而“归化”则恰恰相反,主张译文应尽量适应、照顾日的语的文化习惯,为读者着想,替读者扫除语言文化障碍。3.文化空缺“语言词汇足最 的承载文化信息、反映人类社会生活的工具”。英汉训’『L的文化内涵极为丰富,但许多方血存在着不对 现缘。从语言学和跨文化交际学的角度来说,它的产生是 为每一种语吉都仃它自身所特有的语言体系和建构,每一个民族都有它[_I己的生活习惯、思维方式、语 心理、行为规范、价值观念和文化传统, 两种语言之问的语义和文化的对等是极为少见的。一种语 中的训 另一种语言中也许没有对应或契合的浏,所以 英洋典故成语时必须改变它的结构形式。4.举例下面通过几个例子来具体分析典故成语英泽时,归化和异化这两种翻洋方法孰优孰劣。(1)东施效颦(((红楼梦 第3 4章)译文.“Tung Shih imitating Hsi Shih”(Yang)洋文 Zhungzi’S story of the beatutiful Xi—Shi’S uglyneighbour,whose endeavours to imitate the hideous thatpeople ran from her in terror.(David Hawkes)译文.山EJ《红楼梦》,在处理含有文化特色的 故成语时,杨宪益先生采用了异化的洋法,把“东施”译成了“Tung Shih”,一个两方文化中 缺的人物形象,因此这样的泽文对J:曲方读者来说足毫无意义的。 霍克斯采用地道的英语表达法, 外 读者看来町是妙不可苦。(2)愚公移山(《A Dictionary of Chinese Idioms inEnglish)),Northern Art Printing Company)泽文.“The Foolish Old Man who removed themountains.”(异化)译文 “the determination to win victory and the couragrto surmount every dificulty”(归化)(3)请君入瓮(《A Dictionary of Chinese Idioms inEnglish)),Northern Art Printing Company)译文l"Will you kindly step into the jar?”(异化)译文2“Make a person suffer from his own scheme.”(归化)在例(2)中, 洋文采用l芹化的译法把“愚公” 洋成了“The Foolish Old Man”这样一个贬义的短语,严重误解了成语本身的内涵。例(3)的徉文同样用异化译法无法传达出成语本身所表达的J下确意思。而 例中的译文 都用归化译法翻洋山“愚公移山”和“请君入瓮”这两个成语的比喻意义。使口的语读 理解了原语意义,实现了翻泽的口的。三、结束语翻译的本质目的是沟通,足让译语读者理解懂得原文的意思。这就好比把一个人说的话翻译成哑语,再怎么“说”都没有用, 只有把蜕的话转换或日“归化”成用手势表示的哑语,才能让聋哑人明白。因此,翻译的本质目的决定了翻译典故成语时,归化是更好的方法。但同时, 归化法也并不排斥异化法, 而是两者互为补充。总之,在翻译时, 采取归化占主导,异化从属的方法,使两者相得益彰。参考文献:[1]包惠南.文化语境与语言翻译[M].北京:中国对外翻译出版公司,2O01.[2]陈定安.英汉比较与翻译[M].北京: 中国对外翻译出版公司,1998.[3]刘玉杰,钱莲生.汉语成语英译词典[M].北京:北方文艺出版社,1 999.[4] 其昌.汉英翻译技巧[M].北京:外语教学与研究出版社,1990.[5]工襦祥.文化与语言‘[M]北京:外语教学与研究出版社,2OO0.[6]许建平[M].“跨文化翻译中的异化与归化问题”[J].中 翻译,2002, (5).[7] 治奄.人学汉英翻洋教程[M].济南: 山东大学出版社,1999.[8]许 钧. 代美 翻译理论研究[M].武汉:湖北教育出版社,2001.[9]夏征农.辞海[z].北京:中 大百科全书出版社,1999.[10]郭建中.文化与翻译[C].北京:中国对外翻译出版公司,2000.[H]曹雪芹,高鄂.红楼梦[M].北京:人民文学出版社,1982.[12]Baker,Mona,In Other Words:Translat/onCourse[M].Beijing-Foreign Language Teachi—ng and Research Press, 2000.[13]Hawkes,David,The StOng of the Stone[Z].Penguin Books, 1980.[14]Yang,Xianyi&Gladys,A Dream of Mansions[Z].Bei Jing:Foreign Language Press,1994.[I5]Nida Eugene A.&Taber CharlesR,The Theory817d Prac tice of Translation[M].Leiden:E.J.BriII,I969.[16]Nida EugeneA.。Language, , ture and Translating[M].Shanghai:Shanghai Foreign Language Edu—cation Press。1993.
迷路了,回不了家……………(来路不明) 走迷宫…………………………(拐弯抹角) 烤红薯…………………………(转辗反侧) 地狱失窃………………………(疑神疑鬼) 拔河……………………………(东拉西扯) 对理发师的手艺不满意………(岂有此理) 世界上最少的军队……………(单枪匹马) 最贵重的打扮…………………(披星戴月) 站在北极说话…………………(冷言冷语) 看“泰坦尼克”慢慢沉没…………(坐视不救) 跌达医生替人治病……………(扭扭捏捏) 节省介绍费的最佳方法………(毛遂自荐) 剁肉馅太用力了………………(入木三分) 卖桃子的和卖李子的打架……(投桃报李) 补牙……………………………(张口结舌) 检了一跟栓着驴的绳子………(因小见大) 收破烂的吆喝…………………(废话连篇) 打假……………………………(去伪存真) 强地震…………………………(大摇大摆) 古代主要的交通事故…………(人仰马翻) 呼口号…………………………(异口同声) 独身……………………………(自成一家) 一起坐车到终点站……………(同归于尽) 互送秋波………………………(以眼还眼) 拉二胡…………………………(左右开弓) 一出门就碰见岳父大人………(开门见山) 兔子不吃窝边草………………(舍近求远) 漂亮的女人都在正前方………(目不斜视) 小朋友,您今年多大了………(不耻下问) 先坐飞机,再搭地铁……………(上天入地) 上超市购物……………………(各取所需) 笑掉了下巴……………………(乐极生悲) 阎王回家………………………(视死如归) 凉鞋……………………………(空前绝后) 园艺师的工作…………………(拈花惹草) 输液……………………………(细水长流) 啃鸡爪子………………………(张牙舞爪) 长颈鹿觅食……………………(引颈翘首) 环境污染………………………(沉鱼落雁) 上帝的玩具……………………(星罗棋布) 越狱……………………………(不辞而别) 刚学会走路就跳霹雳舞………(手忙脚乱) 最适合的音响广告……………(不同凡响) 猎物出现太多…………………(左右开弓) 刺猬……………………………(芒刺在背) 七除以二………………………(不三不四) 刚出生就死了…………………(出生入死) 世界上最大的工程……………(开天辟地) 数学教师………………………(说三道四) 十五个人吃饭…………………(七嘴八舌) 悲剧电影散场…………………(不欢而散) 现场看乒乓球比赛……………(左顾右盼) 相见时只恨不是晚上…………(相见恨晚) 墓碑……………………………(名存实亡) 红烧猪头………………………(焦头烂额) 送戏下乡………………………(载歌载舞) 炒菜时必不可少的工序………(添油加醋) 用霓虹灯装饰的广告语………(闪烁其辞) 先把鸡杀了,再请示妻子是红烧还是清蒸…(先斩后奏) 为了节约两张电影票却失去了一个女朋友………(得不偿失) 得知儿子在学校又犯了错误的一刹那………………………………(揭竿而起) 听烦了笛声后牛对牧童提出的要求…………(对牛弹琴) 在发现别人是在吹牛之前的表情……(肃然起敬) 听说中午吃鸡,高兴得手舞足蹈…………(闻鸡起舞) 儿子怕老子,老子怕老婆,老婆怕儿子(一物降一物) 因为没有房子所以不谈对象…………(无所不谈) 将答案抄在肚皮上准备在科举考试中作弊………(满腹经纶) 在旧社会代表着贫穷的一种体形……(骨瘦如柴) 在母亲看自己的满分试卷时赶紧提出买“耐克”的要求………………………(趁热打铁) 担心天上掉下块金子把自己砸死……(杞人忧天) 本想抛砖引玉,没想到抛出去的砖却砸碎了玉………………………………(事与愿违) 陪老婆逛街的男人看到美女时…(侧目而视) 叁.一、请判断下列句子中加线的成语使用是否正确.对的请打 ,错的请打×. ( )1、这篇论文观点新颖,论据有力,材料丰富,文字精当,堪称不刊之论. ( )2、那是一张两人的合影,左边是一位英俊的解放军战士,右边是一位文弱的莘莘学子. ( )3、《还珠格格》播出时,几乎万人空巷,人们在家里守着荧屏,街上显得静悄悄地. ( )4、在我告别时,他非要送我几套高档衣服不可,真是大方之家. ( )5、为了富国强兵,王安石舍家忘身,殚精竭虑地推行新法;宋神宗不动声色,宵衣旰食地谋划改革. ( )6、自去年中国社会科学辑刊提出建立社会科学规范化以来,“规范化”成为学者之间的一个炙手可热的论题. ( )7、语文考试能得高分的学生大都思维敏捷,博闻强志,并且综合能力较强. ( )8、刚一起跑,高三(1)班的夏曦就滑倒了,他爬起来奋力追赶,离终点20米时终于成为后起之秀,夺得3000米跑的第一点. ( )9、斯诺的其它著作都不可和《西行漫记》相提并论.即使是杰出的报告文学,在事过境迁之后,往往成为明日黄花. ( )10、这位老教师总结出的经验,在教学实践中,屡试屡爽,大家都很佩服. ( )11、王宝森之流贪污腐化,挥霍浪费国家财产,他的人格可说是不名一文. ( )12、我们都司空见惯了那种“违者罚款”的告示牌. ( )13、期中考试,刘军同学数学获得满分,真可谓是登堂入室了. ( )14、如果把中国人民的严正声明和强烈抗议置之度外,一意孤行,他们必将自食其果. ( )15、你游桂林的山水,见到那些构造奇妙的山洞,一定会说是鬼斧神工,天造地设. ( )16、他是个计算机专家,又会两种外国语,我们这些初学计算机的人要虚心向他求教,不耻下问. ( )17、只要你设身处地,到抗洪抢险的第一线去,你就不能不为我们子弟兵那种舍己为人的精神所感动. ( )18、有些人对经济建设上的浪费损失已经习以为常,养成了一种麻木不仁的恶习. ( )19、他是我最真诚的朋友,经常对我耳提面命,使我能在工作中少犯许多错误. ( )20、由于乡亲父老的艰苦奋斗,只不过几年,我的家乡就改头换面,山青水绿,牛肥粮多了. 二、改正下列成语中的错别字. 21、直接了当( ) 22、换然一新( ) 23、道貌暗然( ) 24、既往不究( ) 25、别出心裁( ) 26、礼上往来( ) 27、陨身不恤( ) 28、震聋发聩( ) 29、铤而走险( ) 30、趋之若骛( ) 31、按步就车( ) 32、色厉内茬( ) 33、如火如茶( ) 34、因地治宜( ) 35、推心至腹( ) 36、纷至踏来( ) 37、原形必露( ) 38、谈笑风声( ) 39、委屈求全( ) 40、金壁辉煌( ) 三、 请根据解释写出相关的成语. ( )41、多用来形容做事熟练,轻而易举. ( )42、形容心胸极其狭窄. ( )43、比喻舆论的力量极大,众口一词可以混淆是非. ( )44、比喻局势将有重大变化前夕的迹象和气氛. ( )45、听到别人批评自己的缺点或错误表示欢迎和高兴. ( )46、学习工作等按照一定的步骤逐渐深入或提高. ( )47、比喻遭受一次挫折之后就再也振作不起来. ( )48、指装模作样,活像有那么一回事似的. ( )49、比喻最先做某种坏事或首开某种恶劣风气之先的人. ( )50、比喻做事缺少必要条件,很难做成. ( )51、比喻空欢喜一场. ( )52、比喻人力或物力前后接不上. ( )53、形容群众性的活动声势浩大或场面热烈. ( )54、指隐藏起来或不公开露热烈. ( )55、形容十分谦虚. ( )56、形容精神旺盛,容光焕发. ( )57、比喻失败以后重新恢复势力. ( )58、宇宙间的一切景象都更换了新貌,呈现一派生气. ( )59、汇聚成盛大壮丽的景象. ( )60、为众人所指责,形容触犯众怒. ( )61、读书总有好处. ( )62、指祸乱从内部发生. ( )63、形容国家或集团四分五裂. ( )64、比喻学习上笼统接受不加分析,不求充分理解. ( )65、比喻好的诗文受到人们的称赞和传诵. ( )66、文章一气写成,无须修改,形容文思敏捷,写作技巧纯熟. ( )67、形容工作刚开始就取得成功. ( )68、比喻真心诚意,一再邀请. ( )69、坚持作恶,不肯悔改. ( )70、没有能比得上的(多含褒义). ( )71、敛藏才智,不使外露. ( )72、事物的变化难以捉摸. ( )73、指架柴车穿破衣服去开辟土地,后形容创业艰苦. ( )74、理直气壮、从容不迫地谈. ( )75、为应付某种需要而暂时采取的变通办法. ( )76、按情理或情节来看,尚有可原谅之处. ( )77、不经慎重考虑,轻率地采取狂妄的行动. ( )78、从来没有人做到的,空前的. ( )79、形容遇到变故或在严重、紧急的情况下,沉着镇定,毫不慌乱. ( )80、沉迷于所喜爱的事物,而使意志消磨掉. 81、恣行无忌( )82、纵横捭阖( )83、自惭形秽( )84、孜孜不倦( ) 85、栉风沐雨( )86、怨天尤人( )87、引而不发( )88、颐指气使( ) 89、一曝十寒( )90、洋洋洒洒( )91、偃旗息鼓( )92、邂逅相遇( ) 93、越俎代庖( )94、无稽之谈( )95、未雨绸缪( )96、耳濡目染( ) 97、飞扬跋扈( )98、万马齐喑( )99、惟妙惟肖( )100、贻笑大方( )一、1.√ 2.× 3.× 4.× 5.√ 6.× 7.√ 8.× 9.√ 10.× 11.× 12.× 13.× 14.√ 15.× 16.× 17.√× 18. √19.× 20.× 二、21.接-截 22.换-焕 23.暗-岸 24.究-咎 26.上-尚 27.陨-殒 28.震-振 30骛-鹜 31.步-部 32茬-荏 33.茶-荼 34.治-制35.至-置 36.踏-沓 37.必-毕 38.声-生 39.屈-曲 40.壁-碧 三、41.游刃有余 42.睚眦必报 43.众口铄金 积毁销骨 44.山雨欲来风满楼 45.闻过则喜 46.循序渐进 47.一蹶不振 48.煞有介事 49.始作俑者 50.巧妇难为无米之炊 51.南柯一梦/竹篮打水 52.青黄不接 53.万马奔腾 54.销声匿迹 55.虚怀若谷 56.神采奕奕 57.卷土重来/东山再起 58.万象更新 59.蔚为壮观 60.千夫所指 61.开卷有益 62.祸起萧墙 63.分崩离析 64.不求甚解/囫囵吞枣 65.脍炙人口 66.文不加点 67.马到成功/旗开得胜 68.三顾茅庐 69.怙恶不悛 70.无与伦比 71.韬光养晦 72.变幻莫测 73.筚路蓝缕 74.侃侃而谈 75.权宜之计 76.情有可原 77.轻举妄动 78.前无古人 79.泰然自若/临危不乱 80.玩物丧志 四、81.放纵 82.开合 83.形态丑陋 84.勤勉的样子 85.梳头 86.怨恨 87.拉开弓 88.面颊 89.晒 90.文辞众多的样子 91.放倒 92.没有预约而相遇 93.厨师 94.考查 95修缮 96.沾湿 97.蛮横 98.哑 99.相似 100.被人笑话
退避三舍 春秋时候,晋献公听信谗言,杀了太子申生,又派人捉拿申生的弟弟重耳。重耳闻讯,逃出了晋国,在外流忘十几年。 经过千幸万苦,重耳来到楚国。楚成王认为重耳日后必有大作为,就以国群之礼相迎,待他如上宾。 一天,楚王设宴招待重耳,两人饮洒叙话,气氛十分融洽。忽然楚王问重耳:“你若有一天回晋国当上国君,该怎么报答我呢?”重耳略一思索说:“美女待从、珍宝丝绸,大王您有的是,珍禽羽毛,象牙兽皮,更是楚地的盛产,晋国哪有什么珍奇物品献给大王呢?”楚王说:“公子过谦了。话虽然这么说,可总该对我有所表示吧?”重耳笑笑回答道:“要是托您的福。果真能回国当政的话,我愿与贵国友好。假如有一天,晋楚国之间发生战争,我一定命令军队先退避三舍(一舍等于三十里),如果还不能得到您的原谅,我再与您交战。” 四年后,重耳真的回到晋国当了国君,就是历史上有名的晋文公。晋国在他的治理下日益强大。 公元前633年,楚国和晋国的军队在作战时相遇。晋文公为了实现他许下的诺言,下令军队后退九十里,驻扎在城濮。楚军见晋军后退,以为对方害怕了,马上追击。晋军利用楚军骄傲轻敌的弱点,集中兵力,大破楚军,取得了城濮之战的胜利。 问鼎中原 传说古代夏禹铸造九鼎,代表九州,作为国家权力的象征。夏、商、周三代以九鼎为传国重器,为得天下者所据有。 成语典故:洛阳是东周的都城。楚庄王亲自领兵打败在陆浑一带的戎族以后,又到周定王的边境阅兵,显示楚国势力的强大,想以此威胁周天子,与他分治天下,吓得周定王立即派大臣王孙满去慰劳他。 庄王一见王孙满就问:“我听说大禹铸有九鼎,从夏传到商,又从商传到周,成为世界上的宝贝,现在放在洛阳。这鼎有多大?有多重?” 这一劈头盖脑的问话,把王孙满吓呆了。因为九鼎是大禹治水时,用九州进贡的铁铸成的,它是九州的象征,也是国家政权的象征,夏、商、周三个朝代,都把它作为世代相传的国宝,它标志着天子的尊严,象征着王位的神圣,从来都是奉若神明,不容许任何人过问的。 王孙满呆了一会,赶忙哈起腰,皮笑肉不笑地说:“大王,这九鼎嘛……小人不敢应答啊!” 庄王用轻蔑的口气说:“那九鼎有什么了不起呀?从楚国的仓库里随便拿出一点废铁就足够铸成九鼎!” 王孙满一听这口气,吓得不敢在这里多停留,赶忙向楚王告辞回洛阳。他一边走一边想:自古以来,任何人不敢过问九鼎,今天楚王问九鼎的轻重和大小,而且那样蔑视九鼎,是把周天子没放在眼里,莫非是想灭周朝而统领天下!他越想越害怕,连忙快步往回跑。 此时,周定王在宫里坐立不安,正等着王孙满的消息。王孙满一进宫,周定王劈头就问:“楚国那个叫旅(庄王的名字)的小子说些什么?他对你的态度如何?” 王孙满急忙下跪,结结巴巴地说:“哎呀,不,不得了呀!这世道变、变、变了啊!”说着呜呜地哭了起来。 周定王见此情景,更着急了,赶忙追问:“你快说,是怎么回事?” 王孙满一边套一边说:“楚子狗胆包天!他,他问九鼎有多大、多重,他还说,从楚国仓库里随便拿出一点废铁,就足够铸成九鼎。” 庄王问鼎,有损于天子的尊严,更是对周朝政权的威胁。这平素被尊奉如神的周定王一听到这个消息,又生气又害怕,一时沉默不语,呆若木鸡。过了一会,他起身一遍又遍地抚摸九鼎。大臣们知道了这个消息,都来安慰周定王说:“陛下放心,陛下万福!九鼎天命所系。天命不可改变,苍天会保佑您!” 围魏救赵 是讲战国时期齐国与魏国的桂陵之战。公元前354年,魏惠王欲释失中山的旧恨,便派大将庞涓前去攻打。这中山原本是东周时期魏国北邻的小国被魏国收服,后来赵国乘魏国国丧伺机将中山强占了,魏将庞涓认为中山不过弹丸之地,距离赵国又很近,不若直打赵国都城邯郸,既解旧恨又一举双得。魏王从之,欣欣然似霸业从此开始,即拨五百战车以庞涓为将,直奔赵国围了赵国都城邯郸。赵王急难中只好求救于齐国,并许诺解围后以中山相赠。齐威王应允,令田忌为将,并起用从魏国救得的孙膑为军师领兵出发。这孙膑曾与庞涓同学,对用兵之法谙熟精通。魏王用重金将他聘得,当时庞涓也正事奉魏国。庞涓自觉能力不及孙膑,恐其贤于己,遂以毒刑将孙膑致残,断孙两足并在他脸上刺字,企图使孙不能行走,又羞于见人。后来孙膑装疯,幸得齐使者救助,逃到齐国。这是一段关于庞涓与孙膑的旧事。 且说田忌与孙膑率兵进入魏赵交界之地时,田忌想直逼赵国邯郸,孙膑制止说:解乱丝结绳,不可以握 拳去打,排解争斗,不能参与搏击,平息纠纷要抓住要害,乘虚取势,双方因受到制约才能自然分开。现在魏国精兵倾国而出,若我直攻魏国。那庞涓必回师解救,这样一来邯郸之围定会自解。我们再于中途伏击庞涓归路,其军必败。田忌依计而行。果然,魏军离开邯郸,归路中又陷伏击与齐战于桂陵,魏部卒长途疲惫,溃不成军,庞涓勉强收拾残部,退回大梁,齐师大胜,赵国之围遂解。这便是历史上有名的“围魏救赵”的故事。又后十三年,齐魏之军再度相交于战场,庞涓复又陷于孙膑的伏击自知智穷兵败遂自刎。 朝秦暮楚 在秦统一中国之前,这里是秦楚两国你争我抢的拉锯之地,本地的百姓在秦兵楚将的滋扰之中,学会了聪明的生存方法。早晨,秦兵打过来了,百姓们便说自己是秦国的良民,把秦国的门牌翻过来,晚上楚军攻过来了,百姓们便说自己是楚国的顺民,把楚国的门牌翻过来,以此保护了自己的生命财产。 卧薪尝胆 公元前496年,吴王阖闾派兵攻打越国,但被越国击败,阖闾也伤重身亡。两年后阖闾的儿子夫差率兵击败越国,越王勾践被押送到吴国做奴隶,勾践忍辱负重伺候吴王三年后,夫差才对他消除戒心并把他送回越国。 其实勾践并没有放弃报复仇之心,他表面上对吴王服从,但暗中训练精兵,强政励治并等待时机反击吴国。艰苦能锻炼意志,安逸反而会消磨意志。勾践害怕自己会贪图眼前的安逸,消磨报仇雪耻的意志,所以他为自己安排艰苦的生活环境。他晚上睡觉不用褥,只铺些柴草(古时叫薪),又在屋里挂了一只苦胆,他不时会尝尝苦胆的味道,为的就是不忘过去的耻辱。 勾践为鼓励民众就和王后与人民一起参与劳动,在越人同心协力之下把越国强大起来,最后并找到时机,灭亡吴国。 纸上谈兵 赵括从小就学习兵法,谈论兵事,认为天下没有比得上他的。曾经和他的父亲赵奢谈论兵事,赵奢都难不倒他,但是并不称赞他。赵括的母亲问赵奢其中的原因,赵奢曰∶“打仗,是生死攸关的地方,而赵括太轻率地讨论它了。如果赵王不让他当将军就罢了,如果一定要让他当将军,他一定会使赵军遭受失败。” 赵括代替了廉颇以后,全部变更了军法,轻率的任用军官。秦国的将军白起听说以后,指挥奇兵,假装打败撤退,而断绝赵军的粮道,把赵军一分为二,赵军士气不能统一。被困四十多天,赵军非常饥饿,赵括亲自指挥精兵博战,秦军用箭射死了赵括。 赵括的军队大败,数十万赵军投降了秦国,秦国全部将它们活埋了。
论文选题是按一定价值标准或条件对可供选择的课题进行评价和比较并对研究方向、目标、领域和范围作出抉择的过程,是决定论文内容和价值的关键环节。这里学术堂整理了十五个论文选题供大家进行参考:1、从语用学视角看汉英口译中的语用失误2、英语心智谓词的模糊性及其语际语用发展研究3、英语科技术语的词汇特征及翻译4、Moment in Peking中异国形象之汉译5、中医典籍中“气”的源流与翻译探析6、女性主义视角下张爱玲的翻译观--以英译《海上花列传》为中心7、二语习得视觉化研究的几个关键问题8、晚清以降的中国佛典英译高潮9、基于降维法的译者风格研究10、中国英语口音研究述评11、口译中视角转换的语用原则12、模因理论指导下的汉语歇后语英译13、本土英语教学法:流派、体系与特色14、《骆驼祥子》三个英译本中叙述话语的翻译--译者风格的语料库考察15、基于语料库的“人生”隐喻英汉对比研究
我分享几个现代语言学这本期刊的文献标题给你看看哈,你可以参考参考:京剧翻译中归化和异化策略的研究基于CiteSpace的国内俄语前置词研究可视化分析国外性别语言研究的发展历程、主要内容及理论嬗变新闻漫画中“中美关系”多模态隐喻的认知研究非洲媒体涉华新冠疫情新闻标题的及物性分析外语学习动机领域国际姿态的研究焦点与发展趋势流行语“摆烂”的语用及来源探析
语言学论文有很多,这里学术堂整理了十五个好写的语言学论文题目:1. On English Euphemism谈谈英语委婉语2. Metaphor in English Euphemism 隐喻在英语委婉语中的应用3. The Relationship between Taboo and Euphemism and Their Respective Uses浅谈禁忌语和委婉语之关系及各自用途4. A Survey of Euphemism in English and Chinese对英语和汉语中的委婉表达法之研究5. A Comparative Study of English and Chinese Euphemistic Terms of Death英汉有关“死亡”的委婉语的对比研究6. A Contrast Study of Courtesy Language in English and Chinese英汉委婉语的语用对比研究7. The Phenomena of Ambiguity in English英语中的模糊语现象8. Noun-verb Conversion in Contemporary English现代英语中名词转化为动词的现象9. Onomatopoeia in English and Chinese Nursery Rhymes英汉语儿歌中的拟声词10. Syntactic Functions of Prepositional Phrases前置短语的句法功能11. Various Circumstances under Which Inversion is Used and its Comparison with Chinese 运用倒装的多种情形及其与汉语的比较12. The Analysis of “Up” and “Down” in English and Chinese分析Up和Down在英语和汉语中的用法13. The Comparison between English and Chinese Conjunctions 英汉连词对比14. Difference between Attributive in Chinese and English and How to Translate English Attributive Clauses英汉定语比较与定语从句翻译15. A Tentative Study of Post-posed Adjectives后置形容词初探
语言学被普遍定义为对语言的一种科学化、系统化的理论研究。那语言学的论文题目要怎么选呢?下面我将为你推荐语言学论文选题的内容,希望能够帮到你!
1、论修辞的定义及其发展历程
2、论修辞本质的现代意义
3、论修辞学的性质
4、论现代修辞学的研究对象
5、修辞学的研究任务
6、汉语修辞学的研究对象、任务和范围
7、论汉语修辞的民族特点
8、论修辞学与语言学的关系
9、论修辞学与语法学的关系
10、修辞学与心理学的关系
11、修辞学与社会学的关系
12、论修辞学与美学的关系
13、论修辞学与哲学的关系
14、论修辞与传播的关系
15、修辞学与传播学的关系
16、修辞学与心理语言学的关系
17、修辞学与广告学的关系
18、论修辞学与社会心理学的关系
19、论修辞学与新闻学的关系
20、修辞学的发展与现代社会科学
21、修辞学研究的多维方法
22、论现代修辞学研究的社会心理学方法
23、论社会心理修辞学的研究方法
24、社会修辞学研究概述
25、论修辞研究的心理学方法
26、结构修辞学及其研究
27、语言修辞学及其研究
28、言语修辞学及其研究
29、现代汉语修辞学的发展
30、现代修辞学的发展趋势
31、当代修辞学的发展方向
32、20世纪中国修辞学概述
33、21世纪中国修辞学发展展望
34、现代修辞学的体系建构
35、中西古典修辞学研究比较
36、中西修辞学研究方法比较
37、论修辞中的辩证法
38、修辞与语境的关系
39、话语建构与语境的关系
40、修辞关涉的社会心理因素及其修辞价值
41、语境与话语理解
42、语境与修辞效果评价
43、语境学研究及其发展
44、语境学与现代传播学
45、语境的构成
46、认知修辞学及其发展
47、比喻的传播价值
48、修辞与真理
49、论修辞交际中的伦理法则
50、修辞研究中的伦理学方法
1、论修辞手段的定义及其构成
2、修辞方法及其构成
3、汉语修辞方法的民族性及其在跨文化交流中的价值
4、同义修辞手段
5、同义修辞手段研究概述
6、模糊修辞及其研究
7、寻常词语的艺术化
8、论辞格的本质
9、辞格及其定义
10、辞格的分类标准
11、汉语修辞格研究概说
12、汉语修辞格研究的进展
13、新闻标题中的比喻及其功能
14、比喻的结构
15、汉语比喻的民族特点
16、汉语喻体中的民族审美心理
17、花类喻体的文化含义
18、动物喻体的文化含义
19、比喻的民族心理基础
20、比喻与认知模式
21、夸张的民族特点
22、汉语借代的民族特点
23、反复的修辞功能
24、双关的语义结构
25、比拟的修辞功能及其语体分布
26、现代汉语公众称谓的变迁与社会心理
27、道德观念与汉语词语的伦理分化
28、汉语新修辞格探析
29、移就及其语义结构
30、句式的整散调配与话语风格
31、话语句式的长短转换方法
32、句式的雅俗分化及其调配
33、话语句式语气变化的修辞价值
34、话语句式的杂糅及其修辞价值
35、话语建构中的句式调配
36、话语句式调配的原则
37、话语句式调配的方法
38、词语选择的方法
39、词语的附加修辞功能及其类别
40、词语的态度标示功能及其修辞价值
41、词语的语体标示功能
42、词语理性意义的轻重与运用
43、话语组织的原则
44、句际衔接的方法
45、话语句际组合的原则