首页

> 学术发表知识库

首页 学术发表知识库 问题

论文语言检测英文翻译

发布时间:

论文语言检测英文翻译

可以,但是不建议,并不能完美躲避论文查重,反而费时费力。1、你需要阅读多篇论文,才能选取到自己需要的题材和思路,还要逐句翻译通读,才能确定是否可用,费时费力,效果还不好。2、如果运气好正好找到一篇可用的,那也只建议你借鉴原文思路,搜索中文材料自行进行写作,这样答辩老师即使读过原文也不会说你什么。最后想说论文还是好好写,写完后用PaperPP查重系统查一下,最后用知网定稿,心里有底。再根据查重报告进行修改,这样通过的可能性会大很多,只要用心,通过知网查重系统问题不大。

会的,但是不一定能查出重复,因为翻译过后的内容语义有可能会发生变化,查重系统即使翻译回来,翻译后的句子也不可能和原句一模一样,因此大概率是不会被检测出重复内容。但是翻译后的句子逻辑不通顺,如果论文中大量存在翻译的内容,即便能通过查重,在后续的答辩或者导师检查中也会暴露出问题,影响毕业,建议学生不要使用翻译的方法来降低重复率。

毕业论文查重把知网上的英文文章翻译成中文还会重查吗?中国知网早就已经添加了中英文互译检测。在报告里面有一项叫做“跨语言检测”的结果,所以不要觉得可以!

是可以的。如果文献是英文或其他语言,当翻译成中文时,数据库中没有类似的内容供比较。因此,该系统包含了你的英文文本抄袭,对于中文翻译内容并不是有效的检测。但是,如果像你这样的其他人翻译了这份文件并被包括在网上,请注意是否有人使用过抄袭的英语文章。一旦别人用过,那么当你查重的时候会出现剽窃他的文章,系统到底查不查的出来,我们要查证知道,并不意味着没有其他人翻译的可能性。

英语语言翻译论文题目

可以找清北医学翻译,这家收费不贵,价格也合适。

英汉翻译的载体是 文化 ,并且英汉翻译还受到了文化因素的影响。在英汉翻译的论文中,题目占据了一半文的作用。为此我将为你推荐英汉翻译论文选题的内容,希望能够帮到你!英汉翻译论文选题(一) 1. 跨文化视角中的英汉 谚语 互译 2. 英译汉中名词的转译 3. 文学作品中的隐喻翻译 方法 4. 论正说反译、反说正译 5. 翻译选词如何避免 Chinglish 6. 如何正确使用直译和意译 7. 双面佳人——谈《喧哗与骚动》中凯萧的人物形象 8. 论英汉动物词的文化意象差异与翻译 9. 论非常规翻译的作用 10. 从文化差异中看商标翻译 11. 英汉语言的对比 12. 浅谈《宠儿》中母亲塞丝的形象 13. 《毛猿》中扬克的悲剧探微 14. 文学作品中汉语姓名的英译 15. 《远离尘嚣》对 典故 的运用 16. 英语新闻标题的翻译 17. 析《好人难寻》的主要人物 18. 《喧哗与骚动》的视角 19. 试析欧·亨利小说的写作风格 20. 商务合同中长句的翻译 21. 英译汉中词义的抽象化到具体化的转换 22. 论文化语境与翻译选词 23. 语言差异与翻译中的合理叛逆 24. 浅析《远大前程》主人公匹普的成熟过程 25. 论翻译中的中国英语 26. 翻译中的英汉文化差异 27. 劳伦斯笔下的悲剧性人物保罗 英汉翻译论文选题(二) 1. 语法翻译法在中学英语教学中的应用 2. 中学英语语法课堂多媒体技术运用的优势 3. 汉语宣传资料英译探讨 4. 体现在中英习语中的文化差异 5. 英语学习 中对美国 俚语 的认识 6. 电影片名英汉互译的归化与异化及翻译的相关技巧 7. 浅析中国英语 8. 大卫·科波菲尔中的批判现实主义 9. ”信”与英语比喻翻译 10. 佩科拉的悲剧探源 11. 论凯瑟琳·曼斯菲尔德《园会》中的艺术特色 12. 中学 英语阅读 教学中的文化差异渗透 13. 口译中的笔记及实际运用中的障碍 14. 浅析委婉语及其语用功效 英汉翻译论文选题(三) 1. 汉译英中的文化差异——词汇空缺与中国特色文化翻译 2. Questioning and Teaching of Reading 3. 英汉动物比喻的文化内涵及差异 4. (动物比喻在英汉两种文化的内涵及差异) 5. 哈代——具有乡土田园气息的作家 6. 英语语言中的性别歧视(主义) 7. 浅析英语语篇中的词汇衔接 8. 浅谈景点名称的英译 9. 英汉禁忌语和委婉语对比研究 10. 广告 翻译中的修辞手法 11. 不同语境中的翻译 12. 直译与意译 13. 浅谈中国式英语的现象 14. 英汉翻译中文化特性的处理 15. 英汉谚语比较 16. 英文广告中双关语及其翻译 17. 商标翻译中的文化因素 18. 英美文化差异与颜色词的翻译 19. 论英语俚语的汉译 猜你喜欢: 1. 翻译英语专业毕业论文选题 2. 翻译学术论文题目 3. 英语专业文化类毕业论文题目 4. 英语跨文化论文选题 5. 英汉语言对比方面论文参考目录

英语专业翻译方向毕业论文选题参考:地方名胜古迹汉译英探析语境在翻译中的作用商标的翻译广告语言的翻译论英汉互译中的语义等值问题中西文化差异与不可译性英汉谚语的理解和翻译浅谈颜色词在英语中的翻译英语比喻性词语中文化内涵及翻译英语意义否定表现法及其汉译浅谈新闻标题的翻译伟大的翻译家严复英语长句汉译简评《简•爱》的几种汉译本英语专业本科论文所涉及的专业方向 (一)英语语言习得理论研究 该方向着重研究英语语言学及语言习得的相关理论与实践,可着重讨论某一种语言现象产生的原因及具体表现或某一语言理论在实际生活、教学中的运用。学生可以进行:1.英语修辞研究;2.文体研究;3.英汉比较研究;4.各类语体研究;5.语法研究;6.词汇研究等。 (二)教学理论与教学法该方向主要研究英语教学的理论与实践以及相关的教学指导原则和具体的方法,选题应着重探讨英语教学的方法,可具体到某一课程的教学理念、策略和方法的应用及效度,现代教育技术在英语教学中的应用与探索。学生可以进行:1.英语学习策略研究;2.英语学习焦虑研究;3.英语测试研究;4.英语教学法研究;5.英语教学策略研究;6.计算机辅助英语教学研究等。 (三)商务英语文本研究该方向着重研究商务英语文本文体,语言特点及相关的翻译实践问题。学生可以进行:1.商务英语语言特征研究;2.商务英语文体研究;3.商务英语翻译理论研究;4.商务英语翻译时间探讨;5.商务英语翻译标准探讨等。 (四)翻译理论与实践该方向着重研究英汉互译过程中的口、笔译理论、翻译标准、原则、方法及技巧。论文选题可选择评论赏析某一翻译家或某一本(篇)著名的译作,或论述某一种翻译理论的技巧在实践中的运用,也可讨论某一翻译现象中所反映的文化内涵。学生可以进行:1.翻译理论研究;2.翻译家研究;3.翻译史研究;4.文学翻译研究;5.非文学翻译研究;6.翻译过程研究;7.翻译批评研究;8.翻译的接受与影响研究;9.翻译教学研究;10.翻译标准研究;11.典籍翻译研究等。 (五)英美人文与历史研究 该方向主要研究英美国家的社会、文化、人文、历史各个方面的具体内容,既可宏观也可微观地研究或比较英美国家的某一历史阶段的社会问题或文化现象或评论某一历史事件或历史人物,或跨文化交际方面的相关内容。学生可以进行:1.英美社会制度、社会问题研究;2.英美历史问题、历史人物研究;3.英美文化现象研究;4.西方宗教研究;5.西方影视作品研究;6.跨文化交际研究等。 (六)英美文学研究该方向主要研究英美文学史及各时期的文学流派,作家,作品的文体与写作风格。论文可选择做某一文学理论或作家作品的分析、评论,比较中西文学作品或作家,分析作品中的主题或人物角色。学生可以进行:1.文学流派研究;2.作家研究;3.作品评论或分析;4.文学批评理论研究;5.中西文学作品的比较研究等。

好办,翻译是双语,双文,双文化的产物。因此,好的翻译只能脱裤子放屁重复学习同样的知识技能。比如物理学,在中国物理大学毕业,还要在美国达到物理大学毕业水平,也只能翻译英中/中英的物理大学毕业水平以下的资料,硕士/博士级别的,根本就别想了!是不是一个重要的题目?

翻译文章英语翻译

1.(短篇论著)essay;article:一篇批评文章acriticalessay2.(著作)literaryworks;writings:有许多关于英语阅读教学方面的文章。therearealotofwritingsdealingwiththeteachingofenglishreading.3.(暗含的意思)hiddenmeaning;impliedmeaning:其中大有文章。thereisalotbehindallthis.;therebyhangsatale.

Your schooldays should be some of the best and happiest days of your life.学校生活应该是你生命中最有意义,最快乐的时光。 How can you get the most from them, and make sure you do not waste this wonderful opportunity(机会)to learn?你该怎样好好利用它,确保不会浪费这个大好的学习机会呢? Be positive(积极)about school! 对待学校要用积极的态度!Don’t say things are difficult or boring . Be interested in school-life and your school subjects.不要觉得事情难或是无聊。要对学校的事情保持兴趣。 Join lots of activities. 多参加些活动。Be quick to put your hand up.积极表态! Go round the school with a big smile.微笑面对学校的一切。 Keep fit.保持健康 If you do not eat a good breakfast, you will be thinking about food in class. 早上不吃东西的话,上课的时候就会一直想。If you go to bed late and do not have enough sleep, you will be sleepy in class. 晚上在床上不睡觉,到班上就要打瞌睡了。Play some sports to keep your body strong.参加些运动,来让自己健壮吧。 Do today’s work today. Do not say you will do things tomorrow. 今天的事今天做,不要指望明天会完成。when you get behind the class, it is very difficult to get back in front.落后之后是很难追上来的。 You cannot finish a race if you rest all the time.整场休息的人,是无法完成比赛的。 Don’t be too disappointed if things sometimes go badly . 事情发展不如意时,也不要气馁。Everyone fails some tests, loses some matches and has bad days. 人人都会有不如意的时候。Friends are not always perfect, and they sometimes say and do unpleasant things.朋友们也不是完人,他们也有出错,不如意的时候 Don’t let small problems seem very big and important.不要太看重小问题了 Talk about problems-sometimes they are only the result of misunderstanding. 想想问题吧,有的时候会成为误解的Don’t be too embarrassed(窘迫)to ask for help. You are young. No one thinks you can do everything !年轻人,学着寻求帮助吧,不要不好意思,我们都不是无所不能的。 Plan your time. Don’t waste life lying in bed on Saturday morning. 计划好时间,星期六的早上不要把时间浪费在躺床上Go and play a sport, learn the piano, work on a project, read a book, practice English, or help someone with problems. 去参加一项运动,学学钢琴,展开一项计划,看本数,锻炼英语,或是帮帮别人There are always a lot of things to do.总是有很多事情可以做的Follow our advice, and have a happy school-life!采取这些建议,过一个愉快的学校生活吧。

你的学生时代应该是一些最好的、快乐的生活。你怎么能得到最大的,确保你不要浪费了这个大好机会去学习呢? 学校积极态度!不要说事物是困难的或无趣的人。你有兴趣学校生活和学校课程。参加许多活动。快去请举手。绕学校用一个灿烂的微笑。 保持健康。如果你不吃早餐吃得好,你会考虑食品在上课。如果你睡得很晚,没有足够的睡眠,你会困在上课。播放一些体育运动来保持你的身体强壮。 今天该做的事情。不要说你将做的事了,当你在这门课,这是件很困难的事情,返回到前面。你不能完成的比赛,如果你休息。 别太失望的事情。每个人在某种程度上会失去一些测试,不能比赛,也有坏的日子。朋友不是总是完美的,他们有时会说出或做出不愉快的事情。不要让小小的问题似乎很重要。 他们只谈论问题有时的误解。不要羞于请求帮助。你还年轻。没有人会认为你可以做任何事! 计划你的时间。不要把生命浪费躺在床上星期六早上。去参加体育运动、学习钢琴,一个项目工作,读一本书,练习英语,或者帮助别人所遇到的问题。总是有很多事情要做。 跟我们的建议,并有一个快乐的学校生活!

分类: 教育/科学 >> 外语学习 问题描述: Chang'e and the Cruel Emperor Many years after she was already the moon goddess, Chang'e looked down upon Earth and saw that a terribly cruel emperor sat on the throne. To help the people, she allowed herself to be reborn into the mortal world. The other members of her mortal family were either killed or enslaved by the emperor, but Chang'e managed to escape to the countryside. Meanwhile, the emperor was aging and obsessed with discovering the elixir of life. He had people all over the land brought to him and demanded of them how to find the elixir of life; nobody knew, of course, but the emperor would not accept ignorance for an answer and executed all those who could not answer. In the countryside, Chang'e met the goddess of passion, Guan Yin, who proceeded to give Chang'e a *** all elixir. Chang'e brought the elixir to the emperor. The suspicious emperor worried that it was poison and demanded that Chang'e taste the elixir first. She did, showing no ill effects, so then the emperor took the elixir and promptly died. Then, Chang'e also left the mortal world; the effects of the elixir had only been delayed for her. However, instead of dying, she ascended to the moon to retake her place as a goddess.解析: 嫦娥奔月、残忍皇帝已经是多年的女神>、嫦娥奔月、藐视地看到一个极其残忍的皇帝坐在宝座. 为群众,她自己可以再生的人间. 她的家庭其他成员丧生或遭受致命的皇帝,农村嫦娥奔月逃脱. 同时,皇帝发现老药的痴迷和生活. 他带人到各地,并要求他是如何发现生命灵药. 没有人知道,当然不会接受,但皇帝不作答,不知道那些执行. 在农村,与佛慈悲嫦娥奔月关贤,他准备让小嫦娥奔月灵药. 嫦娥奔月把药给皇帝. 担心皇帝怀疑是中毒,要求先嫦娥奔月味灵药. 突然,毫无不良影响,因此,把皇帝吃迅速死亡. 那么,还有嫦娥奔月尘世. 影响的只是拖延她吃. 但不是死,她登上月球收回其作为佛

学位论文前言翻译英语

1.preface foreword introduction 2.premise

.premise

一、preface

读音:英 [ˈprefəs]   美 [ˈprefəs]

n.序言,引语;开端,前奏;[宗](弥撒的)序诵,序祷

vi.&vt.作序;作为…的序言,作为…的开端;给…作序;开始,导致

第三人称单数: prefaces 复数: prefaces 现在分词: prefacing 过去式: prefaced

例句:This book has a preface written by the author.

这本书有作者的自序。

二、introduction

读音:英 [ˌɪntrəˈdʌkʃn]   美 [ˌɪntrəˈdʌkʃən]

n.介绍;引言,导言;采用,引进;新采用的东西

复数: introductions

例句:The book's introduction is brief.

该书的引言简短。

三、foreword

读音:英 [ˈfɔ:wɜ:d]   美 [ˈfɔ:rwɜ:rd]

n.前言,序(言)

复数: forewords

例句:This book has a foreword by the President.

这本书有一篇总统作的序言。

四、exordium

读音:英 [ek'sɔ:dɪəm]   美 [ɪg'zɔ:dɪrm]

n.(讲话论文等)开端,绪言,绪论

复数: exordiums exordia

例句:The exordium of this article introduced the problems which must be solved and its development background, significance and so on.

本文开始的绪论部分介绍了程序需解决的问题及开发背景、意义等。

五、preliminary remarks

n.序言

例句:I have read this preface of book. To proceed toward ( a main topic) with preliminary remarks.

我已读过这本书的前言。用前言引入(一主要话题)

翻译英文综述算是抄袭吗是的 我 写的

目标检测论文中英翻译

The first day of school our professor

原文: Ren S, He K, Girshick R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[C]// International Conference on Neural Information Processing Systems. MIT Press, 2015:91-99.

译文参考: Faster R-CNN论文翻译——中英文对照

目标检测网络依赖于Region Proposal算法假设目标位置,通过引入Region Proposal(网络RPN),与检测网络共享全图像卷积特征,使得Region Proposals的成本近乎为零。

如下图所示,图a采用的是图像金子塔(Pyramids Of Images)方法;图b采用的是滤波器金字塔(Pyramids Of Filters)方法;图c引入“锚”盒("Anchor" Boxes)这一概念作为多尺度和长宽比的参考,其可看作回归参考金字塔(Pyramids Of Regression References)方法,该方法可避免枚举图像、多尺度滤波器和长宽比。

为了将RPN与Fast R-CNN相结合,本文提出了一种新的训练策略:在region proposal任务和目标检测任务之间交替进行微调,同时保持proposals的固定。该方案能够快速收敛,两个任务之间并共享具有卷积特征的统一网络。

Faster R-CNN由两个模块组成:

RPN以任意大小的图像作为输入,输出一组矩形的目标proposals,每个proposals都有一个目标得分。在实验中,假设两个网络(RPN和Fast R-CNN)共享一组共同的卷积层,并研究了具有5个共享卷积层的 Zeiler和Fergus模型(ZF) ,以及具有13个共享卷积层的 Simonyan和Zisserman模型(VGG-16) 。

为了生成region proposals,对最后的共享卷积层输出的卷积特征图谱使用一个小网络。该网络以卷积特征图谱的 空间窗口作为输入,且每个滑动窗口映射到一个低维特征,所有空间位置共享全连接层。

该低维特征作为两个子全连接层———边界框回归层(box-regression layer, reg)和边界框分类层(box-classification layer, cls)的输入,其卷积核均为 大小。

对于每个滑动窗口位置,可同时预测多个region proposals,最大region proposals数为 。因此,reg层具有 个输出,用于编码k个边界框的坐标;cls层具有 个得分,用于估计每个proposal是目标或不是目标的概率。

Anchors:k个proposals相对于 个参考框是参数化形式。

anchor位于滑动窗口的中心,并与尺度和长宽比相关。默认情况,使用3个尺度和3个长宽比,在每个滑动位置产生 个anchors。对于大小为 的卷积特征图谱,共产生 个anchors。

基于anchor的方法建立在anchors金字塔(pyramid of anchors)上,参考多尺度和长宽比的anchor盒来分类和回归边界框,用于解决多尺度和多长宽比问题。

为了训练RPN,为每个anchor分配一个二值标签。

正标签:

负标签:IoU值低于0.3。

对Fast R-CNN中的多任务损失进行最小化。图像的损失函数为:

其中, 是mini-batch数据中anchor的索引, 是第i个anchor作为目标的预测概率。若anchor为正标签,真值 ;反之, 。 是表示预测边界框4个参数化坐标的向量, 是正真值框的向量。分类损失 为两个类别的对数损失;回归损失 ,其中 为在 Fast R-CNN 一文中定义的鲁棒损失函数(平滑 )。 表示回归损失仅对正anchor激活,否则被禁用( )。cls和rge层的输出分别由 和 组成。该两项使用 和 进行标准化,并使用平衡参数 加权处理。等式中cls项根据mini-batch的大小进行归一化,而reg项根据anchor位置的数据进行归一化。默认情况下, 从而使得cls和reg项的权重大致相等。

对于边界框回归,采用 Rich feature hierarchies for accurate object detection and semantic segmentation 一文中的4个坐标参数化方法:

其中, 和 表示边界框的中心坐标及其宽和高。变量 和 分别表示预测边界框、anchor和真值框。

采样策略:以图像为中心。

在图像中随机采样256个anchors,用于mini-batch数据中损失函数的计算,正负样本的比例为 。

从标准差为0.01的零均值高斯分布中提取权重来随机初始化所有的新网络层,而共享卷积层通过预训练ImageNet分类模型来初始化。同时,调整ZF网络的所有网络层,以及VGG网络的conv3_1之上的网络,用于节省内存的使用。对于60k的mini-batch数据,学习率为0.001;对于PASCAL VOC数据集中的20k的mini-bacth数据,学习率为0.0001。随机梯度下降算法的动量设置为0.9,重量衰减率为0.0005。

训练具有共享特征网络的三个方法:

版权印版权标识

场景文本检测器由文本检测和识别模块组成。已经进行了许多研究,以将这些模块统一为端到端的可训练模型,以实现更好的性能。典型的结构将检测和识别模块放置在单独的分支中,并且RoI pooling通常用于让分支共享视觉特征。然而,当采用识别器时,仍然有机会在模块之间建立更互补的连接,该识别器使用基于注意力的解码器和检测器来表示字符区域的空间信息。这是可能的,因为两个模块共享一个共同的子任务,该任务将查找字符区域的位置。基于这些见解,我们构建了紧密耦合的单管道模型。通过使用检测输出作为识别器输入,并在检测阶段传播识别损失来形成此结构。字符得分图的使用有助于识别器更好地关注字符中心点,并且识别损失传播到检测器模块会增强字符区域的定位。此外,增强的共享阶段允许对任意形状的文本区域进行特征校正和边界定位。大量实验证明了公开提供的直线和曲线基准数据集的最新性能。

场景文本定位,包括文本检测和识别,由于在即时翻译,图像检索和场景解析中的各种应用,最近引起了广泛的关注。尽管现有的文本检测器和识别器在水平文本上很有效,但是在场景图像中发现弯曲的文本实例时,仍然是一个挑战。

为了在图像中发现弯曲的文本,一种经典的方法是将现有的检测和识别模型进行级联,以管理每一侧的文本实例。检测器[32、31、2]尝试通过应用复杂的后处理技术来捕获弯曲文本的几何属性,而识别器则应用多向编码[6]或采用修正模块[37、46、11]来增强弯曲文本上识别器的准确性。

随着深度学习的发展,已经进行了将检测器和识别器组合成可共同训练的端到端网络的研究[14,29]。拥有统一的模型不仅可以提高模型的尺寸效率和速度,还可以帮助模型学习共享功能,从而提高整体性能。为了从该属性中受益,还尝试使用端到端模型[32、34、10、44]处理弯曲文本实例。但是,大多数现有的工作仅采用RoI pooling 在检测和识别分支之间共享底层特征。在训练阶段,不是训练整个网络,而是使用检测和识别损失来训练共享特征层。

如图1所示,我们提出了一种新颖的端到端字符区域注意文本定位模型,称为CRAFTS。而不是将检测和识别模块隔离在两个单独的分支中,我们通过在模块之间建立互补连接来建立一个单一的pipline。我们观察到,使用基于注意力的解码器的识别器[1]和封装字符空间信息的检测器[2]共享一个公用的子任务,该子任务用于定位字符区域。通过将两个模块紧密集成,检测级的输出可帮助识别器更好地识别字符中心点,并且从识别器传播到检测器级的损失会增强字符区域的定位。而且,网络能够使在公共子任务中使用的特征表示的质量最大化。据我们所知,这是构建紧密耦合损失的首个端到端工作。 我们的贡献总结如下: (1)我们提出了一种可以检测和识别任意形状的文本的端到端网络。 (2)通过利用来自修正和识别模块上检测器的空间字符信息,我们在模块之间构造互补关系。 (3)通过在整个网络的所有特征中传播识别损失来建立单个pipline。 (4)我们在包含大量水平,弯曲和多语言文本的IC13,IC15,IC19-MLT和TotalText [20、19、33、7]数据集中实现了最先进的性能。

文本检测和识别方法 检测网络使用基于回归的[16、24、25、48]或基于分割的[9、31、43、45]方法来生成文本边界框。诸如[17,26,47]之类的一些最新方法将Mask-RCNN [13]作为基础网络,并通过采用多任务学习从回归和分割方法中获得了优势。就文本检测的单元而言,所有方法还可以依赖单词级别或字符级别[16,2]预测的使用进行子分类。

文本识别器通常采用基于CNN的特征提取器和基于RNN的序列生成器,并按其序列生成器进行分类。连接主义的时间分类(CTC)[35]和基于注意力的顺序解码器[21、36]。 检测模型提供了文本区域的信息,但是对于识别器而言,要提取任意形状的文本中的有用信息仍然是一个挑战。 为了帮助识别网络处理不规则文本,一些研究[36、28、37]利用 空间变换器网络(STN) [18]。而且,论文[11,46]通过迭代执行修正方法进一步扩展了STN的使用。这些研究表明,递归运行STN有助于识别器提取极端弯曲文本中的有用特征。在[27]中,提出了循环RoIWarp层, 在识别单个字符之前对其进行裁剪。这项工作证明,找到字符区域的任务与基于注意力的解码器中使用的注意力机制密切相关。

构造文本定位模型的一种方法是依次放置检测和识别网络。众所周知的两阶段结构将TextBox ++ [24]检测器和CRNN [35]识别器耦合在一起。简单来说,该方法取得了良好的效果。

端到端的使用基于RNN的识别器 EAA [14]和FOTS [29]是基于EAST检测器[49]的端到端模型。这两个网络之间的区别在于识别器。 FOTS模型使用CTC解码器[35],而EAA模型使用注意力解码器[36]。两项工作都实现了仿射变换层来合并共享功能。提出的仿射变换在水平文本上效果很好,但在处理任意形状的文本时显示出局限性。 TextNet [42]提出了一种在特征池化层中具有透视RoI变换的空间感知文本识别器, 网络保留RNN层以识别2D特征图中的文本序列,但是由于缺乏表现力的四边形,在检测弯曲文本时,网络仍然显示出局限性。

Qin等[34]提出了一种基于Mask-RCNN [13]的端到端网络。给定box proposals,从共享层合并特征,并使用ROI遮罩层过滤掉背景杂波。提出的方法通过确保注意力仅在文本区域中来提高其性能。Busta等提出了Deep TextSpotter [3]网络,并在E2E-MLT [4]中扩展了他们的工作。该网络由基于FPN的检测器和基于CTC的识别器组成。该模型以端到端的方式预测多种语言。

端到端的使用基于CNN的识别器 在处理任意形状的文本时,大多数基于CNN的模型在识别字符级文本都具有优势。 MaskTextSpotter [32]是使用分割方法识别文本的模型。尽管它在检测和识别单个字符方面具有优势, 但由于通常不会在公共数据集中提供字符级别的注释,因此很难训练网络。 CharNet [44]是另一种基于分割的方法,可以进行字符级预测。该模型以弱监督的方式进行训练,以克服缺乏字符级注释的问题。在训练期间,该方法执行迭代字符检测以创建伪ground-truths。

尽管基于分割的识别器已经取得了巨大的成功,但是当目标字符的数量增加时,该方法会受到影响。随着字符集数量的增加,基于分割的模型需要更多的输出通道,这增加了内存需求。journal版本的MaskTextSpotter [23]扩展了字符集以处理多种语言,但是作者添加了基于RNN的解码器,而不是使用他们最初提出的基于CNN的识别器。 基于分割的识别器的另一个限制是识别分支中缺少上下文信息。 由于缺少像RNN这样的顺序建模,在嘈杂的图像下,模型的准确性下降。

TextDragon [10]是另一种基于分割的方法,用于定位和识别文本实例。但是, 不能保证预测的字符段会覆盖单个字符区域。为了解决该问题,该模型合并了CTC来删除重叠字符。 该网络显示出良好的检测性能,但是由于缺少顺序建模而在识别器中显示出局限性。

由于CRAFT检测器[2]具有表示字符区域语义信息的能力,因此被选作基础网络。 CRAFT网络的输出表示字符区域以及它们之间的连接的中心概率。由于两个模块的目标是定位字符的中心位置,我们设想此字符居中信息可用于支持识别器中的注意模块。 在这项工作中,我们对原始的CRAFT模型进行了三处更改;骨干替换,连接表示和方向估计。

骨干置换 最近的研究表明,使用ResNet50可以捕获检测器和识别器定义的明确的特征表示[30,1]。因此,我们将骨干网络由VGG-16 [40]换成ResNet50 [15]。

连接表示 垂直文本在拉丁文本中并不常见,但是在东亚语言(例如中文,日语和韩语)中经常出现。在这项工作中,使用二进制中心线连接顺序字符区域。进行此改变的原因是,在垂直文本上使用原始的亲和力图经常会产生不适定的透视变换,从而生成无效的框坐标。为了生成 ground truth连接图,在相邻字符之间绘制一条粗细为t的线段。这里,t = max((d 1 + d 2)/ 2 *α,1),其中d 1和d 2是相邻字符盒的对角线长度,α是缩放系数。使用该方程式可使中心线的宽度与字符的大小成比例。我们在实现中将α设置为0.1。

方向估计 重要的是获取文本框的正确方向,因为识别阶段需要定义明确的框坐标才能正确识别文本。为此,我们在检测阶段增加了两个通道的输出,通道用于预测字符沿x轴和y轴的角度。为了生成定向图的 ground truth.

共享阶段包括两个模块:文本纠正模块和字符区域注意力( character region attention: CRA)模块。为了纠正任意形状的文本区域,使用了薄板样条(thin-plate spline:TPS)[37]转换。受[46]的启发,我们的纠正模块结合了迭代式TPS,以更好地表示文本区域。通过有吸引力地更新控制点,可以改善图像中文本的弯曲几何形状。 通过实证研究,我们发现三个TPS迭代足以校正。

典型的TPS模块将单词图像作为输入,但是我们提供了字符区域图和连接图,因为它们封装了文本区域的几何信息。我们使用二十个控制点来紧密覆盖弯曲的文本区域。为了将这些控制点用作检测结果,将它们转换为原始输入图像坐标。我们可以选择执行2D多项式拟合以平滑边界多边形。迭代TPS和最终平滑多边形输出的示例如图4所示。

识别阶段的模块是根据[1]中报告的结果形成的。 识别阶段包含三个组件:特征提取,序列建模和预测。 由于特征提取模块采用高级语义特征作为输入,因此它比单独的识别器更轻便。

表1中显示了特征提取模块的详细架构。提取特征后,将双向LSTM应用于序列建模,然后基于注意力的解码器进行最终文本预测。

在每个时间步,基于注意力的识别器都会通过屏蔽对特征的注意力输出来解码文本信息。 尽管注意力模块在大多数情况下都能很好地工作,但是当注意点未对齐或消失时,它无法预测字符[5,14]。 图5显示了使用CRA模块的效果。 适当放置的注意点可以进行可靠的文本预测。

用于训练的最终损失L由检测损失和识别损失组成,取L = Ldet + Lreg。 识别损失的总体流程如图6所示。损失在识别阶段流经权重,并通过字符区域注意模块传播到检测阶段。 另一方面,检测损失被用作中间损失,因此使用检测和识别损失来更新检测阶段之前的权重。

English datasets IC13 [20]数据集由高分辨率图像组成,229张图像用于训练和233张图像用于测试。 矩形框用于注释单词级文本实例。 IC15 [20]包含1000个训练图像和500个测试图像。 四边形框用于注释单词级文本实例。 TotalText [7] 拥有1255个训练图像和300张测试图像。与IC13和IC15数据集不同,它包含弯曲的文本实例,并使用多边形点进行注释。

Multi-language dataset IC19 [33]数据集包含10,000个训练和10,000个测试图像。 数据集包含7种不同语言的文本,并使用四边形点进行注释。

我们联合训练CRAFTS模型中的检测器和识别器。为了训练检测阶段,我们遵循[2]中描述的弱监督训练方法。通过在每个图像中进行批随机采样的裁剪单词特征来计算识别损失。每个图像的最大单词数设置为16,以防止出现内存不足错误。检测器中的数据增强应用了诸如裁剪,旋转和颜色变化之类的技术。对于识别器来说,ground truth框的角点在框的较短长度的0%到10%之间的范围内受到干扰。

该模型首先在SynthText数据集[12]上进行了50k迭代训练,然后我们进一步在目标数据集上训练了网络。使用Adam优化器,并应用在线困难样本挖掘On-line Hard Negative Mining(OHEM) [39]来在检测损失中强制使用正负像素的1:3比例。微调模型时,SynthText数据集以1:5的比例混合。我们采用94个字符来覆盖字母,数字和特殊字符,对于多语言数据集则采用4267个字符。

水平数据集(IC13,IC15) 为了达到IC13基准,我们采用在SynthText数据集上训练的模型,并在IC13和IC19数据集进行微调。在;推理过程中,我们将输入的较长边调整为1280。 结果表明,与以前的最新技术相比,性能显着提高。

然后在IC15数据集上对在IC13数据集上训练的模型进行微调。在评估过程中,模型的输入大小设置为2560x1440。请注意,我们在没有通用词汇集的情况下执行通用评估。表2中列出了IC13和IC15数据集的定量结果。

使用热图来说明字符区域图和连接图,并且在HSV颜色空间中可视化了加权的像素角度值。 如图所示,网络成功定位了多边形区域并识别了弯曲文本区域中的字符。左上角的两个图显示成功识别了完全旋转和高度弯曲的文本实例。

由字符区域注意辅助的注意力 在本节中,我们将通过训练没有CRA的单独网络来研究字符区域注意(CRA)如何影响识别器的性能。

表5显示了在基准数据集上使用CRA的效果。没有CRA,我们观察到在所有数据集上性能均下降。特别是在远景数据集(IC15)和弯曲数据集(TotalText)上,我们观察到与水平数据集(IC13)相比,差距更大。这意味着在处理不规则文本时,送入字符注意力信息可以提高识别器的性能。(?表格中的实验数据是对远景文本更有效,不知道这个结论如何得出来的?)

方向估计的重要性 方向估计很重要,因为场景文本图像中有许多多方向文本。我们的逐像素平均方案对于识别器接收定义良好的特征非常有用。当不使用方向信息时,我们比较模型的结果。在IC15数据集上,性能从74.9%下降到74.1%(-0.8%),在TotalText数据集上,h-mean值从78.7%下降到77.5%(-1.2%)。 结果表明,使用正确的角度信息可以提高旋转文本的性能。

推理速度 由于推理速度随输入图像大小而变化,因此我们在不同的输入分辨率下测量FPS,每个分辨率的较长边分别为960、1280、1600和2560。测试结果得出的FPS分别为9.9、8.3、6.8和5.4。对于所有实验,我们使用Nvidia P40 GPU和Intel®Xeon®CPU。与基于VGG的CRAFT检测器的8.6 FPS [2]相比,基于ResNet的CRAFTS网络在相同大小的输入上可获得更高的FPS。而且,直接使用来自修正模块的控制点可以减轻对多边形生成进行后期处理的需要。

粒度差异问题 我们假设 ground-truth与预测框之间的粒度差异导致IC15数据集的检测性能相对较低。 字符级分割方法倾向于基于空间和颜色提示来概括字符连接性,而不是捕获单词实例的全部特征。 因此,输出不遵循基准测试要求的框的注释样式。图9显示了IC15数据集中的失败案例,这证明了当我们观察到可接受的定性结果时,检测结果被标记为不正确。

在本文中,我们提出了一种将检测和识别模块紧密耦合的端到端可训练单管道模型。 共享阶段中的字符区域注意力充分利用了字符区域图,以帮助识别器纠正和更好地参与文本区域。 此外,我们设计了识别损失通过在检测阶段传播并增强了检测器的字符定位能力。 此外,共享阶段的修正模块可以对弯曲的文本进行精细定位,并且无需开发手工后期处理。 实验结果验证了CRAFTS在各种数据集上的最新性能。

相关百科

热门百科

首页
发表服务