6.以句子对齐的藏汉双语平行语料库为基础,研究了“基于统计的双语词对齐方法”和“基于词典的双语词对齐方法”,评估选择了第二种方法来实现藏汉双语平行语料库中的词对齐,并分析了实验结果。本文基于现有的研究基础,取得了以下成果:1.基于网络...
5.2藏汉双语句子对齐方法的实现第51-54页5.3藏汉双语句子对齐方法的测试第54-55页5.4藏汉双语句子对齐的性能分析第55-56页5.5本章小结第56-57页第六章词对齐的藏汉双语平行语料库构建第57-62页6.1对齐的藏汉双语句子中词
整理了对齐所用双语词典,并对其词语覆盖率进行了评价。汉藏句子对齐遇到的另一问题是汉语与藏文的分词粒度不同,采用在藏汉词典中进一步查词并在汉语句子中比对的方法,使正确句对的得分增加,从而提高对齐正确率。采用该方法准确率为81.11%。
汉维双语语料库中句子对齐技术研究.摘要随着计算机年u互联网的发展,在自然语言处理领域,以双语(或多语)平行语料库为基础的应用日益增多。.除机器翻译方面的应用之外,平行语料库的建设对丁烈语词典编纂、词义消岐和跨语言信息检索也具有重要...
【摘要】:双语语料库的自动对齐已成为机器翻译研究中的一个重要研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,该文先分析了基于长度的方法,然后提出了基于译文的方法:通过使用一部翻译较完整的词典作为桥梁,把英汉句子之间的对应关系连接起来.根据英语文本中的单词,在...
汉英双语语料库对齐——以Paraconc软件为例.封亚飞.【摘要】:众所周知,通过组织构建汉英双语语料库,实现双语语料库在统计的机器翻译系统中的应用,并实现纳-汉之间的双语对照翻译系统,较好地提高翻译的准确性和可读性,进而推动中国文化走出去,对于外国...
面向自然语言处理的大规模汉藏(藏汉)双语语料库构建技术研究,摘要:双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。目前国内外已建立了各类汉英双语语料库以及服务于汉英机器翻译的双语对齐语料库和短语库。为了少数民族语言的机器翻译的研究从一开始就从较高...
第十一届全国机器翻译研讨会(CWMT2015)中国·合肥2015.9.24-25汉语古现句子对齐研究李文句子对齐机器翻译摘要:古代汉语与现代汉语对齐方法,其中融入了新的特征,同时去掉了较常用的…
论文工作对后续汉-越双语的进一步研究提供了有力的技术支持。本文采用IBM的统计词语对齐的研究方法的5个模型构建汉-越双语词语对齐的方案。通过双向训练IBM模型得出双向词语对齐结果,采用开源工具GIZA++[Och,2000;Ochetal.,2003]进行汉-越双语词语
藏族文学典籍藏英汉语料库多模态建设框架1藏族典籍藏英汉语料库的建设意义不同民族有不同的生产生活方式、文化传统、风俗人情等,由此形成了不同的文化资源,这些文化资源是中国少数民族文献的重要组成部分。少数民族文献是以语言为载体、能够体现中国特色的文化要素。
6.以句子对齐的藏汉双语平行语料库为基础,研究了“基于统计的双语词对齐方法”和“基于词典的双语词对齐方法”,评估选择了第二种方法来实现藏汉双语平行语料库中的词对齐,并分析了实验结果。本文基于现有的研究基础,取得了以下成果:1.基于网络...
5.2藏汉双语句子对齐方法的实现第51-54页5.3藏汉双语句子对齐方法的测试第54-55页5.4藏汉双语句子对齐的性能分析第55-56页5.5本章小结第56-57页第六章词对齐的藏汉双语平行语料库构建第57-62页6.1对齐的藏汉双语句子中词
整理了对齐所用双语词典,并对其词语覆盖率进行了评价。汉藏句子对齐遇到的另一问题是汉语与藏文的分词粒度不同,采用在藏汉词典中进一步查词并在汉语句子中比对的方法,使正确句对的得分增加,从而提高对齐正确率。采用该方法准确率为81.11%。
汉维双语语料库中句子对齐技术研究.摘要随着计算机年u互联网的发展,在自然语言处理领域,以双语(或多语)平行语料库为基础的应用日益增多。.除机器翻译方面的应用之外,平行语料库的建设对丁烈语词典编纂、词义消岐和跨语言信息检索也具有重要...
【摘要】:双语语料库的自动对齐已成为机器翻译研究中的一个重要研究课题.目前的句子对齐方法有基于长度的方法和基于词汇的方法,该文先分析了基于长度的方法,然后提出了基于译文的方法:通过使用一部翻译较完整的词典作为桥梁,把英汉句子之间的对应关系连接起来.根据英语文本中的单词,在...
汉英双语语料库对齐——以Paraconc软件为例.封亚飞.【摘要】:众所周知,通过组织构建汉英双语语料库,实现双语语料库在统计的机器翻译系统中的应用,并实现纳-汉之间的双语对照翻译系统,较好地提高翻译的准确性和可读性,进而推动中国文化走出去,对于外国...
面向自然语言处理的大规模汉藏(藏汉)双语语料库构建技术研究,摘要:双语语料库建设及其自动对齐研究对计算语言学的发展具有重要的意义。目前国内外已建立了各类汉英双语语料库以及服务于汉英机器翻译的双语对齐语料库和短语库。为了少数民族语言的机器翻译的研究从一开始就从较高...
第十一届全国机器翻译研讨会(CWMT2015)中国·合肥2015.9.24-25汉语古现句子对齐研究李文句子对齐机器翻译摘要:古代汉语与现代汉语对齐方法,其中融入了新的特征,同时去掉了较常用的…
论文工作对后续汉-越双语的进一步研究提供了有力的技术支持。本文采用IBM的统计词语对齐的研究方法的5个模型构建汉-越双语词语对齐的方案。通过双向训练IBM模型得出双向词语对齐结果,采用开源工具GIZA++[Och,2000;Ochetal.,2003]进行汉-越双语词语
藏族文学典籍藏英汉语料库多模态建设框架1藏族典籍藏英汉语料库的建设意义不同民族有不同的生产生活方式、文化传统、风俗人情等,由此形成了不同的文化资源,这些文化资源是中国少数民族文献的重要组成部分。少数民族文献是以语言为载体、能够体现中国特色的文化要素。