该语料库对600多万字节的中文文章进行了分词及词性标注,其被作为原始数据应用于大量的研究和论文中。PFR语料库是对人民日报1998年上半年的纯文本语料进行了词语切分和词性标注制作而成的,严格按照人民日报的日期、版序、文章顺序编排的。
今天再过来更几个语料库,写论文嘛,这东西只嫌少不嫌多你们都懂得~:https://ota.ox.ac.uk首先是牛津的OTA。这个语料库我还没有开始用,用过了之后再来谈体验。不过要吐槽的一点是学语言学的孩纸们的网页制作技术真是(扶额)。。。页面...
1.3研究设计1.3.1语料说明本文语料均来自于华中科技大学汉语学习初级B班的口语课堂,B班的意思是学生已经有半年的汉语学习基础或相等的水平。自2012年05月至11月止,本文共收集30课时的课堂录音,即1350分钟的录音材料,包括两个学期共四个B班的口语课堂实录。
语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。
清华大学汉语歧义切分语料库(1998年,1亿汉字),后来在汉语树库、篇章语料库建设等方面做了大量研发工作语料库的类型1.按内容构成和目的划分(4种类型)异质的(heterogeneous)-[黄昌宁,2002]最简单的语料收集方法,没有事先规定和选材原则。同质的
(语言学及应用语言学专业论文)汉语“得”字句的句式特点及其在英语中的对应表达专著论文写作演讲实验报告发言稿调研报告叙事研究社会调查报告研究报告经验总结附录毕业设计论文答辩论文摘要读书笔记演讲稿毕业论文试卷开题报告工作总结化学论文图片格式范文脆肉鲩...
现代汉语结构助词分合问题研究摘要忽视已有成果而另起炉灶没有必要也不现实。对已有学术成果,本文加以沿用并适时补充证据,“有多少材料说多少话”,通过较为系统的静态描写与动态分析,对结构助词使用状况进行探讨,就目前使用混乱的表现形式和产生原因做出相应分析,以期对现代...
汉语复句历史演变研究及其语料库建设的中期检查报告.2018年12月03日15:13来源:全国哲学社会科学工作办公室.一、研究进展情况.1.研究计划总体执行情况及各子课题进展情况.(1)研究计划总体执行情况.本项目基本上是按原计划执行。.2017年3月,课题启动...
该语料库对600多万字节的中文文章进行了分词及词性标注,其被作为原始数据应用于大量的研究和论文中。PFR语料库是对人民日报1998年上半年的纯文本语料进行了词语切分和词性标注制作而成的,严格按照人民日报的日期、版序、文章顺序编排的。
今天再过来更几个语料库,写论文嘛,这东西只嫌少不嫌多你们都懂得~:https://ota.ox.ac.uk首先是牛津的OTA。这个语料库我还没有开始用,用过了之后再来谈体验。不过要吐槽的一点是学语言学的孩纸们的网页制作技术真是(扶额)。。。页面...
1.3研究设计1.3.1语料说明本文语料均来自于华中科技大学汉语学习初级B班的口语课堂,B班的意思是学生已经有半年的汉语学习基础或相等的水平。自2012年05月至11月止,本文共收集30课时的课堂录音,即1350分钟的录音材料,包括两个学期共四个B班的口语课堂实录。
语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。
清华大学汉语歧义切分语料库(1998年,1亿汉字),后来在汉语树库、篇章语料库建设等方面做了大量研发工作语料库的类型1.按内容构成和目的划分(4种类型)异质的(heterogeneous)-[黄昌宁,2002]最简单的语料收集方法,没有事先规定和选材原则。同质的
(语言学及应用语言学专业论文)汉语“得”字句的句式特点及其在英语中的对应表达专著论文写作演讲实验报告发言稿调研报告叙事研究社会调查报告研究报告经验总结附录毕业设计论文答辩论文摘要读书笔记演讲稿毕业论文试卷开题报告工作总结化学论文图片格式范文脆肉鲩...
现代汉语结构助词分合问题研究摘要忽视已有成果而另起炉灶没有必要也不现实。对已有学术成果,本文加以沿用并适时补充证据,“有多少材料说多少话”,通过较为系统的静态描写与动态分析,对结构助词使用状况进行探讨,就目前使用混乱的表现形式和产生原因做出相应分析,以期对现代...
汉语复句历史演变研究及其语料库建设的中期检查报告.2018年12月03日15:13来源:全国哲学社会科学工作办公室.一、研究进展情况.1.研究计划总体执行情况及各子课题进展情况.(1)研究计划总体执行情况.本项目基本上是按原计划执行。.2017年3月,课题启动...