这份论文的内容无疑是极具专业性的,但真正让走红的却是它的致谢部分。让网友感动的是作者虽身处极度贫困却从未放弃求学之心,一路坚持并取得博士文凭,最终改变命运。
作者黄国平在论文的致谢部分介绍了自己艰难的求学之路。他出生在四川一个非常贫困的山村,由于受不了穷,12岁时他的母亲离家出走。同样是因为穷,他的父亲在他很小时便在外务工。即便是他生了大病也只是匆匆赶回来,将勉强够治病的钱放下就返回工地。生活的重担压在他和父亲两人的肩上,高中之前黄国平的主要经济来源是抓黄鳝、出租水牛和养小猪崽,在勤奋学习的同时他还要为自己的学费“动脑筋”。
即便如此,他辛辛苦苦为自己筹措的学费还被父亲偷卖,买了酒和肉。就算这样他也没有怨恨父亲,因为现在他只能和父亲、奶奶相依为命。在他17岁那一年,黄国平遇到人生中的重大打击,他的父亲和奶奶离世,从此世间就只有他一人孤独作伴。还好黄国平的伯父将他接到家中照顾,从高三暑假开始,黄国平便利用电脑编程挣生活费。在求学过程中艰难万分的他,要遭受老师频频催学费的尴尬,还要面临和同学明显不对等的生活水平带来的“异样”。即便这样困难,他依然在求学。
有一句话让我感触很深:人后的苦尚且还能客服,人前的尊严无比脆弱。黄国平没有放弃,他利用知识改变命运的理想一直没有消失。现在的黄国平有着一份不错的工作,已经成功从小山村走了出来。希望这篇论文的致谢能让更多的学生实现精神升华,能够树立学习的信念。
我刚好也看了这个贴子,觉得内容很不错,准备把里面提到的五篇论文好好看看。
五篇论文分别是:
1.第一个挑战就是漏译,我们今年有一篇论文从数据方面去分析。我们发现漏译与词语的熵成正相关关系,这个词的熵越大,漏译的可能性越大。它所对应的目标语言词越多,概率越分散(熵越大),越有可能被漏译。
Addressing the Under-translation Problem from the Entropy Perspective To appear in AAAI-2019
2.第二个挑战就是数据稀疏。
多语言翻译 Multi-Task Learning for Multiple Language Translation 2015
无监督学习 Phrase-Based & Neural Unsupervised Machine Translation 2018
3.第三个挑战 引入知识
4.第四个挑战 可解释性
清华大学从注意力的角度去研究 Visualizing and Understanding Neural Machine Translation 2017
5.第五个挑战 语篇翻译
Modeling Coherence for Discourse Neural Machine Translation AAAI-2019
[1] 邢红兵,语法搭配的分类和作用--多义词的激活机制之一,《机器翻译研究进展》,陈肇雄主编,电子工业出版社,1992年8月。[2] 邢红兵,含“VA”结构的句子的语义分析,《浙江师大学报(社会科学版)》,1994年第4期。[3] 孙宏林、孙德金、黄建平、邢红兵,关于确定现代汉语分词原则的实验报告,《北京语言学院第三届青年科学报告会论文集》(内部发行),北京语言学院教务处,1994年。[4] 孙宏林、孙德金、黄建平、李德钧、邢红兵“现代汉语研究语料库系统”概述(合作),《计算机时代的汉语和汉字研究》,罗振声、袁毓林主编,清华大学出版社,1996年11月。《第五届国际汉语教学讨论会论文选》,胡明扬主编,北京大学出版社,1997年10月。[5] 邢红兵、张普、崔永华,Chinese Character Component Disassembly and Standard of GB 13000. 1 Character Set,(第一作者),《第二届术语学、标准化与技术传播国际学术会议论文集》,中国大百科全书出版社,1997年7月。[6] 邢红兵,现代汉语插入语研究,《语言工程》,陈力为 袁琦主编,清华大学出版社,1997年8月。[7] 邢红兵、张普、崔永华,对部件称说的建议,《计算机世界》,1998年4月27日。[8] 信息处理用GB13000.1 字符集汉字部件规范(主要起草人),语文出版社,1998年4月。[9] 邢红兵、张普,汉字基础部件称谓“音托”键位统计,《1998年中文信息处理国际会议论文》,清华大学出版社,1998年9月。[10] 邢红兵,现代汉语字、词基础部件统计分析,《1998年中文信息处理国际会议论文》,清华大学出版社,1998年9月。[11] 邢红兵,现代汉语词类使用情况统计,《浙江师大学报(社会科学版)》,1999年第3期。[12] 邢红兵,从分词的不一致性看汉语分词的难点,“机器翻译与计算机语言信息处理国际学术研讨会”论文,北京1999年6月。[13] 邢红兵,词性标注中难归类词语分析,黄昌宁 董振东主编,《计算语言学文集》,清华大学出版社,1999年10月。[14] 邢红兵、舒华,语料库建设与汉语认知研究,“第三届华人心理学家学术研讨会”论文,1999年10月北京。[15] 邢红兵,汉语词语重叠结构统计分析,北京语言文化大学第五届青年科学报告会论文(二等奖),1999年11月。[16] 邢红兵,汉语词语重叠结构统计分析,《语言教学与研究》,2000年第1期。人大复印资料中心《语言文字学》,2000年第6期转载。[17] 邢红兵,汉语水平词汇双音节词结构分析,北京语言文化大学第八届科学报告会论文。[18] 邢红兵、舒华、孟祥芝、尚悦,形声字声旁规则性效应调查,“国际华语教学研讨会”论文,2000年6月,新加坡。[19] 邢红兵,基于第三代语料库的信息领域术语动态更新,《语言文字应用》,2000年第2期。[20] 邢红兵,计算机领域汉英术语的特征及其在语料分布规律,Proceedings of 2000 International Conference on Multilingual Information Processing, Augest 9-13 Urumqi, China.[21] Sun Maosong, Zhou Qiang, Sun Honglin, Huang Changning, Zhang Pu, Xing Hongbing, Constructing a Word-segmented & POS-tagged Chinese Corpus and a Chinese Treebank, proceedings of 2000 International Conference on Chinese Language Computing, July 8-9, 2000[22] 邢红兵,计算机领域汉英术语的特征及其在语料分布规律,《术语标准化与信息技术》,2000年第3期。[23] 苑春法,李莼,崔永华,邢红兵(2001). 基于遗传算法的汉语构词研究. 《清华大学学报(自然科学版)》2001年Z1期。[24] Lu Qin, Li Yin, Xing Hongbing, Li Ngai Ling and Chan Shiu Tong(2002),The Hong Kong Glyph Specifications for ISO 10646's Ideographic Characters,Twenty-first International Unicode Conference, Dublin, Ireland, 14-17 May 2002.[25] Xing Hongbing, Shu Hua, LiPing (2002). A self-organizing connectionist model of character acquisition in Chinese. In Proceedings of the Twenty-fourth Annual Conference of the Cognitive Science Society. Mahwah, NJ: Lawrence Erlbaum.[26]张亚旭、舒华、周晓林、邢红兵(2003),汉字识别中声旁与整字语音信息激活的相对优势,《北京大学学报(自然科学版)》2003年,第1期。[27] 邢红兵(2003),留学生形声字声旁规则性效应调查,载于《对外汉语研究的跨学科探索——汉语学习与认知国际学术研讨会论文集》,北京语言大学出版社,2003年3月出版。[28] 邢红兵(2003),现代汉语常用动词带宾语能力调查。孙茂松,陈群秀主编,《语言计算与基于内容的文本处理》。清华大学出版社,2003年8月。[29] 邢红兵(2003),对外汉语教材的汉语拼音注音方法调查. 苏培成主编,《信息网络时代的汉语拼音》。语文出版社,2003年10月。[30] 邢红兵(2003),留学生偏误合成词的统计分析,《世界汉语教学》,2003年第4期。[31] 邢红兵(2004),基于“汉语水平词汇等级大纲”的语素数据库建设,《数字化对外汉语教学理论与方法研究》,清华大学出版社,2004年7月,北京。[32] 邢红兵、舒华(2004),《汉语水平词汇与汉字等级大纲》中形声字声旁表音特点分析,载于《汉语口语与书面语教学——2002年国际汉语教学学术研讨会论文集》,北京大学出版社,2004年10月出版。[33] 邢红兵、张旺熹(2004),现代汉语语法项目的标注与统计研究,“对外汉语研究”学术研讨会论文,2004年11月,北京。[34] Xing, H., Shu, H., & Li, P. (2005). The acquisition of Chinese characters: Corpus analyses and connectionist simulations. Journal of Cognitive Science.[35] 邢红兵(2005),信息技术领域术语用字分析,《术语标准化与信息技术》,2005年第1期。[36] 邢红兵(2005),面向对外汉语教学的动词用法频率词典. “对外汉语词典学国际研讨会”论文,2005年3月,香港。[37] 邢红兵(2005),《(汉语水平)汉字等级大纲》汉字部件统计分析. 《世界汉语教学》,2005年第2期。[38] 邢红兵(2006)对外汉语用字统计分析,张普等主编《数字化汉语教学的研究与应用》语文出版社,2006年6月。[39] 邢红兵(2006)《(汉语水平)词汇等级大纲》双音合成词语素统计分析,《世界汉语教学》,2006年第3期。[40] 张博、邢红兵(2006)对外汉语学习词典多义词义项收录排列的基本原则及其实现条件,第二届对外汉语学习词典学国际研讨会,北京。[41] 邢红兵(2006)基于标注语料库的“实用现代汉语语法项目词典”基本框架,第二届对外汉语学习词典学国际研讨会,北京。[42] 邢红兵、张文坚、江诗鹏(2006),面向对外汉语教学的谓词句法属性统计研究,《语言教学与研究》,2006年第3期。[43] Ping Li & Hongbing Xing(2006),Diease But No Sheep, Science Vol 311, 31 Marth 2006.[44] 张金竹、邢红兵(2007)词语的习得途径及对外汉语词汇教学,“第八届词汇语义学研讨会”论文,2007年5月,中国香港。[45] 邢红兵、舒华、李平(2007),小学儿童词汇获得的自组织模型,《当代语言学》,2007年第3期。[46] 南旭萌、李芬芬、邢红兵(2008),留学生汉语学习词典使用情况调查,郑定欧主编《对外汉语学习词典学国际研讨会论文集(三)》,中国社会科学出版社。[47] 蔡北国、邢红兵(2008),谈基于语料库的词的用法研究与词汇教学,载于张普等主编《数字化汉语教学进展与深化》,清华大学出版社。[48] 弓月亭、邢红兵(2008),语料库建设与语法教学,载于张普等主编《数字化汉语教学进展与深化》,清华大学出版社。[49] 张金竹、邢红兵(2008),小学阶段汉字音节的分布与存储,载于张普等主编《数字化汉语教学进展与深化》,清华大学出版社。[50] 邢红兵、舒华(2008),小学语文教材用字基础部件统计分析,《语言文字应用》,2008年第3期。[51] 邢红兵、张普(2009),《现代常用字部件及部件名称规范》特点解读及使用建议,《小学语文》,第7、8期。[52] 郝瑜鑫、邢红兵(2009),基于语料库和数据库的同义词辨析模式,第十届汉语词汇语义学研讨会,2009年7月,山东烟台。[53] 邢红兵(2009),基于联结主义理论的第二语言词汇习得研究框架,语言教学与研究国际学术研讨会,2009年7月,北京。[54] 邢红兵(2009),中介语词汇与现代汉语词汇对比分析,《对外汉语研究》,第五期。[55] 邢红兵(2009),基于联结主义理论的第二语言词汇习得研究框架,《语言教学与研究》,2009年第5期。人大复印资料中心《语言文字学》2010年第1期转载。[56]郝瑜鑫、邢红兵(2009),汉语学习型词典需求调查和基于大规模语料库的学习型词典编撰构想,汉语国际教育‘三教’问题学术研讨会,2009年10月。[57]郝瑜鑫、邢红兵(2010),基于大规模语料库的学习型同义词辨析模式初探,载亢世勇等主编《词汇语义学的新进展——第十届汉语词汇语义学论文集》,新加坡东方语言信息处理学会出版。[58] 陈永朝、邢红兵(2010),基于联结主义理论模型的留学生复合词习得考察,《现代语文》4月下旬刊。[59] 陈永朝、邢红兵(2010),基于分布表征的语义提取和语义透明度自动评估实验,《现代语文》3月下旬刊。[60] 王娟、邢红兵(2010),留学生单音节多义语素构词习得过程的实验研究,《语言教学与研究》,2010年第2期。[61] 张金竹、邢红兵(2010),留学生语素习得路径探析,《现代语文》第11期。[62] 郝瑜鑫、邢红兵(2010),汉语学习型词典需求调查研究——兼论初中级阶段学习型词典的编撰,载《汉语国际教育‘三教’问题——第六届对外汉语学术研讨会论文集》,外语教学与研究出版社出版。[63] Teuvo Kohonen and Hongbing Xing(2011). Contextually Self-Organized Maps of Chinese Words.Lecture Notes in Computer Science, 2011, Volume 6731/2011, 16-29[64]邢红兵(2011),汉字统计研究与对外汉语教学,《汉字教学与研究》,第一辑。[65]邢红兵(2012),第二语言词汇习得的语料库研究方法,《汉语学习》,第2期。[66]郝瑜鑫、徐婷婷、邢红兵(2012),现代汉语常用副词AABB式句法语义研究,《语文学刊》(06) 。[67]邢红兵(2012),基于语料库的词汇知识提取及在二语词汇习得中的应用,第七届国际汉语电脑教学研讨会(TCLT),美国,夏威夷。[68]邢红兵(2012),中介语语料库虚词使用情况统计分析,第五届现代汉语虚词研究与对外汉语教学学术研讨会,吉林,延边大学。[69]邢红兵(2013),基于语料库的词语知识提取与外向型词典编纂,《辞书研究》,第2期。[70]邢红兵、辛鑫(2013). 第二语言词汇习得的中介语对比分析方法[J]. 华文教学与研究,02:64-72。[71]邢红兵(2013). 词语搭配知识与二语词汇习得研究[J]. 语言文字应用,04:117-126。[72]郝瑜鑫、刘汉武、邢红兵(2013). “就是……也/都……”的量级标示功能[J]. 汉语学习,05:65-70。[73]郝瑜鑫、邢红兵(2013). 现代汉语状语和状动结构研究评述[J]. 现代语文(语言研究版),04:13-14。
沈雨娇写的论文有撵炉胶,春夜喜雨等论文。沈雨娇的很多偏关于社会学的论文,发表在人才杂志上,引起很大反向。
2003[教材]《计算语言学概论》,商务印书馆,2003年(俞士汶 主编、常宝宝 詹卫东 合编)2000[专著]《面向中文信息处理的现代汉语短语结构规则研究》,清华大学出版社出版,2000年。 (包括杂志发表论文与会议论文,独立署名论文与联合署名论文,学术随笔,评论,等等,以时间为序)2007Zheng Ye, Weidong Zhan, Xiaolin Zhou, The Semantic Processing of Syntactic Structure in Sentence Comprehension: An ERP Study, In Brain Research, Vol.1142, pp.135-145. ISSN: 0006-8993, ELSEVIER. 2007 Apr. 20; E-publish 2007 Jan. 18.砂冈和子、詹卫东,言语コーパス利用の中国语电子补语辞典编纂とその课题,发表于“日本中国语学会第1回関东支部拡大例会”,日本,东京,明治大学,2007.3.17。2006詹卫东,汉语言文字信息处理状况,《中国语言生活状况报告》(上编),“中国语言生活状况报告”课题组编。商务印书馆2006年。pp.140-154。ISBN 7-100-04988-1/H.1225。柏晓静、詹卫东,汉语“被”字句的约束条件与机器翻译中英语被动句的处理,邢福义主编《汉语被动表述问题研究新拓展》,华中师范大学出版社2006年。pp.1-17。ISBN 7-5622-3372-1/H.268。(本文曾在2003年10月10日至12日于华中师范大学举办的“汉语被动表述问题国际学术研讨会”上宣读)詹卫东,计算机时代的汉语研究——从“面向计算”到“基于计算”,“第二期全国计算语言学讲习班”报告。沈阳航空工业学院。2006.8.19-20。Zhan Weidong, Chang Baobao, Dui Huiming, Zhang Huarui, Recent Developments in Chinese Corpus Research, Presented in The 13th NIJL International Symposium, Language Corpora: Their Compliation and Application. Tokyo, Japan. 2006.3.6-7. The National Institute for Japanese Language.2005詹卫东,以“计算”的眼光看汉语语法研究的“本位”问题,《汉语学报》,商务印书馆2005年第1期。pp.64-73。2004詹卫东 译,语用关系与汉语的词序,《语言学论丛》第30辑,商务印书馆2004年,pp334-368。 Randy La Polla(罗仁地)著,潘露莉(Dory Poa)校。詹卫东,广义配价模式与汉语“把”字句的句法语义规则,《语言学论丛》第29辑,商务印书馆2004年,pp314-333(本文初稿曾在“新世纪第二届现代汉语语法国际研讨会”上宣读,广州·暨南大学,2003.4.10-13)。詹卫东,论元结构与句式变换,《中国语文》2004年第3期。pp.209-221(本文收入中国人民大学复印报刊资料《语言文字学》2004年第7期,pp11-23)。詹卫东,范围副词“都”的语义指向分析,《汉语学报》2004年第1期,pp.74-84(本文曾在“第二届肯特岗国际汉语语言学圆桌会议”上宣读,新加坡国立大学,2002.11.27-29,新加坡)。詹卫东,中文信息处理与汉语研究,语言文字周报(上海)2004.1.14第4版。2003詹卫东,面向自然语言处理的大规模语义知识库研究述要,载徐波、孙茂松、靳光谨主编《中文信息处理若干重要问题》,科学出版社2003年版,pp.107-121。王惠、詹卫东、俞士汶,现代汉语语义词典规格说明书,载《汉语语言与计算学报》(新加坡)2003,Vol.13, No.2。(Journal of Chinese Language and Computing)pp.159-176。王惠、俞士汶、詹卫东,现代汉语语义词典(SKCC)的新进展,载孙茂松、陈群秀主编《语言计算与基于内容的文本处理》,清华大学出版社2003年(本文是全国第七届计算语言学联合学术会议论文/2003.8.9-11,哈尔滨工业大学)。pp.351-356詹卫东,汉语述结式的组配约束及“v+a+n”歧义格式分析,载《语言暨语言学》第4卷第3期“词汇语义学研讨会特刊”(Language & Linguistics, Vol.4 No.3: Special Issue On CLSW, 台北。pp.649-668(本文曾以《汉语述结式论元结构分析》为题在“第三届汉语词汇语义学研讨会”上宣读,台湾中研院语言研究所筹备处承办,2002.4.30-5.6,台北)。常宝宝、詹卫东、张化瑞,面向汉英机器翻译的双语语料库的建设及其管理,《术语标准化与信息技术》,2003年第1期,pp.28-31。詹卫东 译 ,框架语义学,《语言学论丛》(二十七辑),商务印书馆2003年。pp.382-412(C.J.Fillmore 原著,Frame Semantics,原作载韩国语言学会编Linguistics in the Morning Calm,Seoul: Hanshin Publishing Co.,1982,pp.111-137)。2002詹卫东、常宝宝、俞士汶,机器翻译与语言研究,《语言科学》第1卷第1期(2002年11月,创刊号)pp.47-61(本文收入中国人民大学复印报刊资料《语言文字学》2003年第10期,pp102-116)。詹卫东,基于合一的汉语短语结构规则,《语法研究和探索》(十一),商务印书馆,2002年。pp.187-203(本文曾在“第十一次现代汉语语法学术讨论会”上宣读,安徽师范大学.芜湖,2000年10月8-10日)。柏晓静、常宝宝、詹卫东,构建大规模的汉英双语平行语料库,载黄河燕主编《2002全国机器翻译研讨会文集:机器翻译研究进展》,北京:电子工业出版社。pp.124-131。常宝宝、詹卫东、柏晓静,服务于汉英机器翻译的双语对齐语料库和短语库建设,第二届中日自然语言处理专家研讨会论文集(北京:北京大学2002年10月)。pp.147-154。詹卫东,龙游语林探胜景 横岭侧峰各不同 —— 评游汝杰、申小龙、袁毓林语言学自选集,《南方论坛》(广西.双月刊)2002年第2期(总第87期),p.44。詹卫东,形式和意义:在简单与复杂之间,《殊途》第3期。(《殊途》是在北京留学的一批新加坡学生办的一个刊物,大约是2000或2001年前后开始办的)2001詹卫东,确立语义范畴的原则及语义范畴的相对性,《世界汉语教学》2001年第2期。pp.3-13 (本文曾在“21世纪首届现代汉语语法国际研讨会”上宣读,香港城市大学,香港,2001年2.1-3日,并收入由徐烈炯、邵敬敏主编的会议论文集《汉语语法研究的新拓展》,浙江教育出版社2002年版,pp.45-64)。詹卫东,面向组配约束的现代汉语语义词典的构建,在“第二届汉语词汇语义学研讨会” 上宣读(北京大学计算语言学研究所承办,2001年5.14-18)。周强、詹卫东、任海波,构建大规模的汉语语块库,黄昌宁、张普主编《自然语言理解与机器翻译》,清华大学出版社2001年版,pp.102-107(本文曾在“全国第六届计算语言学联合学术会议”上宣读,2001年8月,山西大学)。ZHANG Hong, YU Jiangsheng, ZHAN Weidong, Disambiguation of Chinese Polyphonic Characters, The First International Workshop on MultiMedia Annotation (MMA2001), 2001. 1. 30 - 1.31, Tokyo(东京)LIU Qun, CHANG Baobao, ZHAN Weidong, ZHOU Qiang, A News-oriented Chinese-English Machine Translation System, International Conference on Chinese Computing, 2001.11.25-12.2, Singapore(新加坡)2000詹卫东,语言成分的组合与功能传递,陆俭明主编《面临新世纪挑战的现代汉语语法研究》,山东教育出版社2000年版,pp.823-833(在“98现代汉语语法学国际学术会议”上宣读,北京大学中文系承办,1998年8.26-31)。詹卫东,20世纪汉语语义知识工程研究述要,在“21世纪语法和语法理论研究展望研讨会”上宣读(清华大学中文系,2000年8月)。詹卫东,80年代以来汉语信息处理研究述评,《当代语言学》2000年第2期。pp.63-73。詹卫东,基于配价的汉语语义词典,《语言文字应用》2000年第1期。pp.37-43。1999詹卫东、常宝宝、俞士汶,汉语短语结构定界歧义类型分析及分布统计,载《中文信息学报》1999年第3期。pp.9-17。詹卫东,一个汉语语义表达框架:广义配价模式,载黄昌宁、董振东主编《计算语言学文集》,清华大学出版社1999年版(JSCL'99论文,全国第五届计算语言学联合学术会议,北京,1999.11.1-3日)pp.1-71998詹卫东,“NP+的+VP”格式在组句谋篇中的特点,载《语文研究》1998年第1期。pp.16-23。詹卫东,关于“NP+的+VP”偏正结构,载《汉语学习》1998年第2期。pp.24-28(收入中国人民大学复印报刊资料《语言文字学》1998年第7期,pp.100-104)。詹卫东、常宝宝、俞士汶,基于词组本位语法的语义模型,载新加坡《中文与东方语言信息处理学会学报》(Communications of COLIPS)Vol.8,No.1,1998。pp.1-11。常宝宝、詹卫东,一个汉英机器翻译系统中的语义处理框架,载《计算机世界》报1998年第13期“技术与专题”版。1997詹卫东,PP<被>+VP1+VP2格式歧义自动消解,载《中国语文》1997年第6期。pp.424-431。詹卫东,面向自然语言处理的现代汉语词组本位语法体系,载《语言文字应用》1997年第4期。pp.100-105。詹卫东、刘群,词的语义分类在汉英机器翻译中所起的作用以及难以处理的问题,载陈力为、袁琦 主编《语言工程》,清华大学出版社1997年版,pp.286-291。(本文曾在“全国第四届计算语言学联合学术会议JSCL'97”上宣读,1997年8.15-17,清华大学,北京)。詹卫东、常宝宝、俞士汶,现代汉语短语本位语法体系在汉英机器翻译中的应用及其问题,载吴泉源、钱跃良 主编《智能计算机接口与应用进展》,电子工业出版社1997年版,pp224-229。(本文曾在“第三届中国计算机智能接口与智能应用学术会议”上宣读,1997年,湖南张家界)