首页

> 学术论文知识库

首页 学术论文知识库 问题

微软亚洲研究院论文精选

发布时间:

微软亚洲研究院论文精选

2016年11月14日上午9点,中关村丹棱街5号微软大厦,李开复,张亚勤,沈向洋,洪小文,王坚等中国IT界的技术大佬,以及曾在微软亚洲研究院工作过的近200位院友“同框出现”,宣布“微软亚洲研究院院友会”正式成立:沈向洋担任会长,李开复和张亚勤任名誉会长,他们都是这家研究院曾经的院长。

坦率地讲,夹杂在繁芜的科技资讯信息流之中,这很难称得上是一条惹眼新闻,至少相比上述大佬的同框,几天之后张亚勤和沈向洋出现在乌镇的那一张饭局合影要更为被媒体所追捧。

但科技记者无法忽视的是,多年来,在稿子中描述圈内大佬过往履历时,“微软亚洲研究院”是一个高频词汇。翻看人物图谱,这里是阿里云之父,前金山CEO,百度总裁,小米总裁,海尔CTO, 联想CTO……互联网高管,以及浙江大学、中国科学技术大学、人民大学等国内一线大学计算机/信息技术院系负责人的上一处居心之所;这里和跨国巨头在中国的“办事处”关系不大,它更像是一座拥有18年校龄的“大学”。

中国IT界的黄埔军校,有人喜欢这么说。在院友会成立仪式上,院友代表阿里巴巴CTO王坚感喟:没有人可以绕开这个机构去谈论过去十几年的中国科技史。

一切得从往事谈起。

九八年的召唤

九十年代初——在最不可一世的岁月,来自西雅图的软件巨人却为创新乏力所困。微软前任首席技术官麦尔伏德在1991年建议盖茨成立带有“军备竞赛”属性的创新研究院,进行基础科学研究,以主动迎合技术世界的不确定性。这年,微软首座研究院在雷德蒙成立。

六年之后,麦尔伏德送给了盖茨第二个建议:将研究院开到中国。理由颇为机敏,到1990年代为止,美国一直是这个世界上每年诞生计算机博士最多的地方——直至被中国超越,这被麦尔伏德视作中国IT业态苏醒的前奏。

1998年,微软中国研究院在北京成立。37岁的语音识别专家李开复博士成为首任院长。18年后已成谈资的插曲是:当得知李开复要以“研究院”作为这座机构的后缀时,沈向洋博士大笑,“叫个‘所’都大了”——2001年中国研究院升级为微软亚洲研究院则是后事了。

至少在1998年,沈向洋有充分的理由自嘲。现任院长洪小文后来回忆:“研究院建立前,我到北京参与最初一批员工招募。有些候选人是国内高校博士生,我们只能通过固定电话联络,那时学校里通常一幢宿舍大楼只有一部电话,经常需要麻烦宿管老师或同学帮着叫人来接听。没有几个网站,没有太多信息资源,因而沟通时需要花很多时间同步基础信息,效率比较低。Email倒是能用,但拨号上网资费昂贵又不稳定,实时在线不大可能。”

1998年,每小时8块钱的上网费和4块钱的电话费让上网属于奢侈消费;这一年,配备Windows 95的个人电脑也实属高大上的新锐电器;在更为宏大的叙事里,这一年,中国GDP刚突破万亿美元大关,IT产业所占比重仅约为。

然而同样在1998年,互联网作为社会基础设施迎来破茧之日,一批互联网明日巨星集体相约九八:1998年9月4日,谷歌正式创立;中国则更是普遍把这一年视作商业互联网元年:2月,张朝阳创办搜狐;6月,刘强东成立京东;11月,腾讯诞生;12月,新浪上线。

机遇与挑战在1998年显得尤为冲突——但考虑到成立研究院的愿景,天平似乎更偏向挑战一端。

早在筹备阶段,比尔盖茨和里克·雷斯特博士——微软全球研究院体系的缔造者,就为研究院确立了三条宗旨:推动整个计算机科学前沿技术发展;将最新研究成果快速转化到微软关键产品之中,以帮助用户改善计算体验;着眼于下一代革命性技术研究,助力微软实现长远发展战略和对未来计算的美好构想。

所以你可以想象李开复说服海外精英归国的不易,上述宏愿与当时中国的外部环境格格不入。不过事实美好的一端也成为18年后院友会成立仪式上李开复追忆的画面:“我在卡内基梅隆大学读书时有位同学叫沈为民,写代码非常厉害,我说你是怎么做到的。他说我们在国内都是在纸上写代码,老师则用脑子来运行这个程序。当时给我的感触是,如果能在纸上培养出沈为民这样的人,这样的人才肯定还有很多,一起做研究院一定能做出来。我当时也是抱着这样乐观的心态就回来了。”而中国的人才也是当年比尔盖茨所看重的。

后面的事情令人欣喜,研究院开始在全球顶级学术会议与期刊崭露头角,尤其2002年,他们在计算机科研领域最富盛名的国际图形学年会SIGGRAPH上发表了4篇论文——长久以来这种国际大会鲜有华人身影。

有人后来回忆,当年前去知春路希格玛大厦(研究院旧址)“朝圣”的年轻人一定会颇为失望,一切看上去与其他企业别无二致,除了目光中的这位“理工男”可能刚在国际期刊发表了一篇重要论文。

人工智能的延续

如今十八年过去,微软亚洲研究院当年的愿景已兑换成国际顶级学术会议与期刊上的4000余篇论文。更重要的是,脱胎于这里的技术也转移到微软产品矩阵中——Office,Windows,Bing,Kinect,以及小冰,Cortana,SkypeTranslator等人工智能产品,都有亚洲研究院的身影。

事实上,在人工智能还是个模糊概念,甚至不被学术界普遍承认的岁月,研究院就已将其视作面向未来的基础研究。1999年研究院成立一周年时即确立了最初的几个研究中心:语音组,多媒体组,图形图像组——如今它们都更像是人工智能概念的一部分。

李开复多年后坦言:中国如今能在人工智能领域扮演重要作用,很大程度上要归功于研究院很早开始便在语音识别,自然语言理解等众多人工智能核心技术进行研究。“中国今天的成就真的应该感谢微软亚洲研究院。”

不过,这种“感谢”对于研究院来说,似乎也意味着成长的烦恼。几年前开始,中国科技公司就积极网罗人工智能领域的精英,可以想象,微软亚洲研究院作为最密集的人才聚集地成为了被挖的目标。

事实上,研究院早已熟悉了人才的流动——这也是成立院友会的原因之一。

十八年前,这个国度最顶尖的技术头脑纷纷从美国的高校和科技企业来到微软;十八年后,技术后辈有了更多良禽择木的可能——聪明的大脑不再浓烈地聚集一地,而是稀释在各个地方。他们有些人继续留下来从事自己最热爱的研究,有些人选择离开去领导更大的团队做产品开发,有些人选择到大学任教,有些人则选择在中国这片创业热土圆梦。

命运自有时。如今研究院的愿景落在了醉心于科研的技术信仰者身上。说来宿命的是,就像某种轮回,当人工智能的概念挥别往日的“扭捏”而摇身蜕变为技术界的狂欢,这里的研究员或许比十八年前的前辈更为幸运。他们赶上了人工智能的黄金年代,可以肆意挥洒禀赋,紧跟这一技术的变迁孕育更多可能,且已收获颇丰。

随意摘取几例。去年底在ImageNet计算机视觉识别挑战赛——这一行业标杆属性的赛事上,微软亚洲研究院视觉计算组凭借深层神经网络技术的突破(使用了一种深度高达百层的神经网络,这要比过往任何成功使用的神经网络层数多5倍以上),获得图像分类,图像定位以及图像检测全部三个主要项目的冠军。几乎同一时刻,他们在另一项图像识别挑战赛MS COCO中的图像检测和图像分割项目上同样登顶——而一年过去,今年10月,他们在MS COCO图像分割挑战赛中获得第一名,成绩比第二名高出11%,且相较去年第一名的成绩也有飞跃进步。

在用户一端,承载技术的是应用——这也是微软亚洲研究院近些年最令人欣喜的地方。

去年,在中国登陆的Skype Translator实时语音翻译技术,就凝聚了研究院在语音识别,自动翻译和机器学习等多领域的成果,让世界上使用人数最多的语言和使用最广泛的语言直接对话成为可能。

而在风靡全球的(识别图片中人物的年龄)、(智能识图网站)等应用,同样基于研究院深耕多年的人脸识别技术。

当然,谈及人工智能应用,刷屏无数的小冰是绕不开的名字。抛开插科打诨不谈,我个人更看重的是它与其他行业的嫁接空间。譬如今年9月,小冰就进驻了“敦煌研究院”微信,摇身变为“敦煌小冰”,言谈之间告知人们关于敦煌的一切知识。嫁接得以实现,一项关键技术是微软亚洲研究院推出的自主知识学习技术(Doc Chat):一种基于检索与排序直接从非结构化文档中选取句子作为聊天机器人回复的方法。这一技术也已运用于今年8月发布的第四代微软小冰跨平台商业解决方案,可让小冰更轻松地学习不同领域知识,完成更多嫁接可能。

尽管换了“标题”和讲述者,但这里与人工智能从十八年前开始诉说的故事仍在继续。

基因传承

故事得以延续的前提是传承,研究为先,自由开放的环境与体系得以让这里相对纯粹的“传帮接带”。

事实上,那些离开的人几乎无一例外地珍视这段纯粹的职业生涯。而当他们追忆微软岁月,“感谢”与“传承”总是并列出现。“在现在的创业路上,研究院的文化氛围也深深的影响着我们的公司文化,感谢研究院,感谢当年指导我们的Mentors,感谢一起实习的小伙伴们。”已在创业的蔡东翔院友这样说道,“希望Mentor文化可以在院友会得到一个很好的传承。”

同样作为院友,清华大学计算机系副教授朱军则将传承细化:“我在研究院实习3年多……现在还清晰记得,第一天面试时问我‘为何读博士?’,这成了我现在面试学生必问的题目。Harry(沈向洋)的‘work hard, play harder’是我记得最清楚的一句话,现在也拿来教育学生。”

传承仍在继续。在不少院友看来,如今,院友会的成立可以发挥桥梁与纽带作用,分享经验与资源,甚至在某些奇特的瞬间感到从未离开过一样。这有点像是管理界颇为盛行的联盟关系,当人们离开一个地方,可以通过“同事联络网”成为这个地方的支持者和外部资源,并将它身上的基因散播到更远处。

好吧,也许正如罗振宇所说:世界上至少有两种游戏,一种是有限游戏,一种是无限游戏。有限游戏以游戏结束为目的,比的是谁能赢;无限游戏则是让游戏本身继续下去,而不是让谁赢,卷入的资源越多,参与的人数越多,游戏就能继续下去,这才是无限游戏的目标,也正是那些“老公司”的价值所在。

在我看来,这也正是微软亚洲研究院——这一席“流动的盛宴”,留给技术世界的真正财富。

李北辰/文(知名科技自媒体,致力于用文字优雅的文章,为您提供谈资与见识;微信公号:李北辰)

漏译的原因是什么,如何解决这个问题?这方面有很多工作,下面我就从几个方面去讲一下。我们今年有一篇论文从数据方面去分析。我们发现漏译与词语的熵成正相关关系,这个词的熵越大,漏译的可能性越大。它所对应的目标语言词越多,概率越分散(熵越大),越有可能被漏译。左边的例子,S1对应3种不同的翻译,(s1,t1) (s1,t2) (s1, t3 t4),它的熵就比较大。我们把所有对应的翻译统一替换为一个特殊词『stoken4s1』,以降低词语翻译的熵值。右边呢是我们提出来的三种方法,去改善翻译结果,包括pre-training, multitask learning, two-pass decoding。大家有兴趣的话,可以去看论文。从实验结果来看,相比Transformer,在中英翻译质量上有显著提高,高熵值词语的漏译比例显著下降。数据稀疏第二个挑战就是数据稀疏。相比于统计机器翻译,这个问题对神经网络翻译而言,更严重。实验表明,神经网络对于数据量更敏感。针对数据稀疏问题,我们提出了一个多任务学习的多语言翻译模型。在进行多语言翻译的时候,源语言共享编码器,在解码端,不同的语言,使用不同的解码器。这样在源语言端就会共享编码器的信息,从而缓解数据稀疏问题。后来,加拿大蒙特利尔大学、Google等在此方向上陆续开展了多个工作。实验表明,我们的方法收敛更快,翻译质量也明显提高。更多细节,请阅读论文。这篇论文是2018年EMNLP上的best paper,提出了一个统一的框架。A)里面蓝色的点和红色的点分别代表两种不同的语言句子。如何通过两种语言的单语数据构建翻译系统呢?首先我要做一个初始化,B)是初始化。首先构建一个词典,把这两种语言之间的词做一下对齐。C)是语言模型,基于单语数据,可以训练语言模型,用来衡量这个语言的流利度。那么D)是什么? D)是一个称作Back Translation的技术,是目前大家常用的一个用于增强数据的方法。用B)初始化后构建的一个词典,就可以从一种语言翻译为另外一种语言,哪怕是先基于词的翻译。然后,用另外一种语言的语言模型去对译文进行衡量。然后把得分高的句子挑出来,再翻译回去,这一过程称作Back Translation,然后再用原来那种语言的语言模型去衡量这个句子好还是不好。这样一轮一轮的迭代,数据就会变得越来越好,系统翻译质量也会越来越好。引入知识第三个挑战就是引入知识,如何将更多丰富的知识引入翻译模型是机器翻译长期面临的挑战。这个例子中,中文句子中『横流』对应到目标语言端是没有翻译出来的,用一个特殊的记号叫UNK(Unknown Word)来标记。那么我们做一个什么样的工作呢?我们引入了几种知识,第一种就是叫短语表或者叫词表。如果发现『横流』这个词没有被翻译出来,我们就去查这个词典,这个词典就作为一个外部知识被引入进来了。同时,那我们还引入了一个语言模型,语言模型去衡量目标语言的这个句子是不是流畅。同时,我们引入一个长度奖励特征去奖励长句子。因为句子越长,可能漏掉的信息就越少。这个工作首次将统计机器翻译中的特征引入神经网络翻译,可以作为引入知识的一个框架。但是目前来说,引入知识还是比较表层的。知识的引入,还需要更多更深入的工作。比如说这个例子, 这个句子是存在歧义的。『中巴』 在没有给上下文的时候,是无法判断『巴』是哪个国家的简称。但是下面的句子,有一个限定,“金砖框架”。这个时候,人们就知道该如何翻译了。但是,机器能不能知道?大家可以去翻译引擎上去验证。因为人是知道中国跟哪些国家是金砖国家,但是机器没有这个知识。怎么把这个知识交给机器去做,这是一个非常挑战的问题。还有一个挑战,是可解释性:神经网络翻译到底是神还是神经?虽然人们可以设计和调整网络结构,去优化系统,提高质量。但是对于该方法还缺乏深入的理解。也有很多工作去试图研究网络内部工作机理。清华大学有一篇文章从注意力的角度去进行研究。比如左边的例子,出现了一个UNK,那个UNK是怎么产生的,它虽然没有被翻译出来,但是出现在正确的位置,占了一个位置。通过Attention对应关系,可以看到这个UNK对应到『债务国』。右边例子是一个重复翻译的现象。神经网络机器翻译除了经常漏翻译之外,还会经常重复翻译。比如说出现了两个“history”。那么通过这个对应关系我们就可以看到,第6个位置上的“history”是重复出现的,它的出现不仅跟第一个位置“美国人”和第二个位置“历史”相关,还跟第5个位置“the”相关。因为产生了一个定冠词“the”,模型认为这个地方应该出现一个“history”,这篇文章对这样的例子进行了大量的分析,并且给出了一些分析结果和解决方案。如需进一步了解,可以看原始论文。还有第五个挑战 ,是机器翻译长期以来面临的挑战,语篇翻译。大部分的翻译系统现在所使用的翻译方法都是基于句子,以句子作为单位,一个句子一个句子的进行翻译。单看这三个句子翻译还可以接受。但是连起来看就觉得生硬不连贯。语篇翻译还有第五个挑战 ,是机器翻译长期以来面临的挑战,语篇翻译。大部分的翻译系统现在所使用的翻译方法都是基于句子,以句子作为单位,一个句子一个句子的进行翻译。单看这三个句子翻译还可以接受。但是连起来看就觉得生硬不连贯。我们的方法输出的结果。可以看到,定冠词、代词的加入提升了句子间的连贯性。我们提出了一个两步解码的方法。在第一轮解码中单独生成每个句子的初步翻译结果,在第二轮解码中利用第一轮翻译的结果进行翻译内容润色,并且提出使用增强式学习模型来奖励模型产生更流畅的译文。这是我们系统输出的一个结果,整体上,流畅度提高了。原文链接:打开CSDN,阅读体验更佳机器翻译技术的瓶颈提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言概述一、机器翻译的瓶颈在哪里?二、是否存在第四代机器翻译?三、自然语言处理的可解释性研究之争四、观众问答环节Q1:如何加入先验知识,引入外部知识或融合专业术语是不是一种途径?Q2:有没有可能现在已经出现了一些能超过 Transformer 的模型,但是这种WMT数据加上 BLEU 值的评测手段不能体现出其优势,未来应该设计怎样的评测手段,从而更好地推动机器翻译的发展?Q3:非常认同张民老师认为「翻译是再创造过程」的观点,其实从规继续访问ACL 2018 | TA-NMT:利用大语种语料,提升小语种神经机器翻译能力编者按:随着神经机器翻译的快速发展,英语、法语等大语种之间的翻译任务已经能够达到良好的翻译效果,而小语种的翻译仍然是一个难题。与大语种丰富的语料数据相比,小语种机器翻译面临的主要挑战是语料的稀疏性问题。为了更好地解决这一问题,微软亚洲研究院自然语言计算组提出了一个呈三角结构的神经机器翻译模...继续访问EMNLP 2019 | 大规模利用单语数据提升神经机器翻译BDTC大会官网:作者 | 吴郦军、夏应策来源 | 微软研究院AI头条(ID:MSRAsia)编者按:目前,目标语言端的无标注单语数据已被广泛应用于在机器翻译任务中。然而,目标语言端的无标注数据一旦使用不当,反而会给模型结果带来负面影响。为了有效利用大规模源语言端和目标语言端的单语数据,微软亚洲研究院在 EMNLP 2019 上发表的论文中,提出一...继续访问腾讯AI Lab涂兆鹏:如何提升神经网络翻译的忠实度 | 附PPT + 视频本文为 1 月 4 日,腾讯 AI Lab 高级研究员——涂兆鹏在第 22 期 PhD Talk 中的直播分享实录。机器翻译是自然语言处理的经典任务之一,涉及到自然语言处理的两个基本问题:语言理解和语言生成。这两个问题的建模直接对应译文的两个评价指标:忠实度(是否表达原文的完整意思)和流利度(译文是否流畅)。近几年来,神经网络机器翻译取得了巨大进展,成为了主流模型。神经网络由于能缓解数据稀疏性及捕继续访问干货 | 关于机器翻译,看这一篇就够了作者简介俞谦,携程度假大数据研发部算法工程师,主要负责机器翻译的研究与应用,目前专注于自然语言处理在垂域下的成熟解决方案。机器翻译技术的发展一直与计算机技术、信息论、语言...继续访问人工神经网络的算法原理,人工神经网络算法实例人工神经网络的优缺点人工神经网络由于模拟了大脑神经元的组织方式而具有了人脑功能的一些基本特征,为人工智能的研究开辟了新的途径,神经网络具有的优点在于:(1)并行分布性处理因为人工神经网络中的神经元排列并不是杂乱无章的,往往是分层或以一种有规律的序列排列,信号可以同时到达一批神经元的输入端,这种结构非常适合并行计算。(3)鲁棒性和容错性由于采用大量的神经元及其相互连接,具有联想记忆与联想映射能力,可以增强专家系统的容错能力,人工神经网络中少量的神经元发生失效或错误,不会对系统整体功能带来严重的影响。..继续访问神经翻译笔记5扩展b. 常用的机器翻译技巧文章目录神经翻译笔记5扩展b. 常用的机器翻译技巧组合解码单语数据应用重排序领域适配参考文献 神经翻译笔记5扩展b. 常用的机器翻译技巧 本节介绍提升机器翻译系统效果的常见手段。这些手段有些实际上是深度学习的通用技巧,有些在神经翻译出现后不久就被人提出,经过若干发展沿用至今,有些甚至在统计翻译时代就已出现。无论如何,这些手段独立于模型架构存在,都不仅能够增强模型效果,还展现了顽强的生命力以及良好的通用性 本节参考了Koehn的NMT综述、、三小节的内容,并根据个人喜好作了继续访问从冷战到深度学习,一文看懂机器翻译发展史点击上方“CSDN”,选择“置顶公众号”关键时刻,第一时间送达!CSDN编者友情提示:完成本篇阅读至少需要消耗一周能量,请提前收藏~~~图片来源于网络通常来讲,我打开Google翻译的次数是Facebook的两倍,对我来说即时翻译不再是“赛博朋克”专属的情节,它已经成为我们现实生活的一部分。很难想象,经过一个世纪的努力机器翻译的算法竟得以实现,期间甚至有一半的时间我们都觉察不到这项科技的发展。从搜继续访问机器翻译的局限一、多义性识别上的困难多义性指的是人们交际中所发出的信息在不同的语境下可以表现出多种不同的意义。这是机器翻译要解决的最基本的,也是最难解决的一个问题。如,今天是星期六对丈夫说,可能表示提醒孩子对父母说,可能表示这个孩子想放松,想要出去玩。老板对打工者说,可能表示今天上班算加班。从疲劳过度的学生口中说出来,可能表示今天向睡个懒觉。以上所局还可能有更多的例子,但是单单是这些继续访问神经网络机器翻译技术及应用(上)何中军,百度机器翻译技术负责人。本文根据作者2018年12月在全球架构师峰会上的特邀报告整理而成。 本报告分为以下5个部分: 机器翻译基本原理,介绍机器翻译原理、主要挑战、发展历程,及评价方法 神经网络机器翻译,介绍近年来迅速崛起的神经网络机器翻译 技术挑战,尽管神经网络机器翻译取得一系列较大的进展,但是仍然面临诸多挑战; 典型应用,机器翻译在生产、...继续访问论机器翻译之浅薄翻译 | shawn编辑 | 波波、费棋【AI科技大本营导读】尽管机器翻译明显玩不转备受期待的长篇内容,但我们得承认,在快速获知单词含义层面,它确实为人们提供了一定便利。可奇怪的是,无论媒体报道还是行业中都似乎营造了一种机器翻译马上要取代人类译者的气氛,这给了人们一种快要成了的错觉。有人要揭开盲目乐观的面纱,因《哥德尔、埃舍尔、巴赫》一书而获得普利策奖的美国学者侯世达是其中之一。他以自己亲身体继续访问机器翻译技术现状评述与展望 | 行业观察今天,你AI了没?关注:决策智能与机器学习,每天学点AI干货正文共:2497字7图预计阅读时间:7分

微软亚洲研究院论文

刘勃,周荷琴,魏铭旭. 一种基于颜色和运动信息的夜间车辆检测方法. 中国图象图形学报,, , 2005.刘勃,魏明旭,周荷琴. 一种基于区间分布的自适应背景提取算法.模式识别与人工智能, 18(3),2005. (EI)刘勃,魏明旭,周荷琴. 混合交通环境中阴影检测算法. 信号处理,21(2), Mei, Xian-Sheng Hua, He-Qin Zhou, Shipeng Li. Modeling and Mining of Users' Capture Intention for Home Videos, Accepted by IEEE Trans. on Multimedia (TMM).MEI Tao, ZHOU He-Qin, FENG Huan-Qing. Unsupervised Mining of Sports Video Structure with Mosaic. Journal of University of Science and Technology of China, , , , Apr. Mei, Xian-Sheng Hua, He-Qin Zhou. Tracking Users' Capture Intention: A Novel Complementary View for Home Video Content Analysis. In Proceedings of ACM International Conference on Multimedia (ACM MM), , Singapore, Nov. Mei, Cai-Zhi Zhu, He-Qin Zhou, Xian-Sheng Hua. Spatio-Temporal Quality Assessment for Home Videos. In Proceedings of ACM International Conference on Multimedia (ACM MM), pp. 439-442, Singapore, Nov. Mei, Xian-Sheng Hua, He-Qin Zhou, Shipeng Li, Hong-Jiang Zhang. EFFICIENT VIDEO MOSAICING BASED ON MOTION ANALYSIS. In Proceedings of IEEE International Conference on Image Processing (ICIP), Genoa, Italy, Sep. Mei, Xian-Sheng Hua, He-Qin Zhou, Shipeng Li. To Mine Capture Intention of Camcorder Users. In Proceedings of SPIE International Conference on Visual Communications and Image Processing (VCIP), pp. 268-275, Beijing, China, Jul. Mei, Yu-Fei Ma, He-Qin Zhou, Wei-Ying Ma, Hong-Jiang Video Mining with Mosaic. In Proceedings of IEEE International Multi-Media Modelling Conference (MMM), pp. 107-104, Melbourne, Australia, Jan. 2005.刘勃,魏明旭,周荷琴. 交通场景中分块阴影检测算法研究.计算机工程.31(11),2005周西汉,刘勃,周荷琴. 一种基于对称差分和背景消减的运动检测方法. 计算机仿真,22(4):117-119,123,2005武海澄,刘正敏,周荷琴. 磁共振成像系统中低阶平板式匀场线圈的设计,中国电机工程学报(EI),25(24), 2005: 154-159刘正敏, 周荷琴, 武海澄. 磁共振成像系统的一种快速涡流补偿方法. 中国医疗器械杂志. 29 (6), 2005: 410-413范欣,周荷琴,陈立群. 针对图象自适应显示的视觉注意力模型. 计算机仿真,22(6):53-56,2005诸葛斌,周荷琴等. 中国数字人数据集断层图象自动配准算法. 中国生物医学工程学报,24(4):443-447, 2005 (EI)诸葛斌,冯焕清,周荷琴,袁非牛. 医学图像表面重建中等值面的快速定位. 生物医学工程学杂志22(2):351-354, 2005诸葛斌,周荷琴等. 人体切片数据集颜色的自动校正方法. 航天医学与医学工程,18(3) (EI)诸葛斌,赵聪,周荷琴等. 基于裂隙扫描图象的角膜表面三维重建. 中国生物医学工程学报,24(3):353-356,2005 (EI)郎文辉,冯焕清,周荷琴等. 一种基于HIS的距离联合RGB三维场边缘探测方法. 中国图象图形学报,10(3):301-304, 2005郎文辉,冯焕清,周荷琴等. 基于亮度信息的人体解剖照片集直接成像方法. 中国科学技术大学学报,35(1):88-93, 2005袁非牛,廖光煊,范维澄,周荷琴. 基于光线投射算法的混合场景可视化. 中国图象图形学报,10(7): 2005Guodong Feng, Feng Li, Heqin Zhou, Huanqing Feng. A Mini PACS with High-level Image Postprocessing Function. Proc. of The 7th China-Japan-Korea Medical Informatics Conference. Shenzhen Wu,Feiniu Yuan,Heqin Zhou, etc. Proc. of The 7th China-Japan-Korea Medical Informatics Conference. Shenzhen Xie, Xin Fan, Wei-Ying Ma, He-Qin Zhou. Adapting Images on Proxies for Small Form Factor Devices, 4th IEEE Pacific-Rim Conference on Multimedia 2004.袁非牛,周荷琴等. 基于多重增量递推合采样点分解的求交算法. 北京生物医学工程,2(1):54-58,2004郎文辉,冯焕清,周荷琴,袁非牛. 使用VHD的可视人成像方法研究. 数据采集与处理, 19(2):135-139,2004诸葛斌,冯焕清,周荷琴. 医学图像表面重建中等值面的快速定位. 生物医学工程学杂志,22(2):351-354,2005周西汉,刘勃,周荷琴,袁非牛. 一种基于奔腾SIMD指令的快速背景提取方法. 计算机工程与应用. 40(27):81-83, 2004.刘勃,周荷琴. 基于贝叶斯网络的网络安全评估方法研究. 计算机工程,30(22):111-113,2004. (EI04528745431)Liu Bo,Zhou Xihan,Zhou Heqin. Vehicle Detection and Recognition in Multi-traffic Scenes. (5), .吴小培,冯焕清,周荷琴. 结合小波变换和独立分量分析的脑电特征提取. 仪器仪表学报,25(1),2004Ao Li, Minghui Wang, Dan Xie, Heqin Zhou, Huanqing Feng. A Novel Approach for Protein Subcellular Prediction Using PSI-BLAST and Support Vector Machine. Proc. of The 6th China-Japan-Korea Medical Informatics Conference. , 2004, Nov., Nagoya, Xie, Ao Li, Minghui Wang, Heqin Zhou, Huanqing Feng. LOCSVMpsi: A Subcellular Localization Web Server Based on A Novel Method Using Profile-based SVM. Proc. of The 6th China-Japan-Korea Medical Informatics Conference. , 2004, Nov., Nagoya, Feiniu, LIAO Guangxuan, FAN weicheng, ZHOU Heqin, FENG Huanqing. High Quality Interactive Volume Rendering Based on 3D Texture Mapping Using OpenGL SL. Proc. of The 6th China-Japan-Korea Medical Informatics Conference. . 2004, Nov., Nagoya, Japan.吴小培,李晓辉,冯焕清,周荷琴.基于盲源分离方法的工频干扰消除,信号处理,2003,19(1),81-84,2003诸葛斌,冯焕清,周荷琴.基于有序体数据的最大密度投影算法.中国科学技术大学学报,33(4):473-479,2003袁非牛,周荷琴等. 基于PC图形卡W-Buffer的交互直接体绘制.中国科学技术大学学报,33(4):480-485,2003袁非牛,诸葛斌,周荷琴,冯焕清.基于SIMD技术和阈值分割方法的快速体绘制算法.中国图形图像学报,8(12):2003诸葛斌,冯焕清,周荷琴. 医学图象体绘制中的快速三线性插值算法.航天医学与医学工程,16(3):206-209,2003袁非牛, 周荷琴等. 虚拟内窥镜系统中的自动导航. 航天医学与医学工程,16(3):201-205,2003Li-Qun Chen, Xing Xie, Xin Fan, Wei-Ying Ma, Hong-jiang Zhang, He-Qin Zhou. A visual attention model for adapting images on small displays, ACM Multimedia Systems Journal, , , p353-364, 2003.(SCI)Xin Fan, Xing Xie, He-Qin Zhou, Wei-Ying Ma. Looking into Video Frames on Small Displays. Proceedings of the 11th ACM international conference on Multimedia, p247-250, Berkeley, CA, USA, . (EI)Xin Fan, Xing Xie, Wei-Yang Ma, Hong-Jiang Zhou, Visual Attention Based Image Browsing on Mobile Devices, Proceedings of IEEE International Conference on Multimedia and Expo. 2003, , p53-56, Baltimore, MD, USA, , , , , : A Slicing Tree Based Web Page Representation for Various Display Sizes. The 12th International World Wide Web Conference(WWW2003), Budapest, HUNGRAY, May , , , , . Image Adaptation Based on Attention Model for Small-form-factor Devices, 9th International Conference on Multimedia Modeling, Taipei, Taiwan, Bin, FENG Huan-qing, ZHOU He-qin. Volume Rendering Based on Sorted Volumetric Data.航天医学与医学工程,16(4):243-247, LIU, Heqin ZHOU. Using Object Classification to Improve Urban Traffic Monitoring System. Proceddings of 2003 International Conference on Neural Networks and Signal Processing(ICNN), , 2003, Nanjing, p1155-1159 (ISTP)诸葛斌,冯焕清,周荷琴等. 基于PC机的医学图像三维表面重建. 航天医学与医学工程 , No 4, Mei, Qinghua Huang, Heqin Zhou, He Zhao and Huanqing Feng. An Improved Multiscale Image Enhancement via Laplacian Pyramid, The 2nd International Conference on Image and Graphics (ICIG), SPIE Vol. 4875, No. 1, pp. 402-410, Hefei, China, Aug. 2002.赵何,周荷琴等. 基于PC机的虚拟内窥镜成像算法. 航天医学与医学工程. , , 2002.黄庆华,周荷琴,冯焕清. 一种快速有效的脉冲噪声滤除方法. 计算机工程与应用. YUAN, Heqin ZHOU, He ZHAO, Huanqing FENG. Sampled points decomposing based ray casting for virtual endoscopy. The 2nd International Conference on Image and Graphics(ICIG), Hefei, MEI, Qinghua HUANG, Heqin ZHOU, He ZHAO and Huanqing FENG. An Improved Multiscale Image Enhancement via Laplacian Pyramid. The 2nd International Conference on Image and Graphics(ICIG), Hefei, .周荷琴,王恒良等. 心室Purkinje纤维传导系统的自动生成算法.北京生物医学工程., He, Zhou He-qin, Feng Huan-qing. Study on Imaging Algorithm of Virtual Endoscope System. Proc. Of 2001 Annual National Conference on Biomedical Electronics, Biomedical Measurement, Biomedical Information & Control, Biomedical Sensor techniques.梅 涛, 周荷琴, 冯焕清. 基于JPEG的多比特医学图像压缩方法. Proceedings of 2001 Annual National Conference on Biomedical Electronics, Measurement Information & Control, Sensor Techniques(CBME), Wuhan, Yonggang, Zhou Heqin, Feng Huanqing, Wang Hengliang. Parallel Algorithm for Calculation of Cell Dipoles in ECG Simulation. 《Proc. IEEE-EMBS Asia-Pasific Conf. On BME》, Hangzhou, Hengliang, Zhou Heqin, Feng Huanqing, Guo Yonggang. Error Analysis and Improvement on Simulation Algorithm of Excitation Propagation's Process of Cardiac Electricity. 《Proc. IEEE-EMBS Asia-Pasific Conf. On BME》, Hangzhou, 2000.周荷琴,王恒良,郭永刚,黄庆华,赵何等. 微机原理及应用多媒体CAI软件设计.中国科大学报., , 1999.周荷琴,冯雷,郭永刚.用屏蔽珠抑制高频电磁干扰.电子技术应用., , 1999.周荷琴,蔡方辉,王恒良,冯焕清,刘 兵.多参数监护仪的设计.中国医疗器械杂志., , 1999.周荷琴,孙景群,刘兵,冯焕清,江朝晖. 基于68HC05的心电OEM模块设计. 中国科技大学学报. , , 1998.周荷琴,杜克强,冯焕清. 基于OEM模块的自动血压血氧监护仪设计. 中国科技大学学报. , , 1998.获奖情况曾获中国科学院重大科研成果二等奖 3 项,安徽省教学成果二等奖 1 项,安徽省多媒体教学软件一、二等奖各 1 项。在研项目简介磁共振成像系统:控制器研发; 序列的自动参数调整; 3.图像伪影校正; 4.磁体的自动设计及优化.医学图像处理:1.图像压缩与增强; 2.三维重建和虚拟内窥; 3.医学图像存档与通信系统; 4.数字人.智能交通系统:1.基于视频的交通流量检测; 2.基于视频的交通事件检测与识别; 车载导航系统,GIS.与微软亚洲研究院合作项目:1.可扩展网页信息表征模型研究; 2.基于统计学习的事件检测.无线通信:1.基于OFDM的无线通信系统中若干技术研究; 2.低密度奇偶校验码(LDPC)的编解码方法研究;音频编码技术研究; 4.数字广播系统DRM在DSP上的实现.2.周荷琴 女,1955年出生,汉族,中共党员,大学学历,中学高级教师1973年——1996年 常州市二十四中工作1996年——1999年 常州市二十六中工作1999年——常州市实验初中工作2009年——常州外国语学校工作获奖情况及荣誉称号常州市优秀教育工作者江苏省优秀教育工作者常州市物理评优课一等奖江苏省物理评优课二等奖江苏省依法治校先进个人

2016年11月14日上午9点,中关村丹棱街5号微软大厦,李开复,张亚勤,沈向洋,洪小文,王坚等中国IT界的技术大佬,以及曾在微软亚洲研究院工作过的近200位院友“同框出现”,宣布“微软亚洲研究院院友会”正式成立:沈向洋担任会长,李开复和张亚勤任名誉会长,他们都是这家研究院曾经的院长。

坦率地讲,夹杂在繁芜的科技资讯信息流之中,这很难称得上是一条惹眼新闻,至少相比上述大佬的同框,几天之后张亚勤和沈向洋出现在乌镇的那一张饭局合影要更为被媒体所追捧。

但科技记者无法忽视的是,多年来,在稿子中描述圈内大佬过往履历时,“微软亚洲研究院”是一个高频词汇。翻看人物图谱,这里是阿里云之父,前金山CEO,百度总裁,小米总裁,海尔CTO, 联想CTO……互联网高管,以及浙江大学、中国科学技术大学、人民大学等国内一线大学计算机/信息技术院系负责人的上一处居心之所;这里和跨国巨头在中国的“办事处”关系不大,它更像是一座拥有18年校龄的“大学”。

中国IT界的黄埔军校,有人喜欢这么说。在院友会成立仪式上,院友代表阿里巴巴CTO王坚感喟:没有人可以绕开这个机构去谈论过去十几年的中国科技史。

一切得从往事谈起。

九八年的召唤

九十年代初——在最不可一世的岁月,来自西雅图的软件巨人却为创新乏力所困。微软前任首席技术官麦尔伏德在1991年建议盖茨成立带有“军备竞赛”属性的创新研究院,进行基础科学研究,以主动迎合技术世界的不确定性。这年,微软首座研究院在雷德蒙成立。

六年之后,麦尔伏德送给了盖茨第二个建议:将研究院开到中国。理由颇为机敏,到1990年代为止,美国一直是这个世界上每年诞生计算机博士最多的地方——直至被中国超越,这被麦尔伏德视作中国IT业态苏醒的前奏。

1998年,微软中国研究院在北京成立。37岁的语音识别专家李开复博士成为首任院长。18年后已成谈资的插曲是:当得知李开复要以“研究院”作为这座机构的后缀时,沈向洋博士大笑,“叫个‘所’都大了”——2001年中国研究院升级为微软亚洲研究院则是后事了。

至少在1998年,沈向洋有充分的理由自嘲。现任院长洪小文后来回忆:“研究院建立前,我到北京参与最初一批员工招募。有些候选人是国内高校博士生,我们只能通过固定电话联络,那时学校里通常一幢宿舍大楼只有一部电话,经常需要麻烦宿管老师或同学帮着叫人来接听。没有几个网站,没有太多信息资源,因而沟通时需要花很多时间同步基础信息,效率比较低。Email倒是能用,但拨号上网资费昂贵又不稳定,实时在线不大可能。”

1998年,每小时8块钱的上网费和4块钱的电话费让上网属于奢侈消费;这一年,配备Windows 95的个人电脑也实属高大上的新锐电器;在更为宏大的叙事里,这一年,中国GDP刚突破万亿美元大关,IT产业所占比重仅约为。

然而同样在1998年,互联网作为社会基础设施迎来破茧之日,一批互联网明日巨星集体相约九八:1998年9月4日,谷歌正式创立;中国则更是普遍把这一年视作商业互联网元年:2月,张朝阳创办搜狐;6月,刘强东成立京东;11月,腾讯诞生;12月,新浪上线。

机遇与挑战在1998年显得尤为冲突——但考虑到成立研究院的愿景,天平似乎更偏向挑战一端。

早在筹备阶段,比尔盖茨和里克·雷斯特博士——微软全球研究院体系的缔造者,就为研究院确立了三条宗旨:推动整个计算机科学前沿技术发展;将最新研究成果快速转化到微软关键产品之中,以帮助用户改善计算体验;着眼于下一代革命性技术研究,助力微软实现长远发展战略和对未来计算的美好构想。

所以你可以想象李开复说服海外精英归国的不易,上述宏愿与当时中国的外部环境格格不入。不过事实美好的一端也成为18年后院友会成立仪式上李开复追忆的画面:“我在卡内基梅隆大学读书时有位同学叫沈为民,写代码非常厉害,我说你是怎么做到的。他说我们在国内都是在纸上写代码,老师则用脑子来运行这个程序。当时给我的感触是,如果能在纸上培养出沈为民这样的人,这样的人才肯定还有很多,一起做研究院一定能做出来。我当时也是抱着这样乐观的心态就回来了。”而中国的人才也是当年比尔盖茨所看重的。

后面的事情令人欣喜,研究院开始在全球顶级学术会议与期刊崭露头角,尤其2002年,他们在计算机科研领域最富盛名的国际图形学年会SIGGRAPH上发表了4篇论文——长久以来这种国际大会鲜有华人身影。

有人后来回忆,当年前去知春路希格玛大厦(研究院旧址)“朝圣”的年轻人一定会颇为失望,一切看上去与其他企业别无二致,除了目光中的这位“理工男”可能刚在国际期刊发表了一篇重要论文。

人工智能的延续

如今十八年过去,微软亚洲研究院当年的愿景已兑换成国际顶级学术会议与期刊上的4000余篇论文。更重要的是,脱胎于这里的技术也转移到微软产品矩阵中——Office,Windows,Bing,Kinect,以及小冰,Cortana,SkypeTranslator等人工智能产品,都有亚洲研究院的身影。

事实上,在人工智能还是个模糊概念,甚至不被学术界普遍承认的岁月,研究院就已将其视作面向未来的基础研究。1999年研究院成立一周年时即确立了最初的几个研究中心:语音组,多媒体组,图形图像组——如今它们都更像是人工智能概念的一部分。

李开复多年后坦言:中国如今能在人工智能领域扮演重要作用,很大程度上要归功于研究院很早开始便在语音识别,自然语言理解等众多人工智能核心技术进行研究。“中国今天的成就真的应该感谢微软亚洲研究院。”

不过,这种“感谢”对于研究院来说,似乎也意味着成长的烦恼。几年前开始,中国科技公司就积极网罗人工智能领域的精英,可以想象,微软亚洲研究院作为最密集的人才聚集地成为了被挖的目标。

事实上,研究院早已熟悉了人才的流动——这也是成立院友会的原因之一。

十八年前,这个国度最顶尖的技术头脑纷纷从美国的高校和科技企业来到微软;十八年后,技术后辈有了更多良禽择木的可能——聪明的大脑不再浓烈地聚集一地,而是稀释在各个地方。他们有些人继续留下来从事自己最热爱的研究,有些人选择离开去领导更大的团队做产品开发,有些人选择到大学任教,有些人则选择在中国这片创业热土圆梦。

命运自有时。如今研究院的愿景落在了醉心于科研的技术信仰者身上。说来宿命的是,就像某种轮回,当人工智能的概念挥别往日的“扭捏”而摇身蜕变为技术界的狂欢,这里的研究员或许比十八年前的前辈更为幸运。他们赶上了人工智能的黄金年代,可以肆意挥洒禀赋,紧跟这一技术的变迁孕育更多可能,且已收获颇丰。

随意摘取几例。去年底在ImageNet计算机视觉识别挑战赛——这一行业标杆属性的赛事上,微软亚洲研究院视觉计算组凭借深层神经网络技术的突破(使用了一种深度高达百层的神经网络,这要比过往任何成功使用的神经网络层数多5倍以上),获得图像分类,图像定位以及图像检测全部三个主要项目的冠军。几乎同一时刻,他们在另一项图像识别挑战赛MS COCO中的图像检测和图像分割项目上同样登顶——而一年过去,今年10月,他们在MS COCO图像分割挑战赛中获得第一名,成绩比第二名高出11%,且相较去年第一名的成绩也有飞跃进步。

在用户一端,承载技术的是应用——这也是微软亚洲研究院近些年最令人欣喜的地方。

去年,在中国登陆的Skype Translator实时语音翻译技术,就凝聚了研究院在语音识别,自动翻译和机器学习等多领域的成果,让世界上使用人数最多的语言和使用最广泛的语言直接对话成为可能。

而在风靡全球的(识别图片中人物的年龄)、(智能识图网站)等应用,同样基于研究院深耕多年的人脸识别技术。

当然,谈及人工智能应用,刷屏无数的小冰是绕不开的名字。抛开插科打诨不谈,我个人更看重的是它与其他行业的嫁接空间。譬如今年9月,小冰就进驻了“敦煌研究院”微信,摇身变为“敦煌小冰”,言谈之间告知人们关于敦煌的一切知识。嫁接得以实现,一项关键技术是微软亚洲研究院推出的自主知识学习技术(Doc Chat):一种基于检索与排序直接从非结构化文档中选取句子作为聊天机器人回复的方法。这一技术也已运用于今年8月发布的第四代微软小冰跨平台商业解决方案,可让小冰更轻松地学习不同领域知识,完成更多嫁接可能。

尽管换了“标题”和讲述者,但这里与人工智能从十八年前开始诉说的故事仍在继续。

基因传承

故事得以延续的前提是传承,研究为先,自由开放的环境与体系得以让这里相对纯粹的“传帮接带”。

事实上,那些离开的人几乎无一例外地珍视这段纯粹的职业生涯。而当他们追忆微软岁月,“感谢”与“传承”总是并列出现。“在现在的创业路上,研究院的文化氛围也深深的影响着我们的公司文化,感谢研究院,感谢当年指导我们的Mentors,感谢一起实习的小伙伴们。”已在创业的蔡东翔院友这样说道,“希望Mentor文化可以在院友会得到一个很好的传承。”

同样作为院友,清华大学计算机系副教授朱军则将传承细化:“我在研究院实习3年多……现在还清晰记得,第一天面试时问我‘为何读博士?’,这成了我现在面试学生必问的题目。Harry(沈向洋)的‘work hard, play harder’是我记得最清楚的一句话,现在也拿来教育学生。”

传承仍在继续。在不少院友看来,如今,院友会的成立可以发挥桥梁与纽带作用,分享经验与资源,甚至在某些奇特的瞬间感到从未离开过一样。这有点像是管理界颇为盛行的联盟关系,当人们离开一个地方,可以通过“同事联络网”成为这个地方的支持者和外部资源,并将它身上的基因散播到更远处。

好吧,也许正如罗振宇所说:世界上至少有两种游戏,一种是有限游戏,一种是无限游戏。有限游戏以游戏结束为目的,比的是谁能赢;无限游戏则是让游戏本身继续下去,而不是让谁赢,卷入的资源越多,参与的人数越多,游戏就能继续下去,这才是无限游戏的目标,也正是那些“老公司”的价值所在。

在我看来,这也正是微软亚洲研究院——这一席“流动的盛宴”,留给技术世界的真正财富。

李北辰/文(知名科技自媒体,致力于用文字优雅的文章,为您提供谈资与见识;微信公号:李北辰)

漏译的原因是什么,如何解决这个问题?这方面有很多工作,下面我就从几个方面去讲一下。我们今年有一篇论文从数据方面去分析。我们发现漏译与词语的熵成正相关关系,这个词的熵越大,漏译的可能性越大。它所对应的目标语言词越多,概率越分散(熵越大),越有可能被漏译。左边的例子,S1对应3种不同的翻译,(s1,t1) (s1,t2) (s1, t3 t4),它的熵就比较大。我们把所有对应的翻译统一替换为一个特殊词『stoken4s1』,以降低词语翻译的熵值。右边呢是我们提出来的三种方法,去改善翻译结果,包括pre-training, multitask learning, two-pass decoding。大家有兴趣的话,可以去看论文。从实验结果来看,相比Transformer,在中英翻译质量上有显著提高,高熵值词语的漏译比例显著下降。数据稀疏第二个挑战就是数据稀疏。相比于统计机器翻译,这个问题对神经网络翻译而言,更严重。实验表明,神经网络对于数据量更敏感。针对数据稀疏问题,我们提出了一个多任务学习的多语言翻译模型。在进行多语言翻译的时候,源语言共享编码器,在解码端,不同的语言,使用不同的解码器。这样在源语言端就会共享编码器的信息,从而缓解数据稀疏问题。后来,加拿大蒙特利尔大学、Google等在此方向上陆续开展了多个工作。实验表明,我们的方法收敛更快,翻译质量也明显提高。更多细节,请阅读论文。这篇论文是2018年EMNLP上的best paper,提出了一个统一的框架。A)里面蓝色的点和红色的点分别代表两种不同的语言句子。如何通过两种语言的单语数据构建翻译系统呢?首先我要做一个初始化,B)是初始化。首先构建一个词典,把这两种语言之间的词做一下对齐。C)是语言模型,基于单语数据,可以训练语言模型,用来衡量这个语言的流利度。那么D)是什么? D)是一个称作Back Translation的技术,是目前大家常用的一个用于增强数据的方法。用B)初始化后构建的一个词典,就可以从一种语言翻译为另外一种语言,哪怕是先基于词的翻译。然后,用另外一种语言的语言模型去对译文进行衡量。然后把得分高的句子挑出来,再翻译回去,这一过程称作Back Translation,然后再用原来那种语言的语言模型去衡量这个句子好还是不好。这样一轮一轮的迭代,数据就会变得越来越好,系统翻译质量也会越来越好。引入知识第三个挑战就是引入知识,如何将更多丰富的知识引入翻译模型是机器翻译长期面临的挑战。这个例子中,中文句子中『横流』对应到目标语言端是没有翻译出来的,用一个特殊的记号叫UNK(Unknown Word)来标记。那么我们做一个什么样的工作呢?我们引入了几种知识,第一种就是叫短语表或者叫词表。如果发现『横流』这个词没有被翻译出来,我们就去查这个词典,这个词典就作为一个外部知识被引入进来了。同时,那我们还引入了一个语言模型,语言模型去衡量目标语言的这个句子是不是流畅。同时,我们引入一个长度奖励特征去奖励长句子。因为句子越长,可能漏掉的信息就越少。这个工作首次将统计机器翻译中的特征引入神经网络翻译,可以作为引入知识的一个框架。但是目前来说,引入知识还是比较表层的。知识的引入,还需要更多更深入的工作。比如说这个例子, 这个句子是存在歧义的。『中巴』 在没有给上下文的时候,是无法判断『巴』是哪个国家的简称。但是下面的句子,有一个限定,“金砖框架”。这个时候,人们就知道该如何翻译了。但是,机器能不能知道?大家可以去翻译引擎上去验证。因为人是知道中国跟哪些国家是金砖国家,但是机器没有这个知识。怎么把这个知识交给机器去做,这是一个非常挑战的问题。还有一个挑战,是可解释性:神经网络翻译到底是神还是神经?虽然人们可以设计和调整网络结构,去优化系统,提高质量。但是对于该方法还缺乏深入的理解。也有很多工作去试图研究网络内部工作机理。清华大学有一篇文章从注意力的角度去进行研究。比如左边的例子,出现了一个UNK,那个UNK是怎么产生的,它虽然没有被翻译出来,但是出现在正确的位置,占了一个位置。通过Attention对应关系,可以看到这个UNK对应到『债务国』。右边例子是一个重复翻译的现象。神经网络机器翻译除了经常漏翻译之外,还会经常重复翻译。比如说出现了两个“history”。那么通过这个对应关系我们就可以看到,第6个位置上的“history”是重复出现的,它的出现不仅跟第一个位置“美国人”和第二个位置“历史”相关,还跟第5个位置“the”相关。因为产生了一个定冠词“the”,模型认为这个地方应该出现一个“history”,这篇文章对这样的例子进行了大量的分析,并且给出了一些分析结果和解决方案。如需进一步了解,可以看原始论文。还有第五个挑战 ,是机器翻译长期以来面临的挑战,语篇翻译。大部分的翻译系统现在所使用的翻译方法都是基于句子,以句子作为单位,一个句子一个句子的进行翻译。单看这三个句子翻译还可以接受。但是连起来看就觉得生硬不连贯。语篇翻译还有第五个挑战 ,是机器翻译长期以来面临的挑战,语篇翻译。大部分的翻译系统现在所使用的翻译方法都是基于句子,以句子作为单位,一个句子一个句子的进行翻译。单看这三个句子翻译还可以接受。但是连起来看就觉得生硬不连贯。我们的方法输出的结果。可以看到,定冠词、代词的加入提升了句子间的连贯性。我们提出了一个两步解码的方法。在第一轮解码中单独生成每个句子的初步翻译结果,在第二轮解码中利用第一轮翻译的结果进行翻译内容润色,并且提出使用增强式学习模型来奖励模型产生更流畅的译文。这是我们系统输出的一个结果,整体上,流畅度提高了。原文链接:打开CSDN,阅读体验更佳机器翻译技术的瓶颈提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言概述一、机器翻译的瓶颈在哪里?二、是否存在第四代机器翻译?三、自然语言处理的可解释性研究之争四、观众问答环节Q1:如何加入先验知识,引入外部知识或融合专业术语是不是一种途径?Q2:有没有可能现在已经出现了一些能超过 Transformer 的模型,但是这种WMT数据加上 BLEU 值的评测手段不能体现出其优势,未来应该设计怎样的评测手段,从而更好地推动机器翻译的发展?Q3:非常认同张民老师认为「翻译是再创造过程」的观点,其实从规继续访问ACL 2018 | TA-NMT:利用大语种语料,提升小语种神经机器翻译能力编者按:随着神经机器翻译的快速发展,英语、法语等大语种之间的翻译任务已经能够达到良好的翻译效果,而小语种的翻译仍然是一个难题。与大语种丰富的语料数据相比,小语种机器翻译面临的主要挑战是语料的稀疏性问题。为了更好地解决这一问题,微软亚洲研究院自然语言计算组提出了一个呈三角结构的神经机器翻译模...继续访问EMNLP 2019 | 大规模利用单语数据提升神经机器翻译BDTC大会官网:作者 | 吴郦军、夏应策来源 | 微软研究院AI头条(ID:MSRAsia)编者按:目前,目标语言端的无标注单语数据已被广泛应用于在机器翻译任务中。然而,目标语言端的无标注数据一旦使用不当,反而会给模型结果带来负面影响。为了有效利用大规模源语言端和目标语言端的单语数据,微软亚洲研究院在 EMNLP 2019 上发表的论文中,提出一...继续访问腾讯AI Lab涂兆鹏:如何提升神经网络翻译的忠实度 | 附PPT + 视频本文为 1 月 4 日,腾讯 AI Lab 高级研究员——涂兆鹏在第 22 期 PhD Talk 中的直播分享实录。机器翻译是自然语言处理的经典任务之一,涉及到自然语言处理的两个基本问题:语言理解和语言生成。这两个问题的建模直接对应译文的两个评价指标:忠实度(是否表达原文的完整意思)和流利度(译文是否流畅)。近几年来,神经网络机器翻译取得了巨大进展,成为了主流模型。神经网络由于能缓解数据稀疏性及捕继续访问干货 | 关于机器翻译,看这一篇就够了作者简介俞谦,携程度假大数据研发部算法工程师,主要负责机器翻译的研究与应用,目前专注于自然语言处理在垂域下的成熟解决方案。机器翻译技术的发展一直与计算机技术、信息论、语言...继续访问人工神经网络的算法原理,人工神经网络算法实例人工神经网络的优缺点人工神经网络由于模拟了大脑神经元的组织方式而具有了人脑功能的一些基本特征,为人工智能的研究开辟了新的途径,神经网络具有的优点在于:(1)并行分布性处理因为人工神经网络中的神经元排列并不是杂乱无章的,往往是分层或以一种有规律的序列排列,信号可以同时到达一批神经元的输入端,这种结构非常适合并行计算。(3)鲁棒性和容错性由于采用大量的神经元及其相互连接,具有联想记忆与联想映射能力,可以增强专家系统的容错能力,人工神经网络中少量的神经元发生失效或错误,不会对系统整体功能带来严重的影响。..继续访问神经翻译笔记5扩展b. 常用的机器翻译技巧文章目录神经翻译笔记5扩展b. 常用的机器翻译技巧组合解码单语数据应用重排序领域适配参考文献 神经翻译笔记5扩展b. 常用的机器翻译技巧 本节介绍提升机器翻译系统效果的常见手段。这些手段有些实际上是深度学习的通用技巧,有些在神经翻译出现后不久就被人提出,经过若干发展沿用至今,有些甚至在统计翻译时代就已出现。无论如何,这些手段独立于模型架构存在,都不仅能够增强模型效果,还展现了顽强的生命力以及良好的通用性 本节参考了Koehn的NMT综述、、三小节的内容,并根据个人喜好作了继续访问从冷战到深度学习,一文看懂机器翻译发展史点击上方“CSDN”,选择“置顶公众号”关键时刻,第一时间送达!CSDN编者友情提示:完成本篇阅读至少需要消耗一周能量,请提前收藏~~~图片来源于网络通常来讲,我打开Google翻译的次数是Facebook的两倍,对我来说即时翻译不再是“赛博朋克”专属的情节,它已经成为我们现实生活的一部分。很难想象,经过一个世纪的努力机器翻译的算法竟得以实现,期间甚至有一半的时间我们都觉察不到这项科技的发展。从搜继续访问机器翻译的局限一、多义性识别上的困难多义性指的是人们交际中所发出的信息在不同的语境下可以表现出多种不同的意义。这是机器翻译要解决的最基本的,也是最难解决的一个问题。如,今天是星期六对丈夫说,可能表示提醒孩子对父母说,可能表示这个孩子想放松,想要出去玩。老板对打工者说,可能表示今天上班算加班。从疲劳过度的学生口中说出来,可能表示今天向睡个懒觉。以上所局还可能有更多的例子,但是单单是这些继续访问神经网络机器翻译技术及应用(上)何中军,百度机器翻译技术负责人。本文根据作者2018年12月在全球架构师峰会上的特邀报告整理而成。 本报告分为以下5个部分: 机器翻译基本原理,介绍机器翻译原理、主要挑战、发展历程,及评价方法 神经网络机器翻译,介绍近年来迅速崛起的神经网络机器翻译 技术挑战,尽管神经网络机器翻译取得一系列较大的进展,但是仍然面临诸多挑战; 典型应用,机器翻译在生产、...继续访问论机器翻译之浅薄翻译 | shawn编辑 | 波波、费棋【AI科技大本营导读】尽管机器翻译明显玩不转备受期待的长篇内容,但我们得承认,在快速获知单词含义层面,它确实为人们提供了一定便利。可奇怪的是,无论媒体报道还是行业中都似乎营造了一种机器翻译马上要取代人类译者的气氛,这给了人们一种快要成了的错觉。有人要揭开盲目乐观的面纱,因《哥德尔、埃舍尔、巴赫》一书而获得普利策奖的美国学者侯世达是其中之一。他以自己亲身体继续访问机器翻译技术现状评述与展望 | 行业观察今天,你AI了没?关注:决策智能与机器学习,每天学点AI干货正文共:2497字7图预计阅读时间:7分

亚洲研究院精选论文

院长 洪小文博士洪小文博士现任微软亚洲研究院院长,负责研究院在互联网搜索、数据挖掘、语音技术,及自然语言处理技术、系统、无线与网络、平台器件以及媒体通信等领域的研究管理工作。洪博士同时还负责搜索技术中心(STC)及MSN/Live在中国搜索产品的开发。来到中国之前,洪博士曾担任微软公司自然互动服务部门的架构师,在架构和技术层面上对微软语音服务器、自然用户界面平台和微软支持平台等诸多获奖产品的开发做出了突出的贡献。洪博士1995年加入微软总部任高级研究员。此前,洪博士曾任苹果公司的Apple-ISS研究中心的技术总监,带领其团队研发出苹果中文听写机产品并获得多项工业界大奖。洪小文博士是美国电机电子工程师学会院士(IEEEFellow)和《Communication of the ACM》期刊的编委,在多种国际著名学术刊物及大会上发表过100多篇的学术论文。洪博士毕业于台湾大学,获得电机工程学士学位,之后继续深造于卡内基梅隆大学,并先后获得计算机科学硕士及博士学位。常务副院长 马维英博士作为微软亚洲研究院的常务副院长,马维英博士负责带领研究团队从事互联网搜索和数据挖掘、自然语言计算以及人机交互等领域的研究工作。过去几年里,马维英博士的研究团队已经有大量的核心技术转化进微软搜索和在线服务产品中。他的团队还在国际重要学术会议和期刊上发表了许多高水平论文,包括国际信息检索大会(SIGIR)、国际互联网大会(WWW)和国际多媒体大会(ACM Multimedia)等。在马博士的带领下,他的团队在互联网搜索和数据挖掘以及多媒体信息检索等研究领域的突出成就得到国际学术界的广泛认可。在2001年加入微软亚洲研究院之前,马维英博士从1997年开始一直在美国加州的惠普实验室工作,从事多媒体自适应传输和移动因特网的分布式多媒体服务系统的研究。从1994年到1997年攻读博士学位期间,马维英博士参与了加州大学圣芭芭拉分校的Alexandria数字图书馆(Alexandria Digital Library)项目,在此过程中,他开发的互联网图像检索系统Netra被其他研究人员广泛引用,并且被认为是最具代表性的图像检索系统之一。马维英博士是ACM信息系统学刊(TOIS)和ACM/Springer多媒体系统学报的编委。同时,他是第17届国际互联网大会(WWW)的程序委员会联合主席,2007环太平洋多媒体大会(PCM)的程序委员会主席,2008亚洲信息检索研讨会(AIRS)联合主席。马维英博士曾经担任过2005国际多媒体建模大会 (MMM) 、2005国际图像和视频检索大会 (CIVR) 的联合主席。另外,他还参与组织其他许多国际重要会议并担任程序委员会成员,比如ACM Multimedia, SIGIR, CIKM, KDD, 和WWW等学术大会。迄今为止,马维英博士已经在互联网搜索、信息检索、基于内容的图像检索、数据挖掘、自适应内容传输和移动访问等领域发表了250余篇论文。马维英博士于1990年本科毕业于台湾清华大学电气工程系,之后于1994年和1997年分别获得美国加州大学圣芭芭拉分校(UCSB)电气和计算机工程系硕士和博士学位。常务副院长 郭百宁博士郭百宁博士现为微软亚洲研究院副院长,主要从事网络图形学技术、基于网络应用的虚拟环境技术、几何模型、基于图像的模型和绘制、纹理合成、真实感图形图像技术等领域的研究。郭百宁博士是美国电气电子工程师协会视觉及计算机图形学会刊的副主编。他曾经担任过国际程序委员会的委员,参加过多届国际图形学大会,包括美国计算机学会举办的国际计算机图形学大会(ACM SIGGRAPH),美国电气电子工程师协会举办的国际计算机可视化大会(IEEE Visualization),欧洲计算机绘制技术大会(Eurographics Symposium on Rendering),亚太计算机图形学大会(Pacific Graphics),美国计算机学会举办的虚拟现实软件与技术大会(ACM Symposium on Virtual Reality Software and Technology),美国计算机学会举办的固体与物理建模大会(ACM Symposium on Solid and Physical Modeling)。郭博士在国际著名杂志和学术会议上发表了七十多篇学术论文并拥有四十多项技术专利。郭百宁博士于1999年加盟微软中国研究院(亚洲研究院前身)。此前他是美国英特尔公司硅谷总部研究院的资深研究员,负责下一代图形系统的研究。郭百宁博士在美国康乃尔大学获得硕士和博士学位,在北京大学获得学士学位。常务副院长 赵峰博士赵峰博士,微软亚洲研究院常务副院长,主要负责机算机系统、无线与网络、硬件计算、软件分析等领域的研究工作。在加入微软亚洲研究院之前,赵博士是微软总部雷德蒙研究院的首席研究员,负责网络嵌入式计算组。他领导开发了微软研究院传感器尘粒、微型网络服务、SenseWeb和SensorMap、数据中心基因组、焦耳计量器以及GAMPS数据压缩。 借助多项赵博士研发的技术,如今的微软数据中心被誉为全球仪表化与监控最为密集的云计算基础架构。赵博士是美国电机电子工程师学会院士(IEEE Fellow),《美国计算机学会传感网络汇刊》(ACM Transactions on Sensor Networks)的创刊总编辑,并且撰写或合作撰写了超过100篇技术论文和书籍,其中包括摩根考夫曼出版的《无线传感器网络:信息处理方法》(与Leo Guibas合著)。赵博士获得过许多奖项,其中包括美国斯隆研究奖(Sloan Research Fellow), 美国国家科学基金青年研究奖(US National Science Foundation (NSF) Young Investigator Award )与美国海军研究局青年研究奖(Office of Naval Research (ONR) Young Investigator Award)。他的研究曾被BBC国际频道,商业周刊及科技评论等著名新闻媒体报道。赵博士毕业于上海交通大学,并在美国麻省理工学院(MIT) 获得电机工程与计算机科学博士学位。在加入微软之前赵博士曾在位于硅谷的施乐帕洛阿尔托研究中心(Xerox Palo Alto Research Center) 担任首席科学家工作,领导该中心的传感器网络研究,并任教于美国俄亥俄州立大学和斯坦福大学。技术战略总监 张益肇博士张益肇博士于1999年7月加盟微软亚洲研究院,从事语音方面的研究工作。 现任微软亚洲研究院资深技术战略总监,负责研究项目沟通,知识产权资产管理,新的研究课题管理。履任微软亚洲研究院新职位之前,张博士任微软亚洲工程院副院长,是2003年工程院的创建者之一。在工程院,他带领团队开发Windows Mobile和Windows的产品,并建立起一支多学科技术产品孵化的团队。在加入工程院之前,张博士曾担任研究院语音组主任研究员和高校关系总监,他的团队成功的把汉语普通话语音识别引擎转化到了中文版Office和Windows中。他曾是Nuance Communications公司研究部的创始人之一,该公司是电信领域自然语言界面研究的先驱。在Nuance工作期间,他曾从事自信度分析,声学建模,语音检测等领域的研究工作。他领导研究人员开发了 Nuance产品的日文版本,这是世界上第一个开放式日语语音识别系统。他还曾在麻省理工的林肯实验室开发出了新的语音识别算法,在东芝 ULSI 研究中心发明了一种新的电路优化技术,在通用电气公司的研发中心开展了模式识别方面的研究。张博士毕业于麻省理工学院,获电气工程和计算机科学学士、硕士和博士学位。他在国际著名的杂志和学术会议上发表了多篇关于语音技术和机器学习方面的论文,是多项专利的拥有者。副院长 李世鹏博士李世鹏博士于1999年5月加入微软亚洲研究院,现任副院长、首席研究员及多媒体计算组主任研究员。李博士同时负责协调微软亚洲研究院多媒体领域的研究工作。他的研究兴趣为信号与图像处理、媒体内容分析、图像与视频编码、高清电视技术、多媒体在无线与网络上的通信与在线播放技术、可伸缩媒体编码技术、应用层网络技术、数字版权管理、无线通信与网络、P2P网络技术、新媒体格式及系统、多媒体广告技术、数字医疗及用户意向挖掘等等。从1996年10月至1999年5月,李博士在美国Sarnoff公司(前身为David Sarnoff研究中心及RCA实验室)多媒体技术实验室任研究员。李博士致力于广泛的多媒体领域的研究工作。他对MPEG-4和国际标准里图像和视频编码技术作出重大贡献。1998年他发明和研制了世界上第一个高质量低成本的高清电视解码器。早在2000年他就在微软亚洲研究院发起了P2P传输流媒体的研究工作。他带领他的团队在2001年率先成功地研发了横跨太平洋的基于可伸缩视频编码的流媒体系统原型。他是可伸缩编码的倡导者并对国际标准里的可伸缩扩展标准的制定起了巨大的推进作用。他于2006年首先提出5“D”的多媒体概念,对新一代互联网多媒体的研究和发展指出了方向。他在图象/视频处理、压缩和通信、数字电视、多媒体及无线通信领域写作和合著超过200多篇国际学术论文,还拥有60多项被批准的和90多项正在被批准的相关美国专利。他合著了Marcel Dekker出版的专著《多媒体系统、标准和网络》(2000)、Wiley & Sons出版的《Wiley通信大百科全书》(2003)、Academic Press出版的《IP与无线网络中的多媒体》(2005)中的有关多媒体编码的章节。他合编了SPIE出版的《视觉通信及图像处理专刊》(2005)以及Springer出版的《计算机科学讲座:多媒体信息处理进展》(2008)。李博士是IEEE电路和系统协会视频信号处理和通信委员会秘书长、多媒体系统与应用委员会会员,IEEE通信协会多媒体通信委员会委员,IEEE信号处理协会多媒体信号处理委员会历任委员。他现任《IEEE视频技术的电路与系统》期刊及《视频通信和图像表达》期刊的副主编。他担任过IEEE PCM2000特殊程序主席、IEEE PCM2001会务主席、VCIP2005程序主席、Packet Video 2006大会主席、ICME 2006领域主席、IEEE ISM 2006宣传主席、IEEE PSIVT 2006主题主席、IEEE SiPS 2007评奖主席、IEEE ICME 2007特殊程序主席、PCM 2008的程序主席、及ISCAS 2009领域主席。他还担任着VCIP 2010和CIVR 2010的大会主席。李博士同时还在几十个国际多媒体大会上担任过技术委员会委员。李博士是山东大学、四川大学、华中科技大学、上海交通大学、香港中文大学、南开大学和天津大学的客座教授,同时也是中国科学技术大学和上海交通大学的兼职博导。李博士于1988和1991分别获得中国科学技术大学无线电系学士和硕士学位。他于1996年获得美国宾州Lehigh大学的电机系博士学位。他曾于1991至1992在中国科学技术大学无线电系任助教。李博士是中国科学技术大学历史上至今唯一的一个两次(1987、1991)郭沫若奖学金的获得者。他也是第一个同年获得两次Sarnoff成就奖的研究员 (1997)。李博士曾获得VCIP 2007最佳论文奖、MMSP 2008最佳论文奖(海报)、以及《IEEE视频技术的电路与系统》期刊(2009)最佳论文奖。他指导的学生获得了VCIP 2005最佳学生论文奖。在微软亚洲研究院的十年中,李博士培养了三位MIT TR35奖(世界上35岁以下的最有潜力的35位创新者)的获得者。副院长 张峥博士张峥博士于2002年加入微软亚洲研究院多媒体组,任项目负责人。张峥博士是微软亚洲研究院副院长兼首席研究员,负责系统和网络研究领域(含系统研究组和无线和网络研究组)。张峥博士曾任多个国际会议技术委员会委员,包括IPTPS, ICDCS, WWW, USENIX MobiSys,USENIX ATC等。张峥博士1984年就读于复旦大学电子工程系;1987年作为复旦大学首批本科跳级的13名学生之一进入研究生课程;1990年赴美国德州大学达拉斯分校留学;1992年获硕士学位后,于1993年春转至伊利诺思香槟分校求学(UIUC),并于1996年秋获得博士学位。 此后,张峥博士一直在惠普中央实验室工作,其研究领域涉及高性能超级计算机系统结构和大规模分布式系统, 有多项成果在国际相关会议发表,取得专利,并成功转移到产品中。张峥博士也是网络杂志《新语丝》和 《 国风》的创办人之一,以“竹人”为笔名主持编辑《海外留学生年度诗选》首二卷,并曾在 《国风》主持 《艺廊》及 《半瓶诗铺》专栏。副院长 宋罗兰宋罗兰于1994年加入美国微软任系统工程师,之后前往东京负责微软在中国、日本、韩国、台湾、香港等国家及地区的商业应用系统开发,包括销售、市场、客户支持、人事以及行政。她成功管理过多个关键项目并积累了丰富的技术管理经验。她建立了一个全新的亚洲区IT团队:从招聘人才,制定战略计划,到管理几百万美金的运作资金。因为出色的工作,宋罗兰被提升为高级地区IT经理,负责亚洲12个子公司的业务。1999年宋罗兰回到美国总部担任高级项目经理,负责系统设计、开发、测试以及公司网站的后台主要系统运作支持。其后,她作为高级商务经理,开发全球技术社区,并与亚洲、欧洲、非洲、以及拉美的团队一起将“MVP”(最有价值的专家)推广到全球,使之成为全球技术社区最成功的项目之一。经过19年的海外生活,宋罗兰于2004年8月回到北京出任微软亚洲研究院高校关系部总监,负责整个亚洲地区的高校关系。她以极大的热情投入到新的工作中,并希望她的热情与经验能够帮助年轻一代挖掘并能完全发挥他们的潜质。

高文斐和宋犀堃都是非常优秀的回话技术专家,他们在自然语言处理和方面都有深厚的研究和实践经验。因此,无法一概而论哪一个更好。高文斐毕业于清华大学,曾担任微软亚洲研究院研究员,是对话系统领域的专家。他参与主持了多个国家级重点项目,发表了多篇高质量论文。高文斐在对话生成、对话情感分析以及机器翻译等领域均取得了非常显著的成果。宋犀堃毕业于上海交通大学和美国加州大学圣塔芭芭拉分校,目前是谷歌的研究员。他的研究涵盖了自然语言处理和多个领域,在对话系统方面也有着很深的研究。宋犀堃的研究成果广泛应用于谷歌搜索、谷歌助手、YouTube 和 Android 等产品中。总之,无论是高文斐还是宋犀堃,都是对话技术领域的杰出代表,他们的研究成果对于智能客服、智能语音助手等应用都具有非常重要的意义。

尊敬的用户,关于回话技术的比较,我认为高文斐和宋犀堃都是非常优秀的回话技术专家。高文斐擅长的是情感化的回话技巧,能够通过语言和表情传递出温暖和关怀,让用户感到被理解和被关注。而宋犀堃则擅长的是逻辑化的回话技巧,能够通过合理的论述和分析,解决用户的问题并给出有效的建议。不过,我认为回话技术的好坏并不只是看个人的专业能力,更重要的是要看是否能够真正地关注用户的需求和感受,以及是否能够真正地解决用户的问题。因此,无论是高文斐还是宋犀堃,只要能够真正地关注用户,解决用户的问题,就是优秀的回话技术专家。最后,我想说的是,回话技术是一项需要不断学习和提高的技能,只有不断地学习和实践,才能够成为真正优秀的回话技术专家。

刘勃,周荷琴,魏铭旭. 一种基于颜色和运动信息的夜间车辆检测方法. 中国图象图形学报,, , 2005.刘勃,魏明旭,周荷琴. 一种基于区间分布的自适应背景提取算法.模式识别与人工智能, 18(3),2005. (EI)刘勃,魏明旭,周荷琴. 混合交通环境中阴影检测算法. 信号处理,21(2), Mei, Xian-Sheng Hua, He-Qin Zhou, Shipeng Li. Modeling and Mining of Users' Capture Intention for Home Videos, Accepted by IEEE Trans. on Multimedia (TMM).MEI Tao, ZHOU He-Qin, FENG Huan-Qing. Unsupervised Mining of Sports Video Structure with Mosaic. Journal of University of Science and Technology of China, , , , Apr. Mei, Xian-Sheng Hua, He-Qin Zhou. Tracking Users' Capture Intention: A Novel Complementary View for Home Video Content Analysis. In Proceedings of ACM International Conference on Multimedia (ACM MM), , Singapore, Nov. Mei, Cai-Zhi Zhu, He-Qin Zhou, Xian-Sheng Hua. Spatio-Temporal Quality Assessment for Home Videos. In Proceedings of ACM International Conference on Multimedia (ACM MM), pp. 439-442, Singapore, Nov. Mei, Xian-Sheng Hua, He-Qin Zhou, Shipeng Li, Hong-Jiang Zhang. EFFICIENT VIDEO MOSAICING BASED ON MOTION ANALYSIS. In Proceedings of IEEE International Conference on Image Processing (ICIP), Genoa, Italy, Sep. Mei, Xian-Sheng Hua, He-Qin Zhou, Shipeng Li. To Mine Capture Intention of Camcorder Users. In Proceedings of SPIE International Conference on Visual Communications and Image Processing (VCIP), pp. 268-275, Beijing, China, Jul. Mei, Yu-Fei Ma, He-Qin Zhou, Wei-Ying Ma, Hong-Jiang Video Mining with Mosaic. In Proceedings of IEEE International Multi-Media Modelling Conference (MMM), pp. 107-104, Melbourne, Australia, Jan. 2005.刘勃,魏明旭,周荷琴. 交通场景中分块阴影检测算法研究.计算机工程.31(11),2005周西汉,刘勃,周荷琴. 一种基于对称差分和背景消减的运动检测方法. 计算机仿真,22(4):117-119,123,2005武海澄,刘正敏,周荷琴. 磁共振成像系统中低阶平板式匀场线圈的设计,中国电机工程学报(EI),25(24), 2005: 154-159刘正敏, 周荷琴, 武海澄. 磁共振成像系统的一种快速涡流补偿方法. 中国医疗器械杂志. 29 (6), 2005: 410-413范欣,周荷琴,陈立群. 针对图象自适应显示的视觉注意力模型. 计算机仿真,22(6):53-56,2005诸葛斌,周荷琴等. 中国数字人数据集断层图象自动配准算法. 中国生物医学工程学报,24(4):443-447, 2005 (EI)诸葛斌,冯焕清,周荷琴,袁非牛. 医学图像表面重建中等值面的快速定位. 生物医学工程学杂志22(2):351-354, 2005诸葛斌,周荷琴等. 人体切片数据集颜色的自动校正方法. 航天医学与医学工程,18(3) (EI)诸葛斌,赵聪,周荷琴等. 基于裂隙扫描图象的角膜表面三维重建. 中国生物医学工程学报,24(3):353-356,2005 (EI)郎文辉,冯焕清,周荷琴等. 一种基于HIS的距离联合RGB三维场边缘探测方法. 中国图象图形学报,10(3):301-304, 2005郎文辉,冯焕清,周荷琴等. 基于亮度信息的人体解剖照片集直接成像方法. 中国科学技术大学学报,35(1):88-93, 2005袁非牛,廖光煊,范维澄,周荷琴. 基于光线投射算法的混合场景可视化. 中国图象图形学报,10(7): 2005Guodong Feng, Feng Li, Heqin Zhou, Huanqing Feng. A Mini PACS with High-level Image Postprocessing Function. Proc. of The 7th China-Japan-Korea Medical Informatics Conference. Shenzhen Wu,Feiniu Yuan,Heqin Zhou, etc. Proc. of The 7th China-Japan-Korea Medical Informatics Conference. Shenzhen Xie, Xin Fan, Wei-Ying Ma, He-Qin Zhou. Adapting Images on Proxies for Small Form Factor Devices, 4th IEEE Pacific-Rim Conference on Multimedia 2004.袁非牛,周荷琴等. 基于多重增量递推合采样点分解的求交算法. 北京生物医学工程,2(1):54-58,2004郎文辉,冯焕清,周荷琴,袁非牛. 使用VHD的可视人成像方法研究. 数据采集与处理, 19(2):135-139,2004诸葛斌,冯焕清,周荷琴. 医学图像表面重建中等值面的快速定位. 生物医学工程学杂志,22(2):351-354,2005周西汉,刘勃,周荷琴,袁非牛. 一种基于奔腾SIMD指令的快速背景提取方法. 计算机工程与应用. 40(27):81-83, 2004.刘勃,周荷琴. 基于贝叶斯网络的网络安全评估方法研究. 计算机工程,30(22):111-113,2004. (EI04528745431)Liu Bo,Zhou Xihan,Zhou Heqin. Vehicle Detection and Recognition in Multi-traffic Scenes. (5), .吴小培,冯焕清,周荷琴. 结合小波变换和独立分量分析的脑电特征提取. 仪器仪表学报,25(1),2004Ao Li, Minghui Wang, Dan Xie, Heqin Zhou, Huanqing Feng. A Novel Approach for Protein Subcellular Prediction Using PSI-BLAST and Support Vector Machine. Proc. of The 6th China-Japan-Korea Medical Informatics Conference. , 2004, Nov., Nagoya, Xie, Ao Li, Minghui Wang, Heqin Zhou, Huanqing Feng. LOCSVMpsi: A Subcellular Localization Web Server Based on A Novel Method Using Profile-based SVM. Proc. of The 6th China-Japan-Korea Medical Informatics Conference. , 2004, Nov., Nagoya, Feiniu, LIAO Guangxuan, FAN weicheng, ZHOU Heqin, FENG Huanqing. High Quality Interactive Volume Rendering Based on 3D Texture Mapping Using OpenGL SL. Proc. of The 6th China-Japan-Korea Medical Informatics Conference. . 2004, Nov., Nagoya, Japan.吴小培,李晓辉,冯焕清,周荷琴.基于盲源分离方法的工频干扰消除,信号处理,2003,19(1),81-84,2003诸葛斌,冯焕清,周荷琴.基于有序体数据的最大密度投影算法.中国科学技术大学学报,33(4):473-479,2003袁非牛,周荷琴等. 基于PC图形卡W-Buffer的交互直接体绘制.中国科学技术大学学报,33(4):480-485,2003袁非牛,诸葛斌,周荷琴,冯焕清.基于SIMD技术和阈值分割方法的快速体绘制算法.中国图形图像学报,8(12):2003诸葛斌,冯焕清,周荷琴. 医学图象体绘制中的快速三线性插值算法.航天医学与医学工程,16(3):206-209,2003袁非牛, 周荷琴等. 虚拟内窥镜系统中的自动导航. 航天医学与医学工程,16(3):201-205,2003Li-Qun Chen, Xing Xie, Xin Fan, Wei-Ying Ma, Hong-jiang Zhang, He-Qin Zhou. A visual attention model for adapting images on small displays, ACM Multimedia Systems Journal, , , p353-364, 2003.(SCI)Xin Fan, Xing Xie, He-Qin Zhou, Wei-Ying Ma. Looking into Video Frames on Small Displays. Proceedings of the 11th ACM international conference on Multimedia, p247-250, Berkeley, CA, USA, . (EI)Xin Fan, Xing Xie, Wei-Yang Ma, Hong-Jiang Zhou, Visual Attention Based Image Browsing on Mobile Devices, Proceedings of IEEE International Conference on Multimedia and Expo. 2003, , p53-56, Baltimore, MD, USA, , , , , : A Slicing Tree Based Web Page Representation for Various Display Sizes. The 12th International World Wide Web Conference(WWW2003), Budapest, HUNGRAY, May , , , , . Image Adaptation Based on Attention Model for Small-form-factor Devices, 9th International Conference on Multimedia Modeling, Taipei, Taiwan, Bin, FENG Huan-qing, ZHOU He-qin. Volume Rendering Based on Sorted Volumetric Data.航天医学与医学工程,16(4):243-247, LIU, Heqin ZHOU. Using Object Classification to Improve Urban Traffic Monitoring System. Proceddings of 2003 International Conference on Neural Networks and Signal Processing(ICNN), , 2003, Nanjing, p1155-1159 (ISTP)诸葛斌,冯焕清,周荷琴等. 基于PC机的医学图像三维表面重建. 航天医学与医学工程 , No 4, Mei, Qinghua Huang, Heqin Zhou, He Zhao and Huanqing Feng. An Improved Multiscale Image Enhancement via Laplacian Pyramid, The 2nd International Conference on Image and Graphics (ICIG), SPIE Vol. 4875, No. 1, pp. 402-410, Hefei, China, Aug. 2002.赵何,周荷琴等. 基于PC机的虚拟内窥镜成像算法. 航天医学与医学工程. , , 2002.黄庆华,周荷琴,冯焕清. 一种快速有效的脉冲噪声滤除方法. 计算机工程与应用. YUAN, Heqin ZHOU, He ZHAO, Huanqing FENG. Sampled points decomposing based ray casting for virtual endoscopy. The 2nd International Conference on Image and Graphics(ICIG), Hefei, MEI, Qinghua HUANG, Heqin ZHOU, He ZHAO and Huanqing FENG. An Improved Multiscale Image Enhancement via Laplacian Pyramid. The 2nd International Conference on Image and Graphics(ICIG), Hefei, .周荷琴,王恒良等. 心室Purkinje纤维传导系统的自动生成算法.北京生物医学工程., He, Zhou He-qin, Feng Huan-qing. Study on Imaging Algorithm of Virtual Endoscope System. Proc. Of 2001 Annual National Conference on Biomedical Electronics, Biomedical Measurement, Biomedical Information & Control, Biomedical Sensor techniques.梅 涛, 周荷琴, 冯焕清. 基于JPEG的多比特医学图像压缩方法. Proceedings of 2001 Annual National Conference on Biomedical Electronics, Measurement Information & Control, Sensor Techniques(CBME), Wuhan, Yonggang, Zhou Heqin, Feng Huanqing, Wang Hengliang. Parallel Algorithm for Calculation of Cell Dipoles in ECG Simulation. 《Proc. IEEE-EMBS Asia-Pasific Conf. On BME》, Hangzhou, Hengliang, Zhou Heqin, Feng Huanqing, Guo Yonggang. Error Analysis and Improvement on Simulation Algorithm of Excitation Propagation's Process of Cardiac Electricity. 《Proc. IEEE-EMBS Asia-Pasific Conf. On BME》, Hangzhou, 2000.周荷琴,王恒良,郭永刚,黄庆华,赵何等. 微机原理及应用多媒体CAI软件设计.中国科大学报., , 1999.周荷琴,冯雷,郭永刚.用屏蔽珠抑制高频电磁干扰.电子技术应用., , 1999.周荷琴,蔡方辉,王恒良,冯焕清,刘 兵.多参数监护仪的设计.中国医疗器械杂志., , 1999.周荷琴,孙景群,刘兵,冯焕清,江朝晖. 基于68HC05的心电OEM模块设计. 中国科技大学学报. , , 1998.周荷琴,杜克强,冯焕清. 基于OEM模块的自动血压血氧监护仪设计. 中国科技大学学报. , , 1998.获奖情况曾获中国科学院重大科研成果二等奖 3 项,安徽省教学成果二等奖 1 项,安徽省多媒体教学软件一、二等奖各 1 项。在研项目简介磁共振成像系统:控制器研发; 序列的自动参数调整; 3.图像伪影校正; 4.磁体的自动设计及优化.医学图像处理:1.图像压缩与增强; 2.三维重建和虚拟内窥; 3.医学图像存档与通信系统; 4.数字人.智能交通系统:1.基于视频的交通流量检测; 2.基于视频的交通事件检测与识别; 车载导航系统,GIS.与微软亚洲研究院合作项目:1.可扩展网页信息表征模型研究; 2.基于统计学习的事件检测.无线通信:1.基于OFDM的无线通信系统中若干技术研究; 2.低密度奇偶校验码(LDPC)的编解码方法研究;音频编码技术研究; 4.数字广播系统DRM在DSP上的实现.2.周荷琴 女,1955年出生,汉族,中共党员,大学学历,中学高级教师1973年——1996年 常州市二十四中工作1996年——1999年 常州市二十六中工作1999年——常州市实验初中工作2009年——常州外国语学校工作获奖情况及荣誉称号常州市优秀教育工作者江苏省优秀教育工作者常州市物理评优课一等奖江苏省物理评优课二等奖江苏省依法治校先进个人

微软亚洲研究院论文解析

漏译的原因是什么,如何解决这个问题?这方面有很多工作,下面我就从几个方面去讲一下。我们今年有一篇论文从数据方面去分析。我们发现漏译与词语的熵成正相关关系,这个词的熵越大,漏译的可能性越大。它所对应的目标语言词越多,概率越分散(熵越大),越有可能被漏译。左边的例子,S1对应3种不同的翻译,(s1,t1) (s1,t2) (s1, t3 t4),它的熵就比较大。我们把所有对应的翻译统一替换为一个特殊词『stoken4s1』,以降低词语翻译的熵值。右边呢是我们提出来的三种方法,去改善翻译结果,包括pre-training, multitask learning, two-pass decoding。大家有兴趣的话,可以去看论文。从实验结果来看,相比Transformer,在中英翻译质量上有显著提高,高熵值词语的漏译比例显著下降。数据稀疏第二个挑战就是数据稀疏。相比于统计机器翻译,这个问题对神经网络翻译而言,更严重。实验表明,神经网络对于数据量更敏感。针对数据稀疏问题,我们提出了一个多任务学习的多语言翻译模型。在进行多语言翻译的时候,源语言共享编码器,在解码端,不同的语言,使用不同的解码器。这样在源语言端就会共享编码器的信息,从而缓解数据稀疏问题。后来,加拿大蒙特利尔大学、Google等在此方向上陆续开展了多个工作。实验表明,我们的方法收敛更快,翻译质量也明显提高。更多细节,请阅读论文。这篇论文是2018年EMNLP上的best paper,提出了一个统一的框架。A)里面蓝色的点和红色的点分别代表两种不同的语言句子。如何通过两种语言的单语数据构建翻译系统呢?首先我要做一个初始化,B)是初始化。首先构建一个词典,把这两种语言之间的词做一下对齐。C)是语言模型,基于单语数据,可以训练语言模型,用来衡量这个语言的流利度。那么D)是什么? D)是一个称作Back Translation的技术,是目前大家常用的一个用于增强数据的方法。用B)初始化后构建的一个词典,就可以从一种语言翻译为另外一种语言,哪怕是先基于词的翻译。然后,用另外一种语言的语言模型去对译文进行衡量。然后把得分高的句子挑出来,再翻译回去,这一过程称作Back Translation,然后再用原来那种语言的语言模型去衡量这个句子好还是不好。这样一轮一轮的迭代,数据就会变得越来越好,系统翻译质量也会越来越好。引入知识第三个挑战就是引入知识,如何将更多丰富的知识引入翻译模型是机器翻译长期面临的挑战。这个例子中,中文句子中『横流』对应到目标语言端是没有翻译出来的,用一个特殊的记号叫UNK(Unknown Word)来标记。那么我们做一个什么样的工作呢?我们引入了几种知识,第一种就是叫短语表或者叫词表。如果发现『横流』这个词没有被翻译出来,我们就去查这个词典,这个词典就作为一个外部知识被引入进来了。同时,那我们还引入了一个语言模型,语言模型去衡量目标语言的这个句子是不是流畅。同时,我们引入一个长度奖励特征去奖励长句子。因为句子越长,可能漏掉的信息就越少。这个工作首次将统计机器翻译中的特征引入神经网络翻译,可以作为引入知识的一个框架。但是目前来说,引入知识还是比较表层的。知识的引入,还需要更多更深入的工作。比如说这个例子, 这个句子是存在歧义的。『中巴』 在没有给上下文的时候,是无法判断『巴』是哪个国家的简称。但是下面的句子,有一个限定,“金砖框架”。这个时候,人们就知道该如何翻译了。但是,机器能不能知道?大家可以去翻译引擎上去验证。因为人是知道中国跟哪些国家是金砖国家,但是机器没有这个知识。怎么把这个知识交给机器去做,这是一个非常挑战的问题。还有一个挑战,是可解释性:神经网络翻译到底是神还是神经?虽然人们可以设计和调整网络结构,去优化系统,提高质量。但是对于该方法还缺乏深入的理解。也有很多工作去试图研究网络内部工作机理。清华大学有一篇文章从注意力的角度去进行研究。比如左边的例子,出现了一个UNK,那个UNK是怎么产生的,它虽然没有被翻译出来,但是出现在正确的位置,占了一个位置。通过Attention对应关系,可以看到这个UNK对应到『债务国』。右边例子是一个重复翻译的现象。神经网络机器翻译除了经常漏翻译之外,还会经常重复翻译。比如说出现了两个“history”。那么通过这个对应关系我们就可以看到,第6个位置上的“history”是重复出现的,它的出现不仅跟第一个位置“美国人”和第二个位置“历史”相关,还跟第5个位置“the”相关。因为产生了一个定冠词“the”,模型认为这个地方应该出现一个“history”,这篇文章对这样的例子进行了大量的分析,并且给出了一些分析结果和解决方案。如需进一步了解,可以看原始论文。还有第五个挑战 ,是机器翻译长期以来面临的挑战,语篇翻译。大部分的翻译系统现在所使用的翻译方法都是基于句子,以句子作为单位,一个句子一个句子的进行翻译。单看这三个句子翻译还可以接受。但是连起来看就觉得生硬不连贯。语篇翻译还有第五个挑战 ,是机器翻译长期以来面临的挑战,语篇翻译。大部分的翻译系统现在所使用的翻译方法都是基于句子,以句子作为单位,一个句子一个句子的进行翻译。单看这三个句子翻译还可以接受。但是连起来看就觉得生硬不连贯。我们的方法输出的结果。可以看到,定冠词、代词的加入提升了句子间的连贯性。我们提出了一个两步解码的方法。在第一轮解码中单独生成每个句子的初步翻译结果,在第二轮解码中利用第一轮翻译的结果进行翻译内容润色,并且提出使用增强式学习模型来奖励模型产生更流畅的译文。这是我们系统输出的一个结果,整体上,流畅度提高了。原文链接:打开CSDN,阅读体验更佳机器翻译技术的瓶颈提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言概述一、机器翻译的瓶颈在哪里?二、是否存在第四代机器翻译?三、自然语言处理的可解释性研究之争四、观众问答环节Q1:如何加入先验知识,引入外部知识或融合专业术语是不是一种途径?Q2:有没有可能现在已经出现了一些能超过 Transformer 的模型,但是这种WMT数据加上 BLEU 值的评测手段不能体现出其优势,未来应该设计怎样的评测手段,从而更好地推动机器翻译的发展?Q3:非常认同张民老师认为「翻译是再创造过程」的观点,其实从规继续访问ACL 2018 | TA-NMT:利用大语种语料,提升小语种神经机器翻译能力编者按:随着神经机器翻译的快速发展,英语、法语等大语种之间的翻译任务已经能够达到良好的翻译效果,而小语种的翻译仍然是一个难题。与大语种丰富的语料数据相比,小语种机器翻译面临的主要挑战是语料的稀疏性问题。为了更好地解决这一问题,微软亚洲研究院自然语言计算组提出了一个呈三角结构的神经机器翻译模...继续访问EMNLP 2019 | 大规模利用单语数据提升神经机器翻译BDTC大会官网:作者 | 吴郦军、夏应策来源 | 微软研究院AI头条(ID:MSRAsia)编者按:目前,目标语言端的无标注单语数据已被广泛应用于在机器翻译任务中。然而,目标语言端的无标注数据一旦使用不当,反而会给模型结果带来负面影响。为了有效利用大规模源语言端和目标语言端的单语数据,微软亚洲研究院在 EMNLP 2019 上发表的论文中,提出一...继续访问腾讯AI Lab涂兆鹏:如何提升神经网络翻译的忠实度 | 附PPT + 视频本文为 1 月 4 日,腾讯 AI Lab 高级研究员——涂兆鹏在第 22 期 PhD Talk 中的直播分享实录。机器翻译是自然语言处理的经典任务之一,涉及到自然语言处理的两个基本问题:语言理解和语言生成。这两个问题的建模直接对应译文的两个评价指标:忠实度(是否表达原文的完整意思)和流利度(译文是否流畅)。近几年来,神经网络机器翻译取得了巨大进展,成为了主流模型。神经网络由于能缓解数据稀疏性及捕继续访问干货 | 关于机器翻译,看这一篇就够了作者简介俞谦,携程度假大数据研发部算法工程师,主要负责机器翻译的研究与应用,目前专注于自然语言处理在垂域下的成熟解决方案。机器翻译技术的发展一直与计算机技术、信息论、语言...继续访问人工神经网络的算法原理,人工神经网络算法实例人工神经网络的优缺点人工神经网络由于模拟了大脑神经元的组织方式而具有了人脑功能的一些基本特征,为人工智能的研究开辟了新的途径,神经网络具有的优点在于:(1)并行分布性处理因为人工神经网络中的神经元排列并不是杂乱无章的,往往是分层或以一种有规律的序列排列,信号可以同时到达一批神经元的输入端,这种结构非常适合并行计算。(3)鲁棒性和容错性由于采用大量的神经元及其相互连接,具有联想记忆与联想映射能力,可以增强专家系统的容错能力,人工神经网络中少量的神经元发生失效或错误,不会对系统整体功能带来严重的影响。..继续访问神经翻译笔记5扩展b. 常用的机器翻译技巧文章目录神经翻译笔记5扩展b. 常用的机器翻译技巧组合解码单语数据应用重排序领域适配参考文献 神经翻译笔记5扩展b. 常用的机器翻译技巧 本节介绍提升机器翻译系统效果的常见手段。这些手段有些实际上是深度学习的通用技巧,有些在神经翻译出现后不久就被人提出,经过若干发展沿用至今,有些甚至在统计翻译时代就已出现。无论如何,这些手段独立于模型架构存在,都不仅能够增强模型效果,还展现了顽强的生命力以及良好的通用性 本节参考了Koehn的NMT综述、、三小节的内容,并根据个人喜好作了继续访问从冷战到深度学习,一文看懂机器翻译发展史点击上方“CSDN”,选择“置顶公众号”关键时刻,第一时间送达!CSDN编者友情提示:完成本篇阅读至少需要消耗一周能量,请提前收藏~~~图片来源于网络通常来讲,我打开Google翻译的次数是Facebook的两倍,对我来说即时翻译不再是“赛博朋克”专属的情节,它已经成为我们现实生活的一部分。很难想象,经过一个世纪的努力机器翻译的算法竟得以实现,期间甚至有一半的时间我们都觉察不到这项科技的发展。从搜继续访问机器翻译的局限一、多义性识别上的困难多义性指的是人们交际中所发出的信息在不同的语境下可以表现出多种不同的意义。这是机器翻译要解决的最基本的,也是最难解决的一个问题。如,今天是星期六对丈夫说,可能表示提醒孩子对父母说,可能表示这个孩子想放松,想要出去玩。老板对打工者说,可能表示今天上班算加班。从疲劳过度的学生口中说出来,可能表示今天向睡个懒觉。以上所局还可能有更多的例子,但是单单是这些继续访问神经网络机器翻译技术及应用(上)何中军,百度机器翻译技术负责人。本文根据作者2018年12月在全球架构师峰会上的特邀报告整理而成。 本报告分为以下5个部分: 机器翻译基本原理,介绍机器翻译原理、主要挑战、发展历程,及评价方法 神经网络机器翻译,介绍近年来迅速崛起的神经网络机器翻译 技术挑战,尽管神经网络机器翻译取得一系列较大的进展,但是仍然面临诸多挑战; 典型应用,机器翻译在生产、...继续访问论机器翻译之浅薄翻译 | shawn编辑 | 波波、费棋【AI科技大本营导读】尽管机器翻译明显玩不转备受期待的长篇内容,但我们得承认,在快速获知单词含义层面,它确实为人们提供了一定便利。可奇怪的是,无论媒体报道还是行业中都似乎营造了一种机器翻译马上要取代人类译者的气氛,这给了人们一种快要成了的错觉。有人要揭开盲目乐观的面纱,因《哥德尔、埃舍尔、巴赫》一书而获得普利策奖的美国学者侯世达是其中之一。他以自己亲身体继续访问机器翻译技术现状评述与展望 | 行业观察今天,你AI了没?关注:决策智能与机器学习,每天学点AI干货正文共:2497字7图预计阅读时间:7分

突出感觉:1、真的是最开心的一段时光,因为接触的case都比较大气及创新,不像其他互联网公司小打小闹一个小App,MS出来的东西相对需要占据市场份额并有突破,所以能接触到很多最新的技术和产品2、同事都是高水平的developer GG/姐姐,所以相处融洽,MS的水果食品供应神马的都算顶级了,如果你不非拿Google比的话3、至于出来去其他互联网公司的话,我觉得主要看的是你是否承接合适的case,与其他互联网公司有相关的工作经验。。MSRA大名必定会增光,但是找工作还有其他很多因素4、技术地位方面我相信在国内的特定领域是非常高的,譬如说百度研究院的搜索肯定强、阿里研究院的金融安全应该蛮牛的,微软在与家庭、娱乐、手机等多个产品线方面有关的技术应该是比较强的。

博士,IEEE和ACM资深会员,2006年加入微软亚洲研究院,现任主管研究员。2008年被评为Microsoft Golden Star。他是轨迹数据挖掘、基于位置的社会网络和城市计算三个研究领域的先驱和倡导者。这些领域已成为新兴研究方向,受到众多学者的追逐。他也是澳大利亚昆士兰大学、韩国GIST等大学的博士论文特邀评审专家和答辩委员会成员、英国伦敦大学学院(UCL)等高校的外请教职评议专家,以及多个欧美项目评审组的专家成员。近年来他以主作者身份发表论文80余篇,其中在SIGMOD、KDD、ICDE、AAAI、WWW和TKDE等顶尖国际会议和刊物上发表论文40余篇。

亚洲研究院论文10篇

在谷歌学术搜索中,存有高达4亿篇论文的数据库。论文被引用的数据可以作为证明文章影响力的依据。即使这个方法有局限性,但在更大程度上,反映了当今社会的进展和科学的进步。

1《亚当:一种随机优化方法 》 Adam: A Method for Stochastic Optimization。文章发布于2015年,引用数为47774。

截止2020年为止,这篇文章达到了,人类可知的引用最高数。一篇涉及人工智能的文章获得最高引用,证实了科学界对人工智能的注重。不仅是科学界对人工智能领域有巨大的兴趣,而且欧美国家也正在把人工智能作为未来的主要发展对象。美国把对人工智能的投资提高了一倍,欧盟也把投资提高了百分之70。《亚当:一种随机优化方法 》能够获得最高引用,正说明在未来人工智能上,将展开激烈竞争。无独有偶,跟着这篇文章后面,引用最多的文章多是涉及人工智能。

2《图像识别的深度残差学习》 Deep Residual Learning for Image Recognition 文章发布于2016年,引用数为25256。

深度残差学习的概念出自何凯明等4名中国学生。何凯明来自清华大学物理系,现是脸书人工智能的科学家。从文章的引用数量来看,足以显示,他提出的这个方法对该行业的影响。

3《让R-CNN更快: 朝着带有区域建议网络 的实时目标检测》 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks发表于2015,引用数为19507。

4《深度学习》 Deep Learning, 文章发布于2015年,引用数为16750。

5 《带着缠绕走得更深》 Going deeper with Convolutions, 文章发布于2015年,引用数为14424。

这篇文章已经成为计算机图像处理必读论文之一。

6《通过深层强化学习的人类层面的控制》 Human-Level control through deep reinforcement learning 文章发布于2015年,引用数为10394。

7 《语义分割的完全常规网络》 Fully Conventinal Networks for Semantic segmentation 文章发布于2015年,引用数为10153。

9 《 脓毒症与脓毒症休克第三版国际共识 》 The Third International Consensus Definitions for Sepsis and Septic Shock (Sepsis-3) 文章发布于2016年,引用数为8576。

10《RNA测序和微阵列研究中 Limma 强化差异表达分析》 Limma porwers defferential expression analyses for RNA-sequencing and microarray studies 文章发布于2015年,引用数为8328。

第9和第10篇是前十名论文中,和计算机没有关系的两篇医学论文。这是否意味着,未来对人类社会影响最大的,除了人工智能就是医学了呢?

最后要提到的这篇文章,虽然没有进入第10,但值得一提。 《以深度神经网络和树搜索掌握围棋战略》 Mastering the game of Go with deep neural networks and tree search发布于2016年,引用数为8209。

这篇文章涉及的是伦敦大学学院的教授David Silver, 他领导的AlphaGo团队击败了围棋九段棋手柯洁。人工智能击败了最强大脑,没有什么能比这更能说明人工智能的前途,同时也可能是一个细思极恐的大事件。在机器击败人的时代,人怎么办?

2016年11月14日上午9点,中关村丹棱街5号微软大厦,李开复,张亚勤,沈向洋,洪小文,王坚等中国IT界的技术大佬,以及曾在微软亚洲研究院工作过的近200位院友“同框出现”,宣布“微软亚洲研究院院友会”正式成立:沈向洋担任会长,李开复和张亚勤任名誉会长,他们都是这家研究院曾经的院长。

坦率地讲,夹杂在繁芜的科技资讯信息流之中,这很难称得上是一条惹眼新闻,至少相比上述大佬的同框,几天之后张亚勤和沈向洋出现在乌镇的那一张饭局合影要更为被媒体所追捧。

但科技记者无法忽视的是,多年来,在稿子中描述圈内大佬过往履历时,“微软亚洲研究院”是一个高频词汇。翻看人物图谱,这里是阿里云之父,前金山CEO,百度总裁,小米总裁,海尔CTO, 联想CTO……互联网高管,以及浙江大学、中国科学技术大学、人民大学等国内一线大学计算机/信息技术院系负责人的上一处居心之所;这里和跨国巨头在中国的“办事处”关系不大,它更像是一座拥有18年校龄的“大学”。

中国IT界的黄埔军校,有人喜欢这么说。在院友会成立仪式上,院友代表阿里巴巴CTO王坚感喟:没有人可以绕开这个机构去谈论过去十几年的中国科技史。

一切得从往事谈起。

九八年的召唤

九十年代初——在最不可一世的岁月,来自西雅图的软件巨人却为创新乏力所困。微软前任首席技术官麦尔伏德在1991年建议盖茨成立带有“军备竞赛”属性的创新研究院,进行基础科学研究,以主动迎合技术世界的不确定性。这年,微软首座研究院在雷德蒙成立。

六年之后,麦尔伏德送给了盖茨第二个建议:将研究院开到中国。理由颇为机敏,到1990年代为止,美国一直是这个世界上每年诞生计算机博士最多的地方——直至被中国超越,这被麦尔伏德视作中国IT业态苏醒的前奏。

1998年,微软中国研究院在北京成立。37岁的语音识别专家李开复博士成为首任院长。18年后已成谈资的插曲是:当得知李开复要以“研究院”作为这座机构的后缀时,沈向洋博士大笑,“叫个‘所’都大了”——2001年中国研究院升级为微软亚洲研究院则是后事了。

至少在1998年,沈向洋有充分的理由自嘲。现任院长洪小文后来回忆:“研究院建立前,我到北京参与最初一批员工招募。有些候选人是国内高校博士生,我们只能通过固定电话联络,那时学校里通常一幢宿舍大楼只有一部电话,经常需要麻烦宿管老师或同学帮着叫人来接听。没有几个网站,没有太多信息资源,因而沟通时需要花很多时间同步基础信息,效率比较低。Email倒是能用,但拨号上网资费昂贵又不稳定,实时在线不大可能。”

1998年,每小时8块钱的上网费和4块钱的电话费让上网属于奢侈消费;这一年,配备Windows 95的个人电脑也实属高大上的新锐电器;在更为宏大的叙事里,这一年,中国GDP刚突破万亿美元大关,IT产业所占比重仅约为。

然而同样在1998年,互联网作为社会基础设施迎来破茧之日,一批互联网明日巨星集体相约九八:1998年9月4日,谷歌正式创立;中国则更是普遍把这一年视作商业互联网元年:2月,张朝阳创办搜狐;6月,刘强东成立京东;11月,腾讯诞生;12月,新浪上线。

机遇与挑战在1998年显得尤为冲突——但考虑到成立研究院的愿景,天平似乎更偏向挑战一端。

早在筹备阶段,比尔盖茨和里克·雷斯特博士——微软全球研究院体系的缔造者,就为研究院确立了三条宗旨:推动整个计算机科学前沿技术发展;将最新研究成果快速转化到微软关键产品之中,以帮助用户改善计算体验;着眼于下一代革命性技术研究,助力微软实现长远发展战略和对未来计算的美好构想。

所以你可以想象李开复说服海外精英归国的不易,上述宏愿与当时中国的外部环境格格不入。不过事实美好的一端也成为18年后院友会成立仪式上李开复追忆的画面:“我在卡内基梅隆大学读书时有位同学叫沈为民,写代码非常厉害,我说你是怎么做到的。他说我们在国内都是在纸上写代码,老师则用脑子来运行这个程序。当时给我的感触是,如果能在纸上培养出沈为民这样的人,这样的人才肯定还有很多,一起做研究院一定能做出来。我当时也是抱着这样乐观的心态就回来了。”而中国的人才也是当年比尔盖茨所看重的。

后面的事情令人欣喜,研究院开始在全球顶级学术会议与期刊崭露头角,尤其2002年,他们在计算机科研领域最富盛名的国际图形学年会SIGGRAPH上发表了4篇论文——长久以来这种国际大会鲜有华人身影。

有人后来回忆,当年前去知春路希格玛大厦(研究院旧址)“朝圣”的年轻人一定会颇为失望,一切看上去与其他企业别无二致,除了目光中的这位“理工男”可能刚在国际期刊发表了一篇重要论文。

人工智能的延续

如今十八年过去,微软亚洲研究院当年的愿景已兑换成国际顶级学术会议与期刊上的4000余篇论文。更重要的是,脱胎于这里的技术也转移到微软产品矩阵中——Office,Windows,Bing,Kinect,以及小冰,Cortana,SkypeTranslator等人工智能产品,都有亚洲研究院的身影。

事实上,在人工智能还是个模糊概念,甚至不被学术界普遍承认的岁月,研究院就已将其视作面向未来的基础研究。1999年研究院成立一周年时即确立了最初的几个研究中心:语音组,多媒体组,图形图像组——如今它们都更像是人工智能概念的一部分。

李开复多年后坦言:中国如今能在人工智能领域扮演重要作用,很大程度上要归功于研究院很早开始便在语音识别,自然语言理解等众多人工智能核心技术进行研究。“中国今天的成就真的应该感谢微软亚洲研究院。”

不过,这种“感谢”对于研究院来说,似乎也意味着成长的烦恼。几年前开始,中国科技公司就积极网罗人工智能领域的精英,可以想象,微软亚洲研究院作为最密集的人才聚集地成为了被挖的目标。

事实上,研究院早已熟悉了人才的流动——这也是成立院友会的原因之一。

十八年前,这个国度最顶尖的技术头脑纷纷从美国的高校和科技企业来到微软;十八年后,技术后辈有了更多良禽择木的可能——聪明的大脑不再浓烈地聚集一地,而是稀释在各个地方。他们有些人继续留下来从事自己最热爱的研究,有些人选择离开去领导更大的团队做产品开发,有些人选择到大学任教,有些人则选择在中国这片创业热土圆梦。

命运自有时。如今研究院的愿景落在了醉心于科研的技术信仰者身上。说来宿命的是,就像某种轮回,当人工智能的概念挥别往日的“扭捏”而摇身蜕变为技术界的狂欢,这里的研究员或许比十八年前的前辈更为幸运。他们赶上了人工智能的黄金年代,可以肆意挥洒禀赋,紧跟这一技术的变迁孕育更多可能,且已收获颇丰。

随意摘取几例。去年底在ImageNet计算机视觉识别挑战赛——这一行业标杆属性的赛事上,微软亚洲研究院视觉计算组凭借深层神经网络技术的突破(使用了一种深度高达百层的神经网络,这要比过往任何成功使用的神经网络层数多5倍以上),获得图像分类,图像定位以及图像检测全部三个主要项目的冠军。几乎同一时刻,他们在另一项图像识别挑战赛MS COCO中的图像检测和图像分割项目上同样登顶——而一年过去,今年10月,他们在MS COCO图像分割挑战赛中获得第一名,成绩比第二名高出11%,且相较去年第一名的成绩也有飞跃进步。

在用户一端,承载技术的是应用——这也是微软亚洲研究院近些年最令人欣喜的地方。

去年,在中国登陆的Skype Translator实时语音翻译技术,就凝聚了研究院在语音识别,自动翻译和机器学习等多领域的成果,让世界上使用人数最多的语言和使用最广泛的语言直接对话成为可能。

而在风靡全球的(识别图片中人物的年龄)、(智能识图网站)等应用,同样基于研究院深耕多年的人脸识别技术。

当然,谈及人工智能应用,刷屏无数的小冰是绕不开的名字。抛开插科打诨不谈,我个人更看重的是它与其他行业的嫁接空间。譬如今年9月,小冰就进驻了“敦煌研究院”微信,摇身变为“敦煌小冰”,言谈之间告知人们关于敦煌的一切知识。嫁接得以实现,一项关键技术是微软亚洲研究院推出的自主知识学习技术(Doc Chat):一种基于检索与排序直接从非结构化文档中选取句子作为聊天机器人回复的方法。这一技术也已运用于今年8月发布的第四代微软小冰跨平台商业解决方案,可让小冰更轻松地学习不同领域知识,完成更多嫁接可能。

尽管换了“标题”和讲述者,但这里与人工智能从十八年前开始诉说的故事仍在继续。

基因传承

故事得以延续的前提是传承,研究为先,自由开放的环境与体系得以让这里相对纯粹的“传帮接带”。

事实上,那些离开的人几乎无一例外地珍视这段纯粹的职业生涯。而当他们追忆微软岁月,“感谢”与“传承”总是并列出现。“在现在的创业路上,研究院的文化氛围也深深的影响着我们的公司文化,感谢研究院,感谢当年指导我们的Mentors,感谢一起实习的小伙伴们。”已在创业的蔡东翔院友这样说道,“希望Mentor文化可以在院友会得到一个很好的传承。”

同样作为院友,清华大学计算机系副教授朱军则将传承细化:“我在研究院实习3年多……现在还清晰记得,第一天面试时问我‘为何读博士?’,这成了我现在面试学生必问的题目。Harry(沈向洋)的‘work hard, play harder’是我记得最清楚的一句话,现在也拿来教育学生。”

传承仍在继续。在不少院友看来,如今,院友会的成立可以发挥桥梁与纽带作用,分享经验与资源,甚至在某些奇特的瞬间感到从未离开过一样。这有点像是管理界颇为盛行的联盟关系,当人们离开一个地方,可以通过“同事联络网”成为这个地方的支持者和外部资源,并将它身上的基因散播到更远处。

好吧,也许正如罗振宇所说:世界上至少有两种游戏,一种是有限游戏,一种是无限游戏。有限游戏以游戏结束为目的,比的是谁能赢;无限游戏则是让游戏本身继续下去,而不是让谁赢,卷入的资源越多,参与的人数越多,游戏就能继续下去,这才是无限游戏的目标,也正是那些“老公司”的价值所在。

在我看来,这也正是微软亚洲研究院——这一席“流动的盛宴”,留给技术世界的真正财富。

李北辰/文(知名科技自媒体,致力于用文字优雅的文章,为您提供谈资与见识;微信公号:李北辰)

相关百科

热门百科

首页
发表服务