1、C刊=CSSCI=南大核心期刊,北大核心期刊一般简称核心。南大核心的范围要比北大核心要小。 2、CSSCI里顶级的期刊,有的学校认定为A,那就是中文期刊里最高级的。而B刊是各学校以自己的标准自己规定的。所以如果要发表论文,还是要到本校相关部门问清本校的期刊分类目录,才好决定投稿对象。
cssci包括管理世界、世界历史、中国社会科学、马克思主义与现实、教学与研究、哲学研究、世界宗教研究部、现代外语、民族语文、文学评论、文学遗产、文艺理论与批评、音乐研究、历史研究、世界历史、近代史研究、文物、考古、经济研究、世界经济、中国工业经济、政治学研究、中国法学、社会学研究、民族研究、等100多类人文社科类期刊。
cssci中文社会科学引文索引英文全称为“Chinese Social Sciences Citation Index”,缩写为CSSCI。由南京大学中国社会科学研究评价中心开发研制的数据库,用来检索中文社会科学领域的论文收录和文献被引用情况,是我国人文社会科学评价领域的标志性工程。
“中文社会科学引文索引”(CSSCI)是国家、教育部重点课题攻关项目。CSSCI遵循文献计量学规律,采取定量与定性评价相结合的方法从全国2700余种中文人文社会科学学术性期刊中精选出学术性强、编辑规范的期刊作为来源期刊。
目前收录包括法学、管理学、经济学、历史学、政治学等在内的25大类的500多种学术期刊,现已开发的CSSCI(1998—2009年)12年度数据,来源文献近100余万篇,引文文献600余万篇。
1.美国《科学引文索引》(Science Citation Index, 简称 SCI )于1957 年由美国科学信息研究所(Institute for Scientific Information, 简称 ISI)在美国费城创办,是由美国科学信息研究所(ISI)1961 年创办出版的引文数据库。SCI(科学引文索引)、EI(工程索引)、ISTP(科技会议录索引)是世界著名的三大科技文献检索系统,是国际公认的进行科学统计与科学评价的主要检索工具,其中以 SCI 最为重要。2.(SSCI)社会科学引文索引为SCI的姊妹篇,亦由美国科学信息研究所创建,是可以用来对不同国家和地区的社会科学论文的数量进行统计分析的大型检索工具。3.中文社会科学引文索引英文全称为“Chinese Social Sciences Citation Index”,缩写为CSSCI。由南京大学中国社会科学研究评价中心开发研制的数据库,用来检索中文社会科学领域的论文收录和文献被引用情况,是我国人文社会科学评价领域的标志性工程。扩展资料:1.SCI 美国科学信息研究所创建的,收录文献的作者、题目、源期刊、摘要、关键词,不仅可以从文献引证的角度评估文章的学术价值,还可以迅速方便地组建研究课题的参考文献网络。SCI创刊于1961年,SCI(科学引文索引 )、EI(工程索引 )、ISTP(科技会议录索引 ) 是世界著名的三大科技文献检索系统,是国际公认的进行科学统计与科学评价的主要检索工具,其中以SCI最为重要。经过40年的发展完善,已从开始时单一的印刷型发展成为功能强大的电子化、集成化、网络化的大型多学科、综合性检索系统。
是最高级别的核心期刊。
cssci全称为Chinese Social Sciences Citation Index,即为中文社会科学引文索引。cssci主要用来检索中文社会科学领域的论文收录和文献被引用情况。
cssci目前收录包括法学、管理学、经济学、历史学、政治学等在内的25大类的500多种学术期刊,现已开发的CSSCI(1998—2009年)12年度数据,来源文献近100余万篇,引文文献600余万篇。
中文社会科学引文索引有印刷版(《中国社会科学研究计量指标——论文、引文与期刊引用统计》),数据库网络版和光盘版,提供多种信息检索途径。来源文献检索途径:篇名、作者、作者所在地区机构、刊名、关键词、文献分类号、学科类别、学位类别、基金类别及项目、期刊年代卷期等。
cssci、A类、B类、C类、核心期刊的区别如下:
一、创刊单位不同。
1、cssci 是南大核心,南京大学评选的《中文社会科学引文索引》,每两年评一次。
中文全程:中文社会科学引文索引。
英文全称为“Chinese Social Sciences Citation Index”,缩写为CSSCI。
由南京大学中国社会科学研究评价中心开发研制的数据库,用来检索中文社会科学领域的论文收录和文献被引用情况,是我国人文社会科学评价领域的标志性工程。
2、核心期刊,通常是指北大核心,也就是平常说的中文核心,北京大学评选的,4年一次。
3、每个单位,根据自己的研究方向,和自己单位科研领先的专业相近的刊物,通常划归为A类,次之B类,再次之C类。
二、认可度和数量不一样。
1、CSSCI是南大版核心,是在各高校认可度最高的一个核心目录。
2、核心期刊是某学科的主要期刊。一般是指所含专业情报信息量大,质量高,能够代表专业学科发展水平并受到本学科读者重视的专业期刊。
3、一般A类是最顶级的期刊,数量很少,比CSSCI目录中的还要少。B类次之。
三、有没有被收录进CSSCI核心目录是A、B、C期刊的分类标准之一。A类、B类、C类这些刊物,多数都是从cssci 和中文核心期刊里面选择出来。
1、A类一级:被SSCI、A&HCI收录的期刊。SSCI、A&HCI是衡量科研水平的重要标志,学术界通常会把SSCI、A&HCI论文放在最前边。
2、A类二级:CSSCI期刊。CSSCI期刊的学术水平在国内教育界被认可和推崇,是统计“211工程”建设成效、申报各级重点学科、博士点的重要数据,部分CSSCI期刊是高校公认的具有代表性的顶尖期刊。
3、A类三级:属二级学科的全国权威性专业期刊。比B类水平高的重要期刊,可以作为高校科研能力比较、博士论文、省级国家级重点学科申报、教师高级职称评审的重要指标,通常都是某专业内的重要期刊。
4、B类:其他被CSSCI收录的期刊,以及ISSHP收录的论文、新华文摘、中国社会科学文摘、光明日报、人民日报发表的论文都算是B类。
5、C类:没有被CSSCI收录但被《中文核心期刊要目总览》收录的期刊,在学科内有重要影响,多为青年高校教师论文发表的期刊。
扩展资料
期刊鉴别方法:
(1)通过中国新闻出版总署网站进行在线查询登陆中华人民共和国新闻出版总署网站,在新闻机构查询栏中输入媒体名称,并选择媒体类别,进行检索。
若是正式刊物,会显示该期刊的相关信息;若是非法刊物,会显示“当前大陆地区出版发行并经新闻出版总署批准的期刊中未搜索到您查询的期刊!”字样。
(2)通过中国期刊网查询中国期刊网已收录了国内大部分刊物文献,通过此网查询可以识别此刊非彼刊。
(3)通过观察刊物“版权页”上的信息查询如果发现刊物可疑,可以通过版权页上的信息查询。此外还可以通过刊物所在地的大学或编辑部门和刊物所在地的出版管理部门查询。
注意事项 发表论文要发表在有正式刊号的杂志上。当前作者发表论文存在以下几个误区:误区一,发表在论文集上。一些机构打着各种名义编写的论文集,没有正式刊号,在晋升职称时,往往不计分。
参考资料来源:百度百科-核心期刊
参考资料来源:百度百科-中文社会科学引文索引
cssci 是南大核心,南京大学评选的《中文社会科学引文索引》,每两年评一次核心期刊,通常是指北大核心,也就是平常说的中文核心,北京大学评选的,4年一次每个单位,根据自己的研究方向,和自己单位科研领先的专业相近的刊物,通常划归为A类,次之B类,再次之C类一般来说,单位能够划分A类、B类、C类的,基本上要求都是比较高的地方,A类、B类、C类这些刊物,多数都是从cssci 和中文核心期刊里面选择出来的,也有极个别把不是不是核心的报纸刊物划在A类、B类里面,比如人民日报、光明日报等等
是最高级别的核心期刊。
cssci全称为Chinese Social Sciences Citation Index,即为中文社会科学引文索引。cssci主要用来检索中文社会科学领域的论文收录和文献被引用情况。
cssci目前收录包括法学、管理学、经济学、历史学、政治学等在内的25大类的500多种学术期刊,现已开发的CSSCI(1998—2009年)12年度数据,来源文献近100余万篇,引文文献600余万篇。
中文社会科学引文索引有印刷版(《中国社会科学研究计量指标——论文、引文与期刊引用统计》),数据库网络版和光盘版,提供多种信息检索途径。来源文献检索途径:篇名、作者、作者所在地区机构、刊名、关键词、文献分类号、学科类别、学位类别、基金类别及项目、期刊年代卷期等。
这种划分方式按期刊代表学术水平通常A类>B类>C类。A刊、B刊、C刊是一些单位对期刊水平的简单认定,A刊、B刊、C刊和普刊的区分有不同标准,一般以学术水平来区分。
具体而言:C刊=CSSCI=南大核心期刊,北大核心期刊一般简称核心。南大核心的范围要比北大核心要小。
CSSCI里顶级的期刊,有的学校认定为A,那就是中文期刊里最高级的。而B刊是各学校以自己的标准自己规定的。所以如果要发表论文,还是要到本校相关部门问清本校的期刊分类目录,才好决定投稿对象。
核心期刊
通常所说的核心期刊是指北大版的中文核心期刊,指被北大图书馆每三年出版一次的《中文核心期刊要目总览》中列出的期刊。
广泛意义的核心期刊包括所有的核心数据库。首先当然包括南大核心,即南京大学“中文社会科学引文索引来源期刊”,C刊。
其次就是北大核心,就是指被北大图书馆每三年出版一次的《中文核心期刊要目总览》中列出的期刊。
再次还有科技核心期刊,即中国科学技术信息研究所的“中国科技论文统计源期刊”。
CSSCI是核心期刊的一种,CSSCI是南大核心期刊,国内核心期刊有七大类,在国内的影响力和认可度有所不同,南大核心期刊可以算是国内核心期刊中的顶尖刊物,是位于核心期刊体系之首的期刊。
cssci是什么级别的刊物?中国科学引文索引是中国科技信息研究院主管的中国科技核心期刊遴选工作以中国科技信息研究院核心期刊选刊标准为基础,充分体现了主办单位中国科技引文索引事业发展委员会的科学选刊标准。 这个技术的评估方法主要是以中国科技信息研究院核心期刊选刊标准作为起点的。sci相对来说难度会高一些,但中国有中科院、北大核心。 先看你是搞研究还是写论文。搞研究肯定是中国科技核心。基本差不多。 没有特别的关系,现在区别主要在你上的级别是什么,如果是医学方面的相关研究,比如肿瘤、泌尿、甲状腺、肾脏等等,会更侧重于中国科技核心,如果是基础研究相关,尤其是汉字和阿拉伯数字相关,更侧重sci如果看sci要求,毫无疑问的中国科技核心。 如果看中国科技引文索引cscd,两者都可以。 但是一般读博士主要看sci。看你看重哪一方面的学术研究,国家级的还是省级的,基本看ifesi是综合国内外开放引用数据库所收录的信息,对国际学术期刊有最全面的统计。在学术界有很多名校对此研究的比较透彻。 所以看你要看重的是什么。cscd和sci都是国际a类核心期刊。 ps这个是提高学术的一条路。 别走歪了。医学类的还是建议sci建议只看sci而不要看中国科技核心。
cssci论文格式
CSSCI一般指中文社会科学引文索引,用来检索中文社会科学领域的论文收录和文献被引用情况。
1、 封面:
下载统一封面,指导老师栏暂时不填
2、 题目:
毕业论文(设计)题目字数不的超过2个汉字,题目过长可设正、副标题,题目用三号黑体,居中,与下文“摘要”二字空一行距。
3、 中文摘要及关键词:
摘要是论文内容的简要陈述,应尽量反映论文的主要信息,包括研究目的、方法、成果和结论,不含图表,不加注释,具有独立性和完整性。中文摘要一般在1—15字,外文摘要内容应与中文摘要内容完全相同。外文摘要字体用Times New Roman。
“摘要”二字的字样:用三号黑体,“摘”字与“要”字之间空两字符并居中。
关键词是反映毕业论文(设计)主题内容的名词,是供检索使用的。主题词条应为通用技术词汇,不得自造关键词。关键词一般为3—5个,不能写成关键语,按词条意义和逻辑顺序,由宏观到微观排列。
关键词排在摘要文字部分下方。
4、 目录:
目录要与正文题序层次一致,按级编写,要求层次清晰。
“目录”二字的字样用三号黑体字,“目”字与“录”字之间空两字符并居中。
5、 正文:
论文正文部分包括:绪论(或引言、序言)、论文主体及结论。
绪论是综合评述前人工作,说明论文工作的选题目和意义,国内外文献综述,以及论文所要研究的内容。
论文主体是论文的主要组成部分。要求层次清楚,文字简练,通顺,重点突出。结论是整个论文的总结,应以简练的文字说明论文所做的工作,或者说明作者认为最需要强调的带结论性问题,一般不超过一页。
正文字数:3—8字
6、 注释:
正文中引用他人的观点及原话、主要数据等必要注明出处,有需要解释的内容,可以加注说明。所引用著作需注明:作者、著作名、出版单位和出版年号、页号;所引资料来自刊物需注明:作者、篇名、发表的刊物名、出版年号、期号、页码一律采用尾注。
7、 参考文献:
为了反映论文的科学依据和作者尊重他人研究成果的严肃态度,同时向读者提供有关信息的出处,正文之后一般应刊出主要参考文献。列出的`只限于那些作者亲自阅读过的,最重要的且发表在工开出版文物上的文献或网上下载的资料。参考文献应在每一行开头排出序号,置于所引用部分的右上角如:xxx1。参考文献表上的著作按论文中引用顺序排列,著作按如下格式著录:序号 著者 书名(期刊) 出版地:出版社,出版年月。
参考文献的数量:本科毕业论文要求著作三本以上,论文1篇以上;参考文献呢内容另起一页,参考文献字体为三号黑体并居中,其中参考文献要分类别,如:著作类、论文类、网站类等等。
8、 致谢词(可选可不选,作者自定):
对导师和给予指导或协助完成毕业论文(设计)工作的组织和个人表示感谢。文字要简捷、实事求是,切忌浮夸和庸俗之词。致谢词亦可写为后记,致谢词内容另起一页,用三号黑体字并居中。如写为“后记”,“后”字与“记”字之间空两个用三号黑体字并居中。
(一)需报送全文,文稿请用word录入排版。字数不超过5000字。
(二)应完整扼要,涉及主要观点的图片、曲线和表格不能缺少,正文要有“结论”部分。如稿件内容不清或文章篇幅超长等原因,编辑有权删改。
(三)论文结构请按下列顺序排列:
1.大标题(第一行):三黑字体,居中排。
2.姓名(第二行):小三楷字体,居中排。
3.作者单位或通信地址(第三行):按省名、城市名、邮编顺序排列,用小三楷字体。
4.关键词。需列出4个关键词,小三楷字体。第1个关键词应为二级学科名称。学科分类标准执行国家标准;关键词后请列出作者的中国科协所属全国性学会个人会员的登记号
5.正文。小四号宋体。文中所用计量单位,一律按国际通用标准或国家标准,并用英文书写,如km2,kg等。文中年代、年月日、数字一律用阿拉伯数字表示。
正文中的各级标题、图、表体例见下表:
表;标题体例
标题级别字体字号格式说明
一级标题三号标宋居中题目
二级标题四号黑体左空2字,单占行汉字加顿号,如“一、”
三级标题四号仿宋体左空2字,单占行汉字加括号,如“(一)”
四级标题小四号黑体左空2字,单占行阿拉伯数字加下圆点,如“1。”
五级标题小四号宋体左空2字,右空1字,接排正文阿拉伯数字加括号,如“(1)”允许用于无标题段落
图、表、注释及参考文献体例
内容字体字号格式说明
图题五号宋体排图下,居中,单占行图号按流水排序,如“图1;“图2”
图注小五号宋体排图题下,居中,接排序号按流水排序,如“1。”;“2。”
表题五号黑体排表上,居中,可在斜杠后接排计量单位,组合单位需加括号如“表2几种发动机的最大功率/kW”“表5几种车辆的速度/(km/h)”表序号按流水排序,如“表1”、“表2”
表栏头小五号宋体各栏居中,计量单位格式同上
图文/表文小五号宋体表文首行前空1字,段中可用标点,段后不用标点
6.参考文献。文章必须有参考文献。“参考文献”4字作为标题,字体五黑,居中,其他字体五宋。文献著录格式如下:
(1)著作:作者姓名。书名。出版社名,出版年月,页码(如有两个以上作者,作者间用逗号分开)
(2)期刊:作者姓名。文章名。期刊名,年份,卷(期)、页码。
7.作者简介。请在参考文献之后附作者简介。“作者简介”请用五黑字体左起顶格排,后空一格,接排。作者简介字体五宋,100字以内,包括姓名、参加的全国性学会名称、中国科协个人会员登记号、工作单位、电话、传真、电子信箱等。
CSSCI是南京大学核心期刊目录里认定的期刊,是国内最权威的期刊,其次是北京大学核心期刊。CSSCI是最难发的核心了,一般来说,一个教授能发一两篇南核,就是很厉害的了。但是即便是教授,如果发表这里的期刊也是不容易。
中文社会科学引文索引英文全称为"Chinese Social Sciences Citation Index",缩写为CSSCI。用来检索中文社会科学领域的论文收录和文献被引用情况。
"中文社会科学引文索引"(CSSCI)由南京大学中国社会科学研究评价中心开发研制而成,是国家、教育部重点课题攻关项目。CSSCI遵循文献计量学规律,采取定量与定性评价相结合的方法从全国2700余种中文人文社会科学学术性期刊中精选出学术性强、编辑规范的期刊作为来源期刊。
目前收录包括法学、管理学、经济学、历史学、政治学等在内的25大类的500多种学术期刊,现已开发的CSSCI(1998-2009年)12年度数据,来源文献近100余万篇,引文文献600余万篇。
早上或者午后,我一般是中午饭后服用两粒Mkule NMN胶囊,坚持服用下来明显感觉精神状态更好,精力充沛没有疲劳和困倦。你可以统一去知道了解下
iscience被sci纳入,应该属于核心水平期刊了,可以多多留意它。iScience是CellPress于2018年新开的综合性开源期刊。该杂志主要发表包括生命科学、物理学和材料科学在内的基础和应用研究。该杂志将成为一个多学科交叉和开放获取的同行评阅期刊。
人工智能和机器学习技术的快速发展,使得AI 主题会议也层出不穷,下面带大家一起了解一下人工智能领域的顶会都有哪些1. CVPR 国际计算机视觉与模式识别会议(CVPR)是IEEE一年一度的学术性会议,会议的主要内容是计算机视觉与模式识别技术。CVPR是世界顶级的计算机视觉会议(三大顶会之一,另外两个是 ICCV 和 ECCV ),近年来每年有约1500名参加者,收录的论文数量一般300篇左右。本会议每年都会有固定的研讨主题,而每一年都会有公司赞助该会议并获得在会场展示的机会。 2. ECCV ECCV 的全称是European Conference on Computer Vision(欧洲计算机视觉国际会议) ,两年一次,是计算机视觉三大会议(另外两个是ICCV和CVPR)之一。每次会议在全球范围录用论文300篇左右,主要的录用论文都来自美国、欧洲等顶尖实验室及研究所,中国大陆的论文数量一般在10-20篇之间。ECCV2010的论文录取率为27% 3.ICCV ICCV 的全称是 IEEE International Conference on Computer Vision,即国际计算机视觉大会,由IEEE主办,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议,被澳大利亚ICT学术会议排名和中国计算机学会等机构评为最高级别学术会议,在业内具有极高的评价。不同于在美国每年召开一次的CVPR和只在欧洲召开的ECCV,ICCV在世界范围内每两年召开一次。ICCV论文录用率非常低,是三大会议中公认级别最高的. 4. ICLR ICLR ,全称为「International Conference on Learning Representations」(国际学习表征会议),2013 年才刚刚成立了第一届。这个一年一度的会议虽然今年(2018)才办到第六届,但已经被学术研究者们广泛认可,被认为「深度学习的顶级会议」。这个会议的来头不小,由位列深度学习三大巨头之二的 Yoshua Bengio 和 Yann LeCun 牵头创办。 5. NIPS NIPS (NeurIPS),全称神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems),是一个关于机器学习和计算神经科学的国际会议。该会议固定在每年的12月举行,由NIPS基金会主办。NIPS是机器学习领域的顶级会议。在中国计算机学会的国际学术会议排名中,NIPS为人工智能领域的A类会议。 6.ICML ICML 是 International Conference on Machine Learning的缩写,即国际机器学习大会。ICML如今已发展为由国际机器学习学会(IMLS)主办的年度机器学习国际顶级会议。 7. IJCV 国际期刊计算机视觉,详细描绘了信息科学与工程这一领域的快速发展。一般性发表的文章提出广泛普遍关心的重大技术进步。短文章提供了一个新的研究成果快速发布通道。综述性文章给与了重要的评论,以及当今发展现状的概括。 8. PAMI PAMI 是IEEE旗下,模式识别和机器学习领域最重要的学术性汇刊之一。在各种统计中,PAMI被认为有着很强的影响因子和很高的排名。 9. AAAI 国际人工智能协会。前身为美国人工智能协会,目前是一个非盈利的学术研究组织,致力于推动针对智能行为本质的科学研究 10. IJCAI IJCAI 全称为人工智能国际联合大会(International Joint Conference on Artificial Intelligence),是国际人工智能领域排名第一的学术会议,为 CCF A 类会议。该会议于 1969 年首度在美国华盛顿召开,随着人工智能的热度日益攀升,原本仅在奇数年召开的IJCAI 自 2015 年开始变成每年召开。 11. ACM/MM ACMMM 是全球多媒体领域的顶级会议,会议每年通过组织大规模图像视频分析、社会媒体研究、多模态人机交互、计算视觉、计算图像等影响多媒体行业的前沿命题竞赛,引领全球新媒体发展方向。 12. TNNLS 从英文翻译而来-IEEE神经网络与学习系统交易是由IEEE计算智能学会出版的月度同行评审科学期刊。它涵盖了神经网络和相关学习系统的理论,设计和应用。
2019 年可以说是「预训练模型」流行起来的一年。自 BERT 引发潮流以来,相关方法的研究不仅获得了 EMNLP 大会最佳论文等奖项,更是在 NLP、甚至图像领域里引领了风潮。
去年也有很多 游戏 AI 取得了超越人类的水平。人工智能不仅已经玩转德州扑克、星际争霸和 Dota2 这样复杂的 游戏 ,还获得了 Nature、Science 等顶级期刊的肯定。
机器之心整理了去年全年 在人工智能、量子计算等领域里最为热门的七项研究 。让我们以时间的顺序来看:
第一个重磅研究出现在 2 月,继发布刷新 11 项 NLP 任务记录的 3 亿参数量语言模型 BERT 之后,谷歌 OpenAI 于 2019 年 2 月再次推出了一种更为强大的模型,而这次的模型参数量达到了 15 亿。这是一种 大型无监督语言模型 ,能够生产连贯的文本段落,在许多语言建模基准上取得了 SOTA 表现。此外,在没有任务特定训练的情况下,该模型能够做到初步的阅读理解、机器翻译、问答和自动摘要。
该模型名为 GPT-2,它是基于 Transformer 的大型语言模型,包含 15 亿参数、在一个 800 万网页数据集上训练而成。训练 GPT-2 有一个简单的目标:给定一个文本中前面的所有单词,预测下一个单词。GPT-2 是对 GPT 模型的直接扩展,在超出 10 倍的数据量上进行训练,参数量也多出了 10 倍。
GPT-2 展示了一系列普适而强大的能力,包括生成当前最佳质量的条件合成文本,其中我们可以将输入馈送到模型并生成非常长的连贯文本。此外,GPT-2 优于在特定领域(如维基百科、新闻或书籍)上训练的其它语言模型,而且还不需要使用这些特定领域的训练数据。在 知识问答、阅读理解、自动摘要和翻译等任务 上,GPT-2 可以从原始文本开始学习,无需特定任务的训练数据。虽然目前这些下游任务还远不能达到当前最优水平,但 GPT-2 表明如果有足够的(未标注)数据和计算力,各种下游任务都可以从无监督技术中获益。
最后,基于大型通用语言模型可能会产生巨大的 社会 影响,也考虑到模型可能会被用于恶意目的,在发布 GPT-2 时,OpenAI 采取了以下策略: 仅发布 GPT-2 的较小版本和示例代码,不发布数据集、训练代码和 GPT-2 模型权重 。
机器学习顶会的最佳论文,总会引起人们的广泛讨论。在今年 6 月于美国加州举办的 ICML 2019(国际机器学习大会)上,由苏黎世联邦理工学院(ETH)、德国马普所、谷歌大脑共同完成的《Challenging Common Assumptions in the Unsupervised Learning of Disentangled Representations》获得了其中一篇最佳论文。研究者在论文中提出了一个与此前学界普遍预测相反的观点:对于任意数据,拥有相互独立表征(解耦表征)的无监督学习是不可能的。
论文链接:
在这篇论文中,研究者冷静地审视了该领域的最新进展,并对一些常见的假设提出了质疑。
首先,研究者表示从理论上来看,如果不对模型和数据进行归纳偏置,无监督学习解耦表征基本是不可能的;然后他们在七个不同数据集进行了可复现的大规模实验,并训练了 12000 多个模型,包括一些主流方法和评估指标;最后,实验结果表明,虽然不同的方法强制执行了相应损失「鼓励」的属性,但如果没有监督,似乎无法识别完全解耦的模型。此外,增加的解耦似乎不会导致下游任务学习的样本复杂度的下降。
研究者认为,基于这些理论,机器学习从业者对于超参数的选择是没有经验法则可循的,而在已有大量已训练模型的情况下, 无监督的模型选择仍然是一个很大的挑战 。
去年 6 月,来自德国波恩-莱茵-锡格应用技术大学和谷歌大脑的研究者发表了一篇名为《Weight Agnostic Neural Networks》的论文,进而引爆了机器学习圈。在该论文中,他们提出了一种神经网络架构搜索方法, 这些网络可以在不进行显式权重训练的情况下执行各种任务 。
论文链接:
通常情况下,权重被认为会被训练成 MNIST 中边角、圆弧这类直观特征,而如果论文中的算法可以处理 MNIST,那么它们就不是特征,而是函数序列/组合。对于 AI 可解释性来说,这可能是一个打击。很容易理解,神经网络架构并非「生而平等」,对于特定任务一些网络架构的性能显著优于其他模型。但是相比架构而言,神经网络权重参数的重要性到底有多少?
来自德国波恩-莱茵-锡格应用技术大学和谷歌大脑的一项新研究提出了一种神经网络架构搜索方法,这些网络可以在不进行显式权重训练的情况下执行各种任务。
为了评估这些网络,研究者使用从统一随机分布中采样的单个共享权重参数来连接网络层,并评估期望性能。结果显示,该方法可以找到少量神经网络架构,这些架构可以在没有权重训练的情况下执行多个强化学习任务,或 MNIST 等监督学习任务。
BERT 带来的影响还未平复,CMU 与谷歌大脑 6 月份提出的 XLNet 在 20 个任务上超过了 BERT 的表现,并在 18 个任务上取得了当前最佳效果。
来自卡耐基梅隆大学与谷歌大脑的研究者提出新型预训练语言模型 XLNet,在 SQuAD、GLUE、RACE 等 20 个任务上全面超越 BERT。
作者表示, BERT 这样基于去噪自编码器的预训练模型可以很好地建模双向语境信息,性能优于基于自回归语言模型的预训练方法 。然而,由于需要 mask 一部分输入,BERT 忽略了被 mask 位置之间的依赖关系,因此出现预训练和微调效果的差异(pretrain-finetune discrepancy)。
基于这些优缺点,该研究提出了一种泛化的自回归预训练模型 XLNet。XLNet 可以:1)通过最大化所有可能的因式分解顺序的对数似然,学习双向语境信息;2)用自回归本身的特点克服 BERT 的缺点。此外,XLNet 还融合了当前最优自回归模型 Transformer-XL 的思路。
延伸阅读:
2019 年 7 月,在无限制德州扑克六人对决的比赛中,德扑 AI Pluribus 成功战胜了五名专家级人类玩家。Pluribus 由 Facebook 与卡耐基梅隆大学(CMU)共同开发,实现了前辈 Libratus(冷扑大师)未能完成的任务,该研究已经登上了当期《科学》杂志。
据介绍,Facebook 和卡内基梅隆大学设计的比赛分为两种模式:1 个 AI+5 个人类玩家和 5 个 AI+1 个人类玩家,Pluribus 在这两种模式中都取得了胜利。如果一个筹码值 1 美元,Pluribus 平均每局能赢 5 美元,与 5 个人类玩家对战一小时就能赢 1000 美元。职业扑克玩家认为这些结果是决定性的胜利优势。 这是 AI 首次在玩家人数(或队伍)大于 2 的大型基准 游戏 中击败顶级职业玩家 。
在论文中,Pluribus 整合了一种新的在线搜索算法,可以通过搜索前面的几步而不是只搜索到 游戏 结束来有效地评估其决策。此外,Pluribus 还利用了速度更快的新型 Self-Play 非完美信息 游戏 算法。综上所述,这些改进使得使用极少的处理能力和内存来训练 Pluribus 成为可能。 训练所用的云计算资源总价值还不到 150 美元 。这种高效与最近其他人工智能里程碑项目形成了鲜明对比,后者的训练往往要花费数百万美元的计算资源。
Pluribus 的自我博弈结果被称为蓝图策略。在实际 游戏 中,Pluribus 使用搜索算法提升这一蓝图策略。但是 Pluribus 不会根据从对手身上观察到的倾向调整其策略。
在人工智能之外的量子计算领域,去年也有重要的研究突破。2019 年 9 月,谷歌提交了一篇名为《Quantum supremacy using a programmable superconducting processor》的论文自 NASA 网站传出,研究人员首次在实验中证明了量子计算机对于传统架构计算机的优越性:在世界第一超算 Summit 需要计算 1 万年的实验中,谷歌的量子计算机只用了 3 分 20 秒。因此,谷歌宣称实现「量子优越性」。之后,该论文登上了《自然》杂志 150 周年版的封面。
这一成果源自科学家们不懈的努力。谷歌在量子计算方向上的研究已经过去了 13 年。2006 年,谷歌科学家 Hartmut Neven 就开始 探索 有关量子计算加速机器学习的方法。这项工作推动了 Google AI Quantum 团队的成立。2014 年,John Martinis 和他在加利福尼亚大学圣巴巴拉分校(UCSB)的团队加入了谷歌的工作,开始构建量子计算机。两年后,Sergio Boixo 等人的论文发表,谷歌开始将工作重点放在实现量子计算优越性任务上。
如今,该团队已经构建起世界上第一个超越传统架构超级计算机能力的量子系统,可以进行特定任务的计算。
量子优越性实验是在一个名为 Sycamore 的 54 量子比特的完全可编程处理器上运行的。该处理器包含一个二维网格,网格中的每个量子比特与其他四个相连。量子优越性实验的成功归功于谷歌改进了具有增强并行性的双量子比特门,即使同时操作多个门,也能可靠地实现记录性能。谷歌使用一种新型的控制旋钮来实现这一性能,该旋钮能够关闭相邻量子比特之间的交互。此举大大减少了这种多连通量子比特系统中的误差。此外,通过优化芯片设计来降低串扰,以及开发避免量子比特缺陷的新控制校准,谷歌进一步提升了性能。
虽然 AI 没有打败最强人类玩家 Serral,但其研究的论文仍然登上了 Nature。2019 年 10 月底,DeepMind 有关 AlphaStar 的论文发表在了当期《Nature》杂志上,这是人工智能算法 AlphaStar 的最新研究进展,展示了 AI 在「没有任何 游戏 限制的情况下」已经达到星际争霸Ⅱ人类对战天梯的顶级水平,在 Battle.net 上的排名已超越 99.8%的活跃玩家 。
回顾 AlphaStar 的发展历程,DeepMind 于 2017 年宣布开始研究能进行即时战略 游戏 星际争霸Ⅱ的人工智能——AlphaStar。2018 年 12 月 10 日,AlphaStar 击败 DeepMind 公司里的最强玩家 Dani Yogatama;12 月 12 日,AlphaStar 已经可以 5:0 击败职业玩家 TLO 了(TLO 是虫族玩家,据 游戏 解说们认为,其在 游戏 中的表现大概能有 5000 分水平);又过了一个星期,12 月 19 日,AlphaStar 同样以 5:0 的比分击败了职业玩家 MaNa。至此,AlphaStar 又往前走了一步,达到了主流电子竞技 游戏 顶级水准。
根据《Nature》论文描述,DeepMind 使用通用机器学习技术(包括神经网络、借助于强化学习的自我博弈、多智能体学习和模仿学习)直接从 游戏 数据中学习。AlphaStar 的 游戏 方式令人印象深刻——这个系统非常擅长评估自身的战略地位,并且准确地知道什么时候接近对手、什么时候远离。此外,论文的中心思想是将 游戏 环境中虚构的自我博弈扩展到一组智能体,即「联盟」。
联盟这一概念的核心思想是:仅仅只是为了赢是不够的。相反,实验需要主要的智能体能够打赢所有玩家,而「压榨(exploiter)」智能体的主要目的是帮助核心智能体暴露问题,从而变得更加强大。这不需要这些智能体去提高它们的胜率。通过使用这样的训练方法,整个智能体联盟在一个端到端的、完全自动化的体系中学到了星际争霸Ⅱ中所有的复杂策略。
2019 年在 AI 领域的各个方向上都出现了很多技术突破。新的一年,我们期待更多进展。
此外,机器之心于 2019 年 9 月底推出了自己的新产品 SOTA 模型,读者可以根据自己的需要寻找机器学习对应领域和任务下的 SOTA 论文,平台会提供论文、模型、数据集和 benchmark 的相关信息。