cvpr最佳学生论文_学术参考网

cvpr最佳学生论文

孙剑老师对整个 AI 界的贡献是巨大的，毋庸置疑，ResNet，Faster RCNN 都是耳熟能详的名字。关于他的贡献，孙剑教授无论是在学术上还是产业上，都做得非常好。任何一个搞CV算法，尤其是DL相关的人，都很难绕开孙博这个节点。

学术上：孙剑教授发表了学术论文百余篇，被引超过了25万次，并且在2009和2009两次获得CVPR计算机视觉年会的最佳论文。产业上：孙剑教授加入旷视科技任首席科学家，并且他在2017年带领旷视研究院击败了谷歌、脸书、微软等科技巨头，获得了COCO&Places图像理解国际大赛三项冠军，拥有超过40多项专利。

大学里任何一位老师，只要获得孙剑教授学术上的成就或者产业上的成就，就属于凤毛麟角，孙剑教授在学术上和产业上成就显著，由此可见孙剑教授多么优秀，没想到如此杰出的一位教授，在年仅45岁的时候就不幸因病去世，真的是太让人惋惜了。孙老师是在公司内经常被人提及的名字。孙老师在这个领域的贡献是极大的，能力是极高的，就算是在旷视这种天才云集的公司，孙老师也是让人高山仰止的存在。

孙剑博士是旷视首席科学家、旷视研究院院长，CV领域TOP级别的人物，何凯明在微软亚洲研究院实习的导师，最著名的ResNet通讯作者。他带领旷视研究院研发了多项创新技术，引领前沿人工智能应用。只要从事深度学习基本上都知道他的重量级存在。孙老师的科研哲学理念对我们的影响非常大，论坛邮件里有大量关于做科研和工作的心得。

论文阅读 | CVPR2017(Best Paper) | Densely Connected Convolutional Networks

大名鼎鼎的DenseNet，17年CVPR的best paper（当然有争议是后话），不得不读。黄高博士的扛鼎之作，之前在读他的Snapshot-Ensembles时感觉就很舒服，整个文章逻辑很清楚，实验对比做的也十分全面，相信这篇best paper更是没有问题，会给读者一种爽的感觉。

2019.2.20 2852次。绝对值很高，但相比其他经典网络，ResNet，GoogLeNet之类，有些差距。

本篇在16年8月挂到arXiv上，中了2017年CVPR，是继16年何大神的ResNet之后，第二个华人的best paper，这里有个作者本尊的talk，现场讲解。一作Gao Huang（黄高）05年北航的本科生（GPA第一），15年清华博士毕业（读了6年。。），后来在康奈尔待了3年做博后，此刻在清华作青椒，本篇是在康奈尔时的工作。二作刘壮（同等贡献）也是碉堡，现在在伯克利做博士生，之前是清华姚班的（13级），发这篇文章时还在清华，也就是说本科生。。。最近以一作的身份新发了一篇《Rethinking the Value of Network Pruning》，中了19年的ICLR，同时也是18年NIPS的best paper award。。这个世界太疯狂了，这都不是潜力股了，而是才华横溢溢的不行了。

官方实现在这里：

黄高个人主页在这里：

刘壮个人主页在这里：

先前的研究中说明只要网络包含短路连接，基本上就能更深，更准确，更有效的训练。本文基于这个观察，引入了密集卷积网络（DenseNet），它以前馈方式将每个层连接到所有层。传统的卷积网络L层有L个连接，而DenseNet有个直接连接。对于每一层，它前面所有层的特征图都当作输入，而其本身的特征图作为所有后面层的输入（短路连接被发挥到极致，网络中每两层都相连）。DenseNet具有几个引入注目的优点：可以缓解梯度消失问题，加强特征传播，鼓励特征重用，并大幅减少参数数量。

随着CNN变得越来越深，一个新的研究问题出现了：随着输入信息或梯度通过多层，它在到达网络结尾（或开始）处就消失了。ResNets和Highway Networks通过恒等连接将信号从一层传输到下一层。Stochastic depth通过在训练期间随机丢弃层来缩短ResNets，以得到更好的信息和梯度流。FractalNets重复组合几个并行层序列和不同数量的卷积块，以获得较深的标准深度，同时在网络中保持许多短路径。尽管上述方法的网络结构都有所不同，但它们有一个共同特征：创建从早期层到后期层的短路径。

本文提出一个简单的连接模式：为了确保网络中各层之间的最大信息流，将所有层（匹配特征图大小）直接相互连接。为了保持前向传播性质，每个层从所有前面的层获得附加输入，并将其自身特征图传递给所有后续层。

至关重要的是，与ResNets相比，在传递给下一层之前，不是通过求和来合并特征，而是通过concat来合并特征。因此，层有个输入，包括所有先前卷积块的特征图。其特征图被传递到后续所有层。这在L层网络中引入了个连接，而不是传统架构的L个连接。正是因为这种密集连接模式，所以称本文方法为密集连接网络（ Dense Convolutional Network DenseNet）。

相比传统卷积网络，这种密集连接模式有有一点可能违反直觉的是，它需要更少的参数，因为无需重新学习冗余的特征图。本文提出的DenseNet架构显式区分了添加到网络的信息和保留的信息。DenseNet的层非常窄（如每层只有12个滤波器），只给网络的"集体知识"增加一小组特征图，并保持其余的特征图不变。

除了更好的参数利用率之外，DenseNet的一大优势是它改善了整个网络中的信息流和梯度，使得网络更易于训练。每层都可以直接访问损失函数和原始输入信号的梯度（我屮，这不就是GoogLeNet当时为解决梯度消失而在中间层引入分类器那种ugly办法的替代吗），从而导致隐式的深度监督。这有助于训练更深的网络。

与DenseNet相似的级联结构早在1989年就提出来了。。Adanet的提出差不多是与DenseNet并行的，跨层连接也相似（话说竞争真激烈。。）

本文作者提出的另一个网络Stochastic depth说明并非所有层都需要，在深度残差网络中存在大量冗余的层。本文的部分灵感也来源于此。

相比从极深或极宽的架构中提取表示能力，DenseNet是通过特征重用来利用网络的潜力，得到易于训练和高参数效率的压缩模型。相比从不同层拼接特征的Inception网络，DenseNet更简单有效（看来Inception因其结构复杂性没少被批判）。

定义为单张输入图像，网络由层组成，每一层实现非线性变换，其中为层的索引号。可以是BN，ReLU，Pooling，Conv等操作的复合函数，定义层的输出为。

传统的层连接：。ResNets增加了跳跃连接：。ResNets的一个优势是梯度可以通过恒等函数直接从后面的层流向前面的层。然而，恒等函数和的输出通过加法合并，有可能会阻碍网络的信息流。

本文引入与ResNets不同的连接模式：从任意层到所有后续层的直接连接（图1）。结果就是，第层接收所有之前层的特征图作为输入：。为了便于实现，concat 的多个输入为单一张量。

受ResNet v2启发，定义为三个连续运算的复合函数：BN，ReLU，3 x 3 Conv

当特征图的大小改变时，concat运算是不可能的，然鹅，卷积网络的一个关键组成部分就是下采样层，通过它可以改变特征图大小。为了便于在架构中进行下采样，将网络划分为多个密集连接的密集块（dense blocks），如图2所示。

将密集块之间的层称为过渡层（transition layers），它们进行卷积和池化。本文实验中的过渡层由BN，1 x 1卷积和 2 x 2平均池化组成。

如果每个函数生成个特征图，它后面跟着的层有个输入特征图，其中是输入层的通道数。DenseNet和现有网络架构的一个重要区别是DenseNet可以有非常窄的层，如。本文将超参数定义为网络的成长率（growth rate）。对此的一种解释是，每一层都可以访问其块中所有前面的特征图，即，网络的『集体知识』。可以将特征图视为网络的全局状态。每一层增加自己的个特征图到这个状态。成长率反映了每层由多少新信息对全局状态有贡献。全局状态一旦写入，就可以被网络中的任何地方访问，而不像传统网络那样，无需从一层复制到另一层。（全文精华应该就是这一段了）

1x1 conv非常有用（提升计算效率），本文也大用特用。本文定义DenseNet-B的为 BN-ReLU-Conv(1x1)-BN-ReLU-Conv(3x3)

为了使模型更紧凑，可以减少过渡层的特征图数量。如果密集块包含个特征图，定义接下来的过渡层生成个特征图，其中表示压缩率。定义的DenseNet为DenseNet-C，本位实验中设置为。当同时使用瓶颈层和压缩过渡层时，定义模型为DenseNet-BC。

非ImageNet数据集采用同一个架构，由3个密集块构成。ImageNet的架构如表1所示

CIFAR SVHN ImageNet

所有网络都用SGD。

CIFAR和SVHN的batch size为64，epoch分别为300和40，初始学习率为0.1，在50%和75%的epoch时分别除10。

ImageNet的batch size为256，90个epoch，初始学习率为0.1，在30和60epoch时分别除10。

weight decay为，动量为0.9。用He初始化。

对于CIFAR和SVHN，还在每个卷积层后接了dropout层（除第一个卷积层外），丢失率为0.2。

看表2的最后一行

DenseNet可以利用更大更深模型表示能力的增长。

如图4所示

主要用DenseNet-BC和ResNet作比较。

表面上看，DenseNets和ResNets没什么不同，两个式子的差别仅仅是输入从加法变为concat，然而，这种看似很小的修改导致两种网络架构的行为明显不同。

因为鼓励特征重用，所以得到更紧凑的模型。

如图4所示。

对DenseNets准确率提升的一种解释是各个层通过短路连接从损失函数接收额外的监督（某种深度监督）。DenseNets用隐式的方式执行相似的深度监督：网络顶部的单个分类器通过最多两到三个过渡层为所有层提供直接监督。然而，由于在所有层之间共享相同的损失函数，因此DenseNets的损失函数和梯度基本上不那么复杂。

和随机深度的对比，随机深度有点类似DenseNet：如果所有中间层都随机丢弃，那么在相同的池化层之间的任意两层都有可能直接连接。

DenseNet就是好，就是好啊就是好。在遵循简单的连接规则的同时，DenseNets自然地整合了恒等映射，深度监督和多样化深度的属性。

又是一篇没有什么数学公式的paper，越来越感觉深度学习像物理，很多结果都是基于做实验得到的。通过对实验的观察对比分析，找出实验中的缺陷不足，从而去改进，然后发paper。黄高博士的写作套路还是非常讨喜的，特别是开头的地方，娓娓道来，一步一步告诉你为什么要这么做，为什么要引入这一步。此外，DenseNets和作者本人的工作『随机深度』也有千丝万缕的关系，看来功夫做扎实了，沿着一条道路是可以出一系列成果的。

这是个好问题。。是要进一步衍生ResNet吗？

提出密集连接结构，将ResNet的跳跃连接发扬光大为两两连接

效果比ResNet还好，通过减少滤波器个数（文中称作成长率），参数量也下来了

感觉效果提升并没有那么明显，被后续出来的ResNeXt超过了

各种网络结构的实现：

黄高本人视频讲解：

作者本人的解答： CVPR 2017最佳论文作者解读：DenseNet 的“what”、“why”和“how”

DenseNet的3个优势：

清华十大学神之吴佳俊太神了！

1 吴佳俊简介
　　据其清华校友蒋林浩同学透露，目前吴佳俊可能不在国内，而在国外交流学习。对于吴佳俊的情况，蒋林浩表示，吴佳俊平时非常低调，作为好友他不便过多透露相关信息。清华大学交叉信息研究院办公室负责人也表示，吴佳俊成绩确实非常优秀，院办也早有耳闻，其他信息不便透露。

　　吴佳俊在进清华之前就曾拿过2009年全国青少年信息学奥林匹克竞赛一等奖。考进大学后，2012年荣获清华大学蒋南翔奖学金，该奖学金是清华大学三项最高奖学金之一。
1 吴佳俊事迹
　　“清华新一代学神出现了!论文数量质量赶超老师，清华新一代学神男神吴佳俊，2010年从华东师大二附中考入清华大学计算机科学与技术系。三年年级名次第一、世界顶级的计算机视觉会议CVPR审稿人，发表论文数量质量向老师看齐，各种奖学金拿到手软。看到审稿人三个字疯了!学渣默默飘过。”昨天，人人网推荐的一个热门话题引来不少网友的关注。

　　事件原由是清华大学学生李轻飏上传网络的一张照片，照片显示的是清华大学交叉信息研究院大三学生吴佳俊参选2013年清华大学本科生特等奖学金的个人履历介绍。履历表上各种获奖信息和成绩排名让不少网友感慨，“新学神出现了!”李轻飏告诉记者，该奖学金是清华大学最高级别的奖学金，全校仅10个名额左右。

　　对清华十大学神之一吴佳俊的个人简历，网友最称道的是其“CVPR2014审稿人”的身份。“我们多少年才出了几篇CVPR，前两天院长还说CVPR是CV(计算机视觉)领域教授们的梦想呢。那厢清华就出了CVPR学生审稿人，膜拜!”网友表示这个身份很多老师也要奋斗多年才能拿到。南京大学计算机专业毕业的陈先生告诉记者，CVPR是世界顶级的计算机视觉会议，是全球三大顶级会议之一。能当上审稿人，至少此前已经有一两篇论文入选CVPR，而履历表上显示吴佳俊已有五篇入选，“这对于一个大三学生来说，学术能力是很牛了，短时间达到这个级别确实非常难。”陈先生说。

　　不少计算机相关专业的网友表示，看了该生的履历自己瞬间变身“学渣”。“学神，你是怎么做到的?学神为什么我只能看到你的背影?”不少网友感慨，自己和吴佳俊的差距太明显，令人感伤。

　　2010年9月，年仅18岁的吴佳俊通过全国信息学奥林匹克竞赛从上海华东师范大学第二附属中学保送至清华大学。

　　和清华十大学神之一吴佳俊一起经历过高中竞赛的蒋林浩时常回忆起他们的“战友”岁月：“当时我们学校专门指导信息学竞赛的老师离职了，新换的老师还不熟悉，大家几乎只能自学。佳俊就把大家召集起来一起学习、经常请高年级同学做指导，发起‘互相出题和讲解’的活动。最后我们寝室四个人三个都考来了清华。”

　　入校后，校内二次招生选拔使成绩优异的他进入了有着中国计算机人才“摇篮”之称的清华计算机科学实验班。

　　在清华园，这个班级还有一个亲切的称呼——“姚班”，它由世界著名计算机科学家、计算机科学最高奖“图灵奖”得主姚期智院士创办。然而，在这个通过层层筛选汇集的30余人的精英班级里，吴佳俊的开始并不顺利：“大一上学期的几门考试成绩都不理想，一些基础课程如《计算机入门》等比较复杂，学起来有点吃力。”

　　清华十大学神之一吴佳俊又重拾起高中的学习方法，经常找班里的同学一起琢磨课业上的难题。“那时他经常忙到很晚，除了学习，还要花几个小时处理社团的事，有时候我们都睡了，他才回到宿舍。第二天起来，他已经离开了，几乎是‘晚二朝七’的节奏。”吴佳俊的室友杜超总会忍不住琢磨：“你究竟是如何在尽量少的睡眠下又保证不困的呢?”吴佳俊笑着回答：“人一天睡5个小时就够了，多了就是浪费时间。”

　　以上就是关于《清华十大学神之吴佳俊太神了!》的内容，相信大家通过努力和适当的方法，也能追赶上学神的步伐，我们一起加油!