姓名:李泽 学号:20021110073 学院:电子工程学院
原文链接:
【嵌牛导读】: 通过学习吴恩达教授的课程,本文总结出以下三方面内容:一,读一系列文献以增长某一领域知识的系统方法;二,如何正确阅读一篇研究论文;三,获得有助于搜索论文和关键信息的在线资源
【嵌牛鼻子】: 系统方法 研究论文 关键信息
【嵌牛提问】: 如何收集针对主题的资源集?如何深入挖掘自己认为与主题相关的资源?
【嵌牛内容】
“智慧不是学而可取,而是毕生追求所得。”
——阿尔伯特·爱因斯坦
一个人总会自然而然地去学习周围人所展示的技能和习惯,这就是为什么大多数博士生都能获得有效领悟研究论文内容的技能。但是,大多数人不是博士生,那么对于普通人来说,如何获得方方面面阅读研究论文和理解内容的能力呢?
阅读研究论文
如果一些从业人员在机器学习领域的专业化方面很有天赋,这对他们来说是非常有利的。例如,具备计算机视觉领域的通才知识是值得赞赏的,但具备关键技术(如姿态估计)方面的专业知识和技能将更能吸引在该领域寻找从业人员的公司和组织。
下面以姿态估计主题为例,指导如何阅读与主题相关的研究论文。
1 、 收集针对主题的资源集。资源形式可包括:研究论文、Medium文章、博文、视频、GitHub库等。
谷歌搜索“姿态估计”,将显示包含主题相关信息的一流资源。第一步的目标是整理所有相关资源,如YouTube视频、实施文档以及研究论文。在这一阶段,收集自己认为重要的资源,没有数量限制,但是请确保为有用的论文、视频和文章创建一个“候选名单”。
2 、 深入挖掘自己认为与主题相关的资源。记录对于每个候选资源的理解,这一点至关重要。吴恩达建议根据自己对资源的理解程度绘制一个表格,如下所示。
添加到列表中的每篇文章至少要浏览10-20%内容,以确保在已标识的资源中了解到足够多的介绍性内容,并能准确地评估其相关性。
对于已标识更具相关性的论文/资源,建议更深一步理解。最后得到一些自己完全理解的合适资源。
你可能会问自己:“阅读多少论文/资源才够?笔者也不知道答案,但是吴恩达知道。据吴恩达说,理解5-20篇论文即可展现出对主题的基本理解,也许足以推动技术的实施。阅读50-100篇论文可以很好的理解该领域。在浏览资源并提取重要信息后,表格可能变成这样:
3 、 这是笔者观察到的一个快速技巧,在理解研究论文时很有用。该步骤是进行结构性注释,用自己的话总结论文中的关键发现、结果和技术。
下列步骤将集中于如何阅读一篇研究论文。
阅读一篇研究论文只通读一遍论文内容不能实现理解的目的。吴恩达认为,一次性从头到尾逐字阅读一篇论文并非形成理解的最佳方式。要想很好的理解内容,至少要将论文通读三遍。
4 、 第一遍,阅读文中以下部分:题目、摘要和图片。
5 、 第二遍,先阅读以下部分:引言、结论、图片(再次阅览),然后浏览论文剩余部分。
论文的引言和结论部分包含了对文章总体内容清晰简明的介绍和对发现的总结。这几节通常只提供包括关键信息,而无补充信息。作为读者,这是有益的,因为能抓到阅读论文其他部分所需的关键信息。
6 、 第三遍,阅读全文,但是跳过所有陌生复杂的数学计算或技术公式。还可跳过不理解或不熟悉的术语和技术。
7 、 对某个领域进行深入研究的论文可以多阅读几遍。这些额外遍数将主要专注在对文中数学、技术以及陌生术语的理解。
对于那些通常出于信息和工程目的阅读研究论文的人,深入研究可能是非常耗时的,特别是在还有20篇论文要阅读的时候。
笔者通过介绍LeNet卷积神经网络的原始论文来展开本文的介绍过程,并总结了笔记中的关键内容,然后将其转换为一系列Medium文章。
结论
“学习的过程是循序渐进的,而非一蹴而就的。”
——吴恩达
在机器学习和计算机视觉领域,笔者仍然是个新手,有很多未涉足的知识(保守陈述)。但是笔者相信,不论在哪个领域,只要持之以恒地探索知识,就能获得超越常人的理解能力和专业技能。
从吴恩达介绍的技巧来看,笔者一个月至少要阅读4篇论文并理解。老实说,笔者全身心投入1周半时间才完成LeNet论文的阅读。但是阅读次数越多,就能越快越好地阅读并理解研究论文。
吴恩达表示,他总是随身带着一批研究论文以便阅读。吴恩达是机器学习领域的杰出人才。所以笔者相信,效仿他的习惯和学习技巧会对学习之旅非常有益。
附上B站吴恩达公开课视频
第一步(需5-10分钟)
快速浏览整篇论文,对其有个大概的了解。你也可以自己决定是否需要进一步阅读。该阶段分下面的几个步骤组成:
1、仔细阅读题目、摘要和引言;
2、阅读标题和小节标题,标题下的内容不必看。
3、阅读结论
4、看看参考文献,也许有你读过的论文。
在第一步完成后,你应该可以回答以下五个问题:
1.类别:这篇论文是什么类型?测试类?对现有系统进行分析的?对原型系统进行描述的?
2.内容:在你读过的论文中与其相关的有哪些?使用哪些理论基础来分析文章?
3.正确性:结论是否有效?
4.创新:该论文的主要创新是什么?
5.清晰度:该论文是否条理清晰?
回答出以上问题,你便清楚是否有必要继续阅读该论文,这也许与你的兴趣或研究领域有关,也可能是作者的结论不正确使之没必要再继续阅读。这也再次提醒你,在你写论文的时候,希望有人看你的论文,那么简明扼要的标题及摘要是非常重要的,无论是读者还是审稿人在用五分钟过一遍你的论文后,看不到文章的亮点也就对你的论文失去读下去的兴趣了。
第二步(需1小时左右)
在第二步要仔细阅读论文,但忽略掉诸如证明之类的细节。 阅读过程中做好笔记记录重点,或在论文空白处标注出来,
1、仔细阅读论文中的数字、图表和其他插图。 尤其要注意图表: 轴标签是否正确? 标示的结果是否有误差线? 这些常见的错误能区分出该论文是粗制滥造的还是经过尽心做研究后的结果。
2、为了了解更多关于该论文的背景,记得要标记未读过的参考文献供进一步阅读。通过第二步的阅读,你应该能够掌握论文的主要内容。你也应该可以把论文的主旨及论据总结给别人。对于你感兴趣的论文,读到这个程度就可以了,但是对于那些在你研究领域内的论文来时,还远远不够。
有些情况你在读到第二步结束时仍然难以理解论文,可能的原因是主旨对你来说是全新的,还有不熟悉的术语和缩略词。也可能论文作者使用您不明白的论据或实验技术,导致大部分论文内容无法理解。除此之外,有些论文可能写得很差,也导致你无法理解该篇论文。亦或者可能是深夜,你很累了。如果是这样,你可以选择:(1)把论文放到一边,期望着在你走向事业成功的路上不需要理解它,(b)在了解了相关背景知识后,过段时间再回头读,或者(c)坚持不懈继续阅读。
第三步(数小时)
要充分了解一篇论文,尤其你是审稿人时,需要进行第三步。第三步的关键是:在脑中勾勒出整篇论文,作出与作者相同的假设,重新创作。通过将这种重新创作与实际文章进行比较,您可以轻松地验证出论文的创新之处,也可以轻松找出一些不易察觉的缺陷和假设。
这一步需要读者精读论文,完成这一步读者便可验证论文中每一个假设是否成立,并且同时思考如果自己是本文作者的话会如何去体现自己的idea ,这种假设自己是作者的方法可以加深你对该论文论据及表述技巧上的理解,并且能从中学到这些技巧。在完成第三步的过程中,你应该时刻留意对于未来研究工作的新想法。
第三步是最耗费时间的,对于初学者来说可能要数小时,即便是有经验的学者也至少要一两个小时。当完成这一步后,你应该可以在脑海中重现构造论文的整个架构,同时能确定论文中哪些是好的,哪些是一般的论点。特别地,你也应该能明确指出论文中不清晰的假设、漏掉引用的相关工作以及论文中试验和分析的手段潜在的缺点。
写给研究初学者的论文阅读简明教程。
痛苦
做研究,少不得要读论文。
如果你不了解一个领域已经被研究成了什么样子,又如何找到自己研究的切入点呢?
可是,对许多初学者来说,读论文是件痛苦的事儿。
他们匆匆忙忙开始,在CNKI用关键词搜索出来一堆论文,一通下载之后,就打开第一篇,从头到尾一字一句地读起来。
读完一篇,放到一边;再读另外一篇。
读到后面,发现前面的论文已经遗忘了。于是翻回头去再读一遍。
这还只是中文论文,那英文的??
如果你有无限的时间和注意力,这样做也没有什么大问题。大不了就是读的时间比较长,效率比较低而已。
然而,你的时间是稀缺资源。
你的注意力是更为稀缺的资源。
处置稀缺资源,不可如此草率。
读论文的时候,要提升效率,你需要做以下几件工作:
选择合适的文献,确定阅读的优先次序;
即便对筛选过的文献,也要以正确的顺序来阅读内容;
用恰当的方式做笔记。
本文就以上三点,分别给你介绍一些方法、技巧与工具。希望对你(研究的初学者)能有些帮助。
什么?你不是初学者?
那就不必往下读了。赶紧抓紧时间读论文去吧。
选择
从许多相关论文里,选择哪些值得读,甚至是该优先阅读,不是一件容易的事情。
你要了解如何找到相关的论文。
你还应该纵览领域的全景,看哪些论文更受同行青睐。
对筛选后的结果(可能数量)依然很多,你也需要区分论文的价值(靠谱程度)。
在之前的文章里,我为你介绍过前两个问题的一些处理方法。包括:
如何用人工智能帮你找论文?
如何快速梳理领域文献?
读过本文后,欢迎你点击链接,阅读或者复习相关内容。
大多数情况下,前两轮筛选后的论文,你依然不应该全都读。
千万不要误以为印成铅字的,都是宝贵的知识。
我给学生的建议,是依据论文载体的“靠谱”程度,区分优先级。
不同论文载体,在“靠谱”与“不靠谱”的两极之间,形成了一个光谱。
排在最高优先级的,是顶级期刊。
除了这几本“神仙妖怪”级别的期刊,各领域也都有公认的顶级期刊列表。
你可以自己在搜索引擎查找,或者向同行专家请教。
排在靠谱程度最后一位的??是本科毕业论文。
本科毕业论文中,当然也有非常优秀的作品。
但是,其中不靠谱论文所占比例,真的是高到难以想象。
这不只是因为本科生缺乏研究经验,知识储备不足??主要是个态度问题。
大部分本科生,没有激励去认真完成毕业论文。
许多论文是截止日期前最后几天(甚至几小时),突击而成的结果。
这样的论文质量怎么样?
你说呢?
我所说的本科毕业论文,可不只是说国内情形。
TED视频里,Tim Urben 讲述了自己毕业论文写作过程。有中文字幕,风趣幽默,建议你看看。
古人说:
取法乎上,仅得其中;取法乎中,仅得其下。
想想看,一个本科生,做论文的参考资料都是上几届本科生的毕业论文,其论文的水平大概会如何?
每当我看到学生放着优秀期刊的论文不去阅读、分析和引用,反要在参考文献列表中掺杂大量的学位论文,都会要求重做文献回顾环节。
顺序
至少在目前,机器还无法替你阅读论文。
你得自己来。
我给你推荐一个讲解如何读论文的视频教程,只有7分多钟。但是看过后,会让你非常有收获。
教程讲者 Peter W. Carr 教授执教于明尼苏达大学。他多年来和学生合作研究,积累了丰富的论文阅读和写作指导经验。
发布这个视频时,他和团队已发表论文300余篇。
下图是明尼苏达大学网站上列出他获得的(部分)荣誉和奖项。
考虑到你可能不是很习惯观看全英文无字幕视频,我给你转述一下教程的主要内容,并且在叙述中加入我的一些思考。
Carr 教授首先强调:
不要一字一句,从头到尾线性阅读。
千万不要。
史蒂芬平克在《风格的感觉》一书中指出:
写作是个把网状的思考,用树状的语法结构,转换成线性字符串的过程(参见“The Web, the Tree, and the String”一章)。
阅读的目的,定然不是重复记忆那些线性的字符串,而是还原作者的网状思考,并且进行加工。
你可以放心大胆地调整阅读顺序。
不要担心剧透,论文又不是侦探小说。
Carr 教授给出了下面这样的论文阅读顺序:
首先是题目、关键词和摘要。
浏览后决定要不要继续看。
然后读结论。通过结论看这篇文章是否为自己感兴趣的研究。
到这里,似乎平淡无奇。许多文章、书籍也会告诉你上述知识。
但是Carr 教授强调了一句:你可以随时停止阅读一篇文章,甚至丢弃掉。
我的解读是,读论文一样要遵守经济规律,不要试图去打捞沉没成本,在已经不看好、或者不感兴趣的论文上投入更多时间。
许多文章都会告诉你,读过上述内容后,应该去看引言。
但是 Carr 教授说:不要这样做。
你应该先看图表(如果有)。
这阶段,你应该只看图表,不要逐字阅读图表上下文的语句。
图表是否吸引你的注意力,直接决定你要不要做下一步——读引言。
我很赞同这种顺序。
因为引言的主要作用是强调论文研究主题的价值和必要性,会尝试与更为宏大的图景、更重要的问题相联系。有的甚至会有“吹嘘”的成分。
但是研究主体部分出现的图表结果,却实实在在可以看出一篇论文在某个问题的研究上,实际偏向哪个方向,以及前进了多远。
读过图表和引言后,你才需要读论文的核心部分。
核心部分是哪里?
不,不是实验,而是研究结果和讨论。
论文写作初学者往往在做出图表后欣喜异常。图表展示后,居然没有任何分析文字,就高高兴兴直接跑去写结论。
虽然“一幅图抵得上千言万语”,但是你的图表结果真的是这么不言自明吗?
对研究结果的探讨,要解答读者可能存在的疑问,并且从实验结果中挖掘出全部的蛛丝马迹。
这才是见真功夫的地方。
即便是面对同样的资料,有的人能挖掘与分析出来的内容,比别人丰富许多。
你如果有闲暇时间,可以读读马伯庸《显微镜下的大明》。看看简单的史料,可以被剖析到怎样的深度。
只有你认为作者的讨论部分有价值的时候,才真正需要去阅读论文里面最为困难的部分——实验。
这一部分,你要从头到尾仔细读,速度肯定要慢下来,花更多时间。而且对有的实验过程,你甚至需要花时间去尝试重复它。
从追求效率的角度看,只有真正有价值的事情,才值得你这样耗用自己宝贵的时间。
笔记
许多人读完论文,就认为完事大吉了。
不对!
你已经用了这么长的时间来阅读论文,那就要把花费时间的价值保留住。
有的人说,我脑子好,过目成诵,都记住了啊!
科学实验研究证明,人脑的记忆能力,其实远没有你想象得靠谱。
Peter W. Carr 教授强调,你需要及时记下笔记。他甚至特意引用了中文谚语“好脑子赛不过烂笔头”。
你可能认为,记笔记很容易啊。
但注意 Carr 教授提出的笔记标准:
以后你只要看笔记就可以了,论文就不用再看第二遍了。
承担着这么重要的使命,可就不是一般的笔记了。
这种记笔记的方式,万维钢先生是这样描述的:
我曾经听人讲一个笑话,说我们是怎么向别人学习的呢?我们就如同小偷一样到人家里把除了厨房水槽之外的所有东西都搬走了——然后我们回过头去把厨房水槽也搬走了。
你可以点击链接查看万维钢先生的经典博文《用强力研读书》,其中的笔记方法不仅可以用于记录读书笔记,对论文也同样适用。
记笔记,方法固然重要,但工具也很关键。
很多人喜欢记在纸片上,记完就丢弃了。
有的人虽然用了本子记录,但是记满几本笔记后,想找到某个内容也很困难。
移动互联网时代,不要使用这种过时的方法。
论文的笔记,你可以直接用数字化方式记录。
例如我喜欢使用 MarginNote Pro 这款论文阅读与笔记工具。配合Apple Pencil,你在做笔记时可以找到纸笔写画的感觉。
可是,与纸笔记录相比,数字化论文阅读笔记的存储和检索效果,要高出许多。
你可以方便地将笔记导出到印象笔记里面,这样即便是手写的中文文字记录,都可以很容易检索到。
下图是我查询“牙”这个字获得的结果。
如果论文中有一些新概念,你不理解。没关系,也记下来。
不要尝试当时解决,因为那样会破坏你阅读的整体感和记笔记的流畅程度。
搞定一篇论文的笔记初稿后,再根据记下的这些疑问要点,按图索骥去查找相关的信息。
这些信息,应有助于你消化理解新知。
我推荐你先到 wikipedia 和 youtube 这样的网站上看看,是否有对应知识点合适的教程。
有的论文,由于最初写作者文笔过于晦涩,你可以找到许多后来者尝试以更清楚的方式来转述的论文或者博客文章。
这些内容,你可以直接补充进你的笔记,也可以记录新的笔记条目,将其和原先的笔记条目建立链接。
印象笔记可以自动帮助你分析该条笔记和其他笔记间的关联。
这些笔记,记录于不同时间,放置在不同目录,打的标签各异。
但是,人工智能却将它们依据内容的关联度联系在了一起。
这种跨越时空的关联能力被称为“远程联想”。许多写作大家靠着这种方式,写出价值密度颇高,又极有创意的文字。
他们当初为了达成这一目标,需要花费大量的时间整理索引卡片。
而对于你,完成同样的目的,却只需要点击几下鼠标而已。
小结
总结一下,本文为你讲述了高效读论文的几个关键点:
首先要选择合适的文献,确定阅读的优先次序。你需要分清不同的论文类型和价值,在有限的时间约束内,优先选择最有可能富含价值的论文。
其次对筛选过的文献,应以正确的顺序来阅读其内容。不要眉毛胡子一把抓。从最感兴趣的地方开始,把最困难、最耗费时间的章节放在最后。阅读中随时准备退出,以避免踩坑。
用恰当的方式做笔记。强力研读的笔记,可以帮你把一篇文章的重要内容全部“偷走”。用合适的笔记工具来记录和整理笔记,不仅会让你的记录事半功倍,而且写论文的时候文思泉涌。
讨论
你平时是如何读论文的?你在论文阅读中,遇到过什么困难吗?你是如何解决的?你有更好的论文阅读方法与技巧吗?欢迎留言,把你的经验和思考分享给大家,我们一起交流讨论。
如果你对我的文章感兴趣,欢迎点赞,并且关注我的专栏,以便收到后续作品更新通知。
如果本文可能对你身边的亲友有帮助,也欢迎你把本文通过微博或朋友圈分享给他们。让他们一起参与到我们的讨论中来。