作为一个工科生,在全国人民抗击病毒宅在家里的这段时期迎来自己最长的一个寒假。但是,学习科研不能因为寒假过长而落下,现在结合目前在看的一篇论文,给广大在读(ke)学(yan)生(gou)分享一下快速看完一篇英文论文的方法~
-上海交大研一在读,一作EI论文1篇已录用 -研究方向为复杂装备的状态检测、可靠性
在阅读一篇论文时,首先要搞清楚英文论文的 结构 ,主要分为以下部分: - Abstract 论文摘要。摘要部分出现在论文的最前面,因此也最为重要,需要重点阅读。
- Introduction 介绍。介绍论文研究的背景、研究对象等信息,对不熟悉背景的同学有引导的作用。有时还包括研究方法论的系统介绍。
- Methodology 方法论。主要介绍研究采用的算法(研究方法)的原理、创新点。
- Experiment & Result 实验和结果展示。这部分结合研究方法进行实验(计算机实验、力学实验等等),对实验数据、结果进行展示分析,通常以图表的形式呈现。
- Conclusion 结论。通过对实验结果的分析,对全文的结论进行总结和强调。
- Reference 参考文献。一般来说参考文献可以不看。但在判断论文质量的时候可以起到作用,参考文献越多,文献越权威,可以判断该论文的质量越好(当然期刊级别也可以判断,所以尽量不要看水刊哦)
对于阅读一篇英文论文的顺序,不同的同学会有不同的喜好。从个人的角度来说,我的顺序通常时 Abstract ->( Introduction )-> Conclusion -> Experiment & Result -> Methodology 采用这样的顺序原因如下: -摘要部分展示了最主要的背景和结论,应该重点阅读,当发现摘要展示的内容和我们的期望/研究对象不相符,可以直接跳过该论文。
-对研究背景了解可以直接跳过 Introduction 部分,该部分主要是结合研究背景来强调研究的重要性(每个研究者当然都会说自己的研究重要)。当然不熟悉研究背景还是可以看一看~
-结论部分重申了重要的结论和重要的实验结果,对于这些结论,我们会感到好奇,究竟是怎么得到的?如果论文得出的都是我们不感兴趣的(与我们的研究对象不相关)的结论,可以直接跳过该论文。
-在结论部分我们发现了令我们感兴趣的结论,于是我们可以回到实验和结果展示部分,仔细研究实验和结果展示的图、表。作者为什么要绘制这些图表?作者通过怎样的实验得到了这些图和表?
-最后阅读方法论部分。对于我而言,这样可以省去被数学公式、物理原理难住的时间。如果确定论文的方法可行,适合自己的研究,再弄懂这一部分。此时最好再借助一些博客和工具书,详细理解公式的推导过程。
总的来说就是: 1.通读摘要、(背景介绍)、结论,确认是否为自己感兴趣(相关)的方向、方法。 2.阅读实验和结果展示部分,了解实验是如何进行的,数据进行了怎样的处理和分析。 3.确定论文研究方法可借鉴,再阅读方法论,彻底理解方法论的公式推导。如果并不想采用论文的研究方法,这一部分的阅读也可省去。
现在以目前正读的一篇会议论文 Wind Turbine Structural Health Monitoring: A Short Investigation Based on SCADA Data 来简单介绍一下这个过程。
可以看出,斜体部分是介绍整篇论文的背景。(另外,如果有同学摘要阅读困难的话建议谷歌翻译哦)介绍了海上风场的日益增长,然而海上风场的运维费用昂贵,因此,海上风机的状态监测具有重要性。粗体部分介绍的是论文采用的方法:首先用机器学习方法绘制出每个风机的功率曲线,再用其他风机的功率值去预测某个风机的功率值,并且对比了 神经网络和高斯过程 两种方法。
由于摘要中的背景比较详细了,我们可以直接跳过 Introduction 部分直接看 Conclusion 。
结论部分是对摘要部分未说明完全的部分更详细的补充。斜体进一步扩充了摘要的内容:采用了 神经网络和高斯过程 对48个风机进行了功率曲线建模,接着采用每个风机的模型对其他风机的功率进行预测,得到了均方误差(MSE errors)的混淆矩阵(confusion matrix)。粗体部分详细分析了结果:所有的模型很稳健,最高的均方误差为,接着分析了最高均方根误差产生的原因(采用风机4的模型预测风机3)。强调了产生的混淆矩阵可以作为风机异常状态监测的基线值,可以结合控制图来监测整个风场的运行状态。最后的斜体字强调了一下未来可能的研究工作。
通过结论,我们大概知道了论文的研究方法。接着可以去看论文的实验和结果展示部分。
从结论我们看出,最重要的结果是 神经网络和高斯过程 均方误差的混淆矩阵,所以这里只找这两个图就好;果不其然,在文章的正中间找到了。
我们再来看看作者给出对应的分析(神经网络):
和结论部分类似,说明了模型稳健,最大的均方误差在5左右,发生在位于风场最外排的风机3和风机4之间。
这里说明了当风机未正常工作时,MSE的值非常高。混淆矩阵图展示了一个风机正常工作的潜在阈值,可以用来进行单个风机或整个风场的状态监测。
这部分可以说就是论文结论部分的拓展。
当看完这些之后,我们再思考,这个方法/实验可以用到我们的问题中去吗?如何实现?这时就可以进一步结合其他的参考资料了解一下神经网络回归、高斯过程回归、MSE的计算和混淆矩阵的生成这些问题啦!
到此,一篇论文读完。
参考文献 Papatheou E, Dervilis N, Maguire E, et al. Wind turbine structural health monitoring: a short investigation based on SCADA data[C]. 2014. 原文链接
这篇文章如果对你有帮助的话请点个赞哦~