目前正在复现一篇paper的代码,工作还没有完成,这里作为自己的经验总结。首先必须得说,复现他人的程序实在是迫不得已的事情。要么源码无法要到,要么就是不符合自己的编程习惯或者输入输出不能够对应得上。通过p…
吴恩达老师曾经说过,看一篇论文的关键,是复现作者的算法。然而,很多论文根本就复现不了,这是为什么呢?一、数据关系因为作者使用的数据比较私密,一般人拿不到,这种情况下,即使作者提供了源代码,但是读者却拿不到数据,也就没法复现算法。
超90%论文算法不可复现,你为何不愿公开代码?人工智能(AI)这个蓬勃发展的领域正面临着实验重现的危机,就像实验重现问题过去十年来一直困扰着心理学、医学以及其他领域一样。他们没有足够时间在每种条件下都测试算法,或者在文章中记录他们尝试过的每个超参数。
作为一个在复现论文中踩坑无数,好不容易走出来的人,简单说一下我的看法。例子1:我是活体检测落地的,老师当时跟我说,旷视能做出来,你应该也可以做个差不多的吧(微笑)。然后我就开始的漫长的算法复现道路。后来很久以后发现了两件事。
复现论文实验一直是一大难题,或者说复现实验达到论文中精度是一大难题。绝大部分时候我们很难复现到媲美原文的精度,这很大原因是神经网络的参数众多,优化技巧众多,参数初始化等一些列问题,一般论文中对不会对小细节的处理进行描述或者他们有着一些不为人知的“trick”,所以我们...
很多时候我们想要复现别人的研究成果,编程实现或者改进一个算法,我们都会涌现出一个强烈的愿望:啊我想要直接看作者的程序!哪怕自己掌握了算法梗概,也希望自己能够对一下答案~于是,慢慢总结了一下如何科学…
如果作者没有关注论文中的参数,那么可能是他们不理解这些参数,因此需要更为详细的科学调查;有可能这是针对特定任务的,需要领域知识来设置;更简单地是,有可能它们根本无关紧要。这并不是说你不会把这个数搞错,你可能会设置错。
为什么很多论文中有结果但没有算法代码.可选中1个或多个下面的关键词,搜索相关资料。.也可直接点“搜索资料”搜索整个问题。.#热议#公司那些设施可以提高员工幸福感?.论文里面怎么会贴代码呢,论文只需要提出论点和理论依据以及证明数据...
研二了,导师说这学期这两个月内必须发一篇小论文不然毕业堪忧非常令人担心。深度学习机器学习方向,本科毫无代码基础,现在也几乎不会任何一种语言,深度学习勉强了解框架,但几乎没有任何实战能力,GitHub代码下下来套模型都调不明白。
例如,一篇偏理论的论文其算法可能不是核心,又或者由于研究所用数据涉及所有权问题,因此代码无法公开,从而导致可复现性受到阻碍。那么研究论文的代码是否应该「开源」?我们来看开发者们的观点。论文代码是否应该「强制」开源?
目前正在复现一篇paper的代码,工作还没有完成,这里作为自己的经验总结。首先必须得说,复现他人的程序实在是迫不得已的事情。要么源码无法要到,要么就是不符合自己的编程习惯或者输入输出不能够对应得上。通过p…
吴恩达老师曾经说过,看一篇论文的关键,是复现作者的算法。然而,很多论文根本就复现不了,这是为什么呢?一、数据关系因为作者使用的数据比较私密,一般人拿不到,这种情况下,即使作者提供了源代码,但是读者却拿不到数据,也就没法复现算法。
超90%论文算法不可复现,你为何不愿公开代码?人工智能(AI)这个蓬勃发展的领域正面临着实验重现的危机,就像实验重现问题过去十年来一直困扰着心理学、医学以及其他领域一样。他们没有足够时间在每种条件下都测试算法,或者在文章中记录他们尝试过的每个超参数。
作为一个在复现论文中踩坑无数,好不容易走出来的人,简单说一下我的看法。例子1:我是活体检测落地的,老师当时跟我说,旷视能做出来,你应该也可以做个差不多的吧(微笑)。然后我就开始的漫长的算法复现道路。后来很久以后发现了两件事。
复现论文实验一直是一大难题,或者说复现实验达到论文中精度是一大难题。绝大部分时候我们很难复现到媲美原文的精度,这很大原因是神经网络的参数众多,优化技巧众多,参数初始化等一些列问题,一般论文中对不会对小细节的处理进行描述或者他们有着一些不为人知的“trick”,所以我们...
很多时候我们想要复现别人的研究成果,编程实现或者改进一个算法,我们都会涌现出一个强烈的愿望:啊我想要直接看作者的程序!哪怕自己掌握了算法梗概,也希望自己能够对一下答案~于是,慢慢总结了一下如何科学…
如果作者没有关注论文中的参数,那么可能是他们不理解这些参数,因此需要更为详细的科学调查;有可能这是针对特定任务的,需要领域知识来设置;更简单地是,有可能它们根本无关紧要。这并不是说你不会把这个数搞错,你可能会设置错。
为什么很多论文中有结果但没有算法代码.可选中1个或多个下面的关键词,搜索相关资料。.也可直接点“搜索资料”搜索整个问题。.#热议#公司那些设施可以提高员工幸福感?.论文里面怎么会贴代码呢,论文只需要提出论点和理论依据以及证明数据...
研二了,导师说这学期这两个月内必须发一篇小论文不然毕业堪忧非常令人担心。深度学习机器学习方向,本科毫无代码基础,现在也几乎不会任何一种语言,深度学习勉强了解框架,但几乎没有任何实战能力,GitHub代码下下来套模型都调不明白。
例如,一篇偏理论的论文其算法可能不是核心,又或者由于研究所用数据涉及所有权问题,因此代码无法公开,从而导致可复现性受到阻碍。那么研究论文的代码是否应该「开源」?我们来看开发者们的观点。论文代码是否应该「强制」开源?