我们都知道在科研论文中有两大类:一类是研究型论文;另一类是综述型论文。其中,前者主要是以研究为主的行文思路,根据研究发现的不同发表在不同级别的杂志上;而后者多是本身没有新的研究发现,主要是对前人的研究结果进行评价综述。然而,这两种分类都是针对以实验为主论文分类,那么这两年生信为主的文章发文量逐年增加,是否也有这样的分类呢? Immugent今天就来解读特别的一类生信文章,姑且把它称为“生信综述”吧,因为我人微言轻,并不会我把它叫什么,以后都是这种叫法,就不绞尽脑汁想这个名字了。 这类“生信综述”文章已经有很多年的发展史了,主要都是围绕对各种火爆一时(引领科研)的重大技术来展开,比如近些年火热的单细胞测序技术。那么今天我就来以单细胞测序为主题,来解读一下如何利用此类思路发表高分文章,注意全都是一分钱没花的那种! 我先讲的第一篇是2021年发表在J Am Soc Nephrol(IF:)的篇名为“How to Get Started with Single Cell RNA Sequencing Data Analysis”的文章。好吧,看了一下日历,今年已经2022年了,就不吐槽这个文章时效性的问题了。但全文真的很简单,就是介绍了一下单细胞测序数据分析的基本流程。 来看看它的摘要:在过去的5年里,单细胞方法已经能够在一个实验中监测数千个单个细胞的基因和蛋白质表达、遗传和表观遗传变化。随着测量方法的改进以及反应和测序成本的降低,这些数据集的大小正在迅速增加。关键的瓶颈仍然是对单细胞实验产生的丰富信息的分析。在这篇综述中,我们对分析管道进行了一个简化的概述,因为它们通常在该领域中使用。我们的目标是使研究人员开始单细胞分析,以获得挑战和最常用的分析工具的概述。此外,我们希望能够帮助其他人了解单细胞数据集的典型读数在已发表的文献中是如何呈现的。好吧,确实是一篇综述! 全文虽然有7副图,但大多都是那种最基础的绘图,想必大家都会。但是这里Immugent想说的是这篇文章虽然是综述类,但其实比真正的综述好写多了。类比这篇文章,等到下一次再出现类似于单细胞测序这种现象级技术,是不是有的小伙伴也整一篇类似的呢! 接下来要讲的第二篇是2020年发表在Comput Struct Biotechnol J (IF:)的篇名为“Benchmarking algorithms for pathway activity transformation of single-cell RNA-seq data”的文章。这类文章就比上一类有些技术含量了,起码像综述的感觉了! 就像这篇是总结了对单细胞数据进行通路评分的各种算法,并使用已经发表的数据对各类算法的优缺点进行了比较,并在最后给出了自己的见解。嗯,怎么说呢!还是比一般的综述好写一点,比纯算法开发类文章好开发一些。那么如果这类算法在不久的将来出现了更多,那么是不是就科研考虑写一个更新版的呢? 接下来要讲的第三篇是2021年发表在Genome Biol(IF:)的篇名为“Over 1000 tools reveal trends in the singlecell RNA-seq analysis landscape”的文章。这个文章作为汇总类综述,真的不是吹的了,一篇文章总结了1000+种分析单细胞数据的工具,我对这个作者也是膜拜之至。 并且作者还开发了一个网站: ,并这个网站收录的工具还会一直更新,这真是圈内的劳模啊。 这类文章虽然需要耗费一些时间,但思路还是很简洁的,但是主要是得掌握住时效性,而且最好是自己研究的领域,那样能提出自己的一些思考,就能给文章增色不少。 第四篇是2020年,同样发表在Genome Biol(IF:)的篇名为“A benchmark of batch-effect correction methods for single-cell RNA sequencing data”的文章。作者对当时存在的14种对不同来源的单细胞数据进行去批次处理的算法进行比较,深入揭示它们之间的优缺点和功能表现。 全文的图做的都是很精美的,而且从数据处理的效果来看,这应该是一个大型生信实验室的作品。建议大家有时间都读一下这篇文章,将会有助于以后在处理不同来源的单细胞数据时选择最合适的算法。 放在最后一篇的文章当然是压轴出场了,那就是在2019年发表在Nat Biotechnol(IF:)杂志上,篇名为“A comparison of single-cell trajectory inference methods”的文章。对来自数千个单细胞的全基因组组学数据进行轨迹分析,目前已有很多算法来推断这些细胞沿着发展轨迹的分布。基于这些结果,作者开发了一套指导方针,以帮助用户为他们的数据集选择最佳的方法。 事实上,虽然到目前已经开发了70多种推断单细胞轨迹的工具,但比较它们的性能是具有挑战性的,因为它们需要的输入和产生的输出模型差异很大。在这篇文章中,作者在110个真实数据集和229个合成数据集上对其中的45种方法进行了基准测试,以了解细胞排序、拓扑结构、可伸缩性和可用性。结果表明了现有的一些工具之间的互补性,方法的选择应该主要取决于数据集的维度和轨迹拓扑。 最后,作者还免费提供了多种单细胞数据轨迹分析的评估网站( ),这将有助于开发更多轨迹分析的工具,用于探索日益庞大和复杂的单细胞数据集。对于这篇文章,我不做过多评述,只想着大家有时间都要去读一下,其中无论是对数据的处理还是对结果的讨论上都是前面文章无法媲美的,是难得的优质文章。 如今科技发展日新月异,在21世纪做出有价值的科研成果往往缺的不是技术,而是对热点的灵敏嗅觉以及对时局的掌控。张泽民,汤富酬,郭国骥老师均是凭借单细胞测序技术跻身世界一流领域的科学家,就是因为他们把控住了时局。 同样的,上述几类“生信综述”的着力点均是当时迫切需要解决的单细胞测序技术热点问题,才得以不花费半毛钱发表一系列高分文章。而且,因为是热点科学问题,这些文章截止到目前的引用率都很高,后面肯定还会持续升高。如果说单细胞测序是一个制高点,倒不如说是起点,因为此类技术在未来还会有很多,希望本篇推文能给大家带来一些思考,欢迎有推荐类似生信文章的小伙伴通过后台与我们联系。