常用的统计指标一般都有哪些?有很多内科主治医师考生都比较关注,为了帮助大家了解,医学教育网为大家整理如下:平均数可反映一组性质相同的观察值的平均水平或集中趋势的统计指标。
标准差是用来说明一组观察值之间的离散度。标准误是用来表示抽样误差的大小。可信区间是用样本均数(或率)和标准误对总体均数(或率)作出区间估计。分为95%可信区间及99%可信区间,95%或99%可信区间即总体均数(或率)有95%或99%的概率(或可能性)在此区间范围内。率可用来说明某种现象发生的频率或强度。在评价口腔疾病的患病状况时,常用率来表示人群中疾病状况的高低。构成比:是用来说明某事物内部各构成部分所占的比重。⽬录标准差(SD)标准差(StandardDeviation),在概率统计中最常使⽤作为统计分布程度(statisticaldispersion)上的测量。标准差定义是总体各单位标准值与其平均数离差平⽅的算术平均数的平⽅根。
它反映组内个体间的离散程度。⼀个较低的标准差表⽰这些值趋向于接近平均(也称为期望值)的集合,⽽较⾼的标准差表⽰这些值分布在更⼤的范围内。标准差的平⽅即⽅差。⾃变量,x, 总数,n
一篇医学论文常常由六个要素构成。1. 文题论文文题应以最恰当、最简明的词语反映论文最重要的特定内容。切忌太泛、太繁,尽量不用“××研究”、“××探讨”等。一般使用充分反映论文主题内容的短语,不使用具有主、谓、宾结构的完整语句,不用标点。中文文题一般不超过20个汉字。2.作者及其工作单位论文作者必须是直接参与选题、设计、研究、观察、资料分析与解释或撰写关键内容,并能对文稿全部内容负责、同意文稿发表者。作者排序由作者在投稿时确定,投稿后一般不得改动。作者单位名称应写全称,并应给到科室。省会及名城的医院和所有医学院校均不加省名。3.摘要摘要应概述研究的目的、方法、结果和结论,应具有独立性和自含性。中文摘要一般400字左右,英文摘要可略详于中文摘要,中英文摘要的主要内容应一致。摘要应着重反应新内容和作者特别强调的观点,不必列出本学科已成为常识的内容。不要简单地重复文题中已有的信息。一般采用第三人称的写法,不列图表,不引用文献,不加评论和解释。中文摘要中使用英文缩略语,应于首次使用时注出其中文全称。英文摘要中的缩略语,应于首次使用时将其英文全称注出。4.关键词论著一般要求3~6个关键词,尽量从美国国立医学图书馆编写的最新版《医学主题词表(MeSH)》中选取。其中文译名可参照中国医科院信息研究所编译的《医学主题词注释字顺表》。注意第1个关键词的选用,该词应反映全文最主要的内容。中英文关键词应一致,均不用缩写。5.正文部分(1) 前言 主要概述研究的背景、目的、研究思路、理论依据等。有的研究还应说明该研究开始的年月。应开门见山、简要、清楚 ''切忌套话、空话、牵涉面过宽、详述历史过程或复习文献过多。(2) 方法 主要介绍研究对象(人或实验动物,包括对照组)的选择及其基本情况,以及研究所采用的方法及观察指标。常用标题有“材料与方法”、“对象与方法”、“资料与方法”等。临床研究需交待病例和对照者来源、选择标准及研究对象的年龄、性别和其他重要特征等,并应注明参与研究者是否知情同意。临床随机对照研究应交待干预方法的设计(随机方法)和采用的盲法。(3) 结果 是论著的核心部分。应将研究过程中所得的各种资料和数据,进行分析、归纳,经过必要的统计学处理,然后用文字和图表加以表述。结果的叙述要客观真实,简洁明了,重点突出,层次分明 ,合乎逻辑,不应与讨论内容混淆。若文中设有图表,则正文不需重述其全部数据,只需摘述其主要发现或数据。(4)讨论 应着重讨论研究中的新发现及从中得出的结论,包括发现的意义及其限度,以及对进一步研究的启示。若不能导出结论,也可进行必要的讨论,提出建议、设想、改进的意见或需解决的问题。应将研究结果与其他有关的研究相联系,并将本研究的结论与目的相关联。不必重述已在前言和结果部分详述过的数据或资料。不要过多罗列文献,避免作不成熟的主观推断,最好留有余地。不应列入图表。6.参考文献标注参考文献可以反映论文的科学依据,体现尊重他人研究成果的态度,并向读者提供有关信息。必须是作者亲自阅读过的、主要的、发表于正式出版物上的原始文献。文内引用时,按文献出现的先后顺序用阿拉伯数字连续编码;图中引用时,按其在全文中出现的顺序编号,引文标注在图题或注释中,图中不应出现引文标注;表中引用时,在表中依次标注。
CiteScore
影响因子是评价学术期刊的一项重要指标,曾被认为是学术界的金标准。但近年来由于在学术评价体系中被滥用受到各方人士的强烈抵制。2016年7月5日,几大顶尖级学术出版机构包括多家著名期刊也联合在预印本网站BioRxiv上发表文章呼吁期刊降低对影响因子计算的痴迷和依赖程度,并强调用引用分布曲线(Citation Distribution)来取代影响因子的简单算术平均。其他一些权威机构也纷纷提出多元化的文献计量评价指标,以期打破影响因子一家独大的局面。2016年12月8日,出版业巨头Elsevier重磅推出了他们基于Scopus数据库的全新期刊评价体系:CiteScore。Scopus数据库涵盖了世界上最广泛的科技和医学文献的文摘、参考文献及索引,因此被各界人士认为是影响因子最有力的竞争对手。与影响因子相比,Cite Score具有以下优势。
一,期刊涵盖数量众多,中文期刊显著增加。
CiteScore涵盖的期刊数量达到22256本,比影响因子的11000种期刊多了一倍。尤为重要的是,相比SCI数据库中的几十种中文期刊,Scopus收录了几百种重要的中文期刊。有学者表示,这对中文期刊会是一件好事。以往很多优秀的中文期刊由于不在SCI检索范围内,在高校职称评定时不被认可,因此稿源越来越少。如果将来国内认可CiteScore,那么对于被收录在Scopus数据库中的这些优秀的中文期刊又是一次极好的机会。
二,指标计算公式有所不同。
与影响因子的计算某期刊连续2年论文在第3年度的篇均引用次数类似,CiteScore计算的是期刊连续3年论文在第4年度的篇均引用次数。但两者有一个重要的区别,影响因子计算时的可引用内容只有论文和综述,剔除了编辑评述、读者来信、更正信息和新闻等计入分母,但其引用数仍被计入分子。而CiteScore将所有文献内容都视作可能被引用的内容,包括编辑评述、读者来信、更正信息和新闻等。这些内容的引用很少,因此会拉低期刊的得分。
三、影响因子没有学科领域的区分,而CiteScore有不同领域的相对排名。
大家都知道,把不同领域的文章混在一起谈影响因子,是没什么意义的。比如数学和工程的跟化学和生物领域的科研人员就没法说到一块去。一个是顶了天都不到2的影响因子,另一个是到10都很正常。CiteScore也是只有比较同一领域的期刊才有意义,对选择发表论文才具有专业引导作用。所以在查询网站中还有Highest CiteScore Percentile在CiteScore后面,这就能够看出期刊在不同领域的相对排名。
四、CiteScore是免费的。
与影响因子只对购买者开放不同,CiteScore对任何在线用户免费开放。任何人都可以通过官方网站来查看期刊CiteScore,也可以分析期刊的引用情况。
CiteScore一经推出,学术界人士普遍表示支持。多数人认为,影响因子是应该有个对手了,只要有进步,有比较都是好的,我们不要一家之言!本人也认为,影响因子已经在评价指标第一把交椅上坐得太久了,以致现在负面影响隐隐有超过积极影响的架势,也是时候有另一个因子取而代之了。但是影响因子毕竟在学术界还是影响深远,全盘否定而推出一个完全不同的指标有可能是操之过急。CiteScore在计算方法上与影响因子大同小异,虽然只是治标,但可能更加符合现在的需求。无论如何,有创新总是好的,多元化的计量评价指标才能让评价体系越来越趋于完善。
采用spss软件,单因素分组对照计算。
t值和P值都用来判断统计上是否显著的指标。在p值就是拒绝原假设的最小alpha值,把统计量写出来,带进去算出来之后,根据统计量的分布来算p值。P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。由R·A·Fisher首先提出。Fisher的具体做法
假定某一参数的取值,选择一个检验统计量,在该统计量的分布在假定的参数取值为真时应该是完全已知的从研究总体中抽取一个随机样本计算检验统计量的值计算概率值或者说观测的显著水平即在假设为真时的前提下,检验统计量大于或等于实际观测值的概率。
这个问题的答案取决于具体的医学研究和论文要求。一般来说,医学论文中的观察指标应该包含以下几组:
实验组:接受特定治疗或干预的患者或被试者组成的组别。
对照组:未接受特定治疗或干预的患者或被试者组成的组别,旨在比较实验组与对照组之间的差异。
随机分组:实验组和对照组应该是随机分组的,以避免实验结果的偏差。
样本量:样本量应该足够大,以确保实验结果的可靠性和统计学意义。
在医学论文中,观察指标的选择和组别应该根据研究目的和研究问题进行合理的设计和选择。同时,需要遵循医学伦理和研究规范,确保研究的可靠性和可信度。
医学论文,尤其是科研性强、学术价值高的论文,必不可少“研究对象、处理因素、观察指标”三要素,论文的基本科学论点、结论,需要在中医药学术上和中医药科学技术上具有一定的理论意义和实践价值。毕业论文(学位学位论文)是研究生毕业时为申请学位而提交供是研究生毕业时为申请学位而提交供评审用的学术论文。
一提起论文价值,恐怕首先想到的是影响因子。尤其是在中国,影响因子对于科研人员和工作者真是命根,晋级,升迁,申请基金,评奖等等无不与影响因子有关。但是除了影响因子,还有许多其它的评价论文价值的方法。本文就介绍一下常见和新兴的评价论文价值的指标。评价一个论文价值,无非从量化和质化两个方面来评价,或者期刊和论文的角度来评价。下面提到的指标,有的是从量化,有的是从质化,有的是从期刊角度,有的是从文章角度。影响因子影响因子确切说是针对期刊的,而并非直接针对论文的。影响因子应该是一个量化和半质化的指标。为何?这是因为高影响因子的期刊低水平的文章也并非没有,低影响因子高水平的论文也大有存在。当然,如果论文婆家找的好,自身的身份也就自然高了。正如以前的皇妃,可能整个素质比一般大众好,可以平民中也大有出类拨粹的人物存在。因此,现在影响因子也是饱受垢病。有的人戏称SCI是stupid chinese idea,其中的原因也就不多说了。查看影响因子的方法有多种,最经典的方法当然是Web of Science,但是收费,一般人用不起。简单方便的方法可以使用医学文献助手:利用医学文献助手筛查PubMed文献质量引用次数这个就不用多介绍了吧。很多数据库和在线查询平台都可以实现引用次数的查看,例如Google和微软学术搜索Microsoft Academic Search,还有利用医学文献助手筛查PubMed文献质量H指数(H Index)H指数是2005年由美国加利福尼亚大学圣地亚哥分校的物理学家乔治·希尔施提出的。H指数的计算基于其研究者的论文数量及其论文被引用的次数。赫希认为:一个人在其所有学术文章中有N篇论文分别被引用了至少N次,他的H指数就是N。可以按照如下方法确定某人的H指数:将其发表的所有SCI论文按被引次数从高到低排序;从前往后查找排序后的列表,直到某篇论文的序号大于该论文被引次数。所得序号减一即为H指数。以上有关H指数的内容来自维基百科查看H指数的最简单的方法就是利用Google Scholar,注意是英文版的,中文版的不要。另外FireFox和Chrome也有相应的插件可以选用。I10指数(I10-Index)I10-index是由Google提出来的,指作者发表文章数被引用10次以上的个数。比如我发表了100篇文章(呵呵,有点大了啥),其中90篇被他人引用了10次以上,那么本人的I10-index就是90。如果说影响因子是针对期刊的话,那么H指数和I10指数就是针对个人的。论文的影响因子高,只能说该论文找了一个好婆家,具体引用情况并不一定。而H指数和I10指数就是确切反应论文引用的一种量化标准。G指数(G-Index)G-Index(G指数)相比于上述几个指标来有点默默无闻。G-Index是由Leo Egghe于2006年提出的, 评价作者论文数量的一个指标。G指数的计算方法如下把所有作者发表文章按照引用次数降序排列,序号为g把作者所有发表文章的序号进行平方,得到g2把作者所有文章的引用次数进行加法,得到∑TC最后一个∑TC仍大于g2的序号就是G指数。有点绕哈,没事举个例子更清楚一些,比如我发表了以下文章,按照引用次数进行排序如下引用次数(TC) 序号 (g) 文章引用 次数之和 (∑TC) g^2 47 1 47 1 42 2 89 4 37 3 126 9 36 4 162 16 21 5 183 25 18 6 201 36 17 7 218 49 16 8 234 64 16 9 250 81 16 10 266 100 15 11 281 121 13 12 294 144 13 13 307 169 13 14 320 196 13 15 333 225 12 16 345 256 12 17 357 289 12 18 369 324 12 19 381 361 11 20 392 400 … … … … 由上表可以看出我的H指数是13,g指数是19,因为第20个文献g2已经大于前面所有引用次数之和了。(该例子数值来源于Egghe. An Improvement of the H-Index: the G-Index)G指数相比于H指数和I10指数,更能反应论文整个引用情况。比如我发表的文章,总体都不高,可能H指数比较高,可是一算G指数立马原形毕露,原来是水货一枚。H5指数(H5-index)和H5中位数(H5-median)H指数、I10指数和G指数是针对个人论文引用次数的统计,而H5指数和H5中位数(H5-median)是针对杂志引用次数的一种评价体系。H5指数H5指数是过去5年之内某一杂志所发表的论文数相比于引用数的最小值,如Nature杂志过去5年之内发表了1000篇文章(当然实际数值比这个大),按照每篇论文的引用数进行降序排列第381位的文章的引用数是381,而382的文章引用数是300,那么Nature的H5指数就是381H5相较于IF,是反应杂志过去5年文章的引用情况,而IF是反应的杂志平均引用情况。H5相较于H指数,是针对杂志的总体情况,而H指数是针对于个人论文的引用情况。有时候不同影响因子的杂志,H5可能一样。如PLoS One和Nature Reviews Immunology的H5都是130,可是两者的影响因子相差可不止一个档次。H5中位数H5中位数(H5-median)是指所用文章引用次数的中位数。为毛不用平均数?因为资料不是正态分布。每一个杂志的文章引用次数肯定不会是平均分布的,正如我国居民收入一样。有的引用次数肯定很大,可是有的文献可能很水,引用次数少的可怜。如果平均无法反应真实的引用情况,中位数最佳的选择。F1000F1000(Faculty of 1000)是为生物学及医学研究人员提供评估服务的二次文献数据库,是由英国BioMed Central出版的一种新型在线研究辅助工具,包括生物学(Biology)和医学(Medicine)两大系列。 其目前是给生命科学研究者一个新的评价体系,而不仅仅依赖于是否被SCI收录。医学F1000:由2400多位世界顶级的临床专家、学者收集和评价,提供目前世界上最重要的医学论文信息及发展趋势。它包括18个领域:麻醉和镇痛、心血管疾病、重症监护和急诊医学、皮肤病学、糖尿病和内分泌病学、循证医学、胃肠病和肝病学、血液病学、感染性疾病、肾病学、神经疾病、肿瘤学、心理学、公共卫生和流行病学、呼吸系统疾病、风湿和临床免疫、泌尿病学、女性健康。该网站文献与PubMed及PubMed Central进行了链接。生物学F1000:由2300多位专家学者的评价,提供目前世界上最重要的生物学论文信息及研究趋势。涵盖学科领域:生物学、生物化学、生物信息学、生物技术、癌症生物学、心血管生物学、细胞生物学、化学生物学、发育生物学、生态学、进化生物学、胃肠生物学、基因组学和遗传学、免疫学、代谢及内分泌学、微生物学、分子生物学、分子医学、神经科学、药理学与药物发现、生理学、植物生物学、肾生物学、呼吸生物学、结构生物学。主要特点主要对PubMed收录的重要论文的进行客观评估,评估依据是以学术成就而非该期刊是否被SCI收录;参加评议的成员分别由美国和欧洲等国际知名机构的著名专家组成。根据论文对当前世界生物和医学研究的贡献程度和科学价值,通过客观反映学术水平的指标(F1000因子)给予评分,每日将最近一个月内的极少数优秀论文推荐给读者,并提供Pubmed链接。F1000三个等级分别为9分(杰出)、6分(必读)和3分(推荐)。以上有关F1000的内容来自百度百科。因此F1000相比于影响因子,多人工挑选的干预,其分值高的研究意义就比较重大。F1000应该是一个质化的指标,最简单的实时查看F1000的方法也可以使用医学文献助手。聊完了传统的评价指标,再扒一扒新兴的论文评价指标AltmetricAltmetric是一个新兴的指标,虽然字面意思是替代指标,但是我认为「社会化影响力」或者「网络影响因子」或者「分享因子」更能反应其本质。Altmetric出现的背景可能大家遇到这么一种情况,有的论文发表以后,被大家广泛转载,网络新闻报道,Twitter或者G+上评论和分享。这时,影响因子和F1000就不能反应这些了。Altmetric就是在这种情况下出现的,Altmetric就是反应某一论文分享、下载、阅读的情况。但是现在Altmetric争议也比较大,关于名字都有争议。我个人认为InterMetric更好,简称IM,有点和实时通讯软件混了啥。SocialMetirc,简称SM,有点变态了哈。有关Altmetric更多详情可以参阅此文:利用Altmetric评价系统了解论文的关注度分享情况类似的还有Plum Metrics (利用Plum Metrics评价系统了解论文的关注度分享情况)和Impactstory(这个可能要挂代理)RG ScoreRG Score(RG因子)是ResearchGate推出的一个评价作者的指标。RG Score推出的目的是为了帮助评价自己在科学圈内的处于一个啥水平。计算方法并不是自我发表了多少文章,而是自己的科研工作被同行认可以程度。RG Score不同于传统评价指标在于可以统计更多的信息,如下载,浏览、分享等。RG Score不同于Altmetric之处在于RG Score更测重于分享。如果和同行分享自己的Idea,并得到同行的认可和讨论,那么RG Score增长很快。更多有关RG Score的详情可以查看此文:ResearchGate科研人员自己的FaceBook
简单查询,包括人用、农用等等,差不多有400个期刊。
1.药学学报2.中国药学杂志3.中国医院药学杂志4.药物分析杂志5.中国医药工业杂志6.中国新药与临床杂志7.中国药理学通报8.中国抗生素杂志
药学学报 中国药学杂志 中国药理学通报 药物分析杂志 中国新药杂志 中国新药与临床杂志 中国医院药学杂志 中国医药工业杂志 中国药科大学学报 中国抗生素杂志 沈阳药科大学学报 中国药理学与毒理学杂志 中国临床药理学杂志 中国药房 中国生化药物杂志 中国现代应用药学 华西药学杂志
1.药学学报 2.中国药学杂志 3. 中国药理学通报 4.药物分析杂志 5.中国新药杂志 6.中国新药与临床杂志 7. 中国医院药学杂志8. 中国医药工业杂志9.中国药科大学学报 10. 中国抗生素杂志11. 沈阳药科大学学报12. 中国药理学与毒理学杂志 13. 中国临床药理学杂志14. 中国药房 15.中国生化药物杂志 16. 中国现代应用药学 17. 华西药学杂志 2012版核心目录
一、医学论文课题设计的内容1.阐述背景。即阐述该课题研究的背景,包括理论背景和实践背景。理论背景主要是阐述该课题的研究是在什么样的意识形态环境下产生和进行的,理论依据是什么,将在什么样的理论指导下进行研究。实践背景主要是说明在什么样的实践环境中产生和进行,其中具有什么有利条件和不利因素,存在什么问题等。在阐述背景的时候要将理论背景和实践背景结合起来论述,单独的论述并不能体现课题的研究价值。2.研究的对象和内容。确定课题研究的对象和内容目的是让人明确该课题要研究什么,在什么范围内研究。这是课题设计中的重要内容,所以在撰写的过程中,要清楚明白的表述出研究的内容。3.研究的必要性和可行性。包括说明问题产生的原因、课题的理论和实践价值、前人的工作和经验教训、完成本课题已具备的条件、存在的困难和障碍,以及克服困难的主要措施等。4.研究的目的和意义。阐明该课题的研究有什么意义,要达到什么目的。这是开展此次课题研究的核心价值,所以在撰写的过程中,我们要突出这部分的内容。5.研究假设。确定和阐明研究的实验因子,提出对解决课题中问题的最初假设,即假设根据某种理论和条件,通过研究可以取得什么样的成果。假设部分要贴切实际,不要随意想象,要有理有据。6.研究原则、方法和手段。要规定课题研究的指导原则,并根据课题的类型和性质决定采用什么研究方法和手段。7.评价。阐明对研究成果将如何评价,包括评估的人员、原则、过程、方法等等。8.实施步骤和措施。确定整个研究过程的实施步骤,包括研究阶段划分,每阶段的具体任务,各位参与研究人员的工作范围和任务,各阶段各方面的负责人,研究成果的形式和要求,所需财力、物力及开支的预算计划与安排。二、医学科研课题设计要达到的指标:(1)技术指标和措施。包括动物质量及数量、病例数、研究手段、技术参数、操作程序和实施方案等。(2)效益指标,包括社会效益、经济效益和生态效益。效益高低是衡量医学科研课题设计价值的客观指标之一,所以要认真计算投入与产出的经济效益帐。(3)医学科研课题设计进度计划指标,要长计划短安排。对每一阶段应完成的指标,要有明确要求,以防课题无限期拖延。(4)医学科研课题设计的规模与选点,应根据研究内容来确定,但要事先作好调查研究。要考虑气候条件、地理环境、生态条件、人群分布和交通水电等条件。
一项研究在完成了设立对照和随机分组等实验设计工作后,接下来的工作就是做实验和收集数据了。在医学论文中,数据分为三种类型:计数,计量和等级。下面,我们分别来谈谈这三种数据。计数数据是定性观察的结果, 例如患者的性别、职业等等。统计指标是各个属性或类别的计数,率,结构百分比等等。计量数据是定量观察的结果, 通常有度量单位,例如患者的年龄 、血压、心率等等。统计指标常用平均数±标准差来表示。等级数据介于定性观察和定量观察之间。观察结果有等级或程度上的差别, 但不能用数量表示,例如疗效评价(包括无效,有效,显著等)。下面来看一个具体的实例:在这里,性别、职业、ECG(这里的ECG只有正常和异常两种结果)是定性观察的结果,属于计数数据;而心率、收缩压、舒张压是定量观察的结果,属于计量数据;而疗效,因为有等级的关系。分为无效,有效,显著三个等级,所以属于等级数据。但是,这三种数据的类型不是一成不变的。必要的时候,它们之间是可以进行相互转换的。下面,我们看一下算盘总结的斗转星移之转换大法:三种数据之间的互相转换:1. 计量数据转换为计数或者等级数据这种情况一般是为了使分组后有足够多的分母。例如,上面那个例子中的患者的年龄,可以转换为等级数据:30~39岁,40~49岁,50~59岁,60~74岁,≥75岁五个等级的年龄组。这样就变成了等级数据。又例如,患者的收缩压可以转换为定性数据:按照诊断标准,<150 mm Hg为正常血压;≥150 mm Hg为高血压,这样就变成了定性数据。2. 计量资料转换为计数资料这种情况一般是用于计算发病率。还是用上面那个例子,患者的血压是本来是计量资料。但是,我们可以根据诊断标准,将其转换成正常血压或者高血压,这就变成了计数资料。也可以据此计算出高血压的发病率。3.计数或者等级资料转换成计量资料这种形式多以评分的形式出现。例如,临床上常用的疼痛评分系统。疼痛,作为一种非常主观的感受,是一种定性数据。可以作为计数数据,区分为无痛感和有痛感两种类型;也可以作为等级数据,区分为无痛感,轻微痛感,中度痛感,强烈痛感等级别。但是,如果我们要更加精确一点的话,可以采用临床上常用的0~10分的评分系统,让患者自己来打分。0分为无痛感;10分为最强烈的痛感。这样,就可以轻易地转换成为计量资料。综上所述,医学研究的数据(常见的数据资料)分为三种类型。如果不注意区分这三种类型,就会采用错误的统计方法,造成错误。
CiteScore
影响因子是评价学术期刊的一项重要指标,曾被认为是学术界的金标准。但近年来由于在学术评价体系中被滥用受到各方人士的强烈抵制。2016年7月5日,几大顶尖级学术出版机构包括多家著名期刊也联合在预印本网站BioRxiv上发表文章呼吁期刊降低对影响因子计算的痴迷和依赖程度,并强调用引用分布曲线(Citation Distribution)来取代影响因子的简单算术平均。其他一些权威机构也纷纷提出多元化的文献计量评价指标,以期打破影响因子一家独大的局面。2016年12月8日,出版业巨头Elsevier重磅推出了他们基于Scopus数据库的全新期刊评价体系:CiteScore。Scopus数据库涵盖了世界上最广泛的科技和医学文献的文摘、参考文献及索引,因此被各界人士认为是影响因子最有力的竞争对手。与影响因子相比,Cite Score具有以下优势。
一,期刊涵盖数量众多,中文期刊显著增加。
CiteScore涵盖的期刊数量达到22256本,比影响因子的11000种期刊多了一倍。尤为重要的是,相比SCI数据库中的几十种中文期刊,Scopus收录了几百种重要的中文期刊。有学者表示,这对中文期刊会是一件好事。以往很多优秀的中文期刊由于不在SCI检索范围内,在高校职称评定时不被认可,因此稿源越来越少。如果将来国内认可CiteScore,那么对于被收录在Scopus数据库中的这些优秀的中文期刊又是一次极好的机会。
二,指标计算公式有所不同。
与影响因子的计算某期刊连续2年论文在第3年度的篇均引用次数类似,CiteScore计算的是期刊连续3年论文在第4年度的篇均引用次数。但两者有一个重要的区别,影响因子计算时的可引用内容只有论文和综述,剔除了编辑评述、读者来信、更正信息和新闻等计入分母,但其引用数仍被计入分子。而CiteScore将所有文献内容都视作可能被引用的内容,包括编辑评述、读者来信、更正信息和新闻等。这些内容的引用很少,因此会拉低期刊的得分。
三、影响因子没有学科领域的区分,而CiteScore有不同领域的相对排名。
大家都知道,把不同领域的文章混在一起谈影响因子,是没什么意义的。比如数学和工程的跟化学和生物领域的科研人员就没法说到一块去。一个是顶了天都不到2的影响因子,另一个是到10都很正常。CiteScore也是只有比较同一领域的期刊才有意义,对选择发表论文才具有专业引导作用。所以在查询网站中还有Highest CiteScore Percentile在CiteScore后面,这就能够看出期刊在不同领域的相对排名。
四、CiteScore是免费的。
与影响因子只对购买者开放不同,CiteScore对任何在线用户免费开放。任何人都可以通过官方网站来查看期刊CiteScore,也可以分析期刊的引用情况。
CiteScore一经推出,学术界人士普遍表示支持。多数人认为,影响因子是应该有个对手了,只要有进步,有比较都是好的,我们不要一家之言!本人也认为,影响因子已经在评价指标第一把交椅上坐得太久了,以致现在负面影响隐隐有超过积极影响的架势,也是时候有另一个因子取而代之了。但是影响因子毕竟在学术界还是影响深远,全盘否定而推出一个完全不同的指标有可能是操之过急。CiteScore在计算方法上与影响因子大同小异,虽然只是治标,但可能更加符合现在的需求。无论如何,有创新总是好的,多元化的计量评价指标才能让评价体系越来越趋于完善。
荷兰阿姆斯特丹大学医学院麻醉科Patrick Schober 教授发表了一篇论文 Statistics From A (Agreement) to Z (z Score): A Guide to Interpreting Common Measures of Association, Agreement, Diagnostic Accuracy, Effect Size, Heterogeneity, and Reliability in Medical Research》 相关系数测量的是两个变量之间的关联强度。在一般医学研究论文中普遍都会报道相关系数。 Pearson相关系数描述了线性关系的强度,需假设两个变量都是连续变量,且呈近似正态分布。Spearman秩相关系数没有对数据分布做出任何假设,只是要求数据可以以一种有意义的方式进行排序。它描述了单调关系的关联强度,即一个变量的值随着另一个变量的值的增加而不断增加或减少,但不一定以线性方式增加或减少。 相关系数范围一般为-1至+1。正值表示一个变量的值随着另一个变量的值的增加而增加,而负值表示相反的关系。绝对值越来越接近1,表示关系越来越密切。 Pearson相关系数平方(或R2,决定系数)也经常在文献中报道。它的解释为一个变量被另一个变量解释的方差的比例(或百分比)。例如,表1中的Pearson相关系数对应的可解释的方差分别<1%、1%-15%、16%-48%、49%-80%和≥81%,相应的可解释的方差比例为“可忽略”、“较低”、“中等”、“较高”和“非常高”。 Cronbach’α系数是评价多条目评分量表的可靠性,即内部一致性的指标。评分量表广泛应用于心理学和社会科学,以解决所谓的无法直接测量的潜在结构,如自尊、焦虑、抑郁、躯体化等。 一个最为常见的例子就是李克特式(Likert)评分量表,在该量表中,评估者或受访者对每个问卷测量条目使用“非常同意”、“同意”、“中立”、“不同意”或“非常不同意”等描述词,来对观察结果、看法、态度、认知、表现等进行分类。 在医学研究中,心理测量评分量表应用越来越多,越来越强调不能直接测量的有关患者幸福感方面的问题,包括患者满意度、恢复质量或与健康相关的生活质量等等。 在开发、修订或评估评分量表的研究中,尽管存在一些局限性,但Cronbach’α仍然是最常用的评估内部一致性的指标。Cronbach’α的主要假设是所有的量表条目都是连续的,且呈正态分布,所有的量表条目都具有相同的潜在结构,每个条目对量表总得分的贡献是相等的(称为tau等效)。 当所有量表条目反映相同的结构时,整个量表条目的不同子集应产生一致的结果。 Cronbach’α反映了量表条目之间的相关程度或相互关系,它的值通常在0到1之间,值越接近于1表示内部一致性越强。然而,Cronbach’α值对量表条目的数量较为敏感,条目越多,Cronbach’α值越高,过高的值说明量表条目的冗余度较高。 虽然在文献中对Cronbach’α通俗易懂的解释差异较大,但Cronbach’α≥通常被认为是“可接受的”。值得注意的是,这种情况主要适用于量表用于研究目的的情况(例如,比较两组患者之间的患者满意度)。 当量表用于临床评估时,通常需要更高的值(≥)。因此,当量表用于患者治疗的临床决策时,“可接受”甚至“良好”的可靠性,可能并不够好。
一提起论文价值,恐怕首先想到的是影响因子。尤其是在中国,影响因子对于科研人员和工作者真是命根,晋级,升迁,申请基金,评奖等等无不与影响因子有关。但是除了影响因子,还有许多其它的评价论文价值的方法。本文就介绍一下常见和新兴的评价论文价值的指标。评价一个论文价值,无非从量化和质化两个方面来评价,或者期刊和论文的角度来评价。下面提到的指标,有的是从量化,有的是从质化,有的是从期刊角度,有的是从文章角度。影响因子影响因子确切说是针对期刊的,而并非直接针对论文的。影响因子应该是一个量化和半质化的指标。为何?这是因为高影响因子的期刊低水平的文章也并非没有,低影响因子高水平的论文也大有存在。当然,如果论文婆家找的好,自身的身份也就自然高了。正如以前的皇妃,可能整个素质比一般大众好,可以平民中也大有出类拨粹的人物存在。因此,现在影响因子也是饱受垢病。有的人戏称SCI是stupid chinese idea,其中的原因也就不多说了。查看影响因子的方法有多种,最经典的方法当然是Web of Science,但是收费,一般人用不起。简单方便的方法可以使用医学文献助手:利用医学文献助手筛查PubMed文献质量引用次数这个就不用多介绍了吧。很多数据库和在线查询平台都可以实现引用次数的查看,例如Google和微软学术搜索Microsoft Academic Search,还有利用医学文献助手筛查PubMed文献质量H指数(H Index)H指数是2005年由美国加利福尼亚大学圣地亚哥分校的物理学家乔治·希尔施提出的。H指数的计算基于其研究者的论文数量及其论文被引用的次数。赫希认为:一个人在其所有学术文章中有N篇论文分别被引用了至少N次,他的H指数就是N。可以按照如下方法确定某人的H指数:将其发表的所有SCI论文按被引次数从高到低排序;从前往后查找排序后的列表,直到某篇论文的序号大于该论文被引次数。所得序号减一即为H指数。以上有关H指数的内容来自维基百科查看H指数的最简单的方法就是利用Google Scholar,注意是英文版的,中文版的不要。另外FireFox和Chrome也有相应的插件可以选用。I10指数(I10-Index)I10-index是由Google提出来的,指作者发表文章数被引用10次以上的个数。比如我发表了100篇文章(呵呵,有点大了啥),其中90篇被他人引用了10次以上,那么本人的I10-index就是90。如果说影响因子是针对期刊的话,那么H指数和I10指数就是针对个人的。论文的影响因子高,只能说该论文找了一个好婆家,具体引用情况并不一定。而H指数和I10指数就是确切反应论文引用的一种量化标准。G指数(G-Index)G-Index(G指数)相比于上述几个指标来有点默默无闻。G-Index是由Leo Egghe于2006年提出的, 评价作者论文数量的一个指标。G指数的计算方法如下把所有作者发表文章按照引用次数降序排列,序号为g把作者所有发表文章的序号进行平方,得到g2把作者所有文章的引用次数进行加法,得到∑TC最后一个∑TC仍大于g2的序号就是G指数。有点绕哈,没事举个例子更清楚一些,比如我发表了以下文章,按照引用次数进行排序如下引用次数(TC) 序号 (g) 文章引用 次数之和 (∑TC) g^2 47 1 47 1 42 2 89 4 37 3 126 9 36 4 162 16 21 5 183 25 18 6 201 36 17 7 218 49 16 8 234 64 16 9 250 81 16 10 266 100 15 11 281 121 13 12 294 144 13 13 307 169 13 14 320 196 13 15 333 225 12 16 345 256 12 17 357 289 12 18 369 324 12 19 381 361 11 20 392 400 … … … … 由上表可以看出我的H指数是13,g指数是19,因为第20个文献g2已经大于前面所有引用次数之和了。(该例子数值来源于Egghe. An Improvement of the H-Index: the G-Index)G指数相比于H指数和I10指数,更能反应论文整个引用情况。比如我发表的文章,总体都不高,可能H指数比较高,可是一算G指数立马原形毕露,原来是水货一枚。H5指数(H5-index)和H5中位数(H5-median)H指数、I10指数和G指数是针对个人论文引用次数的统计,而H5指数和H5中位数(H5-median)是针对杂志引用次数的一种评价体系。H5指数H5指数是过去5年之内某一杂志所发表的论文数相比于引用数的最小值,如Nature杂志过去5年之内发表了1000篇文章(当然实际数值比这个大),按照每篇论文的引用数进行降序排列第381位的文章的引用数是381,而382的文章引用数是300,那么Nature的H5指数就是381H5相较于IF,是反应杂志过去5年文章的引用情况,而IF是反应的杂志平均引用情况。H5相较于H指数,是针对杂志的总体情况,而H指数是针对于个人论文的引用情况。有时候不同影响因子的杂志,H5可能一样。如PLoS One和Nature Reviews Immunology的H5都是130,可是两者的影响因子相差可不止一个档次。H5中位数H5中位数(H5-median)是指所用文章引用次数的中位数。为毛不用平均数?因为资料不是正态分布。每一个杂志的文章引用次数肯定不会是平均分布的,正如我国居民收入一样。有的引用次数肯定很大,可是有的文献可能很水,引用次数少的可怜。如果平均无法反应真实的引用情况,中位数最佳的选择。F1000F1000(Faculty of 1000)是为生物学及医学研究人员提供评估服务的二次文献数据库,是由英国BioMed Central出版的一种新型在线研究辅助工具,包括生物学(Biology)和医学(Medicine)两大系列。 其目前是给生命科学研究者一个新的评价体系,而不仅仅依赖于是否被SCI收录。医学F1000:由2400多位世界顶级的临床专家、学者收集和评价,提供目前世界上最重要的医学论文信息及发展趋势。它包括18个领域:麻醉和镇痛、心血管疾病、重症监护和急诊医学、皮肤病学、糖尿病和内分泌病学、循证医学、胃肠病和肝病学、血液病学、感染性疾病、肾病学、神经疾病、肿瘤学、心理学、公共卫生和流行病学、呼吸系统疾病、风湿和临床免疫、泌尿病学、女性健康。该网站文献与PubMed及PubMed Central进行了链接。生物学F1000:由2300多位专家学者的评价,提供目前世界上最重要的生物学论文信息及研究趋势。涵盖学科领域:生物学、生物化学、生物信息学、生物技术、癌症生物学、心血管生物学、细胞生物学、化学生物学、发育生物学、生态学、进化生物学、胃肠生物学、基因组学和遗传学、免疫学、代谢及内分泌学、微生物学、分子生物学、分子医学、神经科学、药理学与药物发现、生理学、植物生物学、肾生物学、呼吸生物学、结构生物学。主要特点主要对PubMed收录的重要论文的进行客观评估,评估依据是以学术成就而非该期刊是否被SCI收录;参加评议的成员分别由美国和欧洲等国际知名机构的著名专家组成。根据论文对当前世界生物和医学研究的贡献程度和科学价值,通过客观反映学术水平的指标(F1000因子)给予评分,每日将最近一个月内的极少数优秀论文推荐给读者,并提供Pubmed链接。F1000三个等级分别为9分(杰出)、6分(必读)和3分(推荐)。以上有关F1000的内容来自百度百科。因此F1000相比于影响因子,多人工挑选的干预,其分值高的研究意义就比较重大。F1000应该是一个质化的指标,最简单的实时查看F1000的方法也可以使用医学文献助手。聊完了传统的评价指标,再扒一扒新兴的论文评价指标AltmetricAltmetric是一个新兴的指标,虽然字面意思是替代指标,但是我认为「社会化影响力」或者「网络影响因子」或者「分享因子」更能反应其本质。Altmetric出现的背景可能大家遇到这么一种情况,有的论文发表以后,被大家广泛转载,网络新闻报道,Twitter或者G+上评论和分享。这时,影响因子和F1000就不能反应这些了。Altmetric就是在这种情况下出现的,Altmetric就是反应某一论文分享、下载、阅读的情况。但是现在Altmetric争议也比较大,关于名字都有争议。我个人认为InterMetric更好,简称IM,有点和实时通讯软件混了啥。SocialMetirc,简称SM,有点变态了哈。有关Altmetric更多详情可以参阅此文:利用Altmetric评价系统了解论文的关注度分享情况类似的还有Plum Metrics (利用Plum Metrics评价系统了解论文的关注度分享情况)和Impactstory(这个可能要挂代理)RG ScoreRG Score(RG因子)是ResearchGate推出的一个评价作者的指标。RG Score推出的目的是为了帮助评价自己在科学圈内的处于一个啥水平。计算方法并不是自我发表了多少文章,而是自己的科研工作被同行认可以程度。RG Score不同于传统评价指标在于可以统计更多的信息,如下载,浏览、分享等。RG Score不同于Altmetric之处在于RG Score更测重于分享。如果和同行分享自己的Idea,并得到同行的认可和讨论,那么RG Score增长很快。更多有关RG Score的详情可以查看此文:ResearchGate科研人员自己的FaceBook
CiteScore
影响因子是评价学术期刊的一项重要指标,曾被认为是学术界的金标准。但近年来由于在学术评价体系中被滥用受到各方人士的强烈抵制。2016年7月5日,几大顶尖级学术出版机构包括多家著名期刊也联合在预印本网站BioRxiv上发表文章呼吁期刊降低对影响因子计算的痴迷和依赖程度,并强调用引用分布曲线(Citation Distribution)来取代影响因子的简单算术平均。其他一些权威机构也纷纷提出多元化的文献计量评价指标,以期打破影响因子一家独大的局面。2016年12月8日,出版业巨头Elsevier重磅推出了他们基于Scopus数据库的全新期刊评价体系:CiteScore。Scopus数据库涵盖了世界上最广泛的科技和医学文献的文摘、参考文献及索引,因此被各界人士认为是影响因子最有力的竞争对手。与影响因子相比,Cite Score具有以下优势。
一,期刊涵盖数量众多,中文期刊显著增加。
CiteScore涵盖的期刊数量达到22256本,比影响因子的11000种期刊多了一倍。尤为重要的是,相比SCI数据库中的几十种中文期刊,Scopus收录了几百种重要的中文期刊。有学者表示,这对中文期刊会是一件好事。以往很多优秀的中文期刊由于不在SCI检索范围内,在高校职称评定时不被认可,因此稿源越来越少。如果将来国内认可CiteScore,那么对于被收录在Scopus数据库中的这些优秀的中文期刊又是一次极好的机会。
二,指标计算公式有所不同。
与影响因子的计算某期刊连续2年论文在第3年度的篇均引用次数类似,CiteScore计算的是期刊连续3年论文在第4年度的篇均引用次数。但两者有一个重要的区别,影响因子计算时的可引用内容只有论文和综述,剔除了编辑评述、读者来信、更正信息和新闻等计入分母,但其引用数仍被计入分子。而CiteScore将所有文献内容都视作可能被引用的内容,包括编辑评述、读者来信、更正信息和新闻等。这些内容的引用很少,因此会拉低期刊的得分。
三、影响因子没有学科领域的区分,而CiteScore有不同领域的相对排名。
大家都知道,把不同领域的文章混在一起谈影响因子,是没什么意义的。比如数学和工程的跟化学和生物领域的科研人员就没法说到一块去。一个是顶了天都不到2的影响因子,另一个是到10都很正常。CiteScore也是只有比较同一领域的期刊才有意义,对选择发表论文才具有专业引导作用。所以在查询网站中还有Highest CiteScore Percentile在CiteScore后面,这就能够看出期刊在不同领域的相对排名。
四、CiteScore是免费的。
与影响因子只对购买者开放不同,CiteScore对任何在线用户免费开放。任何人都可以通过官方网站来查看期刊CiteScore,也可以分析期刊的引用情况。
CiteScore一经推出,学术界人士普遍表示支持。多数人认为,影响因子是应该有个对手了,只要有进步,有比较都是好的,我们不要一家之言!本人也认为,影响因子已经在评价指标第一把交椅上坐得太久了,以致现在负面影响隐隐有超过积极影响的架势,也是时候有另一个因子取而代之了。但是影响因子毕竟在学术界还是影响深远,全盘否定而推出一个完全不同的指标有可能是操之过急。CiteScore在计算方法上与影响因子大同小异,虽然只是治标,但可能更加符合现在的需求。无论如何,有创新总是好的,多元化的计量评价指标才能让评价体系越来越趋于完善。