医学论文统计学错误解析

不论是什么错，还是谁提出的，一经核实，原刊物会在以后的期刊中，给出勘误表或更正。如果是作者本人，发现的最好尽快与杂志社联系，予以更正，并附一封对读者的致歉信。

科学研究很早就已经从简单的定性分析深入到细致的定量分析，科研工作者要面对大量的数据分析问题，科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中，实验设计的方法直接决定了数据采取何种统计学方法，因为每种统计方法都要求数据满足一定的前提和假定，所以论文在实验设计的时候，就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别，其中最主要的就是统计方法和实验设计不符，造成数据统计结果不可靠。下面，医刊汇编译列举一些常见的可以避免的问题和错误：打开百度APP，查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中，最常见的此类错误就是实验设计是多组研究，需要对数据使用方差分析的时候，而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中，不同数据要采取不同统计处理方法，这就需要作者清楚地描述出每个统计值采用的是何种统计学方法，但在许多使用一种以上数据统计分析方法的医学论文中，作者往往只是简单地把论文采用的数据统计方法进行了整体罗列，并没有对每个数据结果分析分别交代具体的统计方法，这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性，即作者即使不看文章内容，也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字，缺乏直观的统计图或表；或者虽然也列出了统计表或统计图，但表或图内缺项很多，让读者难以从中提取太多有用的信息。另外，也有作者为了增加文章篇幅，同时列出统计表和统计图，造成不必要的浪费和重复。统计表的优点是详细，便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释，最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误，把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论，一定要把统计结果和临床实践结合在一起，这样才会避免出现类似的错误。至于回避阴性结果，只提供阳性结果，是因为不少作者在研究设计时，难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时，从一个方向的实验就下完美的结论，尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性，有时会刻意回避报道差异的不显著结果，不思考和探究差异不显著的原因和意义，反而会因此忽视一些重大的科学发现。

中国光大（集团）总公司：你公司《关于报送企业集团统计报表的请示》（光京字［2003］67号）收悉。经研究，现批复如下：一、我局现行企业集团统计报表制度规定，国家试点企业集团和中央管理的企业集团统计报表由我局企业调查总队负责布置、收集。由于你公司属于中央管理的企业集团，因此你公司填报的企业集团统计报表应直接报送给我局企业调查总队，具体执行时间从今年半年报开始。二、《北京市统计局关于完善企业集团统计报表制度的通知》（京统发［2003］85号）要求你公司向其报送集团2003年年报和半年报的有关事宜，我局企业调查总队已和北京市统计局企调队进行了沟通，北京市企业集团统计的范围不再包括你公司，其所需资料由我局企业调查总队予以提供。国家统计局办公室二○○三年九月十五日

统计学是一门抽象难懂的学科，非统计学专业毕业人员一般很难做到精通。下文是我为大家整理的关于统计类论文投稿的范文，欢迎大家阅读参考!

医学统计学方法应用的错误解析

一、引言

医学由于其研究的复杂性和系统性，常需要应用严谨的统计学方法，由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解，在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此，正确应用统计学方法，并将所获得的结果进行正确的描述有助于单篇论著的质量提高，现将医学论文中统计学方法应用及其常见结果的错误解析如下。

二、医学论文统计学方法应用概况

医学论文的摘要是全文的高度浓缩[1]，主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。

(一)材料与方法部分

正文中，材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述，读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况，其目的是表明统计学方法应用的合理性和可靠性，他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术，要具备可比较性和科学性，

方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法，必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验，多组间计量资料的F检验，计数资料的卡方检验，不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法，要在这里简要说明并给出参考文献，还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号，如基于家系资料研究的版本。

(二)论文结果部分

论文结果部分要显示应用统计学方法得到的统计量[2]，所采用的统计学指标较多时，往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度，除了与测量仪器的精密程度有关外，还与样本本身的均数有关，所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数，百分比一般保留一个小数。在统计软件中，分析结果往往精确度比较高，一般要采用四舍五入的方法使其靠近实验的实际情况，否则还会降低论文的可信度和可读性。

结果部分的统计表采用统一的“三线”表，表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置，要求整齐美观，不能出现错行现象。要明确标注观察的例数，得到的检验统计量。统计图可以直观的表达研究结果，如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出，描述的是67%的置信区间，不是95%，提倡在误差条图采用95%的置信区间。

关于统计量，一般采用均数与标准差两个指标，均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比，分母的确定必须要符合逻辑，过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化，可以采用卡方检验。

1.假设检验的结果中，常见只写P值的情况，有时候会误导读者，也会隐藏计算失误的情况，因此写出具体的统计值，如F值、t值，可以增强可信度。对于率、相关系数、均数这类描述统计量，要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性，对于结果的计算要求具体的P值，如P=或P=。

2.在对论文进行讨论时，作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设，对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件，P值很小表明两组间没有差别的概率很小。当P<，表明差异具有统计学意义。P值与观察的样本量的大小有关联，当样本量小的时候，数据之间的差别即使很大，P值也可能很大;当样本量大时，数据之间的差别即使很小，P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联，有统计学意义的样本相关系数可能很小。因此，有统计学差异的描述并不一定意味着两组间差别很大，错判的危险性很大，显著性的检验为定性的结果，结合统计量大小方可判断是否具有专业意义。

变量间虚假的相关关系与变量随时间变化而变化相关，统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的研究方法的不同来考量。使用回归方程进行分析，当两变量间具有显著性关系，但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度，而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病，灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致，在疾病患病率很低时，出现假阳性也是正常的，要确诊疾病必须要与临床症状体征相结合。因此，这两个率的计算方法必须交待清楚。

三、医学论文统计学方法应用的常见错误分析

(一)“材料与方法”中的统计学方法应用的常见错误

“材料与方法”中统计学方法常见的问题主要为：对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如，临床入组病例分组只采用简单的随机分组，未描述随机分组的方法，未描述是否双盲双模拟，未设置空白对照组，分组后对性别、年龄、文化程度的描述未进行统计学检验，对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单，没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件，有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。

(二)“结果”统计学方法应用的常见错误

1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数，导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量，如F值、t值保留的位数不符合要求。

2.对统计学指标进行分析和计算时，一般采用计数资料和计量资料进行区分。计量资料常用三线表，在近似服从正态分布的前提下采用均数、标准差进行说明，如果不符合正态分布时，可以采用加对数或其他的处理方式使其近似正态分布，否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算，影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标，常见样本量过小的问题，采用率进行描述会影响统计结果的可靠性，采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率，也是不可取的。

3.在判断临床疗效之一指标时，两组平均疗效有差别并不意味着两组的每一个个体都有效或无效，必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效，服药一周后，研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率，研究组和对照组的有效率分别为和，尽管平均疗效相差较多，但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果，P 值的表达提倡报告精确P值，如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS，SPSS等，只要提供原始数据，就可以计算出t值、F值和相应的自由度，并可获得精确的P值。

四、小结

提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3]，医学论文中统计方法应用和统计结果的表达正确与否，不仅体现了论文的科学性和严谨性，而且对于提高期刊整体的学术质量，促进医学科学的发展和传播也有着重要作用[4]。

参考文献：

[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).

[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).

[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).

统计学专业毕业现状分析与对策研究

本科毕业论文是高等学校人才培养计划的重要组成部分，是本科教学过程中最后一个重要的教学实践环节，是学士学位授予的一个重要依据。[1，2]然而，相较于其他教学环节，毕业论文没有受到足够的重视，从而导致该环节存在着一些问题。[3]本文将以中央民族大学统计学专业毕业论文为例，在分析其现状的基础上，找到问题并提出相应的建议。

中央民族大学统计学本科专业设置于2003年，目前已有六届毕业生。经过学院和学校层面的努力，统计学专业作为新办专业取得了较快发展，所培养的学生具有较好的专业能力和综合素质，近四成学生继续读研深造，就业的学生大都在专业对口的工作岗位上，就业率一直在85%左右。

本科毕业论文环节在培养方案中是6个学分。学生在第七学期开始选择指导教师以确定毕业论文题目。经过前6个学期的系统理论学习，统计学专业学生已基本掌握了统计学的基础理论和基本方法，具备了正确的统计思想和较强的统计软件应用能力，以及运用所学的理论和方法解决实际问题、文献检索和资料查询等综合能力。本科毕业论文的写作就是统计学专业学生将上述基础和能力进一步深化与升华的重要过程，从而培养学生的创新能力和实践能力，使学生的知识、技能和素质得到进一步的充实和提高，同时也是衡量学校教学质量和办学水平的重要指标。因此对如何提高毕业论文质量进行研究是必要和有意义的。[4]

一、统计学专业毕业论文质量的现状分析

从论文完成情况来看，每届的毕业论文基本都能达到论文教学环节的要求，通过对中央民族大学统计学专业2007～2011年四届毕业生的毕业论文进行分析，发现毕业论文及格率为。

从毕业论文研究的类型来看，主要分为两大类：理论研究型论文和实证型论文，理论研究型论文表现为总结和论述现有统计理论问题，表述理论研究的成果，或应用理论对现实问题进行分析、说明，并提出自己的思考;实证型论文主要表现为针对某一特定的实际目的或目标，运用所学统计的理论和方法，对经济、管理、金融、医学、生物、工程、环境等领域进行统计调查、统计信息管理、数量分析等。

从论文知识点范围的分析来看，学生论文绝大多数是统计专业问题，极少数是其他数学分支的问题。从中央民族大学历届统计学专业学生的毕业论文情况分析，发现毕业论文中研究其他数学分支的问题占总数的，主要包括：一是其他科目的应用研究(数学分析、常微分方程、运筹学及空间解析几何等)，占总数的。二是数学专业教育和数学思维的研究，占总数的。研究统计学专业问题的毕业论文占绝大部分，比例为，选题内容广泛且多为社会热点问题，涉及经济、社会、医疗卫生、教育发展、旅游、基础设施建设等多领域，由于受学校人文环境影响，很大比例的学生对少数民族地区的经济、社会、民生等问题进行了统计分析，约占总学生人数的。所使用的分析方法主要集中于抽样调查、回归分析、多元统计方法、聚类分析、判别分析等常用统计方法。

此外，统计分析显示学生成绩普遍偏高，统计学专业学生的毕业论文，尤其是实证类论文，存在着可以大量使用背景介绍和统计软件分析结果的特点，因此，一些论文没有创新性和学术含量，但具有较大的篇幅，与理学院其他专业的毕业论文成绩比较，其平均成绩相对较高，约分。

二、统计学专业毕业论文存在的问题

毕业论文的质量问题关系到本科人才的培养规格和目标，直接体现了学生本科阶段的学习成果，是衡量教学水平、学生毕业与学位资格认证的重要依据。通过对论文和考评结果的具体分析，发现学生的毕业论文在创新性、理论深度及论文写作常识多方面存在问题。具体表现为：

1.创新性不够

学生的毕业论文表现为理论性研究非常少，大都是实证型论文，并且多是简单的统计方法应用，缺少创新性研究和思考。从中央民族大学历届统计学专业学生的毕业论文来看，理论研究型论文只占，与实证型论文的比例为1︰，比例悬殊，体现了学生在毕业论文大的选题过程中，避重就轻，缺乏创新的特点。如每年都有一定数量的学生选择“我国人均GDP的预测”这类针对某经济指标进行预测的题目，论文的主要内容就是利用ARMA、灰色预测或者趋势外推方法等一种或多种方法对时间序列数据做简单建模和分析，论文没有对指标本身的意义以及国内国际的社会经济形势进行综合分析。这种方法简单套用性质的论文占有很大的比重。

2.选题过大、内容空泛，缺乏深入研究，存在抄袭、拼凑现象

有些学生在选择研究课题时，往往不能根据自身的专业知识结构特点和社会实践情况进行准确定位，只是一味的盲目的选择一些过大过空的社会热点问题，因此难以看到所要研究的问题的本质。如有的学生针对CPI做研究，没有深入了解问题的实质，只是收集了一些文献，很难提出自己的观点或研究角度，造成了材料堆积且过于散乱，论文变成了一些材料的简单拼凑。有些论文针对某一社会经济问题进行研究，论文的主题只是针对现有数据利用简单的统计方法进行分析，对数据的质量和可靠性以及方法的适用性不做针对性讨论，对所得的结论也不结合社会经济现实情况进行分析，导致论文质量不高。

3.相对前沿的分析方法利用较少

前沿的分析方法利用较少，通过毕业论文的写作，统计分析能力没有实质性提升。学生论文使用的统计方法主要集中于回归分析、聚类分析、判别分析、相关性分析等，其中回归分析方法占有非常大的比例，约，其他各统计方法使用的比例分别为：聚类分析为，判别分析为，相关性分析为，多元统计方法为，时间序列分析为，极少有学生使用教科书外的相对前沿的分析方法。

4.论文写作上存在结构不合理、没有相关研究介绍、创新点表述不清、参考文献不会正确标注等问题

从学生的毕业论文来看，论文写作不规范，专业性差。主要存在论文形式不规范、结构不合理、题目含糊、有些论文杂乱无章、口语化严重、可读性差等问题。

三、存在问题的原因分析

针对上述问题，统计学系通过对论文进行详细审查以及组织指导教师和学生座谈，发现毕业论文出现以上问题的主要原因包括以下几方面：

1.学生对论文不够重视

部分学生由于忙于考研学习而无暇顾及毕业论文的研究，还有部分学生由于忙于外出找工作、实习而无心认真撰写论文。论文撰写所需的必要时间难以得到保障，因此学生应付了事，从而无法保证论文的深度。此外，还有部分学生认为毕业论文只是一个教学环节，与考研的好坏无关，存在只要写了论文，教师都会让自己通过的侥幸心理，在思想上没有引起足够的重视。

2.缺乏指导教师的针对性指导

指导教师所带毕业生人数过多，使得导师的工作量呈现超负荷状态，无法保证每个学生毕业论文的质量，从而致使部分学生的论文规范性较差，没有对存在的问题反复修改，使得学生论文存在诸多问题。

3.学生的专业训练还不够

大部分本科生没有经历过论文的写作训练，写作水平较低，不了解学术论文的规范性及其格式，不知如何从科研的角度构思文章、组织材料、安排结构，使得相当一部分学生的毕业论文表达的观点不够准确清楚，论据亦不能很好地支持论点。另外，一些同学为了完成任务，直接将在网络中搜索到的资料不假思索的拼凑在一起，使得内容不成体系，观点混乱。

四、提高毕业论文质量的建议和实践

1.加强毕业论文重要性的宣传，提高学生的重视度

加强对毕业论文重要性的认识有助于提高本科生毕业论文的质量。通过讲座、课堂传授等形式，让学生意识到毕业论文的实践性和综合性是任何教学环节都不能替代的，是提高发现问题、分析问题、解决问题能力的有效途径，更是进行个人综合素质提高的必不可少的重要环节，[4]从而使学生在思想上认识到毕业论文的重要性，投入更多精力进行毕业论文设计。

2.选题和教师的科研项目相结合，提高论文的创新性

在选择课题时，为了能充分发挥学生的主观能动性，可以让学生根据自身的特点，与指导教师协商，结合导师的研究方向制定课题方案。统计学专业的教师一般除了申请国家自然科学基金和国家社会科学基金这类对理论性和创新性要求较高的项目以外，很多教师还主持或参加有相应的应用研究类项目。应用类项目大都需要实地调研(以及问卷涉及和数据分析)或者大量的数据分析和建模。引导学生参加这类项目来设计和完成自己的本科毕业论文，能够激发学生的科研热情和创新潜力。此外，鼓励和引导一些成绩较好，如让具备保研资格的学生参加教师的科研讨论班或者课题组，选择一些具有一定难度的理论问题进行研究，可以使学生了解本学科的发展方向和最新动态。最近两年，越来越多的学生，特别是具备了保研资格的学生，在大四上学期就能投入到项目和毕业论文的写作中。

3.重视平时实践教学环节，培养学生的实践能力、发现问题以及解决问题的能力

为了提高学生的学习兴趣以及对问题的分析、解决能力，广泛开展了丰富多彩的社会实践活动，使学生尽可能早地接触与本专业有关的实际工作，切身体会到如何将理论与实际相结合，了解本学科的实际业务，从而提高自主学习能力，加强专业知识的把握。结合学校的实际情况，积极鼓励学生在大二和大三阶段参加校级和国家级的全国大学生数学建模竞赛，申请“中央民族大学本科生研究训练计划项目”、“北京市大学生科学研究计划项目”和“国家大学生创新性试验计划项目”。项目的申请和实施以及研究报告的写作，对学生来说都是一个很好的锻炼。目前，统计学专业本科生的参与率在70%以上。此外，建立专业实习基地可以提高学生利用专业知识分析和解决实际问题的能力。这些环节的设计和实施都有力地保障了学生本科毕业论文的水平和质量。

4.加强学生科技论文写作训练

加强平时课堂上大作业的规范化，潜移默化培养学生科技论文的写作能力。通过平时的实践活动，如学生数学建模以及大学生创新实践等各类实践性项目来提高学生的论文写作能力。

5.实施激励措施，激发学生的兴趣和主动性

针对那些参与实际课题的学生，学院鼓励指导教师根据学生的完成情况以劳务费的形式给予其奖励，另外积极鼓励毕业论文质量优秀的学生进行投稿发表。此外，还需对答辩程序和评分标准进行规范化，建立优秀毕业论文指导教师和优秀毕业论文奖励制度，以形成积极的导向作用，充分调动指导教师和学生的积极性。

6.加强教师责任心，建立完善的机制

加强学生毕业论文的过程管理，从开题到中期检查严格执行，指导教师严格把关。为了保证学生与教师之间的沟通，学校可以通过建立师生信息反馈机制改善师生分离状态，为师生提供便利的沟通渠道，同时设置适当的教师激励制度，中央民族大学目前对教师指导本科毕业论文有额外的课时补贴。

医学论文统计错误分析

缺失值的处理：缺失值是人群研究中不可避免的问题，其处理方式的差异可能在不同程度上引入偏倚，因此，详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如，瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略，包括：将二分类结局中的缺失值视为未发生事件；将生物标志物和心电图测量中的缺失值进行多重填补（multiple imputation）；为了证明缺失值处理的合理性和填补结果的稳定性，研究还比较了多重填补与完整数据（complete-case）分析的结果。2、数据的预处理：实施统计分析之前往往需要将原始数据进行预处理，如：对连续变量进行函数转换使其更接近正态分布，基于原始数据构建衍生变量，将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据，瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述：确定统计分析使用的变量，并针对每一个变量的分布特征进行描述，是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求，但作者往往套用常用方法，如：连续变量符合正态分布时，采用均数（标准差）描述，否则采用中位数（四分位间距）描述；分类变量采用频数（百分比）描述等。事实上，应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如，CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征，而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析（primary analysis）：指针对研究结局的统计分析，是研究论文的核心证据。因此，医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中，应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。

不论是什么错，还是谁提出的，一经核实，原刊物会在以后的期刊中，给出勘误表或更正。如果是作者本人，发现的最好尽快与杂志社联系，予以更正，并附一封对读者的致歉信。

医学论文统计学方法应用的错误解析论文

摘要：统计学方法应用正确与否直接关系到医学科研结果的可信度和有效性，在研究设计时的错误应用会否决整个科研研究方案，基于错误统计学方法上产生的结果会浪费科研人员的时间和精力。编审人员应该高度重视医学论文的统计学方法应用，提高单篇文献的质量和学术水平。

关键词：统计学方法；医学论文；解析

一、引言

医学由于其研究的复杂性和系统性，常需要应用严谨的统计学方法，由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解，在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此，正确应用统计学方法，并将所获得的结果进行正确的描述有助于单篇论著的质量提高，现将医学论文中统计学方法应用及其常见结果的错误解析如下。

二、医学论文统计学方法应用概况

医学论文的摘要是全文的高度浓缩[1]，主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。

(一)材料与方法部分

正文中，材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述，读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况，其目的是表明统计学方法应用的合理性和可靠性，他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术，要具备可比较性和科学性，

方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法，必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验，多组间计量资料的F检验，计数资料的卡方检验，不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法，要在这里简要说明并给出参考文献，还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号，如基于家系资料研究的版本。

(二)论文结果部分

论文结果部分要显示应用统计学方法得到的统计量[2]，所采用的统计学指标较多时，往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度，除了与测量仪器的精密程度有关外，还与样本本身的均数有关，所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数，百分比一般保留一个小数。在统计软件中，分析结果往往精确度比较高，一般要采用四舍五入的方法使其靠近实验的实际情况，否则还会降低论文的可信度和可读性。

结果部分的统计表采用统一的“三线”表，表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置，要求整齐美观，不能出现错行现象。要明确标注观察的例数，得到的检验统计量。统计图可以直观的表达研究结果，如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出，描述的是67%的置信区间，不是95%，提倡在误差条图采用95%的置信区间。

关于统计量，一般采用均数与标准差两个指标，均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比，分母的确定必须要符合逻辑，过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化，可以采用卡方检验。

1.假设检验的结果中，常见只写P值的情况，有时候会误导读者，也会隐藏计算失误的情况，因此写出具体的统计值，如F值、t值，可以增强可信度。对于率、相关系数、均数这类描述统计量，要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性，对于结果的计算要求具体的P值，如P=或P=。

2.在对论文进行讨论时，作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设，对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件，P值很小表明两组间没有差别的概率很小。当P<；，表明差异具有统计学意义。P值与观察的样本量的大小有关联，当样本量小的时候，数据之间的差别即使很大，P值也可能很大；当样本量大时，数据之间的差别即使很小，P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联，有统计学意义的样本相关系数可能很小。因此，有统计学差异的描述并不一定意味着两组间差别很大，错判的危险性很大，显著性的检验为定性的结果，结合统计量大小方可判断是否具有专业意义。

变量间虚假的相关关系与变量随时间变化而变化相关，统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的'研究方法的不同来考量。使用回归方程进行分析，当两变量间具有显著性关系，但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度，而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病，灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致，在疾病患病率很低时，出现假阳性也是正常的，要确诊疾病必须要与临床症状体征相结合。因此，这两个率的计算方法必须交待清楚。

三、医学论文统计学方法应用的常见错误分析

(一)“材料与方法”中的统计学方法应用的常见错误

“材料与方法”中统计学方法常见的问题主要为：对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如，临床入组病例分组只采用简单的随机分组，未描述随机分组的方法，未描述是否双盲双模拟，未设置空白对照组，分组后对性别、年龄、文化程度的描述未进行统计学检验，对于特殊的统计学方法没有详细交代；动物实验分组的随机化原则描述过于简单，没有具体说清完全随机、配对或分层随机分组等；统计分析方法没有任何说明采用的分析软件，有的只说明采用的分析软件而不交代在软件中采用的统计方法；没有说明原因的情况下出现样本量过于小等情况。

(二)“结果”统计学方法应用的常见错误

1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同；对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多；罕见疾病的发病率、患病率、现患率等指标没有选择好基数，导致结果没有整数位；相关系数、回归系数等指标保留的小数位数过多或者过少；常用的一些检验统计量，如F值、t值保留的位数不符合要求。

2.对统计学指标进行分析和计算时，一般采用计数资料和计量资料进行区分。计量资料常用三线表，在近似服从正态分布的前提下采用均数、标准差进行说明，如果不符合正态分布时，可以采用加对数或其他的处理方式使其近似正态分布，否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算，影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标，常见样本量过小的问题，采用率进行描述会影响统计结果的可靠性，采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率，也是不可取的。

3.在判断临床疗效之一指标时，两组平均疗效有差别并不意味着两组的每一个个体都有效或无效，必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效，服药一周后，研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率，研究组和对照组的有效率分别为和，尽管平均疗效相差较多，但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果，P 值的表达提倡报告精确P值，如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS，SPSS等，只要提供原始数据，就可以计算出t值、F值和相应的自由度，并可获得精确的P值。

四、小结

提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3]，医学论文中统计方法应用和统计结果的表达正确与否，不仅体现了论文的科学性和严谨性，而且对于提高期刊整体的学术质量，促进医学科学的发展和传播也有着重要作用[4]。

参考文献：

[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).

[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).

[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).

[4] 张春军,董凯.网络信息时代加强医学期刊编辑的信息素养[J].牡丹江医学院学报,2011(32).

统计学是一门抽象难懂的学科，非统计学专业毕业人员一般很难做到精通。下文是我为大家整理的关于统计类论文投稿的范文，欢迎大家阅读参考!

医学统计学方法应用的错误解析

一、引言

医学由于其研究的复杂性和系统性，常需要应用严谨的统计学方法，由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解，在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此，正确应用统计学方法，并将所获得的结果进行正确的描述有助于单篇论著的质量提高，现将医学论文中统计学方法应用及其常见结果的错误解析如下。

二、医学论文统计学方法应用概况

医学论文的摘要是全文的高度浓缩[1]，主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。

(一)材料与方法部分

正文中，材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述，读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况，其目的是表明统计学方法应用的合理性和可靠性，他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术，要具备可比较性和科学性，

方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法，必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验，多组间计量资料的F检验，计数资料的卡方检验，不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法，要在这里简要说明并给出参考文献，还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号，如基于家系资料研究的版本。

(二)论文结果部分

论文结果部分要显示应用统计学方法得到的统计量[2]，所采用的统计学指标较多时，往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度，除了与测量仪器的精密程度有关外，还与样本本身的均数有关，所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数，百分比一般保留一个小数。在统计软件中，分析结果往往精确度比较高，一般要采用四舍五入的方法使其靠近实验的实际情况，否则还会降低论文的可信度和可读性。

结果部分的统计表采用统一的“三线”表，表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置，要求整齐美观，不能出现错行现象。要明确标注观察的例数，得到的检验统计量。统计图可以直观的表达研究结果，如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出，描述的是67%的置信区间，不是95%，提倡在误差条图采用95%的置信区间。

关于统计量，一般采用均数与标准差两个指标，均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比，分母的确定必须要符合逻辑，过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化，可以采用卡方检验。

1.假设检验的结果中，常见只写P值的情况，有时候会误导读者，也会隐藏计算失误的情况，因此写出具体的统计值，如F值、t值，可以增强可信度。对于率、相关系数、均数这类描述统计量，要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性，对于结果的计算要求具体的P值，如P=或P=。

2.在对论文进行讨论时，作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设，对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件，P值很小表明两组间没有差别的概率很小。当P<，表明差异具有统计学意义。P值与观察的样本量的大小有关联，当样本量小的时候，数据之间的差别即使很大，P值也可能很大;当样本量大时，数据之间的差别即使很小，P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联，有统计学意义的样本相关系数可能很小。因此，有统计学差异的描述并不一定意味着两组间差别很大，错判的危险性很大，显著性的检验为定性的结果，结合统计量大小方可判断是否具有专业意义。

变量间虚假的相关关系与变量随时间变化而变化相关，统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的研究方法的不同来考量。使用回归方程进行分析，当两变量间具有显著性关系，但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度，而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病，灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致，在疾病患病率很低时，出现假阳性也是正常的，要确诊疾病必须要与临床症状体征相结合。因此，这两个率的计算方法必须交待清楚。

三、医学论文统计学方法应用的常见错误分析

(一)“材料与方法”中的统计学方法应用的常见错误

“材料与方法”中统计学方法常见的问题主要为：对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如，临床入组病例分组只采用简单的随机分组，未描述随机分组的方法，未描述是否双盲双模拟，未设置空白对照组，分组后对性别、年龄、文化程度的描述未进行统计学检验，对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单，没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件，有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。

(二)“结果”统计学方法应用的常见错误

1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数，导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量，如F值、t值保留的位数不符合要求。

2.对统计学指标进行分析和计算时，一般采用计数资料和计量资料进行区分。计量资料常用三线表，在近似服从正态分布的前提下采用均数、标准差进行说明，如果不符合正态分布时，可以采用加对数或其他的处理方式使其近似正态分布，否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算，影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标，常见样本量过小的问题，采用率进行描述会影响统计结果的可靠性，采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率，也是不可取的。

3.在判断临床疗效之一指标时，两组平均疗效有差别并不意味着两组的每一个个体都有效或无效，必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效，服药一周后，研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率，研究组和对照组的有效率分别为和，尽管平均疗效相差较多，但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果，P 值的表达提倡报告精确P值，如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS，SPSS等，只要提供原始数据，就可以计算出t值、F值和相应的自由度，并可获得精确的P值。

四、小结

提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3]，医学论文中统计方法应用和统计结果的表达正确与否，不仅体现了论文的科学性和严谨性，而且对于提高期刊整体的学术质量，促进医学科学的发展和传播也有着重要作用[4]。

参考文献：

[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).

[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).

[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).

统计学专业毕业现状分析与对策研究

本科毕业论文是高等学校人才培养计划的重要组成部分，是本科教学过程中最后一个重要的教学实践环节，是学士学位授予的一个重要依据。[1，2]然而，相较于其他教学环节，毕业论文没有受到足够的重视，从而导致该环节存在着一些问题。[3]本文将以中央民族大学统计学专业毕业论文为例，在分析其现状的基础上，找到问题并提出相应的建议。

中央民族大学统计学本科专业设置于2003年，目前已有六届毕业生。经过学院和学校层面的努力，统计学专业作为新办专业取得了较快发展，所培养的学生具有较好的专业能力和综合素质，近四成学生继续读研深造，就业的学生大都在专业对口的工作岗位上，就业率一直在85%左右。

本科毕业论文环节在培养方案中是6个学分。学生在第七学期开始选择指导教师以确定毕业论文题目。经过前6个学期的系统理论学习，统计学专业学生已基本掌握了统计学的基础理论和基本方法，具备了正确的统计思想和较强的统计软件应用能力，以及运用所学的理论和方法解决实际问题、文献检索和资料查询等综合能力。本科毕业论文的写作就是统计学专业学生将上述基础和能力进一步深化与升华的重要过程，从而培养学生的创新能力和实践能力，使学生的知识、技能和素质得到进一步的充实和提高，同时也是衡量学校教学质量和办学水平的重要指标。因此对如何提高毕业论文质量进行研究是必要和有意义的。[4]

一、统计学专业毕业论文质量的现状分析

从论文完成情况来看，每届的毕业论文基本都能达到论文教学环节的要求，通过对中央民族大学统计学专业2007～2011年四届毕业生的毕业论文进行分析，发现毕业论文及格率为。

从毕业论文研究的类型来看，主要分为两大类：理论研究型论文和实证型论文，理论研究型论文表现为总结和论述现有统计理论问题，表述理论研究的成果，或应用理论对现实问题进行分析、说明，并提出自己的思考;实证型论文主要表现为针对某一特定的实际目的或目标，运用所学统计的理论和方法，对经济、管理、金融、医学、生物、工程、环境等领域进行统计调查、统计信息管理、数量分析等。

从论文知识点范围的分析来看，学生论文绝大多数是统计专业问题，极少数是其他数学分支的问题。从中央民族大学历届统计学专业学生的毕业论文情况分析，发现毕业论文中研究其他数学分支的问题占总数的，主要包括：一是其他科目的应用研究(数学分析、常微分方程、运筹学及空间解析几何等)，占总数的。二是数学专业教育和数学思维的研究，占总数的。研究统计学专业问题的毕业论文占绝大部分，比例为，选题内容广泛且多为社会热点问题，涉及经济、社会、医疗卫生、教育发展、旅游、基础设施建设等多领域，由于受学校人文环境影响，很大比例的学生对少数民族地区的经济、社会、民生等问题进行了统计分析，约占总学生人数的。所使用的分析方法主要集中于抽样调查、回归分析、多元统计方法、聚类分析、判别分析等常用统计方法。

此外，统计分析显示学生成绩普遍偏高，统计学专业学生的毕业论文，尤其是实证类论文，存在着可以大量使用背景介绍和统计软件分析结果的特点，因此，一些论文没有创新性和学术含量，但具有较大的篇幅，与理学院其他专业的毕业论文成绩比较，其平均成绩相对较高，约分。

二、统计学专业毕业论文存在的问题

毕业论文的质量问题关系到本科人才的培养规格和目标，直接体现了学生本科阶段的学习成果，是衡量教学水平、学生毕业与学位资格认证的重要依据。通过对论文和考评结果的具体分析，发现学生的毕业论文在创新性、理论深度及论文写作常识多方面存在问题。具体表现为：

1.创新性不够

学生的毕业论文表现为理论性研究非常少，大都是实证型论文，并且多是简单的统计方法应用，缺少创新性研究和思考。从中央民族大学历届统计学专业学生的毕业论文来看，理论研究型论文只占，与实证型论文的比例为1︰，比例悬殊，体现了学生在毕业论文大的选题过程中，避重就轻，缺乏创新的特点。如每年都有一定数量的学生选择“我国人均GDP的预测”这类针对某经济指标进行预测的题目，论文的主要内容就是利用ARMA、灰色预测或者趋势外推方法等一种或多种方法对时间序列数据做简单建模和分析，论文没有对指标本身的意义以及国内国际的社会经济形势进行综合分析。这种方法简单套用性质的论文占有很大的比重。

2.选题过大、内容空泛，缺乏深入研究，存在抄袭、拼凑现象

有些学生在选择研究课题时，往往不能根据自身的专业知识结构特点和社会实践情况进行准确定位，只是一味的盲目的选择一些过大过空的社会热点问题，因此难以看到所要研究的问题的本质。如有的学生针对CPI做研究，没有深入了解问题的实质，只是收集了一些文献，很难提出自己的观点或研究角度，造成了材料堆积且过于散乱，论文变成了一些材料的简单拼凑。有些论文针对某一社会经济问题进行研究，论文的主题只是针对现有数据利用简单的统计方法进行分析，对数据的质量和可靠性以及方法的适用性不做针对性讨论，对所得的结论也不结合社会经济现实情况进行分析，导致论文质量不高。

3.相对前沿的分析方法利用较少

前沿的分析方法利用较少，通过毕业论文的写作，统计分析能力没有实质性提升。学生论文使用的统计方法主要集中于回归分析、聚类分析、判别分析、相关性分析等，其中回归分析方法占有非常大的比例，约，其他各统计方法使用的比例分别为：聚类分析为，判别分析为，相关性分析为，多元统计方法为，时间序列分析为，极少有学生使用教科书外的相对前沿的分析方法。

4.论文写作上存在结构不合理、没有相关研究介绍、创新点表述不清、参考文献不会正确标注等问题

从学生的毕业论文来看，论文写作不规范，专业性差。主要存在论文形式不规范、结构不合理、题目含糊、有些论文杂乱无章、口语化严重、可读性差等问题。

三、存在问题的原因分析

针对上述问题，统计学系通过对论文进行详细审查以及组织指导教师和学生座谈，发现毕业论文出现以上问题的主要原因包括以下几方面：

1.学生对论文不够重视

部分学生由于忙于考研学习而无暇顾及毕业论文的研究，还有部分学生由于忙于外出找工作、实习而无心认真撰写论文。论文撰写所需的必要时间难以得到保障，因此学生应付了事，从而无法保证论文的深度。此外，还有部分学生认为毕业论文只是一个教学环节，与考研的好坏无关，存在只要写了论文，教师都会让自己通过的侥幸心理，在思想上没有引起足够的重视。

2.缺乏指导教师的针对性指导

指导教师所带毕业生人数过多，使得导师的工作量呈现超负荷状态，无法保证每个学生毕业论文的质量，从而致使部分学生的论文规范性较差，没有对存在的问题反复修改，使得学生论文存在诸多问题。

3.学生的专业训练还不够

大部分本科生没有经历过论文的写作训练，写作水平较低，不了解学术论文的规范性及其格式，不知如何从科研的角度构思文章、组织材料、安排结构，使得相当一部分学生的毕业论文表达的观点不够准确清楚，论据亦不能很好地支持论点。另外，一些同学为了完成任务，直接将在网络中搜索到的资料不假思索的拼凑在一起，使得内容不成体系，观点混乱。

四、提高毕业论文质量的建议和实践

1.加强毕业论文重要性的宣传，提高学生的重视度

加强对毕业论文重要性的认识有助于提高本科生毕业论文的质量。通过讲座、课堂传授等形式，让学生意识到毕业论文的实践性和综合性是任何教学环节都不能替代的，是提高发现问题、分析问题、解决问题能力的有效途径，更是进行个人综合素质提高的必不可少的重要环节，[4]从而使学生在思想上认识到毕业论文的重要性，投入更多精力进行毕业论文设计。

2.选题和教师的科研项目相结合，提高论文的创新性

在选择课题时，为了能充分发挥学生的主观能动性，可以让学生根据自身的特点，与指导教师协商，结合导师的研究方向制定课题方案。统计学专业的教师一般除了申请国家自然科学基金和国家社会科学基金这类对理论性和创新性要求较高的项目以外，很多教师还主持或参加有相应的应用研究类项目。应用类项目大都需要实地调研(以及问卷涉及和数据分析)或者大量的数据分析和建模。引导学生参加这类项目来设计和完成自己的本科毕业论文，能够激发学生的科研热情和创新潜力。此外，鼓励和引导一些成绩较好，如让具备保研资格的学生参加教师的科研讨论班或者课题组，选择一些具有一定难度的理论问题进行研究，可以使学生了解本学科的发展方向和最新动态。最近两年，越来越多的学生，特别是具备了保研资格的学生，在大四上学期就能投入到项目和毕业论文的写作中。

3.重视平时实践教学环节，培养学生的实践能力、发现问题以及解决问题的能力

为了提高学生的学习兴趣以及对问题的分析、解决能力，广泛开展了丰富多彩的社会实践活动，使学生尽可能早地接触与本专业有关的实际工作，切身体会到如何将理论与实际相结合，了解本学科的实际业务，从而提高自主学习能力，加强专业知识的把握。结合学校的实际情况，积极鼓励学生在大二和大三阶段参加校级和国家级的全国大学生数学建模竞赛，申请“中央民族大学本科生研究训练计划项目”、“北京市大学生科学研究计划项目”和“国家大学生创新性试验计划项目”。项目的申请和实施以及研究报告的写作，对学生来说都是一个很好的锻炼。目前，统计学专业本科生的参与率在70%以上。此外，建立专业实习基地可以提高学生利用专业知识分析和解决实际问题的能力。这些环节的设计和实施都有力地保障了学生本科毕业论文的水平和质量。

4.加强学生科技论文写作训练

加强平时课堂上大作业的规范化，潜移默化培养学生科技论文的写作能力。通过平时的实践活动，如学生数学建模以及大学生创新实践等各类实践性项目来提高学生的论文写作能力。

5.实施激励措施，激发学生的兴趣和主动性

针对那些参与实际课题的学生，学院鼓励指导教师根据学生的完成情况以劳务费的形式给予其奖励，另外积极鼓励毕业论文质量优秀的学生进行投稿发表。此外，还需对答辩程序和评分标准进行规范化，建立优秀毕业论文指导教师和优秀毕业论文奖励制度，以形成积极的导向作用，充分调动指导教师和学生的积极性。

6.加强教师责任心，建立完善的机制

加强学生毕业论文的过程管理，从开题到中期检查严格执行，指导教师严格把关。为了保证学生与教师之间的沟通，学校可以通过建立师生信息反馈机制改善师生分离状态，为师生提供便利的沟通渠道，同时设置适当的教师激励制度，中央民族大学目前对教师指导本科毕业论文有额外的课时补贴。

医学论文统计学错误辨析

1、第一类错误又称Ⅰ型错误、拒真错误，是指拒绝了实际上成立的、正确的假设，为“弃真”的错误，其概率通常用α表示。假设检验是反证法的思想，依据样本统计量作出的统计推断，其推断结论并非绝对正确，结论有时也可能有错误，错误分为两类。

2、第二类错误，Ⅱ型错误，接受了实际上不成立的H0 ，也就是错误地判为无差别，这类取伪的错误称为第二类错误，其概率用β表示。简单说就是：你的假设是错误，但你接受该假设。

“第一类错误”和“第二类错误”之间的关系：

1、当样本例数固定时，α愈小，β愈大；反之，α愈大，β愈小。因而可通过选定α控制β大小。要同时减小α和β，唯有增加样本例数。统计上将1-β称为检验效能或把握度(power of a test)，即两个总体确有差别存在，而以α为检验水准，假设检验能发现它们有差别的能力。实际工作中应权衡两类错误中哪一个重要以选择检验水准的大小。

2、做假设检验的时候会犯两种错误：第一，原假设是正确的，而你判断它为错误的；第二，原假设是错误的，而你判断它为正确的。我们分别称这两种错误为第一类错误(Type I error)和第二类错误(Type II error)。

第一类错误：原假设是正确的，却拒绝了原假设。

第二类错误：原假设是错误的，却没有拒绝原假设。

我们常把假设检验比作法庭判案，我们想知道被告是好人还是坏人。原假设是“被告是好人”，备择假设是“被告是坏人”。法庭判案会犯两种错误：如果被告真是好人，而你判他有罪，这是第一类错误(错杀好人)；如果被告真是坏人，而你判他无罪，这是第二类错误(放走坏人)。

记忆方法：我们可以把第一类错误记为“以真为假”，把第二类错误记为“以假为真”。当然我们也可以将第一类错误记为“错杀好人”，把第二类错误记为“放走坏人”。

在其他条件不变的情况下，如果要求犯第一类错误概率越小，那么犯第二类错误的概率就会越大。这个结论比较容易理解，当我们要求“错杀好人”的概率降低时，那么往往就会“放走坏人”。

同样的，在其他条件不变的情况下，如果要求犯第二类错误概率越小，那么犯第一类错误的概率就会越大。当我们要求“放走坏人”的概率降低时，那么往往就会“错杀好人”。同样的，在其他条件不变的情况下，如果要求犯第二类错误概率越小，那么犯第一类错误的概率就会越大。当我们要求“放走坏人”的概率降低时，那么往往就会“错杀好人”。

弃真错误是指放弃了真实的、成立的结论。而存伪是保留了不成立的、错误的结论。二者是统计检验中的两个错误。

科学研究很早就已经从简单的定性分析深入到细致的定量分析，科研工作者要面对大量的数据分析问题，科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中，实验设计的方法直接决定了数据采取何种统计学方法，因为每种统计方法都要求数据满足一定的前提和假定，所以论文在实验设计的时候，就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别，其中最主要的就是统计方法和实验设计不符，造成数据统计结果不可靠。下面，医刊汇编译列举一些常见的可以避免的问题和错误：打开百度APP，查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中，最常见的此类错误就是实验设计是多组研究，需要对数据使用方差分析的时候，而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中，不同数据要采取不同统计处理方法，这就需要作者清楚地描述出每个统计值采用的是何种统计学方法，但在许多使用一种以上数据统计分析方法的医学论文中，作者往往只是简单地把论文采用的数据统计方法进行了整体罗列，并没有对每个数据结果分析分别交代具体的统计方法，这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性，即作者即使不看文章内容，也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字，缺乏直观的统计图或表；或者虽然也列出了统计表或统计图，但表或图内缺项很多，让读者难以从中提取太多有用的信息。另外，也有作者为了增加文章篇幅，同时列出统计表和统计图，造成不必要的浪费和重复。统计表的优点是详细，便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释，最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误，把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论，一定要把统计结果和临床实践结合在一起，这样才会避免出现类似的错误。至于回避阴性结果，只提供阳性结果，是因为不少作者在研究设计时，难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时，从一个方向的实验就下完美的结论，尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性，有时会刻意回避报道差异的不显著结果，不思考和探究差异不显著的原因和意义，反而会因此忽视一些重大的科学发现。

你可以参考一下《当代医学论文研究》里面很多这样子的文章

医学论文里统计分析错误

不论是什么错，还是谁提出的，一经核实，原刊物会在以后的期刊中，给出勘误表或更正。如果是作者本人，发现的最好尽快与杂志社联系，予以更正，并附一封对读者的致歉信。

你可以参考一下《当代医学论文研究》里面很多这样子的文章

计学，可以说无处不在，我们每个人的日常生活都会受到统计学的影响。但是很多人，即使受过统计学的正规训练，也会在不知不觉之间犯一些常见的分析错误。下面这篇文章，我就和大家分享一些现实生活中比较常见的统计研究错误。1. 参照组（Control group）那天我恰好在网上看到一篇文章，叫做《眼保健操对于保护眼睛有作用么？》。作者的观点是眼保健操没有什么作用，列举的证据是眼保健操在中国的学校里推行了50多年，小学生和中学生的近视率大大上升了，而非下降。因此作者得出结论：眼保健操对视力有害。乍一看，好像确实是这么回事：50多年前我们开始在学校里要求学生们做眼保健操。但是现在孩子们的近视率，则要比当时的那些孩子的近视率高出很多。但是如果就因为这个而得出眼保健操没用的结论，则是谬之大矣。主要原因在于：没有参照组。和建国初那时候的孩子们相比，现在的孩子由于功课压力，在室内花的时间（读书，做作业，上补习班等）大幅度增长，用眼的“诱惑”也大大增加，比如电视，电脑，手机等等。因此无论是否做眼保健操，现在孩子的视力肯定都不及当时的孩子。这也不是中国独有的现象，日本，韩国，新加坡等国的情况也类似。而这些国家都没有眼保健操。如果要真正研究眼保健操对于保护视力是否有效，那么就应该通过参照组来对比。研究人员应该找到两组情况类似的样本（比如同一个学校里的孩子）进行研究。这两组样本的区别除了他们是否做眼保健操以外，在其他方面越相似越好。然后通过一定时间的跟踪调查，研究人员才可能得出更加客观和可靠的研究结果。1747年，苏格兰医生James Lind在一艘名叫Salisbury的船上成功的找到了治疗坏血病的方法：就是通过吃橙子和柠檬补充维他命C。而他找到该疗法的关键就是运用了参照组实验方法。坏血病是一种非常可怕的疾病。坏血病的发病特征包括皮下出血（因此腿会变黑），极度疲劳，牙床腐烂，肌肉变软。长期出海的船员和海盗是坏血病的多发人群。James Lind使用的参照组实验是这样进行的。在Salisbury这艘船上，Lind医生找到了12个坏血病严重程度差不多的病人，将他们两人一组分成6组。对于这6组病人，Lind医生给予了他们6种不同的治疗方法，包括橙子，柠檬，苹果酒，醋和盐水等。后来Lind医生发现，食用橙子和柠檬的那组病人的恢复速度显然比其他组别要快很多，因此得出结论橙子和柠檬可以治疗坏血病。现在我们知道，橙子中的维他命C才是坏血病的克星。Lind医生通过参照组实验获得的这项重要发现，帮助挽救了成千上万的水手的生命。如果没有参照组这个重要的分析方法，Lind医生能否找到正确的解药要打一个大问号。当时，Lind医生一度怀疑坏血病的病因和啤酒有关。Lind医生观察到，每次船上的啤酒被喝光时，往往也伴之以坏血病的大面积流行。但事实上，啤酒喝光，和坏血病盛行，只是一个巧合而已。因为坏血病往往多发于长期航海旅途中，而在海上旅行久了，啤酒自然也会被喝完。如果不通过参照组方法去分析真正的原因，那么就可能得出啤酒能够治疗坏血病这样错误的结论。在我们阅读分析一些统计研究报告时，一个很重要的地方就是要看该研究有没有参照组进行对比。如果研究只是比较了几个变量之间的关系而缺乏参照组进行对照，那么该研究的结论就值得怀疑。2. 随机取样（Random Sampling）下面来讲讲“随机取样（Random Sampling）”这个问题。在现实中，我们经常面对的问题是，需要研究的样本量太大，无法收集到完整的数据。比如我们想要了解全国十几亿人的想法，或者想要知道所有沿海城市的中产阶级的消费偏好，等等。要想精确的回答这些问题，我们就需要随机抽取一些代表性样本，通过样本的表现来推测整体的特征。如何确保收集到的样本真正“随机”，是一个技术含量很高的问题。在这方面有很多失败的例子可供我们学习。1936年，美国的总统选举大战在罗斯福(FDR）和兰登（Alf Landon）之间展开。在选举投票前，当时一家非常大的调查机构Literary Digest发出了1千万张明信片来收集美国人的投票倾向。在这1千万张明信片中，Literary Digest收到了2百万份回复。在这些回复中，绝大部分人都倾向于选兰登。因此Literary Digest得出结论：兰登将赢得总统选举。当时还有另外一家新成立不久的调查公司，名叫Gallup。Gallup没有Literary Digest那么大的预算。他们只是有针对性的选了几千个受访者做了民意调查，并得出罗斯福将会赢得总统大选的结论。

统计学是一门抽象难懂的学科，非统计学专业毕业人员一般很难做到精通。下文是我为大家整理的关于统计类论文投稿的范文，欢迎大家阅读参考!

医学统计学方法应用的错误解析

一、引言

医学由于其研究的复杂性和系统性，常需要应用严谨的统计学方法，由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解，在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此，正确应用统计学方法，并将所获得的结果进行正确的描述有助于单篇论著的质量提高，现将医学论文中统计学方法应用及其常见结果的错误解析如下。

二、医学论文统计学方法应用概况

医学论文的摘要是全文的高度浓缩[1]，主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。

(一)材料与方法部分

正文中，材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述，读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况，其目的是表明统计学方法应用的合理性和可靠性，他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术，要具备可比较性和科学性，

方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法，必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验，多组间计量资料的F检验，计数资料的卡方检验，不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法，要在这里简要说明并给出参考文献，还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号，如基于家系资料研究的版本。

(二)论文结果部分

论文结果部分要显示应用统计学方法得到的统计量[2]，所采用的统计学指标较多时，往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度，除了与测量仪器的精密程度有关外，还与样本本身的均数有关，所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数，百分比一般保留一个小数。在统计软件中，分析结果往往精确度比较高，一般要采用四舍五入的方法使其靠近实验的实际情况，否则还会降低论文的可信度和可读性。

结果部分的统计表采用统一的“三线”表，表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置，要求整齐美观，不能出现错行现象。要明确标注观察的例数，得到的检验统计量。统计图可以直观的表达研究结果，如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出，描述的是67%的置信区间，不是95%，提倡在误差条图采用95%的置信区间。

关于统计量，一般采用均数与标准差两个指标，均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比，分母的确定必须要符合逻辑，过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化，可以采用卡方检验。

1.假设检验的结果中，常见只写P值的情况，有时候会误导读者，也会隐藏计算失误的情况，因此写出具体的统计值，如F值、t值，可以增强可信度。对于率、相关系数、均数这类描述统计量，要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性，对于结果的计算要求具体的P值，如P=或P=。

2.在对论文进行讨论时，作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设，对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件，P值很小表明两组间没有差别的概率很小。当P<，表明差异具有统计学意义。P值与观察的样本量的大小有关联，当样本量小的时候，数据之间的差别即使很大，P值也可能很大;当样本量大时，数据之间的差别即使很小，P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联，有统计学意义的样本相关系数可能很小。因此，有统计学差异的描述并不一定意味着两组间差别很大，错判的危险性很大，显著性的检验为定性的结果，结合统计量大小方可判断是否具有专业意义。

变量间虚假的相关关系与变量随时间变化而变化相关，统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的研究方法的不同来考量。使用回归方程进行分析，当两变量间具有显著性关系，但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度，而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病，灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致，在疾病患病率很低时，出现假阳性也是正常的，要确诊疾病必须要与临床症状体征相结合。因此，这两个率的计算方法必须交待清楚。

三、医学论文统计学方法应用的常见错误分析

(一)“材料与方法”中的统计学方法应用的常见错误

“材料与方法”中统计学方法常见的问题主要为：对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如，临床入组病例分组只采用简单的随机分组，未描述随机分组的方法，未描述是否双盲双模拟，未设置空白对照组，分组后对性别、年龄、文化程度的描述未进行统计学检验，对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单，没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件，有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。

(二)“结果”统计学方法应用的常见错误

1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数，导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量，如F值、t值保留的位数不符合要求。

2.对统计学指标进行分析和计算时，一般采用计数资料和计量资料进行区分。计量资料常用三线表，在近似服从正态分布的前提下采用均数、标准差进行说明，如果不符合正态分布时，可以采用加对数或其他的处理方式使其近似正态分布，否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算，影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标，常见样本量过小的问题，采用率进行描述会影响统计结果的可靠性，采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率，也是不可取的。

3.在判断临床疗效之一指标时，两组平均疗效有差别并不意味着两组的每一个个体都有效或无效，必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效，服药一周后，研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率，研究组和对照组的有效率分别为和，尽管平均疗效相差较多，但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果，P 值的表达提倡报告精确P值，如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS，SPSS等，只要提供原始数据，就可以计算出t值、F值和相应的自由度，并可获得精确的P值。

四、小结

提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3]，医学论文中统计方法应用和统计结果的表达正确与否，不仅体现了论文的科学性和严谨性，而且对于提高期刊整体的学术质量，促进医学科学的发展和传播也有着重要作用[4]。

参考文献：

[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).

[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).

[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).

统计学专业毕业现状分析与对策研究

本科毕业论文是高等学校人才培养计划的重要组成部分，是本科教学过程中最后一个重要的教学实践环节，是学士学位授予的一个重要依据。[1，2]然而，相较于其他教学环节，毕业论文没有受到足够的重视，从而导致该环节存在着一些问题。[3]本文将以中央民族大学统计学专业毕业论文为例，在分析其现状的基础上，找到问题并提出相应的建议。

中央民族大学统计学本科专业设置于2003年，目前已有六届毕业生。经过学院和学校层面的努力，统计学专业作为新办专业取得了较快发展，所培养的学生具有较好的专业能力和综合素质，近四成学生继续读研深造，就业的学生大都在专业对口的工作岗位上，就业率一直在85%左右。

本科毕业论文环节在培养方案中是6个学分。学生在第七学期开始选择指导教师以确定毕业论文题目。经过前6个学期的系统理论学习，统计学专业学生已基本掌握了统计学的基础理论和基本方法，具备了正确的统计思想和较强的统计软件应用能力，以及运用所学的理论和方法解决实际问题、文献检索和资料查询等综合能力。本科毕业论文的写作就是统计学专业学生将上述基础和能力进一步深化与升华的重要过程，从而培养学生的创新能力和实践能力，使学生的知识、技能和素质得到进一步的充实和提高，同时也是衡量学校教学质量和办学水平的重要指标。因此对如何提高毕业论文质量进行研究是必要和有意义的。[4]

一、统计学专业毕业论文质量的现状分析

从论文完成情况来看，每届的毕业论文基本都能达到论文教学环节的要求，通过对中央民族大学统计学专业2007～2011年四届毕业生的毕业论文进行分析，发现毕业论文及格率为。

从毕业论文研究的类型来看，主要分为两大类：理论研究型论文和实证型论文，理论研究型论文表现为总结和论述现有统计理论问题，表述理论研究的成果，或应用理论对现实问题进行分析、说明，并提出自己的思考;实证型论文主要表现为针对某一特定的实际目的或目标，运用所学统计的理论和方法，对经济、管理、金融、医学、生物、工程、环境等领域进行统计调查、统计信息管理、数量分析等。

从论文知识点范围的分析来看，学生论文绝大多数是统计专业问题，极少数是其他数学分支的问题。从中央民族大学历届统计学专业学生的毕业论文情况分析，发现毕业论文中研究其他数学分支的问题占总数的，主要包括：一是其他科目的应用研究(数学分析、常微分方程、运筹学及空间解析几何等)，占总数的。二是数学专业教育和数学思维的研究，占总数的。研究统计学专业问题的毕业论文占绝大部分，比例为，选题内容广泛且多为社会热点问题，涉及经济、社会、医疗卫生、教育发展、旅游、基础设施建设等多领域，由于受学校人文环境影响，很大比例的学生对少数民族地区的经济、社会、民生等问题进行了统计分析，约占总学生人数的。所使用的分析方法主要集中于抽样调查、回归分析、多元统计方法、聚类分析、判别分析等常用统计方法。

此外，统计分析显示学生成绩普遍偏高，统计学专业学生的毕业论文，尤其是实证类论文，存在着可以大量使用背景介绍和统计软件分析结果的特点，因此，一些论文没有创新性和学术含量，但具有较大的篇幅，与理学院其他专业的毕业论文成绩比较，其平均成绩相对较高，约分。

二、统计学专业毕业论文存在的问题

毕业论文的质量问题关系到本科人才的培养规格和目标，直接体现了学生本科阶段的学习成果，是衡量教学水平、学生毕业与学位资格认证的重要依据。通过对论文和考评结果的具体分析，发现学生的毕业论文在创新性、理论深度及论文写作常识多方面存在问题。具体表现为：

1.创新性不够

学生的毕业论文表现为理论性研究非常少，大都是实证型论文，并且多是简单的统计方法应用，缺少创新性研究和思考。从中央民族大学历届统计学专业学生的毕业论文来看，理论研究型论文只占，与实证型论文的比例为1︰，比例悬殊，体现了学生在毕业论文大的选题过程中，避重就轻，缺乏创新的特点。如每年都有一定数量的学生选择“我国人均GDP的预测”这类针对某经济指标进行预测的题目，论文的主要内容就是利用ARMA、灰色预测或者趋势外推方法等一种或多种方法对时间序列数据做简单建模和分析，论文没有对指标本身的意义以及国内国际的社会经济形势进行综合分析。这种方法简单套用性质的论文占有很大的比重。

2.选题过大、内容空泛，缺乏深入研究，存在抄袭、拼凑现象

有些学生在选择研究课题时，往往不能根据自身的专业知识结构特点和社会实践情况进行准确定位，只是一味的盲目的选择一些过大过空的社会热点问题，因此难以看到所要研究的问题的本质。如有的学生针对CPI做研究，没有深入了解问题的实质，只是收集了一些文献，很难提出自己的观点或研究角度，造成了材料堆积且过于散乱，论文变成了一些材料的简单拼凑。有些论文针对某一社会经济问题进行研究，论文的主题只是针对现有数据利用简单的统计方法进行分析，对数据的质量和可靠性以及方法的适用性不做针对性讨论，对所得的结论也不结合社会经济现实情况进行分析，导致论文质量不高。

3.相对前沿的分析方法利用较少

前沿的分析方法利用较少，通过毕业论文的写作，统计分析能力没有实质性提升。学生论文使用的统计方法主要集中于回归分析、聚类分析、判别分析、相关性分析等，其中回归分析方法占有非常大的比例，约，其他各统计方法使用的比例分别为：聚类分析为，判别分析为，相关性分析为，多元统计方法为，时间序列分析为，极少有学生使用教科书外的相对前沿的分析方法。

4.论文写作上存在结构不合理、没有相关研究介绍、创新点表述不清、参考文献不会正确标注等问题

从学生的毕业论文来看，论文写作不规范，专业性差。主要存在论文形式不规范、结构不合理、题目含糊、有些论文杂乱无章、口语化严重、可读性差等问题。

三、存在问题的原因分析

针对上述问题，统计学系通过对论文进行详细审查以及组织指导教师和学生座谈，发现毕业论文出现以上问题的主要原因包括以下几方面：

1.学生对论文不够重视

部分学生由于忙于考研学习而无暇顾及毕业论文的研究，还有部分学生由于忙于外出找工作、实习而无心认真撰写论文。论文撰写所需的必要时间难以得到保障，因此学生应付了事，从而无法保证论文的深度。此外，还有部分学生认为毕业论文只是一个教学环节，与考研的好坏无关，存在只要写了论文，教师都会让自己通过的侥幸心理，在思想上没有引起足够的重视。

2.缺乏指导教师的针对性指导

指导教师所带毕业生人数过多，使得导师的工作量呈现超负荷状态，无法保证每个学生毕业论文的质量，从而致使部分学生的论文规范性较差，没有对存在的问题反复修改，使得学生论文存在诸多问题。

3.学生的专业训练还不够

大部分本科生没有经历过论文的写作训练，写作水平较低，不了解学术论文的规范性及其格式，不知如何从科研的角度构思文章、组织材料、安排结构，使得相当一部分学生的毕业论文表达的观点不够准确清楚，论据亦不能很好地支持论点。另外，一些同学为了完成任务，直接将在网络中搜索到的资料不假思索的拼凑在一起，使得内容不成体系，观点混乱。

四、提高毕业论文质量的建议和实践

1.加强毕业论文重要性的宣传，提高学生的重视度

加强对毕业论文重要性的认识有助于提高本科生毕业论文的质量。通过讲座、课堂传授等形式，让学生意识到毕业论文的实践性和综合性是任何教学环节都不能替代的，是提高发现问题、分析问题、解决问题能力的有效途径，更是进行个人综合素质提高的必不可少的重要环节，[4]从而使学生在思想上认识到毕业论文的重要性，投入更多精力进行毕业论文设计。

2.选题和教师的科研项目相结合，提高论文的创新性

在选择课题时，为了能充分发挥学生的主观能动性，可以让学生根据自身的特点，与指导教师协商，结合导师的研究方向制定课题方案。统计学专业的教师一般除了申请国家自然科学基金和国家社会科学基金这类对理论性和创新性要求较高的项目以外，很多教师还主持或参加有相应的应用研究类项目。应用类项目大都需要实地调研(以及问卷涉及和数据分析)或者大量的数据分析和建模。引导学生参加这类项目来设计和完成自己的本科毕业论文，能够激发学生的科研热情和创新潜力。此外，鼓励和引导一些成绩较好，如让具备保研资格的学生参加教师的科研讨论班或者课题组，选择一些具有一定难度的理论问题进行研究，可以使学生了解本学科的发展方向和最新动态。最近两年，越来越多的学生，特别是具备了保研资格的学生，在大四上学期就能投入到项目和毕业论文的写作中。

3.重视平时实践教学环节，培养学生的实践能力、发现问题以及解决问题的能力

为了提高学生的学习兴趣以及对问题的分析、解决能力，广泛开展了丰富多彩的社会实践活动，使学生尽可能早地接触与本专业有关的实际工作，切身体会到如何将理论与实际相结合，了解本学科的实际业务，从而提高自主学习能力，加强专业知识的把握。结合学校的实际情况，积极鼓励学生在大二和大三阶段参加校级和国家级的全国大学生数学建模竞赛，申请“中央民族大学本科生研究训练计划项目”、“北京市大学生科学研究计划项目”和“国家大学生创新性试验计划项目”。项目的申请和实施以及研究报告的写作，对学生来说都是一个很好的锻炼。目前，统计学专业本科生的参与率在70%以上。此外，建立专业实习基地可以提高学生利用专业知识分析和解决实际问题的能力。这些环节的设计和实施都有力地保障了学生本科毕业论文的水平和质量。

4.加强学生科技论文写作训练

加强平时课堂上大作业的规范化，潜移默化培养学生科技论文的写作能力。通过平时的实践活动，如学生数学建模以及大学生创新实践等各类实践性项目来提高学生的论文写作能力。

5.实施激励措施，激发学生的兴趣和主动性

针对那些参与实际课题的学生，学院鼓励指导教师根据学生的完成情况以劳务费的形式给予其奖励，另外积极鼓励毕业论文质量优秀的学生进行投稿发表。此外，还需对答辩程序和评分标准进行规范化，建立优秀毕业论文指导教师和优秀毕业论文奖励制度，以形成积极的导向作用，充分调动指导教师和学生的积极性。

6.加强教师责任心，建立完善的机制

加强学生毕业论文的过程管理，从开题到中期检查严格执行，指导教师严格把关。为了保证学生与教师之间的沟通，学校可以通过建立师生信息反馈机制改善师生分离状态，为师生提供便利的沟通渠道，同时设置适当的教师激励制度，中央民族大学目前对教师指导本科毕业论文有额外的课时补贴。

医学论文统计学错误例析PDF

医学统计中的常见误区有哪些

医学统计学是运用概率论与数理统计的原理及方法，结合医学实际，研究数字资料的搜集、整理分析与推断的一门学科。医学研究的对象主要是人体以及与人的健康有关的各种因素。下面是我为大家带来的关于医学统计中的常见误区的知识，欢迎阅读。

一，真正差异和统计学差异

常常有人和我说： P值越小，试验结果的差异就越大!而且还有依据 [P < 是有显著性差异; P < 是有极显著性差异]。

其实，这些人忽略了 n 这个样本数的作用，n 的大小会影响 P 值。但更应该澄清一下的是： P 值代表的是统计学差异，并不是真正的差异!真正的差异只能靠平均值或者频度的比较才能得到。

二，卡方检验的局限性

我们知道各组之间的计数资料的比较，要用卡方检验，但有些情况是不行的!!!

1，当样本有小于5的值2X2表时，必须要用 Fisher 检验才正确!

2，当组与组之间有不同的背景，而这些背景因子还可能会影响到组与组之间结果差异，这是就必须要用 Mantel-Haenszel 检验!

这第2条可能大家不要理解，那我就举两个例子：

1) 关于男性和女性对于不同颜色的喜好的统计学分析

但这里应该注意到年龄可能会对这个分析造成影响，这就要用Mantel-Haenszel 检验了。

***红色蓝色黄色

男性 5 7 8

女性 15 10 6

可以按大人和小孩(比如我们以15岁为分界)分层，在SPSS中要把这个因素放到[行] [列]下边的[层化]一栏里，并在统计指标选项里，选 Cochran和Mantel-Haenszel的统计量选项，这样出来的结果就可靠了!

2)两种治疗(A和B)效果的评价分析：

*****A法 B法

生存 41 54

死亡 47 31

用卡方检验 X2=; P <

但是，病人的临床分期将影响着分析结果：

********生存**************死亡

——————————***——————————

————A****B————————A*****B———

1期-----18-----21--------------------0--------0-------

2期-----23-----33-------------------13------- 8-------

3期------0------0--------------------34-------23-------

再用Mantel-Haenszel检验： X2=; P >

说明实际上A法和B法两组的统计学差异，是这个不同的分期造成的!!!

1，当样本有小于5的值2X2表时，必须要用 Fisher 检验才正确!

讨论：当样本有小于5的值2X2表时，必须要用 Fisher 确切概率法。

当样本有小于5的值R×C表时，将某两组合并，用pearson卡方检验。

三，t 检验的局限性

1，我们经常用 t 检验来判别两组病人血清中某种标记物水平上的差异，但这里要注意，有一些血清标记物的水平是不能用 t 检验的!

比如：血清标记物 PSA和AFP，在正常人的水平是很低的，而在病人则明显增加，呈现指数幂次改变，这样一来，血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!

这时应该用非参数性检验---即 Mann-Whitney U test (Wilcoxon U test)。

2，关于用不用配对t 检验，我个人认为当同一组样本在不同时点，不同处理方式的比较上，应该用配对t 检验。

四，ANOVA 检验的局限性

1，在2组以上计量资料样本比较时，ANOVA 检验非常常用。但这个检验只是说明了一个趋势的比较结果，并不能说明真正的统计学差异，真正的`差异还要通过每两个点的直接比较，也就是说应该在ANOVA 检验后，还必须做两两比较或多重比较，这样才能从全貌上反映出统计的全部结果。

2，既然方差分析得到差别有显著性意义的结论后，还需进行两两比较，有人认为还不如一开始就进行多次t检验更方便，其实，这种认识是不妥当的。t检验用于ANOVA的两两比较将增大第一类错误，产生假阳性，因此要采用特定的方法，在SPSS的one-way ANOVA或General linear models中操作时，Post Hoc(多重比较)对话框内有多种方法可供选择，象两两比较一般用SNK法，而多个试验组和一个对照组的比较则多用dunnett检验。

3，我们经常用 ANOVA 检验来判别几组病人血清中某种标记物水平上的差异，但这里要注意，与 t 检验一样，有一些血清标记物的水平是不能用 ANOVA 检验的!

如上所说的：血清标记物 PSA和AFP，在正常人的水平是很低的，而在病人则明显增加，呈现指数幂次改变，这样一来，血清 PSA和AFP水平在每组病人中很容易不是呈现正态分布!

这时应该用非参数性检验---即 Kruskal-Wallis rank test 。

五，单元线性相关分析

有时我们常常只注意到了 P 值大小，可最重要的是 r 值!

样本数 n 对 P 值结果的影响很大，容易让我们产生错觉，其实，相关的存在与否的评价是与 r 值最直接相关的，如下：

当 P 值小于时： r 值

几乎没有相关关系

弱的相关关系

有相关关系

强相关关系

极强相关关系

P 值只是证明这个相关在统计学上是否成立!!!

1，当样本有小于5的值2X2表时，必须要用 Fisher 检验才正确!

讨论：当样本有小于5的值2X2表时，必须要用 Fisher 确切概率法。

当样本有小于5的值R×C表时，将某两组合并，用pearson卡方检验。

不是说样本小于5

而是说：在R×C表中

理论频数不应该小于1，并且1≤T≤5的格子数不应该超过总格子数的1/5，若出现上述情况可以通过以下方法：

a.增加样本含量，使理论频数增大;

b.根据专业知识，删除理论频数太小的行和列;或者将理论频数太小的行或列与性质相近的邻行和邻近列合并。

c.改用双向无序的R×C表的fishher确切概率法。

还有一点

四格表卡方检验的适应指标：(T为理论频数)

1。n≥40，且T≥5时用卡方检验基本公式。但是当p≈α应该用fisher确切概率法

2。n≥40，但是1≤T≤5时，用四格表校正公式

3。n<40，或者T<1时，用fisher四格表确切概率法

4。四格表卡方检验的连续性校正仅仅用于自由度为1的四格表尤其是n较小时。

补充几点：

1. 关于P值：P值的大小并不是各组差异的大小，而是统计学差异显著性的大小。P值越小，说明得出各组没有差异的概率越小，越有理由说明各组存在差异(可以说，P值的大小反映了做出统计结论的“理由”的大小，而不是被比较的各组的实际差异的大小，得出有意义的结论后，其差异的大小可直接通过各组的均数或率进行比较)。

2. 关于t检验和方差分析：katalyster兄上面提到的t检验及方差分析在某些时候不适用，实际上就是每种方法都有其应用条件，不服从正态分布当然不能用。对这样的资料首先可考虑变量变换(如抗体滴度等资料，为指数或幂次的关系，可用对数转换)，如变换后，服从正态分布，可用上述方法;若还不符合，则考虑非参数检验。

3. 关于相关分析：两个变量间是否存在相关关系，要看P值，而不是r值，r值用来说明相关关系的大小。当P<，才能讲两变量间存在相关关系，再看r值，r值越大，相关关系越强，反之越小;否则，P>,不能讲两变量间存在相关关系，r值毫无意义。

感谢kushuya, xiaoxiongzjh两位专家的补充和指正!之所以开这个专题，是真心想让初学者从这些<误区>中走出来!

六，Logistic regression 分析

在判断某因子对疾病的危险度时常用的方法。

1，假设要判断某因子对疾病的危险度(OR)，要了解这个OR是一个相对危险度，即是有某因子存在和没有某因子存在之间比较的OR值。

2，OR 和 RR 不一样，OR是在Logistic regression model中使用，RR是在Cox proportional hazard model中使用。

3，假设要判断某因子对疾病的危险度，要在多变量Logistic regression model中校正一些混扰因素，如常见的年龄，性别，吸烟等等，并最后得出这个 Adjusted OR。但并不是说有了这些校正，我们就可以在实验设计上就不考虑这些混扰因素，相反，必须在实验设计上就把这些混扰因素在实验组和对照组配平，光靠在多变量Logistic regression model中校正是不可靠的。

其它方法---生存分析 (Kaplan-Meier法+ Logrank法)：

我们有时在临床研究只注意到了用这种方法分析与生存相关的研究，其实，在疾病复发上也常用这种方法!前者是以生---死为判别，后者则以复发---不复发为判别。

不论是什么错，还是谁提出的，一经核实，原刊物会在以后的期刊中，给出勘误表或更正。如果是作者本人，发现的最好尽快与杂志社联系，予以更正，并附一封对读者的致歉信。

中国光大（集团）总公司：你公司《关于报送企业集团统计报表的请示》（光京字［2003］67号）收悉。经研究，现批复如下：一、我局现行企业集团统计报表制度规定，国家试点企业集团和中央管理的企业集团统计报表由我局企业调查总队负责布置、收集。由于你公司属于中央管理的企业集团，因此你公司填报的企业集团统计报表应直接报送给我局企业调查总队，具体执行时间从今年半年报开始。二、《北京市统计局关于完善企业集团统计报表制度的通知》（京统发［2003］85号）要求你公司向其报送集团2003年年报和半年报的有关事宜，我局企业调查总队已和北京市统计局企调队进行了沟通，北京市企业集团统计的范围不再包括你公司，其所需资料由我局企业调查总队予以提供。国家统计局办公室二○○三年九月十五日

医学论文统计学方法应用的错误解析论文

摘要：统计学方法应用正确与否直接关系到医学科研结果的可信度和有效性，在研究设计时的错误应用会否决整个科研研究方案，基于错误统计学方法上产生的结果会浪费科研人员的时间和精力。编审人员应该高度重视医学论文的统计学方法应用，提高单篇文献的质量和学术水平。

关键词：统计学方法；医学论文；解析

一、引言

医学由于其研究的复杂性和系统性，常需要应用严谨的统计学方法，由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解，在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此，正确应用统计学方法，并将所获得的结果进行正确的描述有助于单篇论著的质量提高，现将医学论文中统计学方法应用及其常见结果的错误解析如下。

二、医学论文统计学方法应用概况

医学论文的摘要是全文的高度浓缩[1]，主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。

(一)材料与方法部分

正文中，材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述，读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况，其目的是表明统计学方法应用的合理性和可靠性，他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术，要具备可比较性和科学性，

方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法，必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验，多组间计量资料的F检验，计数资料的卡方检验，不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法，要在这里简要说明并给出参考文献，还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号，如基于家系资料研究的版本。

(二)论文结果部分

论文结果部分要显示应用统计学方法得到的统计量[2]，所采用的统计学指标较多时，往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度，除了与测量仪器的精密程度有关外，还与样本本身的均数有关，所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数，百分比一般保留一个小数。在统计软件中，分析结果往往精确度比较高，一般要采用四舍五入的方法使其靠近实验的实际情况，否则还会降低论文的可信度和可读性。

结果部分的统计表采用统一的“三线”表，表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置，要求整齐美观，不能出现错行现象。要明确标注观察的例数，得到的检验统计量。统计图可以直观的表达研究结果，如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出，描述的是67%的置信区间，不是95%，提倡在误差条图采用95%的置信区间。

关于统计量，一般采用均数与标准差两个指标，均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比，分母的确定必须要符合逻辑，过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化，可以采用卡方检验。

1.假设检验的结果中，常见只写P值的情况，有时候会误导读者，也会隐藏计算失误的情况，因此写出具体的统计值，如F值、t值，可以增强可信度。对于率、相关系数、均数这类描述统计量，要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性，对于结果的计算要求具体的P值，如P=或P=。

2.在对论文进行讨论时，作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设，对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件，P值很小表明两组间没有差别的概率很小。当P<；，表明差异具有统计学意义。P值与观察的样本量的大小有关联，当样本量小的时候，数据之间的差别即使很大，P值也可能很大；当样本量大时，数据之间的差别即使很小，P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联，有统计学意义的样本相关系数可能很小。因此，有统计学差异的描述并不一定意味着两组间差别很大，错判的危险性很大，显著性的检验为定性的结果，结合统计量大小方可判断是否具有专业意义。

变量间虚假的相关关系与变量随时间变化而变化相关，统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的'研究方法的不同来考量。使用回归方程进行分析，当两变量间具有显著性关系，但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度，而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病，灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致，在疾病患病率很低时，出现假阳性也是正常的，要确诊疾病必须要与临床症状体征相结合。因此，这两个率的计算方法必须交待清楚。

三、医学论文统计学方法应用的常见错误分析

(一)“材料与方法”中的统计学方法应用的常见错误

“材料与方法”中统计学方法常见的问题主要为：对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如，临床入组病例分组只采用简单的随机分组，未描述随机分组的方法，未描述是否双盲双模拟，未设置空白对照组，分组后对性别、年龄、文化程度的描述未进行统计学检验，对于特殊的统计学方法没有详细交代；动物实验分组的随机化原则描述过于简单，没有具体说清完全随机、配对或分层随机分组等；统计分析方法没有任何说明采用的分析软件，有的只说明采用的分析软件而不交代在软件中采用的统计方法；没有说明原因的情况下出现样本量过于小等情况。

(二)“结果”统计学方法应用的常见错误

1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同；对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多；罕见疾病的发病率、患病率、现患率等指标没有选择好基数，导致结果没有整数位；相关系数、回归系数等指标保留的小数位数过多或者过少；常用的一些检验统计量，如F值、t值保留的位数不符合要求。

2.对统计学指标进行分析和计算时，一般采用计数资料和计量资料进行区分。计量资料常用三线表，在近似服从正态分布的前提下采用均数、标准差进行说明，如果不符合正态分布时，可以采用加对数或其他的处理方式使其近似正态分布，否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算，影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标，常见样本量过小的问题，采用率进行描述会影响统计结果的可靠性，采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率，也是不可取的。

3.在判断临床疗效之一指标时，两组平均疗效有差别并不意味着两组的每一个个体都有效或无效，必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效，服药一周后，研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率，研究组和对照组的有效率分别为和，尽管平均疗效相差较多，但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果，P 值的表达提倡报告精确P值，如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS，SPSS等，只要提供原始数据，就可以计算出t值、F值和相应的自由度，并可获得精确的P值。

四、小结

提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3]，医学论文中统计方法应用和统计结果的表达正确与否，不仅体现了论文的科学性和严谨性，而且对于提高期刊整体的学术质量，促进医学科学的发展和传播也有着重要作用[4]。

参考文献：

[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).

[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).

[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).

[4] 张春军,董凯.网络信息时代加强医学期刊编辑的信息素养[J].牡丹江医学院学报,2011(32).

医学论文

医学论文统计学错误解析