绝大多数的论文撰写,均需通过一定数量临床病例(或资料)的观察,研究事物间的相互关系,以探讨客观存在的新规律。如确定新诊断、新治疗等措施是否优于原沿用的方法,就需进行两种方法比较,这就涉及统计处理;统计设计又是整个课题研究设计中一个重要的组成部分。显然,经正确统计处理的结果可信度高,论文的质量也高。
这个表描述的是术前合并冠心病、切除范围、手术入路、心包内操作这几个因素之间的关联,比如切除范围和术前合并冠心病呈正相关且有统计学意义(>),其它类推。 我是这么认为的。
变量当然是一个一个输入啊也可以用excel导入我替别人做这类的数据分析蛮多的
秋风送爽,也给我们送来了刘岭教授的统计说说第五期。这一期的统计学方法之选择大家一定要认真学起来,说不定马上你就会用到了。编者语针对常用的基本统计学方法,一般而言说的就是t检验、单因素方差分析和卡方检验,这也是大家在写论文、阅读论文时经常遇到的统计学方法(几乎每篇文章都会涉及这一种或几种方法),那到底该采用何种统计学方法呢?今天我们就此来聊聊。一、拿到数据开始分析之前,一定要进行数据类型的划分(图1),因为不同数据类型资料,描述的方式不一样,统计学方法也不一样。图1 统计资料的类型举个例子(表1):表1 某地2002年735例65岁以上老年人健康检查记录二、各种类型资料的统计分析(描述与统计推断)1.计量资料特点:每个观察单位的观察值之间有量的区别,有单位;描述形式:最常见采用“X±S”(一般文献中经常见到),用算数均数描述其平均水平,用标准差描述其离散程度。如果遇到数据“特别变态”(特别是标准差大于算数均数),就采用Md(P25,P75)(Md为中位数,P25和P75为四分位数)(表2)。正态分布检验请大家复习:医学科研课堂丨统计说说(三):你所应该了解的正态、方差齐性检验表2 计量资料常用统计指标的特点及其应用场合统计推断方法:一般分为单因素和多因素两种。单因素分析方法分析要点:一是划清数据类型(计量资料);二是明确试验设计类型(完全随机设计?几组样本?);三是注意所用方法的应用条件;四是满足正态方差齐性时采用t检验(注意t检验有三种形式哦!)或单因素方差分析,不满足时采用秩和检验(图2)。图2 计量资料统计方法的正确选择提醒两点:① 如果样本数据不服从正态分布的话,那就只能用非参数检验(秩和检验),但其检验效能低于参数检验(t检验或方差分析)。所谓检验效能低就是本身有差异,却没有能力发现其差异。② 如果是两组以上样本的数据时,不能采用t检验(会导致假阳性错误概率增加),应该采用方差分析。若方差分析的P<,需再进一步两两比较,常用的方法为LSD法或SNK法(注意依旧不能采用t检验)。在上两讲内容中我们已经学过t检验(医学科研课堂丨统计说说(二):你的t检验做对了吗?)和方差分析(医学科研课堂丨统计说说(四):统计学方法之灵魂—方差分析)了,至于秩和检验,我们以后会逐步介绍滴。多因素分析一般采用回归分析,主要是线性回归分析,以后会给大家介绍此方法。2.计数资料特点:无序分类,同类别中各观察单位之间没有量的差别,但各类别间有质的不同,各类别互不相容。其中二分类一定是计数资料(例如性别只有男/女之分,是否继发某种疾病只有继发/未继发之分),而多分类满足分类在性质上没有程度等级上的差别,即为计数资料(例如婚姻状况包括未婚、已婚、离异、丧偶,就属于多分类,但各分类没有程度等级差别,因此为计数资料,尿糖定性检测结果包括-、+、++、+++、++++,属于具有程度等级差别的多分类资料,就不属于计数资料,属于等级资料了)。描述形式:最常见采用“例数(%)”(一般文献中经常见到),主要要分清构成比(结构相对数)和率(强度相对数)的差别(表3)。而且在应用时,分母(就是样本量啦)一般不宜过小,分母太小不足以反映数据的客观事实,也不稳定。表3 计数资料常用统计指标的特点及其应用场合比如说:1.某地肺癌患者中男性A例,女性B例,则当地肺癌患者的性别比为A/B就是“比”。2.某次研究共检出了致病菌3种,总株数为A+B+C,其中一种致病菌检出株数为A,那么A/(A+B+C)就是构成比,即该种致病菌占总致病菌的比重或分布。3.某研究对患者(总例数为B)进行治疗,结果治愈的患者例数为A,则A/B即为率(可以理解为治愈率)。统计推断方法:一般分为单因素和多因素两种。单因素分析方法分析要点:一是划清数据类型(计数资料);二是明确试验设计类型(完全随机设计?几组样本?);三是注意所用方法的应用条件;四是多样本率比较,若卡方检验的P<,需再进一步两两比较,并进行Bonferroni校正,以控制假阳性(图3)。图3 计数资料统计方法的正确选择提醒两点:① 构成比是以100作为基数,各构成部分所占的比重之和必须为100%,故某组成部分所占比重的增减必影响其它组成部分的比重;② 构成比和率在实际应用时容易混淆,主要区别在分母上,所以应正确选择分母。多因素分析一般采用回归分析,主要是Logistic回归分析,以后会给大家介绍此方法。3.等级资料特点:属于多分类资料,满足多分类在性质上有程度等级上的差别,各分类属性按一定顺序排列(有序),即为等级资料。描述形式:最常见采用“例数(%)”(一般文献中经常见到),这和计数资料的描述大体相同,主要区别在于多个分类排列时一定要按照顺序进行(从小到大或从弱到强)。统计推断方法:等级资料的统计分析方法在单因素分析中采用非参数检验(秩和检验),当然对于双向有序R×C资料,也就说分组变量和结局变量都是有序(等级)的情况,构成比的比较采用卡方检验,程度的比较采用秩和检验,趋势关联性的比较用秩相关(也称等级相关)。多因素分析中采用有序Logistic回归。注意:分类变量(计数资料和等级资料)在软件分析操作时,要适当数量化处理(赋值),赋值情况会直接影响统计分析结果的解释。最后用下面这张图来总结基本统计学方法的选择(图4)。图4 常用基本统计学方法的正确选择今天的内容就到这里,同学们多多复习,有什么问题和不懂的可以在下面留言,我们会请刘岭教授一一解答。好了,让我们期待下一期吧!撰稿:刘岭 约稿编辑:刘芹排版:毕丽 审核:王东专家简介刘岭:陆军军医大学卫生统计学教研室副教授,主要从事卫生统计学教学、科研工作。担任中华卫生信息学会第八届统计理论与方法专业委员会委员,重庆市预防医学卫生统计专业委员会副主任委员,并担任《第三军医大学学报》等多家杂志的编委、统计审稿专家。历史推荐医学科研课堂丨统计说说(四):统计学方法之灵魂—方差分析 医学科研课堂丨统计说说(三):你所应该了解的正态、方差齐性检验 医学科研课堂丨统计说说(二):你的t检验做对了吗? 医学科研课堂丨统计说说(一):样本量估算是个什么东东?
按数据类型选择的,正态性和方差齐等等医学统计学学专业数据分析找我做
医学论文中常用统计分析方法的合理选择目前,不少医学论文中的统计分析存在较多的问题。有报道,经两位专家审稿认为可以发表的稿件中,其统计学误用率为90%-95%。为帮助广大医务工作者提高统计分析水平,本文将介绍医学论文中常用统计分析方法的选择原则及应用过程中的注意事项。 检验t检验是英国统计学家 1908年根据t分布原理建立起来的一种假设检验方法,常用于计量资料中两个小样本均数的比较。理论上,t检验的应用条件是要求样本来自正态分布的总体,两样本均数比较时,还要求两总体方差相等。但在实际工作中,与上述条件略有偏离,只要其分布为单峰且近似正态分布,也可应用[2]。常用的t检验有如下三类:①单个样本t检验:用于推断样本均数代表的总体均数和已知总体均数有无显著性差别。当样本例数较少(n<60)且总体标准差未知时,选用t检验;反之当样本例数较多或样本例数较少、总体标准差已知时,则可选用u检验 [3]。②配对样本t检验:适用于配对设计的两样本均数的比较,在选用时应注意两样本是否为配对设计资料。常用的配对设计资料主要有如下三种情况:两种同质受试对象分别接受两种不同的处理;同一受试对象或同一样本的两个部分,分别接受不同的处理;同一受试对象处理前后的结果比较。③两独立样本t检验:又称成组t检验,适用于完全随机设计的两样本均数的比较。与配对t检验不同的是,在进行两独立样本t检验之前,还必须对两组资料进行方差齐性检验。若为小样本且方差齐,则选用t检验;反之若方差不齐,则选用校正t检验(t’检验),或采用数据变换的方法(如取对数、开方、倒数等)使两组资料具有方差齐性后再进行t检验,或采用非参数检验[4]。此外,当两组样本例数较多(n1、n2均>50)时,这时应用t检验的计算比较繁琐,可选用u检验[5]。 2.方差分析方差分析适用于两组以上计量资料均数的比较,其应用条件是各组资料取自正态分布的总体且各组资料具有方差齐性。因此,在应用方差分析之前,同样和成组t检验一样需要对各组资料进行正态性检验、方差齐性检验。常用的方差分析有如下几类:①完全随机设计的方差分析:主要用于推断完全随机设计的多个样本均数所代表的总体均数之间有无显著性差别。完全随机设计是将观察对象随机分为两组或多组,每组接受一种处理,形成两个或多个样本。②随机区组设计的方差分析:随机区组设计首先是将全部受试对象按某种或某些特性分为若干区组,然后区组内的每个研究对象接受不同的处理,通过这种设计,既可以推断处理因素又可以推断区组因素是否对试验效应产生作用。此外,由于这种设计还使每个区组内研究对象的水平尽可能地相近,减少了个体间差异对研究结果的影响,比成组设计更容易检验出处理因素间的差别。③析因设计的方差分析:将两个或两个以上处理因素的各种浓度水平进行排列组合、交叉分组的试验设计。它不仅可以检验每个因素各水平之间是否有差异,还可以检验各因素之间是否有交互作用,同时还可以找到处理因素的各种浓度水平之间的最佳组合。此外,还有正交设计、拉丁方设计等多种方差分析法,实验者在应用时可以参考相关的统计学著作。目前,某些医学论文中有这样的情况,就是用t 检验代替方差分析对实验数据进行统计学处理,这是不可取的。t 检验只适用于推断两个小样本均数之间有无显著性差别,而采用t 检验对多组均数进行两两比较,会增加犯I 型错误的概率,即可能把本来无差别的两个总体均数判为有差别,使结论的可信度降低[6]。对多个样本均数进行比较时,正确的方法是先进行方差分析,若检验统计量有显著性意义时,再进行多个样本均数的两两(多重)比较。3.卡方检验(χ2检验)χ2检验是一种用途比较广泛的假设检验方法,但是在医学论文中常用于分类计数资料的假设检验,即用于两个样本率、多个样本率、样本内部构成情况的比较,样本率与总体率的比较,某现象的实际分布与其理论分布的比较。但是当样本满足正态近似条件时,如样本例数n与样本率p满足条件np与n(1— p)均大于5,则可以计算假设检验统计量u值来进行判断。常用的χ2检验分为如下几类:①2×2表χ2检验:适用于两个样本率或构成比的比较,在应用时,当整个试验的样本例数n≥40且某个理论频数1≤T<5时,需对χ2值进行连续性校正。因为T值太小,会导致χ2值增大,易出现假阳性结论。此外,若样本例数n<40,或有某个T值<1,此时即使采用校正公式计算的χ2值也有偏差,需要用2×2表χ2检验的确切概率检验法(Fisher确切检验法)。②配对资料χ2检验:适用于配对设计的两个样本率或构成比的比较,即通过单一样本的数据推断两种处理结果有无显著性差别。在应用时,如果甲处理结果为阳性而乙处理结果为阴性的样本例数n1与甲处理结果为阴性而乙处理结果为阳性的样本例数n2之和<40,需要对计算的χ2值进行校正。③R×C表χ2检验:适用于多个样本率或构成比的比较。在R×C表χ2检验中,若检验统计量有显著性意义时,还需要对多个样本率或构成比进行两两比较,即分割R×C表,使之成为非独立的四格表,并对每两个率之间有无显著性差别作出结论。 2×2表资料在应用时可分为如下几种类型:横断面研究设计的2×2表资料、队列研究设计的2×2表资料、病例-对照研究设计的2×2表资料、配对研究设计的2×2表资料。研究者应注意不同类型的2×2表资料的统计分析方法略有差别,比如在分析队列研究设计的2×2表资料时,如果用χ2公式计算得到P<,研究者则应再计算相对危险度(RR)并检验总体RR与1之间的差异是否具有统计学意义。此外,在进行R×C表χ2检验时,还有如下两个主要的注意事项:首先,T值最好不要<5,若有1/5的T值<5,χ2检验结论是不可靠的,解决的办法有三种:增大样本量;删去T值太小的行和列;将T值太小的行或列与性质相近的邻行或邻列的实际频数合并。其次,不同类型的R×C表资料选择的统计分析方法是不一样。①双向无序的R×C表资料:可以选用一般的χ2公式计算。②单向有序的R×C表资料:如果是原因变量为有序变量的单向有序R×C表资料,可以将其视为双向无序的R×C表资料而选用一般的χ2检验公式计算,但如果是结果变量为有序变量的单向有序R×C表资料,选用的统计分析方法有秩和检验、Radit分析和有序变量的logistic回归分析等。③双向有序且属性不同的R×C表资料:对于这类资料采用的统计分析方法不能一概而论,应根据研究者的分析目而合理选择。如果研究者只关心原因变量与结果变量之间的差异是否具有统计学意义时,此时,原因变量的有序性就显得无关紧要了,可将其视为结果变量为有序变量的单向有序R×C表资料进行分析。如果研究者希望考察原因变量与结果变量之间是否存在线性相关关系,此时需要选用处理定性资料的相关分析方法如Spearman秩相关分析方法等。如果两个有序变量之间的相关关系具有统计学意义,研究者希望进一步了解这两个有序变量之间的线性关系,此时宜选用线性趋势检验。如果研究者希望考察列联表中各行上的频数分布是否相同,此时宜选用一般的χ因此,对于适用参数检验的资料,最好还是用参数检验。秩和检验是最常用的非参数检验,它包括如下几类:①配对资料的符号秩和检验(Wilcoxon配对法):是配对设计的非参数检验。当n≤25时,可通过秩和检验对实验资料进行分析;当n>25时,样本例数超出T界值表的范围,可按近似正态分布用u检验对实验资料进行分析。②两样本比较的秩和检验(Wilcoxon Mann-Whitney检验):适用于比较两样本分别代表的总体分布位置有无差异。如果样本甲的例数为n1,样本乙的例数为n2,且n1<n2;当n1≤10、n2—n1≤10时,可通过两样本比较的秩和检验对实验资料进行分析;当n1、n2超出T界值表的范围时,同样可按近似正态分布用u检验对实验资料进行分析。③多个样本比较的秩和检验(Wilcoxon Kruskal-Wallis检验):适用于比较各样本分别代表的总体的位置有无差别,它相当于单因素方差分析的非参数检验,计算方法主要有直接法和频数表法等。此外,在进行上述3类秩和检验(前两类秩和检验实际上已经被u检验替代)时,如果相同秩次较多,则需要对计算的检验统计量进行校正。公式计算。④双向有序且属性相同的R×C表资料:这类资料实际上就是配对设计2×2表资料的延伸,在分析这类资料时,实验者的目的主要是研究两种处理方法检测结果之间是否具有一致性,因此常用的统计分析方法为一致性检验或Kappa检验。4. 非参数检验非参数检验可不考虑总体的参数、分布而对总体的分布或分布位置进行检验。它通常适用于下述资料[2]:①总体分布为偏态或分布形式未知的计量资料(尤其样本例数n<30时);②等级资料;③个别数据偏大或数据的某一端无确定的数值;④各组离散程度相差悬殊,即各总体方差不齐。该方法具有适应性强等优点,但同时也损失了部分信息,使得检验效率降低。即当资料服从正态分布时,选用非参数检验法代替参数检验法会增大犯Ⅱ类错误的概率。
可以找专业的医学论文辅导机构啊。或者楼主就去“死缠”你的老师或者有经验的作者、医生吧。其实,我个人认为楼上这位朋友的回答挺好的。
271 浏览 7 回答
358 浏览 4 回答
139 浏览 7 回答
212 浏览 3 回答
296 浏览 6 回答
213 浏览 5 回答
149 浏览 3 回答
224 浏览 3 回答
225 浏览 5 回答
303 浏览 2 回答
326 浏览 3 回答
271 浏览 4 回答
146 浏览 5 回答
127 浏览 5 回答
285 浏览 3 回答
318 浏览 5 回答
234 浏览 8 回答
116 浏览 5 回答
189 浏览 6 回答
281 浏览 2 回答
250 浏览 3 回答
140 浏览 2 回答
333 浏览 3 回答
348 浏览 4 回答
131 浏览 4 回答