医学统计方法概述 第一节 医学统计学 在临床医学中的作用和意义 一、医学统计学 1、统计学 统计学(statistics)是研究数据搜集、整理与分析的科学,是认识社会和自然现象数量特征的重要工具。 2、医学统计学 统计学在医学研究领域的应用称为医学统计学。 医学统计学与生物统计学、卫生统计学是统计学原理和方法在互有联系的不同学科领域的应用,三者间有少许区别,但无截然界限。 二、医学统计学在临床医学中的应用及意义 1、临床科研设计 2、对搜集资料的内在规律进行分析 3、为医务工作者阅读科技文献和撰写科研论文提供工具 第二节 统计工作的基本步骤 统计工作的基本步骤通常分为四步:(研究)设计、搜集资料、整理资料和分析资料。 一.研究设计(design) 设计一般包括专业设计和统计设计。专业设计即确定调查题目、内容等。统计设计包括资料收集、整理与分析。 统计设计包括资料收集、整理与分析全过程的统计设想和科学安排。 设计需考虑以下几方面: 1、研究的目的和假设是什么? 2、研究对象的选择范围是什么?如何确定? 3、研究方法是什么?技术路线如何? 4、具体的研究内容、观察项目与指标是什么? 5、研究对象的数量大小,如何抽样?怎样分组? 6、对观察指标如何进一步计算?具体采用哪些统计分析方法? 7、有哪些可能存在的误差?如何避免与减少其影响? 8、时间、人员、经费方面的安排。 实验三要素:处理因素、受试对象、实验效应 设计四原则:对照、随机化、重复、盲法 二、搜集资料(data collection) 按照设计要求,原则是及时、准确、完整地收集原始数据。 1、病历 2、日常医疗工作记录 3、临床检查与化验记录 4、疾病监测报表 5、专题研究 三、整理资料(data sorting) 1、资料的录入和清理 资料录入前后初步的清理是核实,其次是发现异
秋风送爽,也给我们送来了刘岭教授的统计说说第五期。这一期的统计学方法之选择大家一定要认真学起来,说不定马上你就会用到了。
编者语
针对常用的基本统计学方法,一般而言说的就是t检验、单因素方差分析和卡方检验,这也是大家在写论文、阅读论文时经常遇到的统计学方法(几乎每篇文章都会涉及这一种或几种方法),那到底该采用何种统计学方法呢?今天我们就此来聊聊。
一、拿到数据开始分析之前,一定要进行数据类型的划分(图1),因为不同数据类型资料,描述的方式不一样,统计学方法也不一样。
图1 统计资料的类型
举个例子(表1):
表1 某地2002年735例65岁以上老年人健康检查记录
二、各种类型资料的统计分析(描述与统计推断)
1.计量资料
特点:每个观察单位的观察值之间有量的区别,有单位;
描述形式:最常见采用“X±S”(一般文献中经常见到),用算数均数描述其平均水平,用标准差描述其离散程度。如果遇到数据“特别变态”(特别是标准差大于算数均数),就采用Md(P25,P75)(Md为中位数,P25和P75为四分位数)(表2)。正态分布检验请大家复习:医学科研课堂丨统计说说(三):你所应该了解的正态、方差齐性检验
表2 计量资料常用统计指标的特点及其应用场合
统计推断方法:一般分为单因素和多因素两种。
单因素分析方法分析要点:一是划清数据类型(计量资料);二是明确试验设计类型(完全随机设计?几组样本?);三是注意所用方法的应用条件;四是满足正态方差齐性时采用t检验(注意t检验有三种形式哦!)或单因素方差分析,不满足时采用秩和检验(图2)。
图2 计量资料统计方法的正确选择
提醒两点:
① 如果样本数据不服从正态分布的话,那就只能用非参数检验(秩和检验),但其检验效能低于参数检验(t检验或方差分析)。所谓检验效能低就是本身有差异,却没有能力发现其差异。
② 如果是两组以上样本的数据时,不能采用t检验(会导致假阳性错误概率增加),应该采用方差分析。若方差分析的P<0.05,需再进一步两两比较,常用的方法为LSD法或SNK法(注意依旧不能采用t检验)。
在上两讲内容中我们已经学过t检验(医学科研课堂丨统计说说(二):你的t检验做对了吗?)和方差分析(医学科研课堂丨统计说说(四):统计学方法之灵魂—方差分析)了,至于秩和检验,我们以后会逐步介绍滴。
多因素分析一般采用回归分析,主要是线性回归分析,以后会给大家介绍此方法。
2.计数资料
特点:无序分类,同类别中各观察单位之间没有量的差别,但各类别间有质的不同,各类别互不相容。其中二分类一定是计数资料(例如性别只有男/女之分,是否继发某种疾病只有继发/未继发之分),而多分类满足分类在性质上没有程度等级上的差别,即为计数资料(例如婚姻状况包括未婚、已婚、离异、丧偶,就属于多分类,但各分类没有程度等级差别,因此为计数资料,尿糖定性检测结果包括-、+、++、+++、++++,属于具有程度等级差别的多分类资料,就不属于计数资料,属于等级资料了)。
描述形式:最常见采用“例数(%)”(一般文献中经常见到),主要要分清构成比(结构相对数)和率(强度相对数)的差别(表3)。而且在应用时,分母(就是样本量啦)一般不宜过小,分母太小不足以反映数据的客观事实,也不稳定。
表3 计数资料常用统计指标的特点及其应用场合
比如说:
1.某地肺癌患者中男性A例,女性B例,则当地肺癌患者的性别比为A/B就是“比”。
2.某次研究共检出了致病菌3种,总株数为A+B+C,其中一种致病菌检出株数为A,那么A/(A+B+C)就是构成比,即该种致病菌占总致病菌的比重或分布。
3.某研究对患者(总例数为B)进行治疗,结果治愈的患者例数为A,则A/B即为率(可以理解为治愈率)。
统计推断方法:一般分为单因素和多因素两种。
单因素分析方法分析要点:一是划清数据类型(计数资料);二是明确试验设计类型(完全随机设计?几组样本?);三是注意所用方法的应用条件;四是多样本率比较,若卡方检验的P<0.05,需再进一步两两比较,并进行Bonferroni校正,以控制假阳性(图3)。
图3 计数资料统计方法的正确选择
提醒两点:
① 构成比是以100作为基数,各构成部分所占的比重之和必须为100%,故某组成部分所占比重的增减必影响其它组成部分的比重;
② 构成比和率在实际应用时容易混淆,主要区别在分母上,所以应正确选择分母。
多因素分析一般采用回归分析,主要是Logistic回归分析,以后会给大家介绍此方法。
3.等级资料
特点:属于多分类资料,满足多分类在性质上有程度等级上的差别,各分类属性按一定顺序排列(有序),即为等级资料。
描述形式:最常见采用“例数(%)”(一般文献中经常见到),这和计数资料的描述大体相同,主要区别在于多个分类排列时一定要按照顺序进行(从小到大或从弱到强)。
统计推断方法:等级资料的统计分析方法在单因素分析中采用非参数检验(秩和检验),当然对于双向有序R×C资料,也就说分组变量和结局变量都是有序(等级)的情况,构成比的比较采用卡方检验,程度的比较采用秩和检验,趋势关联性的比较用秩相关(也称等级相关)。多因素分析中采用有序Logistic回归。
注意:分类变量(计数资料和等级资料)在软件分析操作时,要适当数量化处理(赋值),赋值情况会直接影响统计分析结果的解释。
最后用下面这张图来总结基本统计学方法的选择(图4)。
图4 常用基本统计学方法的正确选择
今天的内容就到这里,同学们多多复习,有什么问题和不懂的可以在下面留言,我们会请刘岭教授一一解答。好了,让我们期待下一期吧!
撰稿:刘岭 约稿编辑:刘芹
排版:毕丽 审核:王东
专家简介
刘岭:陆军军医大学卫生统计学教研室副教授,主要从事卫生统计学教学、科研工作。担任中华卫生信息学会第八届统计理论与方法专业委员会委员,重庆市预防医学卫生统计专业委员会副主任委员,并担任《第三军医大学学报》等多家杂志的编委、统计审稿专家。
历史推荐
医学科研课堂丨统计说说(四):统计学方法之灵魂—方差分析
医学科研课堂丨统计说说(三):你所应该了解的正态、方差齐性检验
医学科研课堂丨统计说说(二):你的t检验做对了吗?
医学科研课堂丨统计说说(一):样本量估算是个什么东东?
一般常用的统计检验方法有:t 检验、卡方检验、方差分析和相关回归分析。
统计检验方法的选择主要依据数据的类型(计量、计数) 、组数的多少(两组、多组) 、样本量的大小以及对比的方式(相互比较、配对比较) ,此外计量数据还要考虑分布形态和方差齐性等问题。
医学统计方法该如何选择
基本的医学统计方法有很多,如样本均数与已知样本均数比较、两样本均数比较、多个样本均数的比较、两个样本率的比较、多个样本率的比较、两组或多组构成比的比较、非参数检验、多因素资料的方差分析等。如果对于统计方法没有一个整体的把握和认识,可能就会出现误用滥用统计方法的情况。下面是我为大家带来的.关于医学统计方法该如何选择的知识,欢迎阅读。
统计学的基本概念
1、小概率事件
如果事先假定发生概率最多为0.05的事件为小概率事件,那么根据小概率事件原理,即“小概率事件在一次随机试验中几乎不可能发生”。假设检验就是根据小概率事件原理对该假设进行推断。
2、非参数统计
统计学上,对总体的分布不做假设或仅作非常一般性假设条件下的统计推断方法称为“非参数统计”。非参数统计方法很多,应用较多的包括
配对设计资料的Wilcoxon符号秩和检验、单样本的Wilcoxon符号秩和检验、完全随机设计两独立样本的Wilcoxon符号秩和检验、完全随机设计多个独立样本的Kruskal-Wallis秩和检验和随机化区组设计资料的Friedman秩和检验。
3、实验研究三要素
实验研究三要素包括:处理因素、实验对象、实验效应。处理因素有单因素、多因素;实验对象的设计方式有完全随机、配对或随机区组;实验效应通过观察指标来表达,而观察指标又可分为计量、计数或等级资料。这三者的不同组合决定了选用不同的统计方法。
单变量统计方法选择的一般原则
1.影响因素是单因素还是多因素
2.判断拟分析的资料属于哪种类型:计量、计数还是等级资料
3.资料是单一样本、两组样本还是多组样本
4.判断资料所属的设计方式,是完全随机、配对还是随机区组
5.判断资料是否符合拟采用的统计分析方法的应用条件,必要时可考虑变量变换
多变量统计方法的选择
在医学研究中,特别是在临床研究中,每个观察对象记录的观察指标往往不止1个,即有多个反应变量。分析变量间的相互关系是探索疾病病因的重要途径,多参数统计方法常用于这类研究问题的分析。
在医学科研中,常用的多参数统计方法有3种:多元线性回归、Logistic回归分析和生存分析。
多元线性回归要求应变量是连续型变量,但是在医学研究中经常遇到的应变量为非连续的分类变量,如某种疾病的患病与否,器官移植之后是生存还是死亡。
研究分类应变量与诸多自变量间的相互关系,进行疾病的病因分析常选用Logistic回归分析。
在医学随访研究中,不仅要看是否出现了某种结局(如器官移植后是否死亡),还要考虑出现这些结局所经历的时间长短。生存分析就是将观察结局和出现这一结局所经历的时间结合起来分析的一种统计分析方法。