统计指标医学论文

流行病学与统计医学统计学：根据统计学的原理和方法，研究医学数据收集、表达和分析的一门应用各学科。医学统计的主要内容：研究对象：医学数据统计设计：调查设计和实验设计统计描述：率、均数统计推断：对统计指标的差别和关联性进行分析和推断医学统计资料的类型统计工作的基本步骤包括： 1. 研究设计 2. 收集资料：来源：经常性资料【医疗卫生工作记录（病历、医学检查记录、出生死亡报表等）健康检查记录】；一时性资料【专题调查或实验研究】。要求：完整、正确和及时；足够数量；代表性和可比性 3. 整理资料：原始数据的检查与核对：常规检查；取值范围检错；逻辑检错数据的分组设计和归纳汇总。4. 分析资料：统计描述；统计推断（区间估计、假设检验）统计工作的基本步骤包括： A ．实验和调查 B．统计设计 C．收集资料 D．整理资料 E．分析资料统计工作中，分析资料指的是： A ．统计设计 B．收集资料 C．整理资料 D．统计描述 E．统计推断总体：根据研究目的而确定的同质观察单位的全体。有限总体和无限总体。样本：是从总体中随机抽取有代表性的部分观察单位变量值的集合。参数：指总体指标。如总体均数μ，总体标准差σ，总体率π。统计量：指样本指标。如样本均数，样本标准差S ，样本率p 。误差：指实际值与真实值之差。分为随机误差（随机测量误差和抽样误差）、非随机误差（主要是系统误差）概率是对总体而言。是某随机事件发生的可能性大小的数值，常用符号P 表示。取值范围0~1。在统计学中，误差的种类有 A ．标准误差 B．计算误差 C ．系统误差√ D ．随机测量误差√ E ．抽样误差√ 统计学上的误差主要有 A. 系统误差 B.标准误差 C.随机测量误差 D.抽样误差 E.计算错误误差算术均数：简称均数，用于描述对称分布或近似正态分布的资料。描述正态分布资料集中趋势的指标是 A. 百分位数 B.中位数 C.算术均数 D.几何均数描述正态分布资料集中趋势的指标是 A. 中位数 B.几何均数 C.算术平均数 D.标准差有9名健康成人的空腹胆固醇测定值（mmol/L）为，，，，，，，，。求算术均数。有7份血清的抗体效价分别为1:2, 1:4, 1:8, 1:16, 1:32, 1:64, 1:128，求平均抗体效价。 n 5. 61+3. 96+3. 67+4. 99+4. 24+5. 06+5. 20+4. 79+5. 93＝ 9 43. 45＝ 9 ＝4. 83(m m ol /L ) X = G ＝lg -1( 血清抗体平均效价为1:16 注意：变量值中不能有0；不能同时出现负数和正数；若全为负数，计算时先把符号去掉计算中位数(median, M)：可用于任何分布的计量资料有7名正常人的血压（舒张压）测定值（mmHg ）为：72，75，76，77，81，82，86，87求中位数。 M ＝(77＋81)/2=79 一组从小到大排列的定量变量，位次居中的指标是 A ．算术均数 B.几何均数 C．中位数 D.百分位数描述离散趋势的指标是 A. 标准差 B.中位数 C. 几何均数 D.算术均数 n lg 2+lg 4+lg 8+lg 16+lg 32+lg 64+lg 128 ＝lg -1() 7 ＝lg -1(1. 204) ＝16 lg X ) 方差（variance ）与标准差（standard deviation）：表示数据的平均离散情况，常用于描述服从正态分布的资料的离散程度。某地20岁男子160人某地不同年龄女童身高（cm ）的变异程度统计表的基本结构与要求：标题、标目、线条、数字4部分组成。表中数字区不插入文字，不列备注项。必须说明者表“*”号等，在表下方说明。统计表的基本结构为 A ．标题、横标目、纵标目、线条 B．标题、横标目、纵标目、数字 C ．标题、横标目、纵标目、备注 D．标题、标目、线条、数字统计表的基本构成有 A ．标题 B．横标目 C．纵标目 D ．线条 E．数字统计表内不列的项是 A. 标目 B. 线条 C.数字 D.备注制图的基本要求（1）根据资料的性质和分析目的，选择合适的图形。（2）基本结构：标题、标目、刻度、图例4部分组成。标题：一般放在图的下方，左侧加图号标目：分为横标目和纵标目，分别表示横轴和纵轴数字刻度的意义刻度：图例：说明统计图中各种图形锁代表的事物。放在右上角或下方中间比较两家医院15年床位数的增加速度，可选用的统计图是 A ．构成图 B ．直条图 C ．线图 D ．直方图某医院拟表示一年中各月病床使用率的变化趋势，应选用的统计图是 A ．普通线图 B ．直条图 C ．散点图 D ．直方图比较某地2001年和2011年结核、心脏病和肿瘤的死亡率，可选择的统计图是 A. 单式条图 B.复式条图 C.普通线图 D.半对数线图分析某医院1998年住院病人5种疾病构成比可选用的统计图是 A. 单式直条图 B. 复式直条图 C.圆图 D. 线图分析某医院1998年和2008年住院病人5种疾病构成比可选用的统计图是 A ．单式直条图 B．复式直条图 C．百分比条图 D．统计地图观察某地十年肺结核患病率的变化趋势，可选择的统计图是 A. 条图 B.圆图 C.线图 D.直方图比较某地2001年和2011年结核、心脏病和肿瘤的死亡率，可选择的统计图是 A. 单式条图 B.复式条图 C.普通线图 D.半对数线图假设检验的基本步骤 1. 建立假设检验，确定检验水准（1）根据统计推断目的提出对总体特征的假设无效假设，或称为零假设，记作H0，即假设差异是由于抽样误差所致，总体参数相同备择假设，记作H1，即差别不是由于抽样误差所致，总体参数不同（2）确定检验水准亦称显著性水准，用α表示 2. 选定检验方法，计算检验统计量（卡方、t 值、F 值） 3. 确定P 值，做出统计推断结论注意：假设检验是针对总体而言的假设检验的注意事项 1.. 检验方法的正确选择定量资料两个独立样本均数比较：t 检验多个独立样本均数比较：方差分析配对设计：配对t 检验随机区组资料：随机区组设计方差分析 2. 结果的解释：差别有统计学意义与有无实际意义的关系 I 型错误（第一类错误）：指拒绝了实际上是成立的H0。用α表示。 II 型错误（第二类错误）：指不拒绝实际上是不成立的H0。用β表示。 1. 流行病学研究的对象是（） A.病人 B.健康人 C.人群 D.亚健康人 E.亚临床的人下列哪一项是分析流行病学方法（） A.横断面研究 B.生态学研究 C.疾病监测 D.病例对照研究 E.社区干预试验有学者通过调查肺癌病人和非肺癌的人过去的吸烟情况，来研究吸烟和肺癌的关系。这种方法称为： A.现况调查 B.描述性研究 C.筛检试验 D.病例对照研究 E.队列研究有学者对某人群进行了高血压的调查，获得了该人群高血压的患病率，并对不同年龄组的高血压患病情况进行了分析。这种调查研究属于： A.探讨疾病的病因 B.探讨发病机制 C.描述疾病的分布 D.研究疾病自然史 E.疾病筛检计算患病率的分子是（） A ．观察期间某病的新发病例数 B．观察期间某病的新旧病例数 C ．观察期间之后某病的患病人数 D．观察期间某病的暴露人口数 E ．观察期间所有人口数某地区在1个月内进行了糖尿病的普查，可计算当地糖尿病的（） A ．发病率 B．死亡率 C．患病率 D．二代发病率 E．罹患率下面哪一个公式用于计算发病率（E ） A ．（受检者中阳性人数/受检人数）×100% B．（受检者中阳性人数/同期暴露人数）×100% C ．（受检者中阳性人数/受检者人数）×100% D．（受检者中阴性人数/受检者人数）×100% E．（某一时期内新病例数/同期暴露人数）×100% 一个地区通过首次高血压普查，可计算当地的（） A ．高血压患病率 B．高血压罹患率 C．高血压发病率 D．高血压病死率 E．家庭续发率某地区1960年度疫情资料统计，狂犬病患者100人全部死亡，此资料可计算 A ．粗死亡率 B．死亡专率C ．标化死亡率 D．病死率 E．此资料不全难以计算下列叙述中，不属于病例对照研究优点的是（） A ．资料收集后可在短时间内得到结果 B．特别适用于罕见病的研究 C ．一次调查可同时研究一种疾病与多个因素的关系 D．可直接获得发病率资料 E ．所需研究对象的数量相对较少病例对照研究中的调查对象是（） A ．病例组是怀疑患有欲研究疾病的病人，对照组是未患该病的人 B ．病例组是具有某种暴露的人，对照组是未有该暴露的人 C ．病例组是确诊患有欲研究疾病的病人，对照组是未患该病的人 D ．病例组和对照组均是具有某种暴露的人 E．病例组是确诊患有欲研究疾病的病人，对照组是怀疑患有该病的在病例对照研究中，若病例组某危险因素暴露史的比例在统计学上明显高于对照组，则表明( D ) A ．该因素与疾病有统计学关联 B．该因素与疾病有因果关联 C ．该因素是疾病的病因 D．该因素与疾病无关联 E．该病由该因素引起下列关于病例对照研究特点的说法中，正确的为( C ) A ．暴露与疾病都是现在的情况 B．能够确证因素与疾病的因果关联 C ．由因及果的研究 D．需要随机分组 E．属于观察法 OR 主要应用于( A ) A ．现况研究 B．生态学研究 C．现场试验 D．病例对照研究 E．队列研究属于病例对照研究缺点的是( E ) A ．不能分析疾病与多种因素的关联 B．不能估计RR C．样本含量要求很大 D ．容易产生医德问题 E．回忆信息时，易出现错误下列说法中，不属于队列研究特点的是（ B ） A ．由因及果，前瞻性研究 B．属于描述性研究 C．能同时研究一种因素与多种疾病的关系 D ．需要设立对照组 E．因果关联的说服力大于病例对照研究队列研究中的研究对象为（ C ） A ．在一般人群中选取有、无某暴露因素的两个组 B．在患有某病者中选择有、无某暴露因素的两个组 C ．在未患该病人群中选择有、无某暴露因素的两个组 D．患有某种疾病的人群随机分成的两组 E ．一组患有某种疾病者，一组为未患有该种疾病者在队列研究中，暴露组的疾病发病率与对照组的疾病发病率的差值称为 ( A ) A ． AR B． RR C．OR D．PAR E． AR% 队列研究属于( B ) A ．相关性研究 B．分析性研究 C．描述性研究 D．理论性研究 E．实验性研究在队列研究中，估计某因素与某疾病关联强度的指标为( E ) A ．总人群中该病的发病率 B．暴露人群中该病的发病率 C ．人群中危险因素的暴露率 D．OR E． RR 在队列研究中，研究对象的分组原则是按( A ) A ．是否暴露于某因素分组 B．随机分组 C．是否患病分组 D．人为随意分组 E．领导意图分组属于实验流行病学特征的是（E ） A ．由果及因，回顾性研究 B．属于观察法 C．获得因素与疾病联系强度的指标主要为比值比 D ．不能确证因果关联 E．人为施加干预措施关于临床试验中的对照组，正确的说法为( B ) A ．是人群中的非患欲研究疾病者 B．是患欲研究疾病者，但在处理上不同于实验组 C ．不具有某种暴露因素的人 D．与患欲研究疾病者同时入院的其它患者 E．所欲研究疾病的轻型患者多选题：下列所述中属于抽样调查优点的有（ A C D ） A ．工作量小 B．工作量大 C．省时间和人力、物力 D．工作易做到细致 E ．特别适用于患病率很低的疾病调查属于队列研究缺点的为（ A C D ） A ．观察时间长，花费大 B．易出现回忆偏倚 C．不宜用于研究发病率很低的疾病 D ．设计的要求高，实施复杂 E．不能计算发病率、死亡率等属于实验流行病学方法的有（ A/C ） A ．临床试验 B．普查 C．社区试验 D．队列研究 E．个体试验反映诊断试验可靠性的指标是（ E） A ．灵敏度 B．特异度 C．约登指数 D．阳性似然比 E．符合率为提高诊断试验的灵敏度, 对几个独立试验可（B ） A ．串联使用 B．并联使用 C．先串联后并联使用 D ．要求每个试验假阳性率低 E．要求每个试验特异度低某病早期治疗效果好，漏诊后果严重，对此病的试验诊断应（A ） A ．提高灵敏度 B．提高特异度 C．降低诊断的截断值 D．提高阳性预测值 E．提高阴性预测值诊断试验的真实性是指（A ） A ．被试验的测定值与实际值的符合程度 B．是重复试验获得相同结果的稳定程度 C ．是观察者对测量结果判断的一致程度 D．是试验结果表明有无疾病的概率 E．指病例被试验判为阳性的百分比流行病学是研究疾病、健康状态和事件在人群中的分布、影响和决定因素，用以预防科控制疾病、促进健康的学科。流行病学研究的方法：观察性研究实验性研究理论性研究观察性研究: 描述性研究 (横断面研究（现况调查）比例死亡比研究生态学研究) 、分析性研究（病例对照研究队列研究（随访研究））实验性研究：临床实验、现场试验、社区干预试验和整群随机试验理论性研究：流行病学方法研究理论流行病学比例：是表示同意事物局部与总体之间数量上的比值，分子和分母的单位相同，且分子包含于分母之中。（构成比）某医院住院病人中有15％的胃癌患者，该15％是： A. 患病率 B.发病率 C.构成比 D.相对比例：某病患者409人，其中男性170人，女性239人，男女性构成比见右侧表所示。具体计算：表 409名患者性别构成男性患者数男性构成比=⨯100% 男女性患者总数170 =⨯100%= 170+239 构成比的特点是各组成部分的构成比之和为100% 例如，某年某地出生婴儿中，男性婴儿有185人，女性婴儿有176人，则：出生婴儿性别比= 男性婴儿数女性婴儿数 = 185176 = ．比或相对比：是两个相关指标之比，说明两指标间的比例关系。两个指标可以是性质相同，如不同时期发病数之比；也可以性质不同，如医院的门诊人次与病床数之比。常用倍数或百分数表示。两指标可以是绝对数、相对数或平均数。相对比= 甲指标 ⨯100%）乙指标 3．率：表示一定时间内，实际发生某现象的例数与可能发生该现象的总例数之比，用以说明某现象发生的频率或强度，常用百分率（%）、千分率（‰）、万分率（1/万）或十万分率（1/10万）等表示。率= 说明某现象发生频率或强度的相对数是某现象实际发生的例数 ⨯k 可能发生该现象的总例数 A. 率 B.构成比 C.相对比 D.百分位数发病率发病率= 一定时期内某人群某病新病例数 ⨯k 同期暴露人口数用途：反映该病的风险。用来描述疾病的分布、探讨发病因素、提出病因假设、评价防治效果 1.描述疾病的发病率指标，计算时分子应为 A ．新发病例数 B．新旧病例数 C．受检者中阳性人数 D．易感接触者中发病人数 2.发病率的分子是 A ．患病人数之和 B．新病人数之和 C．感染人数之和 D．死亡人数之和 1. 描述疾病的患病率指标，计算时分子应为：B A. 新发病例数 B.新旧病例数 C.受检者中阳性人数 D.易感接触者中发病人数 2. 患病率：又称现患率或流行率。患病率= 特定时间点某人群中某病新旧病例数 ⨯k 同期观察人口数 K=100%，1000‰,10 000/万或100 000/10万时点患病率：调查时间一般在1个月内期间患病率：调查时间超过1个月影响因素：患病率=发病率×病程用途：患病率通常用来描述病程较长的慢性病发生或流行情况黄炳率与发病率的区别 1. 死亡率：指某人群在一定期间内（1年）死于所有原因的人数在该人群中所占比例。 K=1000或100 000/10万死亡率= 某时期内死亡总数 ⨯k 同期平均人口数 2. 病死率：在一定时间内患某病的全部患者中因该病而死亡的比例。多用于病程短的急性病。表明疾病的严重程度。病死率= 某时期因某病死亡的人数 ⨯100% 同期患某病的人数 3. 生存率：又称存活率。指患某病的人（或接受某种治疗措施的患者）经n 年随访，到随访结束时仍存活的病例数与随访病例的总数之比 n年生存率是评价慢性、病死率高的疾病远期疗效的重要指标。 n 年生存率= 1. 相对危险度（RR ）或率比：指暴露组发病率与非暴露组发病率之比。反映了暴露于疾病的关联强度。RR= Ie/I0 RR=1，暴露与疾病无联系 RR1，暴露与疾病存在正联系（暴露是危险因子）例：Doll 和Hill 调查了英国35岁以上男性吸烟习惯与肺癌死亡率的关系，不吸烟人群的肺癌死亡率为‰，中度吸烟者（15-24支/日）的肺癌死亡率为‰。RR= 说明吸烟者死于肺癌的危险性是不吸烟者的倍。 2. 比值比（OR ）：又称优势比、交叉乘积比。指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。发病率（死亡率）很低；研究对象代表性好—— OR≈RR 归因危险度（AR ）或率差（RD ）：是指暴露组发病率与非暴露组发病率之差，反映发病归因于暴露因素的随访满n 年后仍存活的病例数 ⨯100% 随访满n 年的该病病例数程度。AR= Ie-I0 =RR×I0-I0 =I0 (RR-1) AR 意义：暴露者中完全由某暴露因素所致的发病率或死亡率。例：AR=‰‰=‰。表明在每日吸15-24支香烟当中由于吸烟所致的肺癌死亡率为‰ 归因危险度百分比（AR%）：指暴露人群中有暴露因素引起的发病在所有发病中所占的百分比。 AR%= (Ie-I0)/Ie×100% 例：AR%=()/×100%= 表示在每日吸15-24支香烟者中有的肺癌是由吸烟所致。现况调查：在某一人群中应用普查或抽样调查等方法收集特定时间内有关变量、疾病或健康状况的资料，以描述目前疾病或健康状况的分布及某因素与疾病的关联。现况调查的种类（！）普查：指在特定时间内，对特定范围人群的每一个成员所进行的调查，也称全面调查。（2）抽样调查：是从总体人群中随机抽取有代表性的一部分人（样本）进行调查，以样本结果来估计总体人群的疾病或健康状况的一种调查方法。抽样方法：非随机和随机抽样现况调查优缺点（1）优点：研究结果有较强的推广意义；可形成同期对照；是病因探索中的基础性工作（2）局限性：难以确定心因后果；不能获得发病率资料；有可能低估患病水平队列研究的原理是将特定的人群按其是否暴露于某因素或按不同暴露水平分为n 个群组或队列，追踪观察一段时期，比较两组或各组发病率或死亡率的差异，以检验该因素与某疾病有无因果联系及联系强度大小的一种观察性研究方法。 1. 队列研究主要用于： A ．研究发病机理 B．研究职业种类 C ．验证某种暴露因素对发病率或死亡率的影响 D．研究个体基因突变性队列研究的特点：时序是前瞻性研究观察性对比研究暴露组否分组研究方向由“因”推“果” 追踪观察的两组间的发病率或死亡率差异，RR=[a/(a+b)/[c/(c+d)] 1. 队列研究的特点有 A. 属于观察法√ B.属于实验法 C.设立对照√ D.研究方向由因推果√ E.研究方向由果追因队列研究的优缺点：（1）优点：研究对象在疾病发生前按暴露情况分组且进行随访，所获资料完整可靠，无回忆偏倚可直接计算发病率或死亡率，因而能计算相对危险度和特异危险度等指标，直接估计暴露于疾病的联系强度大小可同时研究一种因素与多个疾病的关系, 有助于了解疾病自然史。暴露因素与疾病的时间先后顺序清晰，因此论证因果关系的能力强。暴露因素的作用可分等级，便于计算剂量-效应关系。样本量大，结果较稳定。在有完整资料记录的条件下，可做回顾性历史队列研究。（2）局限性：观察时间长，费人力、费钱，不能在较短时间内得到结果；准备工作繁重，设计的科学性要求高，实施难度大。暴露人年计算工作量较为繁重。不适于研究发病率很低的疾病。由于随访时间长，所以容易产生失访偏倚多选 1. 队列研究的用途有（） A. 用于验证某种暴露因素对发病率的影响 B.用于传染病发病机理研究 C.用于检验职业人群 D. 用于人群干预研究 E.描述疾病的自然发展过程病例对照研究: 选择患有所研究疾病的患者作为病例组，同时选择未患该病的人作为对照组，调查两组人群发病前对某个（些）因素的暴露状况，比较两组暴露率和暴露水平的差异，以研究该疾病与这个（些）因素的关系。病例研究的优点 1. 在疾病发生后进行，研究开始时已有一批可供选择的病例 2. 研究对象按发病与否分成病例组与对照组 3. 研究因素的暴露状况是通过回顾获得的 4. 由果及因的推理顺序 5. 比较两组暴露率或暴露水平，分析暴露于疾病的联系。OR=ad/bc 1. 病例对照研究的因果顺序是：c A ．由因追果 B．由因追因 C．由果追因 D．由果追果 2. 病例对照研究在时间上属于： b A. 现况性研究 B.回顾性研究 C.前瞻性研究 D.回顾加前瞻性研究实例目的：A 型性格与冠状动脉病变的关系研究对象：病例组：经冠状动脉造影确诊的冠心病患者对照组：医院对照（内对照）：冠状动脉造影正常+ECG平板运动试验阴性的其他科室住院者人群对照（外对照）：中型企业健康普查人群完全随机抽样（ ECG平板运动试验阴性）信息采集：信息采集： A 型性格：全国冠心病与A 型行为类型协作组1985年制定的《A 型性格问卷》，按确诊冠心病前两年的情况其他危险因素：一般人口学特征，既往高血压、高血脂等心血管疾病史及家族史，烟酒及膳食习惯等。冠状动脉病变指数：按造影所示病变部位及支数、狭窄程度及范围，结合美国心脏病协会规定的节段法进行评判。研究对象例数：实际分析339人病例组139人医院对照83人人群对照117人主要结果：病例组与医院和人群对照组之间在年龄、性别、居住地及工作年限、职业构成等方面经检验，均无显著性差异，说明各组间可比性较好 A 型性格发生冠心病的危险性：男性：OR 值（95%CI：）女性： OR值（95%CI：）性格评分等级与冠状动脉病变的关系：呈明显剂量-效应关系控制和调整了各因素的混杂后，A 型性格与冠状动脉病变的发生依然密切相关表6-2 性格类型与冠状动脉疾病程度间关系的对比分析实验性研究：又称干预研究，基本性质是研究者在一定程度上掌握着实验的条件，主动给予研究对象某种干预措施。主要类型：临床试验、现场试验、社区试验、类实验实验研究的特点： 1. 前瞻性研究：干预在前，效应在后 2.随机分组： 3. 设立对照组：来自同一总体 4.有干预措施：容易产生伦理学问题临床试验是按实验法，运用随机分配的原则将试验对象分为试验组和对照组，给实验组某种治疗措施，不给对照组该措施或给予安慰剂（placebo ），经过一段时间后评价两种措施产生的效应，从而评价临床治疗、预防措施的效果和进行病因研究。诊断指标：客观指标：仪器测定指标主观指标：患者主诉半客观指标：诊断者的主观感知（肿物的硬度、大小）诊断标准：生物统计学方法、临床判断法、ROC 曲线法真实性：有效性、效度或准确性。是指待评价试验所获得的测量值与实际情况（金标准测量值）符合程度。灵敏度（真阳性率）特异度（真阴性率）误诊率（假阳性率）漏诊率（假阴性率）似然比正确诊断指数练习题提高诊断试验灵敏度的办法是（） A. 串联试验 B.并联试验 C.先串联后并联 D.先并联后串联筛检试验：通过快速的检验、检查或其他措施，将可能有病但表面上健康的人，同那些可能无病的人区分开。筛检的主要用途：早发现临床前期的可疑患者（二级预防）发现高危个体（一级预防）流行病学监测了解疾病的自然史小王是北京海淀区万寿路社区卫生服务中心的一名健康管理师，需要针对本社区老年常见慢性病患者进行健康管理，计划两年之内增加高血压、糖尿病等的检出率、建档率和随访干预覆盖率，五年之内减少因高血压、糖尿病发病和死亡等指标，那么他应该从什么地方开始动手呢？该小区人群一般人口学特征（如年龄、职业、婚姻状况、性别等）情况如何分布？该小区人群常见慢性病（高血压、糖尿病、周围血管疾病、冠心病等）患病率如何？影响这些慢性病患者的危险因素有哪些？如何进行干预？社区中高血压、糖尿病患者的远期心血管病（主要是冠心病和脑卒中）发病和死亡风险如何，怎样预测？在进行12个月的干预后，如何评价效果？

科学研究很早就已经从简单的定性分析深入到细致的定量分析，科研工作者要面对大量的数据分析问题，科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中，实验设计的方法直接决定了数据采取何种统计学方法，因为每种统计方法都要求数据满足一定的前提和假定，所以论文在实验设计的时候，就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别，其中最主要的就是统计方法和实验设计不符，造成数据统计结果不可靠。下面，医刊汇编译列举一些常见的可以避免的问题和错误：打开百度APP，查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中，最常见的此类错误就是实验设计是多组研究，需要对数据使用方差分析的时候，而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中，不同数据要采取不同统计处理方法，这就需要作者清楚地描述出每个统计值采用的是何种统计学方法，但在许多使用一种以上数据统计分析方法的医学论文中，作者往往只是简单地把论文采用的数据统计方法进行了整体罗列，并没有对每个数据结果分析分别交代具体的统计方法，这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性，即作者即使不看文章内容，也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字，缺乏直观的统计图或表；或者虽然也列出了统计表或统计图，但表或图内缺项很多，让读者难以从中提取太多有用的信息。另外，也有作者为了增加文章篇幅，同时列出统计表和统计图，造成不必要的浪费和重复。统计表的优点是详细，便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释，最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误，把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论，一定要把统计结果和临床实践结合在一起，这样才会避免出现类似的错误。至于回避阴性结果，只提供阳性结果，是因为不少作者在研究设计时，难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时，从一个方向的实验就下完美的结论，尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性，有时会刻意回避报道差异的不显著结果，不思考和探究差异不显著的原因和意义，反而会因此忽视一些重大的科学发现。

医学论文统计学方法应用的错误解析论文

摘要：统计学方法应用正确与否直接关系到医学科研结果的可信度和有效性，在研究设计时的错误应用会否决整个科研研究方案，基于错误统计学方法上产生的结果会浪费科研人员的时间和精力。编审人员应该高度重视医学论文的统计学方法应用，提高单篇文献的质量和学术水平。

关键词：统计学方法；医学论文；解析

一、引言

医学由于其研究的复杂性和系统性，常需要应用严谨的统计学方法，由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解，在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此，正确应用统计学方法，并将所获得的结果进行正确的描述有助于单篇论著的质量提高，现将医学论文中统计学方法应用及其常见结果的错误解析如下。

二、医学论文统计学方法应用概况

医学论文的摘要是全文的高度浓缩[1]，主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。

(一)材料与方法部分

正文中，材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述，读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况，其目的是表明统计学方法应用的合理性和可靠性，他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术，要具备可比较性和科学性，

方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法，必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验，多组间计量资料的F检验，计数资料的卡方检验，不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法，要在这里简要说明并给出参考文献，还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号，如基于家系资料研究的版本。

(二)论文结果部分

论文结果部分要显示应用统计学方法得到的统计量[2]，所采用的统计学指标较多时，往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度，除了与测量仪器的精密程度有关外，还与样本本身的均数有关，所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数，百分比一般保留一个小数。在统计软件中，分析结果往往精确度比较高，一般要采用四舍五入的方法使其靠近实验的实际情况，否则还会降低论文的可信度和可读性。

结果部分的统计表采用统一的“三线”表，表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置，要求整齐美观，不能出现错行现象。要明确标注观察的例数，得到的检验统计量。统计图可以直观的表达研究结果，如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出，描述的是67%的置信区间，不是95%，提倡在误差条图采用95%的置信区间。

关于统计量，一般采用均数与标准差两个指标，均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比，分母的确定必须要符合逻辑，过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化，可以采用卡方检验。

1.假设检验的结果中，常见只写P值的情况，有时候会误导读者，也会隐藏计算失误的情况，因此写出具体的统计值，如F值、t值，可以增强可信度。对于率、相关系数、均数这类描述统计量，要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性，对于结果的计算要求具体的P值，如P=或P=。

2.在对论文进行讨论时，作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设，对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件，P值很小表明两组间没有差别的概率很小。当P<；，表明差异具有统计学意义。P值与观察的样本量的大小有关联，当样本量小的时候，数据之间的差别即使很大，P值也可能很大；当样本量大时，数据之间的差别即使很小，P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联，有统计学意义的样本相关系数可能很小。因此，有统计学差异的描述并不一定意味着两组间差别很大，错判的危险性很大，显著性的检验为定性的结果，结合统计量大小方可判断是否具有专业意义。

变量间虚假的相关关系与变量随时间变化而变化相关，统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的'研究方法的不同来考量。使用回归方程进行分析，当两变量间具有显著性关系，但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度，而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病，灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致，在疾病患病率很低时，出现假阳性也是正常的，要确诊疾病必须要与临床症状体征相结合。因此，这两个率的计算方法必须交待清楚。

三、医学论文统计学方法应用的常见错误分析

(一)“材料与方法”中的统计学方法应用的常见错误

“材料与方法”中统计学方法常见的问题主要为：对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如，临床入组病例分组只采用简单的随机分组，未描述随机分组的方法，未描述是否双盲双模拟，未设置空白对照组，分组后对性别、年龄、文化程度的描述未进行统计学检验，对于特殊的统计学方法没有详细交代；动物实验分组的随机化原则描述过于简单，没有具体说清完全随机、配对或分层随机分组等；统计分析方法没有任何说明采用的分析软件，有的只说明采用的分析软件而不交代在软件中采用的统计方法；没有说明原因的情况下出现样本量过于小等情况。

(二)“结果”统计学方法应用的常见错误

1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同；对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多；罕见疾病的发病率、患病率、现患率等指标没有选择好基数，导致结果没有整数位；相关系数、回归系数等指标保留的小数位数过多或者过少；常用的一些检验统计量，如F值、t值保留的位数不符合要求。

2.对统计学指标进行分析和计算时，一般采用计数资料和计量资料进行区分。计量资料常用三线表，在近似服从正态分布的前提下采用均数、标准差进行说明，如果不符合正态分布时，可以采用加对数或其他的处理方式使其近似正态分布，否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算，影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标，常见样本量过小的问题，采用率进行描述会影响统计结果的可靠性，采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率，也是不可取的。

3.在判断临床疗效之一指标时，两组平均疗效有差别并不意味着两组的每一个个体都有效或无效，必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效，服药一周后，研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率，研究组和对照组的有效率分别为和，尽管平均疗效相差较多，但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果，P 值的表达提倡报告精确P值，如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS，SPSS等，只要提供原始数据，就可以计算出t值、F值和相应的自由度，并可获得精确的P值。

四、小结

提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3]，医学论文中统计方法应用和统计结果的表达正确与否，不仅体现了论文的科学性和严谨性，而且对于提高期刊整体的学术质量，促进医学科学的发展和传播也有着重要作用[4]。

参考文献：

[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).

[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).

[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).

[4] 张春军,董凯.网络信息时代加强医学期刊编辑的信息素养[J].牡丹江医学院学报,2011(32).

医学论文中的统计指标

采用spss软件，单因素分组对照计算。

t值和P值都用来判断统计上是否显著的指标。在p值就是拒绝原假设的最小alpha值，把统计量写出来，带进去算出来之后，根据统计量的分布来算p值。P值是用来判定假设检验结果的一个参数，也可以根据不同的分布使用分布的拒绝域进行比较。由R·A·Fisher首先提出。Fisher的具体做法

假定某一参数的取值，选择一个检验统计量，在该统计量的分布在假定的参数取值为真时应该是完全已知的从研究总体中抽取一个随机样本计算检验统计量的值计算概率值或者说观测的显著水平即在假设为真时的前提下，检验统计量大于或等于实际观测值的概率。

描述统计，又称叙述统计，是统计学中，来描绘或总结观察量的基本情况的统计总称。其与推论统计相对应。1、研究者可以透过对数据资料的图像化处理，将资料摘要变为图表，以直观了解整体资料分布的情况。通常会使用的工具是频数分布表与图示法，如多边图、直方图、饼图、散点图等。2、研究者也可以透过分析数据资料，以了解各变量内的观察值集中与分散的情况。运用的工具有：集中量数，如平均数、中位数、众数、几何平均数、调和平均数。与变异量数，如全距、平均差、标准差、相对差、四分差。3、为了解个别观察值在整体中所占的位置，会需要将观察值转换为相对量数，如百分等级、标准分数、四分位数等。统计推断指统计学中，研究如何根据样本数据去推断总体数量特征的方法。它是在对样本数据进行描述的基础上，对统计总体的未知数量特征做出以概率形式表述的推断。更概括地说，是在一段有限的时间内，通过对一个随机过程的观察来进行推断的。在质量活动和管理实践中，人们关心的是特定产品的质量水平，如产品质量特性的平均值、不合格品率等。这些都需要从总体中抽取样本，通过对样本观察值分析来估计和推断，即根据样本来推断总体分布的未知参数，称为参数估计。参数估计有两种基本形式：点估计和区间估计。

统计描述是指运用统计指标如平均数、标准差、率以及统计表和统计图等，对数据的数量特征及其分布规律进行客观地描述和表达，不涉及样本推论总体的问题；统计推断是指在一定的可信程度或概率保证下，根据样本信息去推断总体特征。

医学论文统计指导

缺失值的处理：缺失值是人群研究中不可避免的问题，其处理方式的差异可能在不同程度上引入偏倚，因此，详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如，瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略，包括：将二分类结局中的缺失值视为未发生事件；将生物标志物和心电图测量中的缺失值进行多重填补（multiple imputation）；为了证明缺失值处理的合理性和填补结果的稳定性，研究还比较了多重填补与完整数据（complete-case）分析的结果。2、数据的预处理：实施统计分析之前往往需要将原始数据进行预处理，如：对连续变量进行函数转换使其更接近正态分布，基于原始数据构建衍生变量，将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据，瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述：确定统计分析使用的变量，并针对每一个变量的分布特征进行描述，是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求，但作者往往套用常用方法，如：连续变量符合正态分布时，采用均数（标准差）描述，否则采用中位数（四分位间距）描述；分类变量采用频数（百分比）描述等。事实上，应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如，CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征，而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析（primary analysis）：指针对研究结局的统计分析，是研究论文的核心证据。因此，医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中，应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。

科学研究很早就已经从简单的定性分析深入到细致的定量分析，科研工作者要面对大量的数据分析问题，科研数据的统计分析结果直接影响着论文的结果分析。在医学科研写作中，实验设计的方法直接决定了数据采取何种统计学方法，因为每种统计方法都要求数据满足一定的前提和假定，所以论文在实验设计的时候，就要考虑到以后将采取哪种数据统计方法更可靠。医学统计方法的错误千差万别，其中最主要的就是统计方法和实验设计不符，造成数据统计结果不可靠。下面，医刊汇编译列举一些常见的可以避免的问题和错误：打开百度APP，查看更多高清图片一、数据统计分析方法使用错误或不当。医学论文中，最常见的此类错误就是实验设计是多组研究，需要对数据使用方差分析的时候，而作者都采用了两样本的均数检验。二、统计方法阐述不清楚。在同一篇医学论文中，不同数据要采取不同统计处理方法，这就需要作者清楚地描述出每个统计值采用的是何种统计学方法，但在许多使用一种以上数据统计分析方法的医学论文中，作者往往只是简单地把论文采用的数据统计方法进行了整体罗列，并没有对每个数据结果分析分别交代具体的统计方法，这就很难让读者确认某一具体结果作者到底采用的是何种数据分析方法。三、统计表和统计图缺失或者重复。统计表或者统计图可以直观地让读者了解统计结果。一个好的统计表或统计图应该具有独立性，即作者即使不看文章内容，也可从统计表或统计图中推断出正确的实验结果。而一些医学论文只是简单地堆砌了大量的统计数字，缺乏直观的统计图或表；或者虽然也列出了统计表或统计图，但表或图内缺项很多，让读者难以从中提取太多有用的信息。另外，也有作者为了增加文章篇幅，同时列出统计表和统计图，造成不必要的浪费和重复。统计表的优点是详细，便于分析研究各类问题。统计图(尤其是条形统计图)的优点是能够直观反映变量的数量差异。医学论文中对数据统计结果的解释，最常见的两个错误就是过度信赖P值(结果可信程度的一个递减指标)和回避阴性结果。前一个错误的原因是因为一些作者对P值含义理解有误，把数据的统计学意义和研究的临床意义混淆。所以医学研究人员一定要注意不能单纯依靠统计值武断地得出一些结论，一定要把统计结果和临床实践结合在一起，这样才会避免出现类似的错误。至于回避阴性结果，只提供阳性结果，是因为不少作者在研究设计时，难以摆脱的一种单向的思维定式就是主观地先认定自己所预想的某种结果结论。在归纳某种结果原因时，从一个方向的实验就下完美的结论，尤其是如果这个结论可能对实际情形非常有意义时。这样的思维定势过于强调统计差异的显著性，有时会刻意回避报道差异的不显著结果，不思考和探究差异不显著的原因和意义，反而会因此忽视一些重大的科学发现。

秋风送爽，也给我们送来了刘岭教授的统计说说第五期。这一期的统计学方法之选择大家一定要认真学起来，说不定马上你就会用到了。编者语针对常用的基本统计学方法，一般而言说的就是t检验、单因素方差分析和卡方检验，这也是大家在写论文、阅读论文时经常遇到的统计学方法（几乎每篇文章都会涉及这一种或几种方法），那到底该采用何种统计学方法呢？今天我们就此来聊聊。一、拿到数据开始分析之前，一定要进行数据类型的划分（图1），因为不同数据类型资料，描述的方式不一样，统计学方法也不一样。图1 统计资料的类型举个例子（表1）：表1 某地2002年735例65岁以上老年人健康检查记录二、各种类型资料的统计分析（描述与统计推断）1.计量资料特点：每个观察单位的观察值之间有量的区别，有单位；描述形式：最常见采用“X±S”（一般文献中经常见到），用算数均数描述其平均水平，用标准差描述其离散程度。如果遇到数据“特别变态”（特别是标准差大于算数均数），就采用Md(P25,P75)（Md为中位数，P25和P75为四分位数）（表2）。正态分布检验请大家复习：医学科研课堂丨统计说说（三）：你所应该了解的正态、方差齐性检验表2 计量资料常用统计指标的特点及其应用场合统计推断方法：一般分为单因素和多因素两种。单因素分析方法分析要点：一是划清数据类型（计量资料）；二是明确试验设计类型（完全随机设计？几组样本？）；三是注意所用方法的应用条件；四是满足正态方差齐性时采用t检验（注意t检验有三种形式哦！）或单因素方差分析，不满足时采用秩和检验（图2）。图2 计量资料统计方法的正确选择提醒两点：① 如果样本数据不服从正态分布的话，那就只能用非参数检验（秩和检验），但其检验效能低于参数检验（t检验或方差分析）。所谓检验效能低就是本身有差异，却没有能力发现其差异。② 如果是两组以上样本的数据时，不能采用t检验（会导致假阳性错误概率增加），应该采用方差分析。若方差分析的P<，需再进一步两两比较，常用的方法为LSD法或SNK法（注意依旧不能采用t检验）。在上两讲内容中我们已经学过t检验（医学科研课堂丨统计说说（二）：你的t检验做对了吗？）和方差分析（医学科研课堂丨统计说说（四）：统计学方法之灵魂—方差分析）了，至于秩和检验，我们以后会逐步介绍滴。多因素分析一般采用回归分析，主要是线性回归分析，以后会给大家介绍此方法。2.计数资料特点：无序分类，同类别中各观察单位之间没有量的差别，但各类别间有质的不同，各类别互不相容。其中二分类一定是计数资料（例如性别只有男/女之分，是否继发某种疾病只有继发/未继发之分），而多分类满足分类在性质上没有程度等级上的差别，即为计数资料（例如婚姻状况包括未婚、已婚、离异、丧偶，就属于多分类，但各分类没有程度等级差别，因此为计数资料，尿糖定性检测结果包括-、+、++、+++、++++，属于具有程度等级差别的多分类资料，就不属于计数资料，属于等级资料了）。描述形式：最常见采用“例数（%）”（一般文献中经常见到），主要要分清构成比（结构相对数）和率（强度相对数）的差别（表3）。而且在应用时，分母（就是样本量啦）一般不宜过小，分母太小不足以反映数据的客观事实，也不稳定。表3 计数资料常用统计指标的特点及其应用场合比如说：1.某地肺癌患者中男性A例，女性B例，则当地肺癌患者的性别比为A/B就是“比”。2.某次研究共检出了致病菌3种，总株数为A+B+C，其中一种致病菌检出株数为A，那么A/（A+B+C）就是构成比，即该种致病菌占总致病菌的比重或分布。3.某研究对患者（总例数为B）进行治疗，结果治愈的患者例数为A，则A/B即为率（可以理解为治愈率）。统计推断方法：一般分为单因素和多因素两种。单因素分析方法分析要点：一是划清数据类型（计数资料）；二是明确试验设计类型（完全随机设计？几组样本？）；三是注意所用方法的应用条件；四是多样本率比较，若卡方检验的P<，需再进一步两两比较，并进行Bonferroni校正，以控制假阳性（图3）。图3 计数资料统计方法的正确选择提醒两点：① 构成比是以100作为基数，各构成部分所占的比重之和必须为100%，故某组成部分所占比重的增减必影响其它组成部分的比重；② 构成比和率在实际应用时容易混淆，主要区别在分母上，所以应正确选择分母。多因素分析一般采用回归分析，主要是Logistic回归分析，以后会给大家介绍此方法。3.等级资料特点：属于多分类资料，满足多分类在性质上有程度等级上的差别，各分类属性按一定顺序排列（有序），即为等级资料。描述形式：最常见采用“例数（%）”（一般文献中经常见到），这和计数资料的描述大体相同，主要区别在于多个分类排列时一定要按照顺序进行（从小到大或从弱到强）。统计推断方法：等级资料的统计分析方法在单因素分析中采用非参数检验（秩和检验），当然对于双向有序R×C资料，也就说分组变量和结局变量都是有序（等级）的情况，构成比的比较采用卡方检验，程度的比较采用秩和检验，趋势关联性的比较用秩相关（也称等级相关）。多因素分析中采用有序Logistic回归。注意：分类变量（计数资料和等级资料）在软件分析操作时，要适当数量化处理（赋值），赋值情况会直接影响统计分析结果的解释。最后用下面这张图来总结基本统计学方法的选择（图4）。图4 常用基本统计学方法的正确选择今天的内容就到这里，同学们多多复习，有什么问题和不懂的可以在下面留言，我们会请刘岭教授一一解答。好了，让我们期待下一期吧！撰稿：刘岭约稿编辑：刘芹排版：毕丽审核：王东专家简介刘岭：陆军军医大学卫生统计学教研室副教授，主要从事卫生统计学教学、科研工作。担任中华卫生信息学会第八届统计理论与方法专业委员会委员，重庆市预防医学卫生统计专业委员会副主任委员，并担任《第三军医大学学报》等多家杂志的编委、统计审稿专家。历史推荐医学科研课堂丨统计说说（四）：统计学方法之灵魂—方差分析医学科研课堂丨统计说说（三）：你所应该了解的正态、方差齐性检验医学科研课堂丨统计说说（二）：你的t检验做对了吗？医学科研课堂丨统计说说（一）：样本量估算是个什么东东？

医学论文统计学分析的知识你可以登陆：创新医学网创新医学网上有医学论文统计学分析视频、医学论文写作辅导范文、医学论文写作视频、医学论文写作电子书等等，统计学分析的所有信息创新医学网上有很多资料，都是可以查看的。卫生统计在医学期刊中占有非常重要的地位。任何科研设计、实验研究都离不开统计方法，而统计方法的正确与否直接影响到论文的质量。我们在编审稿件过程中，经常遇到统计学方法使用不当等问题。数理统计的基础是概率论，对统计分析的资料下结论的依据是小概率事件在一次试验中是不可能发生的。一般统计上习惯把概率P≤或P≤认为是小概率事件[1]。当通过假设检验（显著性检验）获得P>时，认为是大概率事件,说明在这一次试验中很可能发生，因此接受假设，认为差异无显著意义（差异不显著）。

医学论文统计图标注

在“南海季风指数”后，打上[]，根据参考文献的出现顺序标上即可。如果参考文献陈瑞闪.台风[M].福州.福建科学技术出版社，2002：149-163”，出现在第一，[]括号里就标1即可。

参考文献和注释按论文中所引用文献或注释编号的顺序列在论文正文之后，参考文献之前。图表或数据必须注明来源和出处。

参考文献是期刊时，书写格式为：[编号]、作者、文章题目、期刊名（外文可缩写）、年份、卷号、期数、页码。

参考文献是图书时，书写格式为：[编号]、作者、书名、出版单位、年份、版次、页码。

扩展资料：

以毕业论文为例，论文正文版面格式：

①正文部分与“关键词”行间空两行；

②汉语正文文字采用小四号宋体；正文英语正文文字采用Times New Roman12号，标题汉语采用四号黑体，标题英语采用Times New Roman14号，每段首起空两格，倍行距；

③段落间层次要分明，题号使用要规范。理工类专业毕业设计，可以结合实际情况确定具体的序号与层次要求；

④文字要求：文字通顺，语言流畅，无错别字，无违反政治上的原则问题与言论，要采用计算机打印文稿，统一采用A4纸张；

⑤图表要求：所有图表、线路图、流程图、程序框图、示意图等不准用徒手图，必须按国家规定的工作要求采用计算机或手工绘图，图表中的文字汉语用小五号宋体。

参考资料来源：百度百科-论文格式

将别人的图标原样呈现，然后按引文注释的方式标注，最好是使用国标GB7714标准标注。

医学论文统计指导要点

缺失值的处理：缺失值是人群研究中不可避免的问题，其处理方式的差异可能在不同程度上引入偏倚，因此，详细报告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。例如，瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略，包括：将二分类结局中的缺失值视为未发生事件；将生物标志物和心电图测量中的缺失值进行多重填补（multiple imputation）；为了证明缺失值处理的合理性和填补结果的稳定性，研究还比较了多重填补与完整数据（complete-case）分析的结果。2、数据的预处理：实施统计分析之前往往需要将原始数据进行预处理，如：对连续变量进行函数转换使其更接近正态分布，基于原始数据构建衍生变量，将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应报告处理原始数据的方法及依据，瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。3、变量分布特征描述：确定统计分析使用的变量，并针对每一个变量的分布特征进行描述，是决定研究选用何种统计分析方法的基础。医学期刊虽然普遍对此提出要求，但作者往往套用常用方法，如：连续变量符合正态分布时，采用均数（标准差）描述，否则采用中位数（四分位间距）描述；分类变量采用频数（百分比）描述等。事实上，应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如，CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征，而非简单的报告连续变量的均数和分类变量的构成比。4、主要分析（primary analysis）：指针对研究结局的统计分析，是研究论文的核心证据。因此，医学论文应详细描述主要分析的实施过程和适用性。在试验性研究中，应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。

医学统计论文

医学统计是研究如何搜集、整理和分析医学研究对象的数据和作出推断的一门学科，下面是我为大家收集整理的是医学统计论文，仅供参考。

摘要：不同的统计分析方法均有其适用的范围和应用的条件，研究者在书写医学论文时应根据论文设计及资料的类型进行合理的试验设计，选择恰当的统计分析方法，切记勿盲目套用。同时，还应注意得出的结果和结论应满足设计的要求。医学统计方法的正确运用，是充分利用试验研究获得的数据，也是最终得出科学、可信的结论的必要条件。

关键词：医学统计；方法；运用；原理；选择

一、统计学方法简介

统计学方法包括统计软件包、统计分析方法以及检验水准三方面的内容。其中医学论文中常提到检验水准即α，它是用来表示组间实际无差别而统计结果判断有差别，犯这类错误的概率。实际工作中常取α=，当研究数据计算的P值小于时，组间差异比较被认为有统计学意义。统计学方法包括统计描述和假设检验两个方面的内容。统计描述是指根据资料及原始数据分布的类型，选择正确的指标来描叙资料及数据的特征。而假设检验即组间差异性检验，是医学论文中最常用的统计学方法。资料类型则包括能用具体数据表示的定量资料与不能用具体数值表示但能反映被观察对象某一特征的定性资料。定性资料的统计描述包括率、相对比和构成比。而参数法及非参数法是常用的定量资料统计分析方法。参数法一般包括t检验、方差分析，非参数法常用的有秩和检验。

二、试验设计中的统计学原理

合理的试验设计与统计处理的可信度存在直接联系，研究者在编写医学论文时应对医学研究设计方法进行说明。在进行试验设计时应遵循随机、对照、均衡和重复四大原则。在进行试验设计的时候通常会涉及到研究对象的选择，研究对象的分组及选择合理的检测指标三个方面的内容。

医学论文就是通过对样本的研究来进行推断总体，找出其共性，得出结论。因此研究者在选择研究对象时应注意选择样本应具有一定数量，能反映出该事物的规律性特征，但又应注意例数不能太多，以免造成不必要的浪费。其选择的原则就是在保证试验结果可靠性的前提下选择最少的样本例数。研究者在选择样本对象后应对其基本特征进行详细的描述，比如患者的年龄、性别、病理分期、疾病诊断的标准等。此外在试验中所用到的试剂、仪器的型号、规格等都应作出说明，以供读者借鉴和做出判断。选定好研究对象后就要对其进行分组。在进行分组时研究者一般遵循统计学中的“随机分配”、“设立对照”以及“均衡”、“重复”的原则。随机化原则是提高组间均衡性的一个重要手段，也是资料分析时进行统计推断的前提。有对照才有比较，在进行组间比较时，应确定好处理因素与实验效应的关系。均衡性则是要使得对结果产生影响的非处理因素尽可能保持一致，这样才能保证对照的结果让人信服。观察实验效应的.指标主要有主观指标与客观指标。正所谓主观指标就是通过问答的方式调查受试者自己判断的主观感受；而客观指标则是通过仪器来检验和测量所得出的结果。在进行试验设计时应选择客观性较强、高灵敏性和精确性的指标。

三、统计学方法的选择

统计学方法的正确选择是直接影响到论文结论可信度的重要依据，因此研究者在编写论文时应注意选择合适的统计学方法。不同的统计学方法应用的范围不同。研究者在编写医学论文时常根据论文研究的目的、资料类型、试验设计的方案、样品大小、水平数、特定条件、数据分布特征以及综合分析等来选择对应的统计方法，同时还要根据专业知识与资料的实际情况，结合统计学原则，灵活地选择。当定性资料正态分布时，研究者一般用均数和标准差来表示统计描述指标；当定性资料不符合正态分布时，则可选用中位数及级差来表示；当定量资料正态分布且组间方差齐时一般选用参数法，反之则选用非参数法。t检验一般适用于小样本（n<50）的定量资料且方差齐的两组数据之间的比较。其特点是在均方差不知道的情况下，可以检验样本平均数的显著性，大样本（n≥50）采用u检验；多个样本均数两两比较则用方差分析，如差异有统计学意义，可采用q检验；Dunnett检验则适用于多个实验组与一个对照组均数的比较。定性资料中，表现为互不相容的类别或属性，分为二分类和多类反应，如治疗结果为显著和好转的人数等，该种资料可选用字检验，大样本（n≥50）时采用u检验。如：患者的治疗结果评定为痊愈、显著有效、好转、无效或死亡。该种资料可选用秩和检验或u检验。总之，不论论文中选用的是哪种统计学方法，都要计算出检验值，然后再根据统计量值来判定P值的大小，结论一般描述为“差异有（无）统计学意义”。

四、常见统计学方法的误用分析及对策

1.统计方法误用。最常见统计方法误用是对等级资料进行比较时应用秩和检验而误用卡方检验。例如：在评价采取不同治疗方法的两组急性脑血管病患者疗效中，治疗组显著有效、有效、无效三种分型分别为15例、10例、8例，对照组分别为14例、11例、9例。本资料例数较少，应选用等级比较的秩和检验，而有些作者却认为只要是率的比较就可以采用字检验。研究者在选择统计学方法时应根据相应的原则，对文章研究目的、资料类型、样品大小、水平数、数据分布特征等进行综合分析后，再来选择对应的统计方法。

2.选用检验方法错误。在有些论文中，作者常将本应用方差分析和q检验的误用t检验。t检验一般适用于小样本（n<50）定量资料且方差齐的两组数据之间的比较，而方差分析及q检验主要用于对多个样本均数进行比较，几种不同治疗或处理方法等的同时比较。例如：在讨论中、西以及中西医结合治疗急性脑血管病时，两组患者的年龄、病程、病情严重程度等差别均无统计学意义，比较三组患者的一些指标变化。组间多重比较应用q检验，但文中作者采用的是t检验，对三组均数进行两两比较。这不仅造成了资料的利用率低，也增加了假阳性的概率，降低了试验结果的可信度。

五、结论表述中的统计学应用

资料的统计处理不是医学研究工作的最终目的，而是通过统计学分析为研究结论提供依据或者线索。因此，在对统计资料进行分析后应把握统计学术语，对结论做出科学的分析跟解释。在根据统计结果得出专业结论时研究者应遵循一个重要原则，就是统计结论都是概率性的，不能绝对地肯定或否定。研究者习惯上将“P<”称为显著性，不应误解为差别很大或者在医学上有显著的价值。统计推断是以一定的概率界值为依据，说明来自同一总体的可能性大小。“差异有统计学意义”说明在试验中的差异不能用抽象误差进行解释；“差异无统计学意义”表明在试验既定的条件下，差异可能是因抽象误差引起的，在增加样本数量的情况下，差异可能变成“有统计学意义”。

参考文献：

[1]医学统计工作的基本内容[J].国际检验医学杂志，2013（19）：2563.

[2]关红阳，郭轶男.医学统计t检验的分析研究[J].中国校外教育，2013（30）：114.

哇要注意这么多啊做医生也不容易啊

1 设计方面的问题

11 分组没有严格遵循随机化原则研究对象的分组与抽样离不开随机化原则，在足够样本的前提下，随机抽样，随机分组，明确交代随机方法，各组样本量、基本特征等。随机不等于随便，有的作者滥用随机，只要抽样或分组，一概冠以随机，不描述随机方法，把随意、随便当做随机，使研究结果不可信。

12 无对照组或不合理医务科技工作者开展研究的目的就是验证假设是否正确，没有对照，无法做出判断。有的论文无对照组，没有对比观察，所得结论没有说服力。有的论文虽设有对照组，但不是严格的随机分组，组间缺乏可比性，如非同期对照，组间性别、年龄、患病状况不一致等。在实验组和对照组的可比性方面，两组例数要基本一致，否则没有可比性。

13 样本含量过少抽取恰当的样本量，结果才有可靠性。有些文章例数太少，这样抽样误差大，导致结果不可靠。研究对象变量标准差小的，样本可以小一些。观察计数指标的样本一般不少于20～30例，计量指标的样本不少于5～10例。有的作者仅仅观察了数例患者，就得出百分之多少的有效率，显然是不恰当的。

对于对比分析，样本太少得出的结果不可靠，往往随着样本量的增大而发生变化。

2 统计学处理不恰当在进行统计学处理时，首先要明白研究资料是计数资料还是计量资料，尽管是一个常识性的问题，但仍有不少作者搞混了。先分类再计数的资料叫计数资料，如A组30例，B组32例，可根据研究目的计算出阳性率、治愈率等。测定某项具体数值的资料叫计量资料，如身高、体重、脉搏、血压等许多物理诊断和化验结果。在医学科研论文中，计数资料最常用的统计学方法是检验，计量资料最常用的是t检验。在研究设计时，就应根据研究资料的特点，决定假设检验的方法。在处理资料时，因均数和标准差是用来描述正态分布资料集中和离散趋势的指标，可否采用均数±标准差描述研究资料的分布特征，首先要看资料是否是正态分布，如果资料不是正态分布或者方差不齐时，应对资料进行转换处理，使其符合正态分布，方差齐性后采用t检验或方差分析，达不到上述要求，用秩和检验。来稿中，不少作者不考虑适用条件，盲目使用t检验。造成统计学方法使用不当，结果不可靠。更有甚者，有的作者不分计数资料还是计量资料，乱用检验或t检验，其结果可想而知。这是无统计学常识或极不负责任的表现。

有的研究资料数据庞大，只能在表格描述中用阿拉伯数字或特殊符号表示与比较对象的P值，如 P>005 ， P<005， P<001，无法一一给出具体的P值。但有的作者既不交代使用的统计学方法，也不给出具体的P值，直接列出 P<005或 P>005，认为差异有统计学意义或无统计学意义，使读者对无法判断结果的可靠性。正确的做法是写明使用的统计学方法，使用了什么统计学软件，如进行了校正检验。亦应说明。这才有说服力。

3 描述不严谨日常生活中对差异的判断与统计学上差异是否有统计学意义是两个完全不同的概念。我们主观上感觉差异不大，而经统计学处理差异可能具有统计学意义;主观上感觉差别很大，但经统计学处理差异可能有统计学意义。有相当数量的作者，在描述统计学结果时，常用差异显着或差异非常显着，易与日常生活中差异的概念混淆，使用差异有统计学意义或差异无统计学意义更为确切。

我们把检验水准设定为 a=005时就是以 P>005为界值，一般以 P>005， P<005， P<0O1 3个档次描述差异有无统计学意义即可，有的作者出现 P<0001，以强调差异的显着性。有的作者用 P>O01或 P<01来表示，是错误的， P>0O1既可能是 P>005，也可能是 P<005，二者有本质的不同。

4 统计符号使用不规范统计符号使用不规范是论文中经常出现的问题，把卡方检验中的写成x或x2，丢掉平方或把希腊字母x写成英文字母x;把均数±标准差( ±s)，丢掉z 上方的一横，既影响论文质量，又影响阅读效果。

5 统计表格不规范统计表格是论文的重要组成部分，表格是否符合统计学要求，对论文有重要影响。常见的问题有：

① 无表题;

② 表题过于简单或过于繁琐。不确切;

③ 横纵标目倒置，不符合语法规律;

④ 标目层次过多;

⑤ 线条太多。甚至左上角有斜线;

⑥ 表内同一栏目数字不对齐，小数点后位数不一致。

表题如同文章的题目，简明扼要，字数控制在15个字以内。表格左侧的标目叫横标目，相当于汉语的主语，表明相应横行内数字的涵义;纵标目位于表格的上方，相当于汉语的谓语部分，说明表格内相应纵行数字的'涵义。

主谓语倒置是统计表格最常见的错误，一般情况下主语做横标目，谓语做纵标目。统计表用三线表，即顶线、底线和隔开纵标目与表内数字的横线，必要时可在纵标目下加辅助线，其余线条一概省略。

统计表格和文字叙述相辅相成，互相补充，能用简洁的文字说明的，一般不用表格，文字描述不要和表格内容完全重复。表格要简洁明快，重点突出，让人一目了然，不要变成数字的堆彻。出现统计表前，要用简要文字描述或强调主要发现，不要把文字叙述放在表格后。

6 使用统计指标不当常见的问题是率与构成比、发病率与患病率、死亡率与病死率等的混淆。

61 把构成比当率构成比是说明事物或现象内部各构成部分的比重，构成比表示某事物内部各组成部分的比重或分布，单位为%，各组成部分之和应为100%。计算公式为：构成比=某组成部分的观察单位数/同一事物各组成的观察单位总数例如2011年某市围产儿死亡总数为18例，其中死胎7例、死产3例、新生儿死亡8例。其构成比分另0为3889%、1667%、4444%。

率为表示某种现象发生的频率或强度。常以%、/万或/lo万表示。计算公式为率=某时期内某现象实际观察单位数/同时期内可能发生该现象的观察单位总数，如共检测568名5～7岁儿童，患龋齿儿童314人，检出率5528%。

构成比和率都是相对数指标。有一篇题为某年某地区4种乙类传染病疫情分析。经数据处理后，作者认为，4种传染病的发病率依次为痢疾5453%(1546/2 835)、肝炎1619%(459/2 835)、乙脑921%(261/2 835)、流脑689% (569/28352007)。该资料是构成比，不是发病率。作者犯了以比代率的错误。

62 发病率与患病率发病率是指观察期内(年、季、月等)新发生某病的例数与同期平均人口数之比，强调在观察期内的新发病例数，常以‰、/7/或/lO万表示。其计算公式为：某病发病率等于某年(期)内所发生的新病例数除以同年(期)平均人口数乘1000%o。例如某地某年年平均人口数为2500人，白喉发病28人，该地白喉年发病率为1120%0。而患病率则指观察时点的某病的现患病例数与该时点人口数之比强调的是该观察时点上某病的现患(新、旧病例)情况，常以百分率表示。有人调查16 875人，其中男性8 674人，沙眼患者7 632人，发病率为8799%;女性8 201人，沙眼患者6 210人。发病率为7572%。这样的结论当然是错误的，其所描述的结果应该是患病率。

63 死亡率与病死率这也是两个容易混淆的指标。某病死亡率是观察人群中某病的死亡频率。常以‰、/万或/10万表示;某病病死率是某病患者中因该病而死亡的频率。

一般以百分率表示。前者反映人群因该病而死亡的频率，后者反映疾病的预后。部分作者常将某病住院病死率误为某病死亡率。如重症监护室患者死亡情况分析一文中报道，颅脑损伤32例，死亡20例，死亡率为625%;严重心衰26例，死亡9例，死亡率为346%;严重肾衰竭18例，死亡11例，死亡率为611%。很明显，作者在这里是将住院病死率误作死亡率来讨论。

我们在编辑医学论文中经常会发现存在这样那样的统计学问题，致使文章质量下降，甚至无法刊用，十分可惜。提高统计学应用水平，减少统计学差错，是作者、审稿专家和编辑共同的责任。树立严谨的科学态度，选择正确的统计学方法，对提高科研水平，确保论文质量有着十分重要的意义。

医学论文

统计指标医学论文