流行病学统计学论文数据分析

流行病学研究方法按照设计类型分为观察法、实验法和数理法三大类。(1)观察法中又有描述性研究和分析性研究2种设计类型，其中描述性研究主要是描述人群中疾病与健康状况的分布，揭示流行或分布的现象，提供病因线索，提出病因假设，它包括个案报告、现况调查、疾病监测、生态学研究等。分析性研究主要是研究影响分布的因素。检验病因假设，它主要包括病例对照研究和队列研究。(2)实验法主要是研究评价疾病防治干预措施的效果，可确证病因假设，它可分临床试验和现场试验，后者包括个体试验与群体试验。(3)数理法主要是通过对分布及其影响因素的研究，建立数学模型来预测疾病流行趋势、描述疾病流行规律、考核疾病防治效果。

去知网找，那里肯定有你要的论文，自己可以先搜搜看，不知道怎样找的话，可以去我百度空间里，有如何在网络上找论文的文章介绍

医学论文统计学分析的知识你可以登陆：创新医学网创新医学网上有医学论文统计学分析视频、医学论文写作辅导范文、医学论文写作视频、医学论文写作电子书等等，统计学分析的所有信息创新医学网上有很多资料，都是可以查看的。卫生统计在医学期刊中占有非常重要的地位。任何科研设计、实验研究都离不开统计方法，而统计方法的正确与否直接影响到论文的质量。我们在编审稿件过程中，经常遇到统计学方法使用不当等问题。数理统计的基础是概率论，对统计分析的资料下结论的依据是小概率事件在一次试验中是不可能发生的。一般统计上习惯把概率P≤或P≤认为是小概率事件[1]。当通过假设检验（显著性检验）获得P>时，认为是大概率事件,说明在这一次试验中很可能发生，因此接受假设，认为差异无显著意义（差异不显著）。

具体的统计学分析方法，我在网上看到过这方面的视频，是赵清波教授讲的，您可以去创新医学网上找他的视频。她从编辑、审稿的角度介绍避免此类错误的技巧,为医学论文的编审工作提供借鉴。

流行病学论文数据分析

流行病学与统计医学统计学：根据统计学的原理和方法，研究医学数据收集、表达和分析的一门应用各学科。医学统计的主要内容：研究对象：医学数据统计设计：调查设计和实验设计统计描述：率、均数统计推断：对统计指标的差别和关联性进行分析和推断医学统计资料的类型统计工作的基本步骤包括： 1. 研究设计 2. 收集资料：来源：经常性资料【医疗卫生工作记录（病历、医学检查记录、出生死亡报表等）健康检查记录】；一时性资料【专题调查或实验研究】。要求：完整、正确和及时；足够数量；代表性和可比性 3. 整理资料：原始数据的检查与核对：常规检查；取值范围检错；逻辑检错数据的分组设计和归纳汇总。4. 分析资料：统计描述；统计推断（区间估计、假设检验）统计工作的基本步骤包括： A ．实验和调查 B．统计设计 C．收集资料 D．整理资料 E．分析资料统计工作中，分析资料指的是： A ．统计设计 B．收集资料 C．整理资料 D．统计描述 E．统计推断总体：根据研究目的而确定的同质观察单位的全体。有限总体和无限总体。样本：是从总体中随机抽取有代表性的部分观察单位变量值的集合。参数：指总体指标。如总体均数μ，总体标准差σ，总体率π。统计量：指样本指标。如样本均数，样本标准差S ，样本率p 。误差：指实际值与真实值之差。分为随机误差（随机测量误差和抽样误差）、非随机误差（主要是系统误差）概率是对总体而言。是某随机事件发生的可能性大小的数值，常用符号P 表示。取值范围0~1。在统计学中，误差的种类有 A ．标准误差 B．计算误差 C ．系统误差√ D ．随机测量误差√ E ．抽样误差√ 统计学上的误差主要有 A. 系统误差 B.标准误差 C.随机测量误差 D.抽样误差 E.计算错误误差算术均数：简称均数，用于描述对称分布或近似正态分布的资料。描述正态分布资料集中趋势的指标是 A. 百分位数 B.中位数 C.算术均数 D.几何均数描述正态分布资料集中趋势的指标是 A. 中位数 B.几何均数 C.算术平均数 D.标准差有9名健康成人的空腹胆固醇测定值（mmol/L）为，，，，，，，，。求算术均数。有7份血清的抗体效价分别为1:2, 1:4, 1:8, 1:16, 1:32, 1:64, 1:128，求平均抗体效价。 n 5. 61+3. 96+3. 67+4. 99+4. 24+5. 06+5. 20+4. 79+5. 93＝ 9 43. 45＝ 9 ＝4. 83(m m ol /L ) X = G ＝lg -1( 血清抗体平均效价为1:16 注意：变量值中不能有0；不能同时出现负数和正数；若全为负数，计算时先把符号去掉计算中位数(median, M)：可用于任何分布的计量资料有7名正常人的血压（舒张压）测定值（mmHg ）为：72，75，76，77，81，82，86，87求中位数。 M ＝(77＋81)/2=79 一组从小到大排列的定量变量，位次居中的指标是 A ．算术均数 B.几何均数 C．中位数 D.百分位数描述离散趋势的指标是 A. 标准差 B.中位数 C. 几何均数 D.算术均数 n lg 2+lg 4+lg 8+lg 16+lg 32+lg 64+lg 128 ＝lg -1() 7 ＝lg -1(1. 204) ＝16 lg X ) 方差（variance ）与标准差（standard deviation）：表示数据的平均离散情况，常用于描述服从正态分布的资料的离散程度。某地20岁男子160人某地不同年龄女童身高（cm ）的变异程度统计表的基本结构与要求：标题、标目、线条、数字4部分组成。表中数字区不插入文字，不列备注项。必须说明者表“*”号等，在表下方说明。统计表的基本结构为 A ．标题、横标目、纵标目、线条 B．标题、横标目、纵标目、数字 C ．标题、横标目、纵标目、备注 D．标题、标目、线条、数字统计表的基本构成有 A ．标题 B．横标目 C．纵标目 D ．线条 E．数字统计表内不列的项是 A. 标目 B. 线条 C.数字 D.备注制图的基本要求（1）根据资料的性质和分析目的，选择合适的图形。（2）基本结构：标题、标目、刻度、图例4部分组成。标题：一般放在图的下方，左侧加图号标目：分为横标目和纵标目，分别表示横轴和纵轴数字刻度的意义刻度：图例：说明统计图中各种图形锁代表的事物。放在右上角或下方中间比较两家医院15年床位数的增加速度，可选用的统计图是 A ．构成图 B ．直条图 C ．线图 D ．直方图某医院拟表示一年中各月病床使用率的变化趋势，应选用的统计图是 A ．普通线图 B ．直条图 C ．散点图 D ．直方图比较某地2001年和2011年结核、心脏病和肿瘤的死亡率，可选择的统计图是 A. 单式条图 B.复式条图 C.普通线图 D.半对数线图分析某医院1998年住院病人5种疾病构成比可选用的统计图是 A. 单式直条图 B. 复式直条图 C.圆图 D. 线图分析某医院1998年和2008年住院病人5种疾病构成比可选用的统计图是 A ．单式直条图 B．复式直条图 C．百分比条图 D．统计地图观察某地十年肺结核患病率的变化趋势，可选择的统计图是 A. 条图 B.圆图 C.线图 D.直方图比较某地2001年和2011年结核、心脏病和肿瘤的死亡率，可选择的统计图是 A. 单式条图 B.复式条图 C.普通线图 D.半对数线图假设检验的基本步骤 1. 建立假设检验，确定检验水准（1）根据统计推断目的提出对总体特征的假设无效假设，或称为零假设，记作H0，即假设差异是由于抽样误差所致，总体参数相同备择假设，记作H1，即差别不是由于抽样误差所致，总体参数不同（2）确定检验水准亦称显著性水准，用α表示 2. 选定检验方法，计算检验统计量（卡方、t 值、F 值） 3. 确定P 值，做出统计推断结论注意：假设检验是针对总体而言的假设检验的注意事项 1.. 检验方法的正确选择定量资料两个独立样本均数比较：t 检验多个独立样本均数比较：方差分析配对设计：配对t 检验随机区组资料：随机区组设计方差分析 2. 结果的解释：差别有统计学意义与有无实际意义的关系 I 型错误（第一类错误）：指拒绝了实际上是成立的H0。用α表示。 II 型错误（第二类错误）：指不拒绝实际上是不成立的H0。用β表示。 1. 流行病学研究的对象是（） A.病人 B.健康人 C.人群 D.亚健康人 E.亚临床的人下列哪一项是分析流行病学方法（） A.横断面研究 B.生态学研究 C.疾病监测 D.病例对照研究 E.社区干预试验有学者通过调查肺癌病人和非肺癌的人过去的吸烟情况，来研究吸烟和肺癌的关系。这种方法称为： A.现况调查 B.描述性研究 C.筛检试验 D.病例对照研究 E.队列研究有学者对某人群进行了高血压的调查，获得了该人群高血压的患病率，并对不同年龄组的高血压患病情况进行了分析。这种调查研究属于： A.探讨疾病的病因 B.探讨发病机制 C.描述疾病的分布 D.研究疾病自然史 E.疾病筛检计算患病率的分子是（） A ．观察期间某病的新发病例数 B．观察期间某病的新旧病例数 C ．观察期间之后某病的患病人数 D．观察期间某病的暴露人口数 E ．观察期间所有人口数某地区在1个月内进行了糖尿病的普查，可计算当地糖尿病的（） A ．发病率 B．死亡率 C．患病率 D．二代发病率 E．罹患率下面哪一个公式用于计算发病率（E ） A ．（受检者中阳性人数/受检人数）×100% B．（受检者中阳性人数/同期暴露人数）×100% C ．（受检者中阳性人数/受检者人数）×100% D．（受检者中阴性人数/受检者人数）×100% E．（某一时期内新病例数/同期暴露人数）×100% 一个地区通过首次高血压普查，可计算当地的（） A ．高血压患病率 B．高血压罹患率 C．高血压发病率 D．高血压病死率 E．家庭续发率某地区1960年度疫情资料统计，狂犬病患者100人全部死亡，此资料可计算 A ．粗死亡率 B．死亡专率C ．标化死亡率 D．病死率 E．此资料不全难以计算下列叙述中，不属于病例对照研究优点的是（） A ．资料收集后可在短时间内得到结果 B．特别适用于罕见病的研究 C ．一次调查可同时研究一种疾病与多个因素的关系 D．可直接获得发病率资料 E ．所需研究对象的数量相对较少病例对照研究中的调查对象是（） A ．病例组是怀疑患有欲研究疾病的病人，对照组是未患该病的人 B ．病例组是具有某种暴露的人，对照组是未有该暴露的人 C ．病例组是确诊患有欲研究疾病的病人，对照组是未患该病的人 D ．病例组和对照组均是具有某种暴露的人 E．病例组是确诊患有欲研究疾病的病人，对照组是怀疑患有该病的在病例对照研究中，若病例组某危险因素暴露史的比例在统计学上明显高于对照组，则表明( D ) A ．该因素与疾病有统计学关联 B．该因素与疾病有因果关联 C ．该因素是疾病的病因 D．该因素与疾病无关联 E．该病由该因素引起下列关于病例对照研究特点的说法中，正确的为( C ) A ．暴露与疾病都是现在的情况 B．能够确证因素与疾病的因果关联 C ．由因及果的研究 D．需要随机分组 E．属于观察法 OR 主要应用于( A ) A ．现况研究 B．生态学研究 C．现场试验 D．病例对照研究 E．队列研究属于病例对照研究缺点的是( E ) A ．不能分析疾病与多种因素的关联 B．不能估计RR C．样本含量要求很大 D ．容易产生医德问题 E．回忆信息时，易出现错误下列说法中，不属于队列研究特点的是（ B ） A ．由因及果，前瞻性研究 B．属于描述性研究 C．能同时研究一种因素与多种疾病的关系 D ．需要设立对照组 E．因果关联的说服力大于病例对照研究队列研究中的研究对象为（ C ） A ．在一般人群中选取有、无某暴露因素的两个组 B．在患有某病者中选择有、无某暴露因素的两个组 C ．在未患该病人群中选择有、无某暴露因素的两个组 D．患有某种疾病的人群随机分成的两组 E ．一组患有某种疾病者，一组为未患有该种疾病者在队列研究中，暴露组的疾病发病率与对照组的疾病发病率的差值称为 ( A ) A ． AR B． RR C．OR D．PAR E． AR% 队列研究属于( B ) A ．相关性研究 B．分析性研究 C．描述性研究 D．理论性研究 E．实验性研究在队列研究中，估计某因素与某疾病关联强度的指标为( E ) A ．总人群中该病的发病率 B．暴露人群中该病的发病率 C ．人群中危险因素的暴露率 D．OR E． RR 在队列研究中，研究对象的分组原则是按( A ) A ．是否暴露于某因素分组 B．随机分组 C．是否患病分组 D．人为随意分组 E．领导意图分组属于实验流行病学特征的是（E ） A ．由果及因，回顾性研究 B．属于观察法 C．获得因素与疾病联系强度的指标主要为比值比 D ．不能确证因果关联 E．人为施加干预措施关于临床试验中的对照组，正确的说法为( B ) A ．是人群中的非患欲研究疾病者 B．是患欲研究疾病者，但在处理上不同于实验组 C ．不具有某种暴露因素的人 D．与患欲研究疾病者同时入院的其它患者 E．所欲研究疾病的轻型患者多选题：下列所述中属于抽样调查优点的有（ A C D ） A ．工作量小 B．工作量大 C．省时间和人力、物力 D．工作易做到细致 E ．特别适用于患病率很低的疾病调查属于队列研究缺点的为（ A C D ） A ．观察时间长，花费大 B．易出现回忆偏倚 C．不宜用于研究发病率很低的疾病 D ．设计的要求高，实施复杂 E．不能计算发病率、死亡率等属于实验流行病学方法的有（ A/C ） A ．临床试验 B．普查 C．社区试验 D．队列研究 E．个体试验反映诊断试验可靠性的指标是（ E） A ．灵敏度 B．特异度 C．约登指数 D．阳性似然比 E．符合率为提高诊断试验的灵敏度, 对几个独立试验可（B ） A ．串联使用 B．并联使用 C．先串联后并联使用 D ．要求每个试验假阳性率低 E．要求每个试验特异度低某病早期治疗效果好，漏诊后果严重，对此病的试验诊断应（A ） A ．提高灵敏度 B．提高特异度 C．降低诊断的截断值 D．提高阳性预测值 E．提高阴性预测值诊断试验的真实性是指（A ） A ．被试验的测定值与实际值的符合程度 B．是重复试验获得相同结果的稳定程度 C ．是观察者对测量结果判断的一致程度 D．是试验结果表明有无疾病的概率 E．指病例被试验判为阳性的百分比流行病学是研究疾病、健康状态和事件在人群中的分布、影响和决定因素，用以预防科控制疾病、促进健康的学科。流行病学研究的方法：观察性研究实验性研究理论性研究观察性研究: 描述性研究 (横断面研究（现况调查）比例死亡比研究生态学研究) 、分析性研究（病例对照研究队列研究（随访研究））实验性研究：临床实验、现场试验、社区干预试验和整群随机试验理论性研究：流行病学方法研究理论流行病学比例：是表示同意事物局部与总体之间数量上的比值，分子和分母的单位相同，且分子包含于分母之中。（构成比）某医院住院病人中有15％的胃癌患者，该15％是： A. 患病率 B.发病率 C.构成比 D.相对比例：某病患者409人，其中男性170人，女性239人，男女性构成比见右侧表所示。具体计算：表 409名患者性别构成男性患者数男性构成比=⨯100% 男女性患者总数170 =⨯100%= 170+239 构成比的特点是各组成部分的构成比之和为100% 例如，某年某地出生婴儿中，男性婴儿有185人，女性婴儿有176人，则：出生婴儿性别比= 男性婴儿数女性婴儿数 = 185176 = ．比或相对比：是两个相关指标之比，说明两指标间的比例关系。两个指标可以是性质相同，如不同时期发病数之比；也可以性质不同，如医院的门诊人次与病床数之比。常用倍数或百分数表示。两指标可以是绝对数、相对数或平均数。相对比= 甲指标 ⨯100%）乙指标 3．率：表示一定时间内，实际发生某现象的例数与可能发生该现象的总例数之比，用以说明某现象发生的频率或强度，常用百分率（%）、千分率（‰）、万分率（1/万）或十万分率（1/10万）等表示。率= 说明某现象发生频率或强度的相对数是某现象实际发生的例数 ⨯k 可能发生该现象的总例数 A. 率 B.构成比 C.相对比 D.百分位数发病率发病率= 一定时期内某人群某病新病例数 ⨯k 同期暴露人口数用途：反映该病的风险。用来描述疾病的分布、探讨发病因素、提出病因假设、评价防治效果 1.描述疾病的发病率指标，计算时分子应为 A ．新发病例数 B．新旧病例数 C．受检者中阳性人数 D．易感接触者中发病人数 2.发病率的分子是 A ．患病人数之和 B．新病人数之和 C．感染人数之和 D．死亡人数之和 1. 描述疾病的患病率指标，计算时分子应为：B A. 新发病例数 B.新旧病例数 C.受检者中阳性人数 D.易感接触者中发病人数 2. 患病率：又称现患率或流行率。患病率= 特定时间点某人群中某病新旧病例数 ⨯k 同期观察人口数 K=100%，1000‰,10 000/万或100 000/10万时点患病率：调查时间一般在1个月内期间患病率：调查时间超过1个月影响因素：患病率=发病率×病程用途：患病率通常用来描述病程较长的慢性病发生或流行情况黄炳率与发病率的区别 1. 死亡率：指某人群在一定期间内（1年）死于所有原因的人数在该人群中所占比例。 K=1000或100 000/10万死亡率= 某时期内死亡总数 ⨯k 同期平均人口数 2. 病死率：在一定时间内患某病的全部患者中因该病而死亡的比例。多用于病程短的急性病。表明疾病的严重程度。病死率= 某时期因某病死亡的人数 ⨯100% 同期患某病的人数 3. 生存率：又称存活率。指患某病的人（或接受某种治疗措施的患者）经n 年随访，到随访结束时仍存活的病例数与随访病例的总数之比 n年生存率是评价慢性、病死率高的疾病远期疗效的重要指标。 n 年生存率= 1. 相对危险度（RR ）或率比：指暴露组发病率与非暴露组发病率之比。反映了暴露于疾病的关联强度。RR= Ie/I0 RR=1，暴露与疾病无联系 RR1，暴露与疾病存在正联系（暴露是危险因子）例：Doll 和Hill 调查了英国35岁以上男性吸烟习惯与肺癌死亡率的关系，不吸烟人群的肺癌死亡率为‰，中度吸烟者（15-24支/日）的肺癌死亡率为‰。RR= 说明吸烟者死于肺癌的危险性是不吸烟者的倍。 2. 比值比（OR ）：又称优势比、交叉乘积比。指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。发病率（死亡率）很低；研究对象代表性好—— OR≈RR 归因危险度（AR ）或率差（RD ）：是指暴露组发病率与非暴露组发病率之差，反映发病归因于暴露因素的随访满n 年后仍存活的病例数 ⨯100% 随访满n 年的该病病例数程度。AR= Ie-I0 =RR×I0-I0 =I0 (RR-1) AR 意义：暴露者中完全由某暴露因素所致的发病率或死亡率。例：AR=‰‰=‰。表明在每日吸15-24支香烟当中由于吸烟所致的肺癌死亡率为‰ 归因危险度百分比（AR%）：指暴露人群中有暴露因素引起的发病在所有发病中所占的百分比。 AR%= (Ie-I0)/Ie×100% 例：AR%=()/×100%= 表示在每日吸15-24支香烟者中有的肺癌是由吸烟所致。现况调查：在某一人群中应用普查或抽样调查等方法收集特定时间内有关变量、疾病或健康状况的资料，以描述目前疾病或健康状况的分布及某因素与疾病的关联。现况调查的种类（！）普查：指在特定时间内，对特定范围人群的每一个成员所进行的调查，也称全面调查。（2）抽样调查：是从总体人群中随机抽取有代表性的一部分人（样本）进行调查，以样本结果来估计总体人群的疾病或健康状况的一种调查方法。抽样方法：非随机和随机抽样现况调查优缺点（1）优点：研究结果有较强的推广意义；可形成同期对照；是病因探索中的基础性工作（2）局限性：难以确定心因后果；不能获得发病率资料；有可能低估患病水平队列研究的原理是将特定的人群按其是否暴露于某因素或按不同暴露水平分为n 个群组或队列，追踪观察一段时期，比较两组或各组发病率或死亡率的差异，以检验该因素与某疾病有无因果联系及联系强度大小的一种观察性研究方法。 1. 队列研究主要用于： A ．研究发病机理 B．研究职业种类 C ．验证某种暴露因素对发病率或死亡率的影响 D．研究个体基因突变性队列研究的特点：时序是前瞻性研究观察性对比研究暴露组否分组研究方向由“因”推“果” 追踪观察的两组间的发病率或死亡率差异，RR=[a/(a+b)/[c/(c+d)] 1. 队列研究的特点有 A. 属于观察法√ B.属于实验法 C.设立对照√ D.研究方向由因推果√ E.研究方向由果追因队列研究的优缺点：（1）优点：研究对象在疾病发生前按暴露情况分组且进行随访，所获资料完整可靠，无回忆偏倚可直接计算发病率或死亡率，因而能计算相对危险度和特异危险度等指标，直接估计暴露于疾病的联系强度大小可同时研究一种因素与多个疾病的关系, 有助于了解疾病自然史。暴露因素与疾病的时间先后顺序清晰，因此论证因果关系的能力强。暴露因素的作用可分等级，便于计算剂量-效应关系。样本量大，结果较稳定。在有完整资料记录的条件下，可做回顾性历史队列研究。（2）局限性：观察时间长，费人力、费钱，不能在较短时间内得到结果；准备工作繁重，设计的科学性要求高，实施难度大。暴露人年计算工作量较为繁重。不适于研究发病率很低的疾病。由于随访时间长，所以容易产生失访偏倚多选 1. 队列研究的用途有（） A. 用于验证某种暴露因素对发病率的影响 B.用于传染病发病机理研究 C.用于检验职业人群 D. 用于人群干预研究 E.描述疾病的自然发展过程病例对照研究: 选择患有所研究疾病的患者作为病例组，同时选择未患该病的人作为对照组，调查两组人群发病前对某个（些）因素的暴露状况，比较两组暴露率和暴露水平的差异，以研究该疾病与这个（些）因素的关系。病例研究的优点 1. 在疾病发生后进行，研究开始时已有一批可供选择的病例 2. 研究对象按发病与否分成病例组与对照组 3. 研究因素的暴露状况是通过回顾获得的 4. 由果及因的推理顺序 5. 比较两组暴露率或暴露水平，分析暴露于疾病的联系。OR=ad/bc 1. 病例对照研究的因果顺序是：c A ．由因追果 B．由因追因 C．由果追因 D．由果追果 2. 病例对照研究在时间上属于： b A. 现况性研究 B.回顾性研究 C.前瞻性研究 D.回顾加前瞻性研究实例目的：A 型性格与冠状动脉病变的关系研究对象：病例组：经冠状动脉造影确诊的冠心病患者对照组：医院对照（内对照）：冠状动脉造影正常+ECG平板运动试验阴性的其他科室住院者人群对照（外对照）：中型企业健康普查人群完全随机抽样（ ECG平板运动试验阴性）信息采集：信息采集： A 型性格：全国冠心病与A 型行为类型协作组1985年制定的《A 型性格问卷》，按确诊冠心病前两年的情况其他危险因素：一般人口学特征，既往高血压、高血脂等心血管疾病史及家族史，烟酒及膳食习惯等。冠状动脉病变指数：按造影所示病变部位及支数、狭窄程度及范围，结合美国心脏病协会规定的节段法进行评判。研究对象例数：实际分析339人病例组139人医院对照83人人群对照117人主要结果：病例组与医院和人群对照组之间在年龄、性别、居住地及工作年限、职业构成等方面经检验，均无显著性差异，说明各组间可比性较好 A 型性格发生冠心病的危险性：男性：OR 值（95%CI：）女性： OR值（95%CI：）性格评分等级与冠状动脉病变的关系：呈明显剂量-效应关系控制和调整了各因素的混杂后，A 型性格与冠状动脉病变的发生依然密切相关表6-2 性格类型与冠状动脉疾病程度间关系的对比分析实验性研究：又称干预研究，基本性质是研究者在一定程度上掌握着实验的条件，主动给予研究对象某种干预措施。主要类型：临床试验、现场试验、社区试验、类实验实验研究的特点： 1. 前瞻性研究：干预在前，效应在后 2.随机分组： 3. 设立对照组：来自同一总体 4.有干预措施：容易产生伦理学问题临床试验是按实验法，运用随机分配的原则将试验对象分为试验组和对照组，给实验组某种治疗措施，不给对照组该措施或给予安慰剂（placebo ），经过一段时间后评价两种措施产生的效应，从而评价临床治疗、预防措施的效果和进行病因研究。诊断指标：客观指标：仪器测定指标主观指标：患者主诉半客观指标：诊断者的主观感知（肿物的硬度、大小）诊断标准：生物统计学方法、临床判断法、ROC 曲线法真实性：有效性、效度或准确性。是指待评价试验所获得的测量值与实际情况（金标准测量值）符合程度。灵敏度（真阳性率）特异度（真阴性率）误诊率（假阳性率）漏诊率（假阴性率）似然比正确诊断指数练习题提高诊断试验灵敏度的办法是（） A. 串联试验 B.并联试验 C.先串联后并联 D.先并联后串联筛检试验：通过快速的检验、检查或其他措施，将可能有病但表面上健康的人，同那些可能无病的人区分开。筛检的主要用途：早发现临床前期的可疑患者（二级预防）发现高危个体（一级预防）流行病学监测了解疾病的自然史小王是北京海淀区万寿路社区卫生服务中心的一名健康管理师，需要针对本社区老年常见慢性病患者进行健康管理，计划两年之内增加高血压、糖尿病等的检出率、建档率和随访干预覆盖率，五年之内减少因高血压、糖尿病发病和死亡等指标，那么他应该从什么地方开始动手呢？该小区人群一般人口学特征（如年龄、职业、婚姻状况、性别等）情况如何分布？该小区人群常见慢性病（高血压、糖尿病、周围血管疾病、冠心病等）患病率如何？影响这些慢性病患者的危险因素有哪些？如何进行干预？社区中高血压、糖尿病患者的远期心血管病（主要是冠心病和脑卒中）发病和死亡风险如何，怎样预测？在进行12个月的干预后，如何评价效果？

[1] 林玫,吴秀玲,吕元聪. 2002～2006年广西猩红热流行病学分析[J]应用预防医学, 2008,(01) . [2] 郭菁,周蕾,程显欣. 海淀区1993～2002年猩红热流行特征分析[J]疾病监测, 2005,(09) . [3] 孟慧,于立明,孙爱民. 蓬莱市1990～2004年猩红热流行病学分析[J]疾病监测, 2005,(10) . [4] 曾丽萍,姚云波,李顺祥,刘红雁,余庆福,马俊才. 玉溪市1994～2003年猩红热流行特征分析[J]中国热带医学, 2005,(03) . [5] 李顺祥,李六九,余庆福,余福保,余怀荣,吴白伟. 玉溪市某中学猩红热爆发疫情的流行病学调查[J]中国学校卫生, 2005,(06) . [6] 黄星辉,王静,蒋德勇,周志刚,余卓君. 1982-2007年攀枝花市猩红热流行病学分析[J]预防医学情报杂志, 2008,(09) . [7] 汤健闻,柳智豪. 百色市1978～2005年猩红热流行趋势分析[J]预防医学论坛, 2006,(06) . [8] 储全胜,鲁开国,叶彩仙,刘永刚,王庆云,薛堂渠. 青岛市猩红热的流行病学分析[J]中国公共卫生, 1993,(09) . [9] 韩振荆,张晓宇. 兰州市1990～1999年猩红热疫情分析[J]中华流行病学杂志, 2000,(05) .

一篇高质量的教科研论文，必须具有下列特征： 1、立论客观，具有独创性：文章的基本观点必须来自具体材料的分析和研究中，所提出的问题在本专业学科领域内有一定的理论意义或实际意义，并通过独立研究，提出了自己一定的认知和看法。 2、论据翔实，富有确证性：论文能够做到旁征博引，多方佐证，所用论据自己持何看法，有主证和旁证。论文中所用的材料应做到言必有据，准确可靠，精确无误。 3、论证严密，富有逻辑性：作者提出问题、分析问题和解决问题，要符合客观事物的发展规律，全篇论文形成一个有机的整体，使判断与推理言之有序，天衣无缝。 4、体式明确，标注规范：论文必须以论点的形成构成全文的结构格局，以多方论证的内容组成文章丰满的整体，以较深的理论分析辉映全篇。此外，论文的整体结构和标注要求规范得体。 5、语言准确、表达简明：论文最基本的要求是读者能看懂。因此，要求文章想的清，说的明，想的深，说的透，做到深入浅出，言简意赅。

医学论文流行病学数据统计

第五章流行病学和医学统计学基本知识，分为两节，分别是：第一节流行病学的基本知识，第二节医学统计学的基本知识。我偷个懒，先更第一节流行病学吧，毕竟内容真的太多了，第二节统计学明天更~1.流行病学概念 2. 任务 3.研究方法分类 4.常用指标 5. 常用研究方法研究疾病、健康状态和事件在人群中的分布、影响和决定因素，用以预防和控制疾病，促进健康的学科。 1.第一阶段---揭示现象 2.第二阶段---找出原因、影响或决定因素 3.第三阶段---提供措施结合健康管理，对应就是：健康信息收集、健康风险评估、健康指导和健康危险因素干预。（一）率和比 1.比例——表示同一事物局部与总体之间数量上的比值，常用P＝a/（a+b）来表示 2.率——表示在一定的条件下某现象实际发生的例数与可能发生该现象的总例数之比，来说明单位时间内某现象发生的频率或强度，率=（某现象实际发生的例数/可能发生该现象的总人数）×k，k=100%、千分之千、万分之万、十万分之十万 3.率的构成：受累人群数量、被观察到的受累人群所处的总体数量、规定的时间 4.比——也称相对比，表示两个数相除所得的值，说明两者的相对水平，公式：比=甲指标/乙指标✖100%（添加）（二）发病指标 1.发病率（1）指一定时期内特定人群中某病新病例出现的频率。公式：发病率=（一定时期某人群中某病新病例数/同期暴露人口数）✖k （2）暴露人口数——也称危险人口，指在观察期间内观察地区的人群中有可能发生所要观察疾病的人。（3）用途——对于传染病和死亡率极低或不致死的疾病尤为重要，反应该病的风险；常用于描述疾病的分布，探讨发病因素，提出病因假设和评价防治措施的效果。 2.患病率（1）亦称现患率、流行率，是指在特定时间点一定人群中某病新病例和旧病例的人数总共所占的比例。患病率=（特定时间点某人群中某病新旧病例数/同期观察人口数）✖k （2）影响因素：发病率、病程。（3）用途——对于病程长的一些慢性病的流行状况能提供有价值的信息，可反映某地区人群疾病的分布以及某疾病的疾病负担程度。可依据患病率来合理计划卫生设施、人力物力及卫生资源的需要，研究疾病流行因素，监测慢性病的控制效果。 3.患病率和发病率的区别（1）患病率的分子为特定时间点所调查人群中某病新旧病例数，而不管这些病例的发病时间；发病率的分子为一定时期暴露人群中新发生的病例数；（2）患病率是由横断面调查获得的疾病频率，衡量疾病的存在或流行情况，是一种静态指标，其实质上是一种比例，不是一种真正的率。而发病率是由发病报告或队列研究获得的单位时间内的疾病频率和强度，为动态指标，是一种真正的率。（三）死亡指标 1.死亡率（1）是指某人群在单位时间内死于所有原因的人数在该人群中所占的比例，是测量人群死亡危险最常用的指标。死亡率=（某人群某年总死亡人数/该人群同年平均人口数）✖k，式中k=千分之千或十万分之十万（2）分类：粗死亡率——死于所有原因的死亡率是一种未经调整的死亡率；死亡专率——按疾病的种类、年龄、性别、职业、种族等分类计算的死亡率。 2.病死率（1）表示一定时期内患某病的全部患者中因该病而死亡的比例，病死率与死亡率不同，病死率并非真正的率，只是一个比值。病死率=（一定时期内因某病死亡人数/同期确诊的某病病例数）✖100% （2）病死率通常用于病程短的急性病，以衡量疾病对人生命威胁的程度。 3.生存率（1）又称存活率，是指患某种病的人（或接受某种治疗措施的患者）经n年的随访，到随访结束时仍存活的病例数占观察病例的比例。（2）n年生存率=（随访满n年的某病存活病例数/随访满n年的该病病例数）✖100% （四）相对危险度 1.相对危险度（1）又称率比（RR),是指暴露组发病率(Ie）与非暴露组发病率（Io）之比，它反映了暴露与疾病的关联强度。计算公式RR=Ie/Io （2）意义——说明暴露组的发病危险是非暴露组的多少倍（3）RR无单位，比值范围在0-正无穷之间。比值越大，联系越强。 RR=1，暴露与疾病无联系；RR＜1，存在负联系，暴露是保护因子；RR＞1，正联系，暴露是危险因子。 2.比值比（1）又称优势比、交叉乘积比（OR)。指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。（2）与RR相同，OR反映暴露者患某种疾病的危险性较无暴露者高的程度。（3）若能满足以下两个条件，则OR值接近甚至等于RR值：所研究疾病的发病率（死亡率）很低、所选择的研究对象代表性好。（五）归因危险度 1.归因危险度（1）又称率差，简写为AR。是指暴露组发病率与非暴露组发病率之差，它反映发病归因于暴露因素的程度。公式：AR=Ie-Io=Io（RR-1）（2）意义：表示暴露者中完全由某暴露因素所致的发病率或死亡率。 2.归因危险度百分比（1）简写：AR%,是指暴露人群中由暴露因素引起的发病在所有发病中所占的百分比。公式：AR%=（Ie-Io）/Ie，再×100% （2）数值越高，越是干预的重点。 3.人群归因危险度百分比（1）简写为PAR%,表示全人群中由暴露引起的发病在全部发病中的比例。公式1：PAR%=（It-Io）/It，再×100%，It为全人群发病率（2）公共卫生学意义：完全控制该暴露因素后人群中某病发病（或死亡）率可能下降的程度。（一）现况调查 1.概念：是指在某一人群中应用普查或抽样调查等方法收集特定时间内有关变量、疾病或健康状况的资料，以描述目前疾病或健康状况的分布及某因素与疾病的关联。因为是在某一时点或在短时间内完成，这个世界点犹如一个断面，故又称之为横断面研究。 2.目的：（1）描述疾病或健康状况的分布（2）发现病因线索（3）适应于疾病的二级预防（4）评价疾病的防治效果（5）疾病监测（6）其他：衡量一个国家或地区的卫生水平和健康状况、卫生服务需求的研究、社区卫生规划的制定 3.分类：普查（全面调查）、抽样调查（分为非随机抽样、随机抽样） 4.优缺点（1）优点：现况调查中常用抽样调查，以样本估计总体的可信度较高，故其研究结果有较强的推广意义。现况研究是在收集玩资料之后，再将样本按照是否暴露或患病来分组比较，即有来自同一群体的自然形成的同期对照组，故结果具有可比性。研究过程应用问卷调查或采样监测等手段，故一次调查可同时观察多种因素，是疾病病因探索过程中不可缺少的基础性工作之一。（2）局限性：难以确定先因后果的时相关系。不能获得发病率资料。极有可能低估该研究群体的患病水平。（二）队列研究 1.概念：亦称群组研究。是将特定的人群按其是否暴露于某因素或按不同暴露水平分为n个群组或队列，追踪观察一段时间，比较两组或各组发病率或死亡率的差异，以检验该因素与某疾病有无因果联系及联系强度大小的一种观察性研究方法。可用于检验病因假设、评价预防效果和研究疾病自然史。 2.类型：前瞻性队列研究、历史性队列研究、双向性队列研究（混合性队列研究） 3.特点（1）在时序上是由前向后的，在疾病发生前开始进行，故属于前瞻性研究。（2）属于观察性对比研究（3）研究对象根据暴露与否分组，这与实验性研究的随机分型不同。（4）是从“因”到“果”的研究。（5）追踪观察的是两组间的发病率或死亡率差异。 4.优缺点（1）优点：在疾病发生前按是否暴露于某因素分组，所获资料完整，无回忆偏倚。可计算暴露组和非暴露组的发病率，能测量两组间的特异危险度和相对危险度。暴露因素的作用可分等级，便于计算剂量-效应关系。样本量大，结果稳定。在有完整资料记录的条件下，可作回顾性历史队列研究。（2）局限性：观察时间长、费人力、花费高。设计的科学性要求高，实施难度大。研究罕见病时需要大量研究对象，不易收集到完整可靠的资料，故不适用于罕见病的研究。（三）病例对照研究 1.概念：为选择一组患所研究疾病的患者与一组无此病的对照组，调查其发病前对某些因素的暴露状况，比较两组中暴露率和暴露水平的差异，以研究该疾病与这些因素的关系。 2.特点（1）在疾病发生后进行，研究开始时已有一批可供选择的病例。（2）研究对象按发病与否分成病例组和对照组。（3）被研究因素的暴露状况是通过回顾调查或信息收集获得的。（4）若按因果关系进行分析，结果已发生，是由果及因的推理顺序。（5）经两组暴露率和暴露水平的比较，分析暴露与疾病的联系。 3.优缺点（1）优点：所需样本量小，病例易获取，易于进行，出结果快。适合于病因复杂、发病率低、潜伏期长的疾病。可对治疗措施的疗效与副作用作初步评价。（2）局限性：暴露因素和疾病的时间先后顺序常难以判断，因此不能确定因果关系。不能计算发病率、死亡率、相对危险度。选择研究对象时容易产生选择偏倚，回顾性调查时易产生信息偏倚（回忆偏倚）。（四）实验性研究 1.基本性质：研究者在一定程度上掌握着实验的条件，主动给予研究对象某种干预措施。又称干预研究。 2.类型：临床试验、现场试验、社区试验、类实验。 3.特点：属于前瞻性研究、随机分组、设立对照组、有干预措施。 4.临床试验（1）是在临床上评价新药、新疗法疗效的一种试验，是临床治疗措施在正式应用之前的最后人体应用试验。（2）它是运用随机分配的原则将试验对象分为试验组和对照组，给前者某种治疗措施，不给后者这种措施或给予安慰剂，经过一段时间后评价该措施的效果和价值的一种前瞻性研究。（3）临床试验的目的是观察和论证某个或某些研究因素对研究对象产生的效应或影响。 5.社区试验：也称生活方式干预试验，是以尚未患所研究疾病的人群作为整体进行试验观察，常用于对某种预防措施或方法进行考核或评价。（五）诊断试验的评价研究 1.概念：诊断试验是对疾病进行诊断的试验方法。 2.诊断指标：客观指标、主观指标、半客观指标。 3.确定诊断标准的方法：生物统计学法、临床判断法、ROC曲线法。 4.诊断试验的评价指标5.诊断试验的评价标准（1）同金标准诊断方法进行同步盲法比较；（2）研究对象的代表性；（3）要有足够的样本量；（4）诊断界值的确定要合理；（5）不仅评价真实性，也评价可靠性；（6）试验的方法和步骤要具体，有可操作性。 6.提高诊断质量的方法（六）筛检试验的评价研究 1.概念：筛检试验通过快速的检验、检查或其他措施，将可能有病但表面上健康的人，同那些可能无病的人区分开来。 2.用途：早期发现那些处于临床前期或临床初期的可疑患者；发现某些疾病的高危个体；开展流行病学监测；了解疾病的自然史。 3.类型：按筛检对象的范围，分为：群体筛检、选择性筛检。 4.方法：单项筛检、多项筛检。 5.建议目前筛检慢性病，主要考虑高血压、糖尿病、超重和肥胖、慢性阻塞性肺疾病，以及宫颈癌、乳腺癌、大肠癌、肝癌、鼻咽癌等筛检方法比较成熟，早期发现治疗效果较好的肿瘤。

流行病学与统计医学统计学：根据统计学的原理和方法，研究医学数据收集、表达和分析的一门应用各学科。医学统计的主要内容：研究对象：医学数据统计设计：调查设计和实验设计统计描述：率、均数统计推断：对统计指标的差别和关联性进行分析和推断医学统计资料的类型统计工作的基本步骤包括： 1. 研究设计 2. 收集资料：来源：经常性资料【医疗卫生工作记录（病历、医学检查记录、出生死亡报表等）健康检查记录】；一时性资料【专题调查或实验研究】。要求：完整、正确和及时；足够数量；代表性和可比性 3. 整理资料：原始数据的检查与核对：常规检查；取值范围检错；逻辑检错数据的分组设计和归纳汇总。4. 分析资料：统计描述；统计推断（区间估计、假设检验）统计工作的基本步骤包括： A ．实验和调查 B．统计设计 C．收集资料 D．整理资料 E．分析资料统计工作中，分析资料指的是： A ．统计设计 B．收集资料 C．整理资料 D．统计描述 E．统计推断总体：根据研究目的而确定的同质观察单位的全体。有限总体和无限总体。样本：是从总体中随机抽取有代表性的部分观察单位变量值的集合。参数：指总体指标。如总体均数μ，总体标准差σ，总体率π。统计量：指样本指标。如样本均数，样本标准差S ，样本率p 。误差：指实际值与真实值之差。分为随机误差（随机测量误差和抽样误差）、非随机误差（主要是系统误差）概率是对总体而言。是某随机事件发生的可能性大小的数值，常用符号P 表示。取值范围0~1。在统计学中，误差的种类有 A ．标准误差 B．计算误差 C ．系统误差√ D ．随机测量误差√ E ．抽样误差√ 统计学上的误差主要有 A. 系统误差 B.标准误差 C.随机测量误差 D.抽样误差 E.计算错误误差算术均数：简称均数，用于描述对称分布或近似正态分布的资料。描述正态分布资料集中趋势的指标是 A. 百分位数 B.中位数 C.算术均数 D.几何均数描述正态分布资料集中趋势的指标是 A. 中位数 B.几何均数 C.算术平均数 D.标准差有9名健康成人的空腹胆固醇测定值（mmol/L）为，，，，，，，，。求算术均数。有7份血清的抗体效价分别为1:2, 1:4, 1:8, 1:16, 1:32, 1:64, 1:128，求平均抗体效价。 n 5. 61+3. 96+3. 67+4. 99+4. 24+5. 06+5. 20+4. 79+5. 93＝ 9 43. 45＝ 9 ＝4. 83(m m ol /L ) X = G ＝lg -1( 血清抗体平均效价为1:16 注意：变量值中不能有0；不能同时出现负数和正数；若全为负数，计算时先把符号去掉计算中位数(median, M)：可用于任何分布的计量资料有7名正常人的血压（舒张压）测定值（mmHg ）为：72，75，76，77，81，82，86，87求中位数。 M ＝(77＋81)/2=79 一组从小到大排列的定量变量，位次居中的指标是 A ．算术均数 B.几何均数 C．中位数 D.百分位数描述离散趋势的指标是 A. 标准差 B.中位数 C. 几何均数 D.算术均数 n lg 2+lg 4+lg 8+lg 16+lg 32+lg 64+lg 128 ＝lg -1() 7 ＝lg -1(1. 204) ＝16 lg X ) 方差（variance ）与标准差（standard deviation）：表示数据的平均离散情况，常用于描述服从正态分布的资料的离散程度。某地20岁男子160人某地不同年龄女童身高（cm ）的变异程度统计表的基本结构与要求：标题、标目、线条、数字4部分组成。表中数字区不插入文字，不列备注项。必须说明者表“*”号等，在表下方说明。统计表的基本结构为 A ．标题、横标目、纵标目、线条 B．标题、横标目、纵标目、数字 C ．标题、横标目、纵标目、备注 D．标题、标目、线条、数字统计表的基本构成有 A ．标题 B．横标目 C．纵标目 D ．线条 E．数字统计表内不列的项是 A. 标目 B. 线条 C.数字 D.备注制图的基本要求（1）根据资料的性质和分析目的，选择合适的图形。（2）基本结构：标题、标目、刻度、图例4部分组成。标题：一般放在图的下方，左侧加图号标目：分为横标目和纵标目，分别表示横轴和纵轴数字刻度的意义刻度：图例：说明统计图中各种图形锁代表的事物。放在右上角或下方中间比较两家医院15年床位数的增加速度，可选用的统计图是 A ．构成图 B ．直条图 C ．线图 D ．直方图某医院拟表示一年中各月病床使用率的变化趋势，应选用的统计图是 A ．普通线图 B ．直条图 C ．散点图 D ．直方图比较某地2001年和2011年结核、心脏病和肿瘤的死亡率，可选择的统计图是 A. 单式条图 B.复式条图 C.普通线图 D.半对数线图分析某医院1998年住院病人5种疾病构成比可选用的统计图是 A. 单式直条图 B. 复式直条图 C.圆图 D. 线图分析某医院1998年和2008年住院病人5种疾病构成比可选用的统计图是 A ．单式直条图 B．复式直条图 C．百分比条图 D．统计地图观察某地十年肺结核患病率的变化趋势，可选择的统计图是 A. 条图 B.圆图 C.线图 D.直方图比较某地2001年和2011年结核、心脏病和肿瘤的死亡率，可选择的统计图是 A. 单式条图 B.复式条图 C.普通线图 D.半对数线图假设检验的基本步骤 1. 建立假设检验，确定检验水准（1）根据统计推断目的提出对总体特征的假设无效假设，或称为零假设，记作H0，即假设差异是由于抽样误差所致，总体参数相同备择假设，记作H1，即差别不是由于抽样误差所致，总体参数不同（2）确定检验水准亦称显著性水准，用α表示 2. 选定检验方法，计算检验统计量（卡方、t 值、F 值） 3. 确定P 值，做出统计推断结论注意：假设检验是针对总体而言的假设检验的注意事项 1.. 检验方法的正确选择定量资料两个独立样本均数比较：t 检验多个独立样本均数比较：方差分析配对设计：配对t 检验随机区组资料：随机区组设计方差分析 2. 结果的解释：差别有统计学意义与有无实际意义的关系 I 型错误（第一类错误）：指拒绝了实际上是成立的H0。用α表示。 II 型错误（第二类错误）：指不拒绝实际上是不成立的H0。用β表示。 1. 流行病学研究的对象是（） A.病人 B.健康人 C.人群 D.亚健康人 E.亚临床的人下列哪一项是分析流行病学方法（） A.横断面研究 B.生态学研究 C.疾病监测 D.病例对照研究 E.社区干预试验有学者通过调查肺癌病人和非肺癌的人过去的吸烟情况，来研究吸烟和肺癌的关系。这种方法称为： A.现况调查 B.描述性研究 C.筛检试验 D.病例对照研究 E.队列研究有学者对某人群进行了高血压的调查，获得了该人群高血压的患病率，并对不同年龄组的高血压患病情况进行了分析。这种调查研究属于： A.探讨疾病的病因 B.探讨发病机制 C.描述疾病的分布 D.研究疾病自然史 E.疾病筛检计算患病率的分子是（） A ．观察期间某病的新发病例数 B．观察期间某病的新旧病例数 C ．观察期间之后某病的患病人数 D．观察期间某病的暴露人口数 E ．观察期间所有人口数某地区在1个月内进行了糖尿病的普查，可计算当地糖尿病的（） A ．发病率 B．死亡率 C．患病率 D．二代发病率 E．罹患率下面哪一个公式用于计算发病率（E ） A ．（受检者中阳性人数/受检人数）×100% B．（受检者中阳性人数/同期暴露人数）×100% C ．（受检者中阳性人数/受检者人数）×100% D．（受检者中阴性人数/受检者人数）×100% E．（某一时期内新病例数/同期暴露人数）×100% 一个地区通过首次高血压普查，可计算当地的（） A ．高血压患病率 B．高血压罹患率 C．高血压发病率 D．高血压病死率 E．家庭续发率某地区1960年度疫情资料统计，狂犬病患者100人全部死亡，此资料可计算 A ．粗死亡率 B．死亡专率C ．标化死亡率 D．病死率 E．此资料不全难以计算下列叙述中，不属于病例对照研究优点的是（） A ．资料收集后可在短时间内得到结果 B．特别适用于罕见病的研究 C ．一次调查可同时研究一种疾病与多个因素的关系 D．可直接获得发病率资料 E ．所需研究对象的数量相对较少病例对照研究中的调查对象是（） A ．病例组是怀疑患有欲研究疾病的病人，对照组是未患该病的人 B ．病例组是具有某种暴露的人，对照组是未有该暴露的人 C ．病例组是确诊患有欲研究疾病的病人，对照组是未患该病的人 D ．病例组和对照组均是具有某种暴露的人 E．病例组是确诊患有欲研究疾病的病人，对照组是怀疑患有该病的在病例对照研究中，若病例组某危险因素暴露史的比例在统计学上明显高于对照组，则表明( D ) A ．该因素与疾病有统计学关联 B．该因素与疾病有因果关联 C ．该因素是疾病的病因 D．该因素与疾病无关联 E．该病由该因素引起下列关于病例对照研究特点的说法中，正确的为( C ) A ．暴露与疾病都是现在的情况 B．能够确证因素与疾病的因果关联 C ．由因及果的研究 D．需要随机分组 E．属于观察法 OR 主要应用于( A ) A ．现况研究 B．生态学研究 C．现场试验 D．病例对照研究 E．队列研究属于病例对照研究缺点的是( E ) A ．不能分析疾病与多种因素的关联 B．不能估计RR C．样本含量要求很大 D ．容易产生医德问题 E．回忆信息时，易出现错误下列说法中，不属于队列研究特点的是（ B ） A ．由因及果，前瞻性研究 B．属于描述性研究 C．能同时研究一种因素与多种疾病的关系 D ．需要设立对照组 E．因果关联的说服力大于病例对照研究队列研究中的研究对象为（ C ） A ．在一般人群中选取有、无某暴露因素的两个组 B．在患有某病者中选择有、无某暴露因素的两个组 C ．在未患该病人群中选择有、无某暴露因素的两个组 D．患有某种疾病的人群随机分成的两组 E ．一组患有某种疾病者，一组为未患有该种疾病者在队列研究中，暴露组的疾病发病率与对照组的疾病发病率的差值称为 ( A ) A ． AR B． RR C．OR D．PAR E． AR% 队列研究属于( B ) A ．相关性研究 B．分析性研究 C．描述性研究 D．理论性研究 E．实验性研究在队列研究中，估计某因素与某疾病关联强度的指标为( E ) A ．总人群中该病的发病率 B．暴露人群中该病的发病率 C ．人群中危险因素的暴露率 D．OR E． RR 在队列研究中，研究对象的分组原则是按( A ) A ．是否暴露于某因素分组 B．随机分组 C．是否患病分组 D．人为随意分组 E．领导意图分组属于实验流行病学特征的是（E ） A ．由果及因，回顾性研究 B．属于观察法 C．获得因素与疾病联系强度的指标主要为比值比 D ．不能确证因果关联 E．人为施加干预措施关于临床试验中的对照组，正确的说法为( B ) A ．是人群中的非患欲研究疾病者 B．是患欲研究疾病者，但在处理上不同于实验组 C ．不具有某种暴露因素的人 D．与患欲研究疾病者同时入院的其它患者 E．所欲研究疾病的轻型患者多选题：下列所述中属于抽样调查优点的有（ A C D ） A ．工作量小 B．工作量大 C．省时间和人力、物力 D．工作易做到细致 E ．特别适用于患病率很低的疾病调查属于队列研究缺点的为（ A C D ） A ．观察时间长，花费大 B．易出现回忆偏倚 C．不宜用于研究发病率很低的疾病 D ．设计的要求高，实施复杂 E．不能计算发病率、死亡率等属于实验流行病学方法的有（ A/C ） A ．临床试验 B．普查 C．社区试验 D．队列研究 E．个体试验反映诊断试验可靠性的指标是（ E） A ．灵敏度 B．特异度 C．约登指数 D．阳性似然比 E．符合率为提高诊断试验的灵敏度, 对几个独立试验可（B ） A ．串联使用 B．并联使用 C．先串联后并联使用 D ．要求每个试验假阳性率低 E．要求每个试验特异度低某病早期治疗效果好，漏诊后果严重，对此病的试验诊断应（A ） A ．提高灵敏度 B．提高特异度 C．降低诊断的截断值 D．提高阳性预测值 E．提高阴性预测值诊断试验的真实性是指（A ） A ．被试验的测定值与实际值的符合程度 B．是重复试验获得相同结果的稳定程度 C ．是观察者对测量结果判断的一致程度 D．是试验结果表明有无疾病的概率 E．指病例被试验判为阳性的百分比流行病学是研究疾病、健康状态和事件在人群中的分布、影响和决定因素，用以预防科控制疾病、促进健康的学科。流行病学研究的方法：观察性研究实验性研究理论性研究观察性研究: 描述性研究 (横断面研究（现况调查）比例死亡比研究生态学研究) 、分析性研究（病例对照研究队列研究（随访研究））实验性研究：临床实验、现场试验、社区干预试验和整群随机试验理论性研究：流行病学方法研究理论流行病学比例：是表示同意事物局部与总体之间数量上的比值，分子和分母的单位相同，且分子包含于分母之中。（构成比）某医院住院病人中有15％的胃癌患者，该15％是： A. 患病率 B.发病率 C.构成比 D.相对比例：某病患者409人，其中男性170人，女性239人，男女性构成比见右侧表所示。具体计算：表 409名患者性别构成男性患者数男性构成比=⨯100% 男女性患者总数170 =⨯100%= 170+239 构成比的特点是各组成部分的构成比之和为100% 例如，某年某地出生婴儿中，男性婴儿有185人，女性婴儿有176人，则：出生婴儿性别比= 男性婴儿数女性婴儿数 = 185176 = ．比或相对比：是两个相关指标之比，说明两指标间的比例关系。两个指标可以是性质相同，如不同时期发病数之比；也可以性质不同，如医院的门诊人次与病床数之比。常用倍数或百分数表示。两指标可以是绝对数、相对数或平均数。相对比= 甲指标 ⨯100%）乙指标 3．率：表示一定时间内，实际发生某现象的例数与可能发生该现象的总例数之比，用以说明某现象发生的频率或强度，常用百分率（%）、千分率（‰）、万分率（1/万）或十万分率（1/10万）等表示。率= 说明某现象发生频率或强度的相对数是某现象实际发生的例数 ⨯k 可能发生该现象的总例数 A. 率 B.构成比 C.相对比 D.百分位数发病率发病率= 一定时期内某人群某病新病例数 ⨯k 同期暴露人口数用途：反映该病的风险。用来描述疾病的分布、探讨发病因素、提出病因假设、评价防治效果 1.描述疾病的发病率指标，计算时分子应为 A ．新发病例数 B．新旧病例数 C．受检者中阳性人数 D．易感接触者中发病人数 2.发病率的分子是 A ．患病人数之和 B．新病人数之和 C．感染人数之和 D．死亡人数之和 1. 描述疾病的患病率指标，计算时分子应为：B A. 新发病例数 B.新旧病例数 C.受检者中阳性人数 D.易感接触者中发病人数 2. 患病率：又称现患率或流行率。患病率= 特定时间点某人群中某病新旧病例数 ⨯k 同期观察人口数 K=100%，1000‰,10 000/万或100 000/10万时点患病率：调查时间一般在1个月内期间患病率：调查时间超过1个月影响因素：患病率=发病率×病程用途：患病率通常用来描述病程较长的慢性病发生或流行情况黄炳率与发病率的区别 1. 死亡率：指某人群在一定期间内（1年）死于所有原因的人数在该人群中所占比例。 K=1000或100 000/10万死亡率= 某时期内死亡总数 ⨯k 同期平均人口数 2. 病死率：在一定时间内患某病的全部患者中因该病而死亡的比例。多用于病程短的急性病。表明疾病的严重程度。病死率= 某时期因某病死亡的人数 ⨯100% 同期患某病的人数 3. 生存率：又称存活率。指患某病的人（或接受某种治疗措施的患者）经n 年随访，到随访结束时仍存活的病例数与随访病例的总数之比 n年生存率是评价慢性、病死率高的疾病远期疗效的重要指标。 n 年生存率= 1. 相对危险度（RR ）或率比：指暴露组发病率与非暴露组发病率之比。反映了暴露于疾病的关联强度。RR= Ie/I0 RR=1，暴露与疾病无联系 RR1，暴露与疾病存在正联系（暴露是危险因子）例：Doll 和Hill 调查了英国35岁以上男性吸烟习惯与肺癌死亡率的关系，不吸烟人群的肺癌死亡率为‰，中度吸烟者（15-24支/日）的肺癌死亡率为‰。RR= 说明吸烟者死于肺癌的危险性是不吸烟者的倍。 2. 比值比（OR ）：又称优势比、交叉乘积比。指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。发病率（死亡率）很低；研究对象代表性好—— OR≈RR 归因危险度（AR ）或率差（RD ）：是指暴露组发病率与非暴露组发病率之差，反映发病归因于暴露因素的随访满n 年后仍存活的病例数 ⨯100% 随访满n 年的该病病例数程度。AR= Ie-I0 =RR×I0-I0 =I0 (RR-1) AR 意义：暴露者中完全由某暴露因素所致的发病率或死亡率。例：AR=‰‰=‰。表明在每日吸15-24支香烟当中由于吸烟所致的肺癌死亡率为‰ 归因危险度百分比（AR%）：指暴露人群中有暴露因素引起的发病在所有发病中所占的百分比。 AR%= (Ie-I0)/Ie×100% 例：AR%=()/×100%= 表示在每日吸15-24支香烟者中有的肺癌是由吸烟所致。现况调查：在某一人群中应用普查或抽样调查等方法收集特定时间内有关变量、疾病或健康状况的资料，以描述目前疾病或健康状况的分布及某因素与疾病的关联。现况调查的种类（！）普查：指在特定时间内，对特定范围人群的每一个成员所进行的调查，也称全面调查。（2）抽样调查：是从总体人群中随机抽取有代表性的一部分人（样本）进行调查，以样本结果来估计总体人群的疾病或健康状况的一种调查方法。抽样方法：非随机和随机抽样现况调查优缺点（1）优点：研究结果有较强的推广意义；可形成同期对照；是病因探索中的基础性工作（2）局限性：难以确定心因后果；不能获得发病率资料；有可能低估患病水平队列研究的原理是将特定的人群按其是否暴露于某因素或按不同暴露水平分为n 个群组或队列，追踪观察一段时期，比较两组或各组发病率或死亡率的差异，以检验该因素与某疾病有无因果联系及联系强度大小的一种观察性研究方法。 1. 队列研究主要用于： A ．研究发病机理 B．研究职业种类 C ．验证某种暴露因素对发病率或死亡率的影响 D．研究个体基因突变性队列研究的特点：时序是前瞻性研究观察性对比研究暴露组否分组研究方向由“因”推“果” 追踪观察的两组间的发病率或死亡率差异，RR=[a/(a+b)/[c/(c+d)] 1. 队列研究的特点有 A. 属于观察法√ B.属于实验法 C.设立对照√ D.研究方向由因推果√ E.研究方向由果追因队列研究的优缺点：（1）优点：研究对象在疾病发生前按暴露情况分组且进行随访，所获资料完整可靠，无回忆偏倚可直接计算发病率或死亡率，因而能计算相对危险度和特异危险度等指标，直接估计暴露于疾病的联系强度大小可同时研究一种因素与多个疾病的关系, 有助于了解疾病自然史。暴露因素与疾病的时间先后顺序清晰，因此论证因果关系的能力强。暴露因素的作用可分等级，便于计算剂量-效应关系。样本量大，结果较稳定。在有完整资料记录的条件下，可做回顾性历史队列研究。（2）局限性：观察时间长，费人力、费钱，不能在较短时间内得到结果；准备工作繁重，设计的科学性要求高，实施难度大。暴露人年计算工作量较为繁重。不适于研究发病率很低的疾病。由于随访时间长，所以容易产生失访偏倚多选 1. 队列研究的用途有（） A. 用于验证某种暴露因素对发病率的影响 B.用于传染病发病机理研究 C.用于检验职业人群 D. 用于人群干预研究 E.描述疾病的自然发展过程病例对照研究: 选择患有所研究疾病的患者作为病例组，同时选择未患该病的人作为对照组，调查两组人群发病前对某个（些）因素的暴露状况，比较两组暴露率和暴露水平的差异，以研究该疾病与这个（些）因素的关系。病例研究的优点 1. 在疾病发生后进行，研究开始时已有一批可供选择的病例 2. 研究对象按发病与否分成病例组与对照组 3. 研究因素的暴露状况是通过回顾获得的 4. 由果及因的推理顺序 5. 比较两组暴露率或暴露水平，分析暴露于疾病的联系。OR=ad/bc 1. 病例对照研究的因果顺序是：c A ．由因追果 B．由因追因 C．由果追因 D．由果追果 2. 病例对照研究在时间上属于： b A. 现况性研究 B.回顾性研究 C.前瞻性研究 D.回顾加前瞻性研究实例目的：A 型性格与冠状动脉病变的关系研究对象：病例组：经冠状动脉造影确诊的冠心病患者对照组：医院对照（内对照）：冠状动脉造影正常+ECG平板运动试验阴性的其他科室住院者人群对照（外对照）：中型企业健康普查人群完全随机抽样（ ECG平板运动试验阴性）信息采集：信息采集： A 型性格：全国冠心病与A 型行为类型协作组1985年制定的《A 型性格问卷》，按确诊冠心病前两年的情况其他危险因素：一般人口学特征，既往高血压、高血脂等心血管疾病史及家族史，烟酒及膳食习惯等。冠状动脉病变指数：按造影所示病变部位及支数、狭窄程度及范围，结合美国心脏病协会规定的节段法进行评判。研究对象例数：实际分析339人病例组139人医院对照83人人群对照117人主要结果：病例组与医院和人群对照组之间在年龄、性别、居住地及工作年限、职业构成等方面经检验，均无显著性差异，说明各组间可比性较好 A 型性格发生冠心病的危险性：男性：OR 值（95%CI：）女性： OR值（95%CI：）性格评分等级与冠状动脉病变的关系：呈明显剂量-效应关系控制和调整了各因素的混杂后，A 型性格与冠状动脉病变的发生依然密切相关表6-2 性格类型与冠状动脉疾病程度间关系的对比分析实验性研究：又称干预研究，基本性质是研究者在一定程度上掌握着实验的条件，主动给予研究对象某种干预措施。主要类型：临床试验、现场试验、社区试验、类实验实验研究的特点： 1. 前瞻性研究：干预在前，效应在后 2.随机分组： 3. 设立对照组：来自同一总体 4.有干预措施：容易产生伦理学问题临床试验是按实验法，运用随机分配的原则将试验对象分为试验组和对照组，给实验组某种治疗措施，不给对照组该措施或给予安慰剂（placebo ），经过一段时间后评价两种措施产生的效应，从而评价临床治疗、预防措施的效果和进行病因研究。诊断指标：客观指标：仪器测定指标主观指标：患者主诉半客观指标：诊断者的主观感知（肿物的硬度、大小）诊断标准：生物统计学方法、临床判断法、ROC 曲线法真实性：有效性、效度或准确性。是指待评价试验所获得的测量值与实际情况（金标准测量值）符合程度。灵敏度（真阳性率）特异度（真阴性率）误诊率（假阳性率）漏诊率（假阴性率）似然比正确诊断指数练习题提高诊断试验灵敏度的办法是（） A. 串联试验 B.并联试验 C.先串联后并联 D.先并联后串联筛检试验：通过快速的检验、检查或其他措施，将可能有病但表面上健康的人，同那些可能无病的人区分开。筛检的主要用途：早发现临床前期的可疑患者（二级预防）发现高危个体（一级预防）流行病学监测了解疾病的自然史小王是北京海淀区万寿路社区卫生服务中心的一名健康管理师，需要针对本社区老年常见慢性病患者进行健康管理，计划两年之内增加高血压、糖尿病等的检出率、建档率和随访干预覆盖率，五年之内减少因高血压、糖尿病发病和死亡等指标，那么他应该从什么地方开始动手呢？该小区人群一般人口学特征（如年龄、职业、婚姻状况、性别等）情况如何分布？该小区人群常见慢性病（高血压、糖尿病、周围血管疾病、冠心病等）患病率如何？影响这些慢性病患者的危险因素有哪些？如何进行干预？社区中高血压、糖尿病患者的远期心血管病（主要是冠心病和脑卒中）发病和死亡风险如何，怎样预测？在进行12个月的干预后，如何评价效果？

医学论文统计数据分析

去知网找，那里肯定有你要的论文，自己可以先搜搜看，不知道怎样找的话，可以去我百度空间里，有如何在网络上找论文的文章介绍

经常有人问到在论文或标书中应该如何写作统计分析部分。标准的答案是：你怎么做的就怎么写，每篇文章都是唯一的存在。好装，汗……。如果我们尝试去归纳和小结，这部分内容的写作其实是有一定规律的。我曾经听过Thomas Allen Long教授关于论文写作的课，人很和蔼，他主编的书也不错，操作性很强。在他的书稿《How to Write, Publish & Present in the Health Sciences》第154页中他小结到，统计分析部分应该包括如下内容：统计描述部分、所有的基本统计方法以及分析方案（如ITT或PP等）、样本量的说明、分组方法、检验水准的设定和所使用的统计分析软件。同样在本书的第155页中也写得：统计分析人员可以帮助作者对数据进行合理的分析、对分析结果进行正确解读，同时可以负责统计分析部分的撰写。他建议将统计分析人员作为作者之一，也许这样统计分析人员就不会粗枝大叶、不负责任了。关于医学统计分析的写作，其实他还有一本书《How to Report Statistics in Medicine》，在统计分析的报告上写得更专业。言归正传，本文既然是要小结“统计分析”部分，那就小结吧。个人觉得“统计分析”部分写作时应该包括以下几个内容：（1）样本量估算及随访/数据收集情况；（2）数据录入和管理的软件和方法；（3）本研究所使用的统计分析软件和分析方案；（4）统计描述的方法，分计量和计数资料两种；（5）统计推断的方法，分单因素和多因素两种；（6）检验水准的选取。由于某些“你懂的”原因，很多普通的论文没有进行样本量估算和区分不同的分析方案（ITT/PP）。所以简单举例如下：本研究采用……数据库进行数据录入和管理，数据录入采用双录入核查方式进行。采用……软件对研究数据进行统计分析。计量资料采用……对其进行正态性检验，符合正态分布的计量资料采用均值±标准差的形式进行描述，不符合正态分布的计量资料采用中位数（25%位数，75%位数）进行描述，计数资料采用例数（百分比）进行描述。符合正态分布的计量资料组间比较采用独立样本t检验或单因素ANOVA进行，不符合正态分布的计量资料组间比较采用非参数检验进行，计数资料组间比较采用卡方检验进行。在多因素分析上，采用多重线性/逻辑回归分析……的影响因素。所有检验以双侧p<为差异有统计学意义。有人说我要写英文的“统计分析”部分，该怎么办？同样，你需要多阅读别人的优秀文章，然后用它们的句式来构建属于你自己统计分析内容。可供参考的句式有：（1）数据采集：Study data were collected on standard forms, checked for completeness, and double keyed into an …… database.（2）统计软件：All statistical analyses were performed using SAS version (SAS Institute Inc, Cary, North Carolina).（3）统计描述：…… were described using mean, median, standard deviation, and 25thand 75th percentiles for continuous variables; frequencies and proportions were used for categorical variables.（4）单因素分析：A two sample independent t test/ one-way analysis of variance (ANOVA)/ Nonparametric tests(Kruskal-Wallis test)/ Pearson’s x2 tests or Fisher exact tests was used to compare the differences between …….（5）多因素分析：Multivariable linear regression/ Multivariable binary logistic regression/ Cox proportional hazards were used to estimate …….（6）检验水准：A p value of less than (2-sided significance testing) was considered statistically significant in all analyses.

《统计学与应用》这本期刊上的文献，你可以去看看学习学习的

医学统计论文

医学统计是研究如何搜集、整理和分析医学研究对象的数据和作出推断的一门学科，下面是我为大家收集整理的是医学统计论文，仅供参考。

摘要：不同的统计分析方法均有其适用的范围和应用的条件，研究者在书写医学论文时应根据论文设计及资料的类型进行合理的试验设计，选择恰当的统计分析方法，切记勿盲目套用。同时，还应注意得出的结果和结论应满足设计的要求。医学统计方法的正确运用，是充分利用试验研究获得的数据，也是最终得出科学、可信的结论的必要条件。

关键词：医学统计；方法；运用；原理；选择

一、统计学方法简介

统计学方法包括统计软件包、统计分析方法以及检验水准三方面的内容。其中医学论文中常提到检验水准即α，它是用来表示组间实际无差别而统计结果判断有差别，犯这类错误的概率。实际工作中常取α=，当研究数据计算的P值小于时，组间差异比较被认为有统计学意义。统计学方法包括统计描述和假设检验两个方面的内容。统计描述是指根据资料及原始数据分布的类型，选择正确的指标来描叙资料及数据的特征。而假设检验即组间差异性检验，是医学论文中最常用的统计学方法。资料类型则包括能用具体数据表示的定量资料与不能用具体数值表示但能反映被观察对象某一特征的定性资料。定性资料的统计描述包括率、相对比和构成比。而参数法及非参数法是常用的定量资料统计分析方法。参数法一般包括t检验、方差分析，非参数法常用的有秩和检验。

二、试验设计中的统计学原理

合理的试验设计与统计处理的可信度存在直接联系，研究者在编写医学论文时应对医学研究设计方法进行说明。在进行试验设计时应遵循随机、对照、均衡和重复四大原则。在进行试验设计的时候通常会涉及到研究对象的选择，研究对象的分组及选择合理的检测指标三个方面的内容。

医学论文就是通过对样本的研究来进行推断总体，找出其共性，得出结论。因此研究者在选择研究对象时应注意选择样本应具有一定数量，能反映出该事物的规律性特征，但又应注意例数不能太多，以免造成不必要的浪费。其选择的原则就是在保证试验结果可靠性的前提下选择最少的样本例数。研究者在选择样本对象后应对其基本特征进行详细的描述，比如患者的年龄、性别、病理分期、疾病诊断的标准等。此外在试验中所用到的试剂、仪器的型号、规格等都应作出说明，以供读者借鉴和做出判断。选定好研究对象后就要对其进行分组。在进行分组时研究者一般遵循统计学中的“随机分配”、“设立对照”以及“均衡”、“重复”的原则。随机化原则是提高组间均衡性的一个重要手段，也是资料分析时进行统计推断的前提。有对照才有比较，在进行组间比较时，应确定好处理因素与实验效应的关系。均衡性则是要使得对结果产生影响的非处理因素尽可能保持一致，这样才能保证对照的结果让人信服。观察实验效应的.指标主要有主观指标与客观指标。正所谓主观指标就是通过问答的方式调查受试者自己判断的主观感受；而客观指标则是通过仪器来检验和测量所得出的结果。在进行试验设计时应选择客观性较强、高灵敏性和精确性的指标。

三、统计学方法的选择

统计学方法的正确选择是直接影响到论文结论可信度的重要依据，因此研究者在编写论文时应注意选择合适的统计学方法。不同的统计学方法应用的范围不同。研究者在编写医学论文时常根据论文研究的目的、资料类型、试验设计的方案、样品大小、水平数、特定条件、数据分布特征以及综合分析等来选择对应的统计方法，同时还要根据专业知识与资料的实际情况，结合统计学原则，灵活地选择。当定性资料正态分布时，研究者一般用均数和标准差来表示统计描述指标；当定性资料不符合正态分布时，则可选用中位数及级差来表示；当定量资料正态分布且组间方差齐时一般选用参数法，反之则选用非参数法。t检验一般适用于小样本（n<50）的定量资料且方差齐的两组数据之间的比较。其特点是在均方差不知道的情况下，可以检验样本平均数的显著性，大样本（n≥50）采用u检验；多个样本均数两两比较则用方差分析，如差异有统计学意义，可采用q检验；Dunnett检验则适用于多个实验组与一个对照组均数的比较。定性资料中，表现为互不相容的类别或属性，分为二分类和多类反应，如治疗结果为显著和好转的人数等，该种资料可选用字检验，大样本（n≥50）时采用u检验。如：患者的治疗结果评定为痊愈、显著有效、好转、无效或死亡。该种资料可选用秩和检验或u检验。总之，不论论文中选用的是哪种统计学方法，都要计算出检验值，然后再根据统计量值来判定P值的大小，结论一般描述为“差异有（无）统计学意义”。

四、常见统计学方法的误用分析及对策

1.统计方法误用。最常见统计方法误用是对等级资料进行比较时应用秩和检验而误用卡方检验。例如：在评价采取不同治疗方法的两组急性脑血管病患者疗效中，治疗组显著有效、有效、无效三种分型分别为15例、10例、8例，对照组分别为14例、11例、9例。本资料例数较少，应选用等级比较的秩和检验，而有些作者却认为只要是率的比较就可以采用字检验。研究者在选择统计学方法时应根据相应的原则，对文章研究目的、资料类型、样品大小、水平数、数据分布特征等进行综合分析后，再来选择对应的统计方法。

2.选用检验方法错误。在有些论文中，作者常将本应用方差分析和q检验的误用t检验。t检验一般适用于小样本（n<50）定量资料且方差齐的两组数据之间的比较，而方差分析及q检验主要用于对多个样本均数进行比较，几种不同治疗或处理方法等的同时比较。例如：在讨论中、西以及中西医结合治疗急性脑血管病时，两组患者的年龄、病程、病情严重程度等差别均无统计学意义，比较三组患者的一些指标变化。组间多重比较应用q检验，但文中作者采用的是t检验，对三组均数进行两两比较。这不仅造成了资料的利用率低，也增加了假阳性的概率，降低了试验结果的可信度。

五、结论表述中的统计学应用

资料的统计处理不是医学研究工作的最终目的，而是通过统计学分析为研究结论提供依据或者线索。因此，在对统计资料进行分析后应把握统计学术语，对结论做出科学的分析跟解释。在根据统计结果得出专业结论时研究者应遵循一个重要原则，就是统计结论都是概率性的，不能绝对地肯定或否定。研究者习惯上将“P<”称为显著性，不应误解为差别很大或者在医学上有显著的价值。统计推断是以一定的概率界值为依据，说明来自同一总体的可能性大小。“差异有统计学意义”说明在试验中的差异不能用抽象误差进行解释；“差异无统计学意义”表明在试验既定的条件下，差异可能是因抽象误差引起的，在增加样本数量的情况下，差异可能变成“有统计学意义”。

参考文献：

[1]医学统计工作的基本内容[J].国际检验医学杂志，2013（19）：2563.

[2]关红阳，郭轶男.医学统计t检验的分析研究[J].中国校外教育，2013（30）：114.

医学论文数据统计分析

秋风送爽，也给我们送来了刘岭教授的统计说说第五期。这一期的统计学方法之选择大家一定要认真学起来，说不定马上你就会用到了。编者语针对常用的基本统计学方法，一般而言说的就是t检验、单因素方差分析和卡方检验，这也是大家在写论文、阅读论文时经常遇到的统计学方法（几乎每篇文章都会涉及这一种或几种方法），那到底该采用何种统计学方法呢？今天我们就此来聊聊。一、拿到数据开始分析之前，一定要进行数据类型的划分（图1），因为不同数据类型资料，描述的方式不一样，统计学方法也不一样。图1 统计资料的类型举个例子（表1）：表1 某地2002年735例65岁以上老年人健康检查记录二、各种类型资料的统计分析（描述与统计推断）1.计量资料特点：每个观察单位的观察值之间有量的区别，有单位；描述形式：最常见采用“X±S”（一般文献中经常见到），用算数均数描述其平均水平，用标准差描述其离散程度。如果遇到数据“特别变态”（特别是标准差大于算数均数），就采用Md(P25,P75)（Md为中位数，P25和P75为四分位数）（表2）。正态分布检验请大家复习：医学科研课堂丨统计说说（三）：你所应该了解的正态、方差齐性检验表2 计量资料常用统计指标的特点及其应用场合统计推断方法：一般分为单因素和多因素两种。单因素分析方法分析要点：一是划清数据类型（计量资料）；二是明确试验设计类型（完全随机设计？几组样本？）；三是注意所用方法的应用条件；四是满足正态方差齐性时采用t检验（注意t检验有三种形式哦！）或单因素方差分析，不满足时采用秩和检验（图2）。图2 计量资料统计方法的正确选择提醒两点：① 如果样本数据不服从正态分布的话，那就只能用非参数检验（秩和检验），但其检验效能低于参数检验（t检验或方差分析）。所谓检验效能低就是本身有差异，却没有能力发现其差异。② 如果是两组以上样本的数据时，不能采用t检验（会导致假阳性错误概率增加），应该采用方差分析。若方差分析的P<，需再进一步两两比较，常用的方法为LSD法或SNK法（注意依旧不能采用t检验）。在上两讲内容中我们已经学过t检验（医学科研课堂丨统计说说（二）：你的t检验做对了吗？）和方差分析（医学科研课堂丨统计说说（四）：统计学方法之灵魂—方差分析）了，至于秩和检验，我们以后会逐步介绍滴。多因素分析一般采用回归分析，主要是线性回归分析，以后会给大家介绍此方法。2.计数资料特点：无序分类，同类别中各观察单位之间没有量的差别，但各类别间有质的不同，各类别互不相容。其中二分类一定是计数资料（例如性别只有男/女之分，是否继发某种疾病只有继发/未继发之分），而多分类满足分类在性质上没有程度等级上的差别，即为计数资料（例如婚姻状况包括未婚、已婚、离异、丧偶，就属于多分类，但各分类没有程度等级差别，因此为计数资料，尿糖定性检测结果包括-、+、++、+++、++++，属于具有程度等级差别的多分类资料，就不属于计数资料，属于等级资料了）。描述形式：最常见采用“例数（%）”（一般文献中经常见到），主要要分清构成比（结构相对数）和率（强度相对数）的差别（表3）。而且在应用时，分母（就是样本量啦）一般不宜过小，分母太小不足以反映数据的客观事实，也不稳定。表3 计数资料常用统计指标的特点及其应用场合比如说：1.某地肺癌患者中男性A例，女性B例，则当地肺癌患者的性别比为A/B就是“比”。2.某次研究共检出了致病菌3种，总株数为A+B+C，其中一种致病菌检出株数为A，那么A/（A+B+C）就是构成比，即该种致病菌占总致病菌的比重或分布。3.某研究对患者（总例数为B）进行治疗，结果治愈的患者例数为A，则A/B即为率（可以理解为治愈率）。统计推断方法：一般分为单因素和多因素两种。单因素分析方法分析要点：一是划清数据类型（计数资料）；二是明确试验设计类型（完全随机设计？几组样本？）；三是注意所用方法的应用条件；四是多样本率比较，若卡方检验的P<，需再进一步两两比较，并进行Bonferroni校正，以控制假阳性（图3）。图3 计数资料统计方法的正确选择提醒两点：① 构成比是以100作为基数，各构成部分所占的比重之和必须为100%，故某组成部分所占比重的增减必影响其它组成部分的比重；② 构成比和率在实际应用时容易混淆，主要区别在分母上，所以应正确选择分母。多因素分析一般采用回归分析，主要是Logistic回归分析，以后会给大家介绍此方法。3.等级资料特点：属于多分类资料，满足多分类在性质上有程度等级上的差别，各分类属性按一定顺序排列（有序），即为等级资料。描述形式：最常见采用“例数（%）”（一般文献中经常见到），这和计数资料的描述大体相同，主要区别在于多个分类排列时一定要按照顺序进行（从小到大或从弱到强）。统计推断方法：等级资料的统计分析方法在单因素分析中采用非参数检验（秩和检验），当然对于双向有序R×C资料，也就说分组变量和结局变量都是有序（等级）的情况，构成比的比较采用卡方检验，程度的比较采用秩和检验，趋势关联性的比较用秩相关（也称等级相关）。多因素分析中采用有序Logistic回归。注意：分类变量（计数资料和等级资料）在软件分析操作时，要适当数量化处理（赋值），赋值情况会直接影响统计分析结果的解释。最后用下面这张图来总结基本统计学方法的选择（图4）。图4 常用基本统计学方法的正确选择今天的内容就到这里，同学们多多复习，有什么问题和不懂的可以在下面留言，我们会请刘岭教授一一解答。好了，让我们期待下一期吧！撰稿：刘岭约稿编辑：刘芹排版：毕丽审核：王东专家简介刘岭：陆军军医大学卫生统计学教研室副教授，主要从事卫生统计学教学、科研工作。担任中华卫生信息学会第八届统计理论与方法专业委员会委员，重庆市预防医学卫生统计专业委员会副主任委员，并担任《第三军医大学学报》等多家杂志的编委、统计审稿专家。历史推荐医学科研课堂丨统计说说（四）：统计学方法之灵魂—方差分析医学科研课堂丨统计说说（三）：你所应该了解的正态、方差齐性检验医学科研课堂丨统计说说（二）：你的t检验做对了吗？医学科研课堂丨统计说说（一）：样本量估算是个什么东东？

一般常用的统计检验方法有：t 检验、卡方检验、方差分析和相关回归分析。统计检验方法的选择主要依据数据的类型(计量、计数) 、组数的多少(两组、多组) 、样本量的大小以及对比的方式(相互比较、配对比较) ,此外计量数据还要考虑分布形态和方差齐性等问题。

医学统计论文

医学统计是研究如何搜集、整理和分析医学研究对象的数据和作出推断的一门学科，下面是我为大家收集整理的是医学统计论文，仅供参考。

摘要：不同的统计分析方法均有其适用的范围和应用的条件，研究者在书写医学论文时应根据论文设计及资料的类型进行合理的试验设计，选择恰当的统计分析方法，切记勿盲目套用。同时，还应注意得出的结果和结论应满足设计的要求。医学统计方法的正确运用，是充分利用试验研究获得的数据，也是最终得出科学、可信的结论的必要条件。

关键词：医学统计；方法；运用；原理；选择

一、统计学方法简介

统计学方法包括统计软件包、统计分析方法以及检验水准三方面的内容。其中医学论文中常提到检验水准即α，它是用来表示组间实际无差别而统计结果判断有差别，犯这类错误的概率。实际工作中常取α=，当研究数据计算的P值小于时，组间差异比较被认为有统计学意义。统计学方法包括统计描述和假设检验两个方面的内容。统计描述是指根据资料及原始数据分布的类型，选择正确的指标来描叙资料及数据的特征。而假设检验即组间差异性检验，是医学论文中最常用的统计学方法。资料类型则包括能用具体数据表示的定量资料与不能用具体数值表示但能反映被观察对象某一特征的定性资料。定性资料的统计描述包括率、相对比和构成比。而参数法及非参数法是常用的定量资料统计分析方法。参数法一般包括t检验、方差分析，非参数法常用的有秩和检验。

二、试验设计中的统计学原理

合理的试验设计与统计处理的可信度存在直接联系，研究者在编写医学论文时应对医学研究设计方法进行说明。在进行试验设计时应遵循随机、对照、均衡和重复四大原则。在进行试验设计的时候通常会涉及到研究对象的选择，研究对象的分组及选择合理的检测指标三个方面的内容。

医学论文就是通过对样本的研究来进行推断总体，找出其共性，得出结论。因此研究者在选择研究对象时应注意选择样本应具有一定数量，能反映出该事物的规律性特征，但又应注意例数不能太多，以免造成不必要的浪费。其选择的原则就是在保证试验结果可靠性的前提下选择最少的样本例数。研究者在选择样本对象后应对其基本特征进行详细的描述，比如患者的年龄、性别、病理分期、疾病诊断的标准等。此外在试验中所用到的试剂、仪器的型号、规格等都应作出说明，以供读者借鉴和做出判断。选定好研究对象后就要对其进行分组。在进行分组时研究者一般遵循统计学中的“随机分配”、“设立对照”以及“均衡”、“重复”的原则。随机化原则是提高组间均衡性的一个重要手段，也是资料分析时进行统计推断的前提。有对照才有比较，在进行组间比较时，应确定好处理因素与实验效应的关系。均衡性则是要使得对结果产生影响的非处理因素尽可能保持一致，这样才能保证对照的结果让人信服。观察实验效应的.指标主要有主观指标与客观指标。正所谓主观指标就是通过问答的方式调查受试者自己判断的主观感受；而客观指标则是通过仪器来检验和测量所得出的结果。在进行试验设计时应选择客观性较强、高灵敏性和精确性的指标。

三、统计学方法的选择

统计学方法的正确选择是直接影响到论文结论可信度的重要依据，因此研究者在编写论文时应注意选择合适的统计学方法。不同的统计学方法应用的范围不同。研究者在编写医学论文时常根据论文研究的目的、资料类型、试验设计的方案、样品大小、水平数、特定条件、数据分布特征以及综合分析等来选择对应的统计方法，同时还要根据专业知识与资料的实际情况，结合统计学原则，灵活地选择。当定性资料正态分布时，研究者一般用均数和标准差来表示统计描述指标；当定性资料不符合正态分布时，则可选用中位数及级差来表示；当定量资料正态分布且组间方差齐时一般选用参数法，反之则选用非参数法。t检验一般适用于小样本（n<50）的定量资料且方差齐的两组数据之间的比较。其特点是在均方差不知道的情况下，可以检验样本平均数的显著性，大样本（n≥50）采用u检验；多个样本均数两两比较则用方差分析，如差异有统计学意义，可采用q检验；Dunnett检验则适用于多个实验组与一个对照组均数的比较。定性资料中，表现为互不相容的类别或属性，分为二分类和多类反应，如治疗结果为显著和好转的人数等，该种资料可选用字检验，大样本（n≥50）时采用u检验。如：患者的治疗结果评定为痊愈、显著有效、好转、无效或死亡。该种资料可选用秩和检验或u检验。总之，不论论文中选用的是哪种统计学方法，都要计算出检验值，然后再根据统计量值来判定P值的大小，结论一般描述为“差异有（无）统计学意义”。

四、常见统计学方法的误用分析及对策

1.统计方法误用。最常见统计方法误用是对等级资料进行比较时应用秩和检验而误用卡方检验。例如：在评价采取不同治疗方法的两组急性脑血管病患者疗效中，治疗组显著有效、有效、无效三种分型分别为15例、10例、8例，对照组分别为14例、11例、9例。本资料例数较少，应选用等级比较的秩和检验，而有些作者却认为只要是率的比较就可以采用字检验。研究者在选择统计学方法时应根据相应的原则，对文章研究目的、资料类型、样品大小、水平数、数据分布特征等进行综合分析后，再来选择对应的统计方法。

2.选用检验方法错误。在有些论文中，作者常将本应用方差分析和q检验的误用t检验。t检验一般适用于小样本（n<50）定量资料且方差齐的两组数据之间的比较，而方差分析及q检验主要用于对多个样本均数进行比较，几种不同治疗或处理方法等的同时比较。例如：在讨论中、西以及中西医结合治疗急性脑血管病时，两组患者的年龄、病程、病情严重程度等差别均无统计学意义，比较三组患者的一些指标变化。组间多重比较应用q检验，但文中作者采用的是t检验，对三组均数进行两两比较。这不仅造成了资料的利用率低，也增加了假阳性的概率，降低了试验结果的可信度。

五、结论表述中的统计学应用

资料的统计处理不是医学研究工作的最终目的，而是通过统计学分析为研究结论提供依据或者线索。因此，在对统计资料进行分析后应把握统计学术语，对结论做出科学的分析跟解释。在根据统计结果得出专业结论时研究者应遵循一个重要原则，就是统计结论都是概率性的，不能绝对地肯定或否定。研究者习惯上将“P<”称为显著性，不应误解为差别很大或者在医学上有显著的价值。统计推断是以一定的概率界值为依据，说明来自同一总体的可能性大小。“差异有统计学意义”说明在试验中的差异不能用抽象误差进行解释；“差异无统计学意义”表明在试验既定的条件下，差异可能是因抽象误差引起的，在增加样本数量的情况下，差异可能变成“有统计学意义”。

参考文献：

[1]医学统计工作的基本内容[J].国际检验医学杂志，2013（19）：2563.

[2]关红阳，郭轶男.医学统计t检验的分析研究[J].中国校外教育，2013（30）：114.

医学论文

流行病学统计学论文数据分析