流行病学与统计 医学统计学:根据统计学的原理和方法,研究医学数据收集、表达和分析的一门应用各学科。 医学统计的主要内容: 研究对象:医学数据 统计设计:调查设计和实验设计 统计描述:率、均数 统计推断:对统计指标的差别和关联性进行分析和推断 医学统计资料的类型 统计工作的基本步骤包括: 1. 研究设计 2. 收集资料:来源:经常性资料【医疗卫生工作记录(病历、医学检查记录、出生死亡报表等)健康检查记录】;一时性资料【专题调查或实验研究】。要求:完整、正确和及时;足够数量;代表性和可比性 3. 整理资料:原始数据的检查与核对:常规检查;取值范围检错;逻辑检错 数据的分组设计和归纳汇总。4. 分析资料:统计描述;统计推断(区间估计、假设检验) 统计工作的基本步骤包括: A .实验和调查 B.统计设计 C.收集资料 D.整理资料 E.分析资料 统计工作中,分析资料指的是: A .统计设计 B.收集资料 C.整理资料 D.统计描述 E.统计推断 总体:根据研究目的而确定的同质观察单位的全体。有限总体和无限总体。 样本:是从总体中随机抽取有代表性的部分观察单位变量值的集合。 参数:指总体指标。如总体均数μ,总体标准差σ,总体率π。 统计量:指样本指标。如样本均数 ,样本标准差S ,样本率p 。 误差:指实际值与真实值之差。分为随机误差(随机测量误差和抽样误差)、非随机误差(主要是系统误差) 概率是对总体而言。是某随机事件发生的可能性大小的数值,常用符号P 表示。取值范围0~1。 在统计学中,误差的种类有 A .标准误差 B.计算误差 C .系统误差√ D .随机测量误差√ E .抽样误差√ 统计学上的误差主要有 A. 系统误差 B.标准误差 C.随机测量误差 D.抽样误差 E.计算错误误差 算术均数: 简称均数,用于描述对称分布或近似正态分布的资料。 描述正态分布资料集中趋势的指标是 A. 百分位数 B.中位数 C.算术均数 D.几何均数 描述正态分布资料集中趋势的指标是 A. 中位数 B.几何均数 C.算术平均数 D.标准差 有9名健康成人的空腹胆固醇测定值(mmol/L)为,,,,,,,,。求算术均数。 有7份血清的抗体效价分别为1:2, 1:4, 1:8, 1:16, 1:32, 1:64, 1:128,求平均抗体效价。 n 5. 61+3. 96+3. 67+4. 99+4. 24+5. 06+5. 20+4. 79+5. 93= 9 43. 45= 9 =4. 83(m m ol /L ) X = G =lg -1( 血清抗体平均效价为1:16 注意:变量值中不能有0;不能同时出现负数和正数;若全为负数,计算时先把符号去掉计算 中位数(median, M):可用于任何分布的计量资料 有7名正常人的血压(舒张压)测定值(mmHg )为:72,75,76,77,81,82,86,87求中位数。 M =(77+81)/2=79 一组从小到大排列的定量变量,位次居中的指标是 A .算术均数 B.几何均数 C.中位数 D.百分位数 描述离散趋势的指标是 A. 标准差 B.中位数 C. 几何均数 D.算术均数 n lg 2+lg 4+lg 8+lg 16+lg 32+lg 64+lg 128 =lg -1() 7 =lg -1(1. 204) =16 lg X ) 方差(variance )与标准差(standard deviation):表示数据的平均离散情况,常用于描述服从正态分布的资料的离散程度。 某地20岁男子160人 某地不同年龄女童身高(cm )的变异程度 统计表的基本结构与要求:标题、标目、线条、数字4部分组成。表中数字区不插入文字,不列备注项。必须说明者表“*”号等,在表下方说明。 统计表的基本结构为 A .标题、横标目、纵标目、线条 B.标题、横标目、纵标目、数字 C .标题、横标目、纵标目、备注 D.标题、标目、线条、数字 统计表的基本构成有 A .标题 B.横标目 C.纵标目 D .线条 E.数字 统计表内不列的项是 A. 标目 B. 线条 C.数字 D.备注 制图的基本要求 (1)根据资料的性质和分析目的,选择合适的图形。 (2)基本结构:标题、标目、刻度、图例4部分组成。 标题:一般放在图的下方,左侧加图号 标目:分为横标目和纵标目,分别表示横轴和纵轴数字刻度的意义 刻度: 图例:说明统计图中各种图形锁代表的事物。放在右上角或下方中间 比较两家医院15年床位数的增加速度,可选用的统计图是 A .构成图 B .直条图 C .线图 D .直方图 某医院拟表示一年中各月病床使用率的变化趋势,应选用的统计图是 A .普通线图 B .直条图 C .散点图 D .直方图 比较某地2001年和2011年结核、心脏病和肿瘤的死亡率,可选择的统计图是 A. 单式条图 B.复式条图 C.普通线图 D.半对数线图 分析某医院1998年住院病人5种疾病构成比可选用的统计图是 A. 单式直条图 B. 复式直条图 C.圆图 D. 线图 分析某医院1998年和2008年住院病人5种疾病构成比可选用的统计图是 A .单式直条图 B.复式直条图 C.百分比条图 D.统计地图 观察某地十年肺结核患病率的变化趋势,可选择的统计图是 A. 条图 B.圆图 C.线图 D.直方图 比较某地2001年和2011年结核、心脏病和肿瘤的死亡率,可选择的统计图是 A. 单式条图 B.复式条图 C.普通线图 D.半对数线图 假设检验的基本步骤 1. 建立假设检验,确定检验水准 (1)根据统计推断目的提出对总体特征的假设 无效假设,或称为零假设,记作H0,即假设差异是由于抽样误差所致,总体参数相同 备择假设,记作H1,即差别不是由于抽样误差所致,总体参数不同 (2)确定检验水准亦称显著性水准,用α表示 2. 选定检验方法,计算检验统计量(卡方、t 值、F 值) 3. 确定P 值,做出统计推断结论 注意:假设检验是针对总体而言的 假设检验的注意事项 1.. 检验方法的正确选择 定量资料 两个独立样本均数比较:t 检验 多个独立样本均数比较:方差分析 配对设计:配对t 检验 随机区组资料:随机区组设计方差分析 2. 结果的解释:差别有统计学意义与有无实际意义的关系 I 型错误(第一类错误):指拒绝了实际上是成立的H0。用α表示。 II 型错误(第二类错误):指不拒绝实际上是不成立的H0。用β表示。 1. 流行病学研究的对象是( ) A.病人 B.健康人 C.人群 D.亚健康人 E.亚临床的人 下列哪一项是分析流行病学方法( ) A.横断面研究 B.生态学研究 C.疾病监测 D.病例对照研究 E.社区干预试验 有学者通过调查肺癌病人和非肺癌的人过去的吸烟情况,来研究吸烟和肺癌的关系。这种方法称为: A.现况调查 B.描述性研究 C.筛检试验 D.病例对照研究 E.队列研究 有学者对某人群进行了高血压的调查,获得了该人群高血压的患病率,并对不同年龄组的高血压患病情况进行了分析。这种调查研究属于: A.探讨疾病的病因 B.探讨发病机制 C.描述疾病的分布 D.研究疾病自然史 E.疾病筛检 计算患病率的分子是( ) A .观察期间某病的新发病例数 B.观察期间某病的新旧病例数 C .观察期间之后某病的患病人数 D.观察期间某病的暴露人口数 E .观察期间所有人口数 某地区在1个月内进行了糖尿病的普查,可计算当地糖尿病的( ) A .发病率 B.死亡率 C.患病率 D.二代发病率 E.罹患率 下面哪一个公式用于计算发病率(E ) A .(受检者中阳性人数/受检人数)×100% B.(受检者中阳性人数/同期暴露人数)×100% C .(受检者中阳性人数/受检者人数)×100% D.(受检者中阴性人数/受检者人数)×100% E.(某一时期内新病例数/同期暴露人数)×100% 一个地区通过首次高血压普查,可计算当地的( ) A .高血压患病率 B.高血压罹患率 C.高血压发病率 D.高血压病死率 E.家庭续发率 某地区1960年度疫情资料统计,狂犬病患者100人全部死亡,此资料可计算 A .粗死亡率 B.死亡专率C .标化死亡率 D.病死率 E.此资料不全难以计算 下列叙述中,不属于病例对照研究优点的是( ) A .资料收集后可在短时间内得到结果 B.特别适用于罕见病的研究 C .一次调查可同时研究一种疾病与多个因素的关系 D.可直接获得发病率资料 E .所需研究对象的数量相对较少 病例对照研究中的调查对象是( ) A .病例组是怀疑患有欲研究疾病的病人,对照组是未患该病的人 B .病例组是具有某种暴露的人,对照组是未有该暴露的人 C .病例组是确诊患有欲研究疾病的病人,对照组是未患该病的人 D .病例组和对照组均是具有某种暴露的人 E.病例组是确诊患有欲研究疾病的病人,对照组是怀疑患有该病的 在病例对照研究中,若病例组某危险因素暴露史的比例在统计学上明显高于对照组,则表明( D ) A .该因素与疾病有统计学关联 B.该因素与疾病有因果关联 C .该因素是疾病的病因 D.该因素与疾病无关联 E.该病由该因素引起 下列关于病例对照研究特点的说法中,正确的为( C ) A .暴露与疾病都是现在的情况 B.能够确证因素与疾病的因果关联 C .由因及果的研究 D.需要随机分组 E.属于观察法 OR 主要应用于( A ) A .现况研究 B.生态学研究 C.现场试验 D.病例对照研究 E. 队列研究 属于病例对照研究缺点的是( E ) A .不能分析疾病与多种因素的关联 B.不能估计RR C.样本含量要求很大 D .容易产生医德问题 E.回忆信息时,易出现错误 下列说法中,不属于队列研究特点的是( B ) A .由因及果,前瞻性研究 B.属于描述性研究 C.能同时研究一种因素与多种疾病的关系 D .需要设立对照组 E.因果关联的说服力大于病例对照研究 队列研究中的研究对象为( C ) A .在一般人群中选取有、无某暴露因素的两个组 B.在患有某病者中选择有、无某暴露因素的两个组 C .在未患该病人群中选择有、无某暴露因素的两个组 D.患有某种疾病的人群随机分成的两组 E .一组患有某种疾病者,一组为未患有该种疾病者 在队列研究中,暴露组的疾病发病率与对照组的疾病发病率的差值称为 ( A ) A . AR B. RR C.OR D.PAR E. AR% 队列研究属于( B ) A .相关性研究 B.分析性研究 C.描述性研究 D.理论性研究 E.实验性研究 在队列研究中,估计某因素与某疾病关联强度的指标为( E ) A .总人群中该病的发病率 B.暴露人群中该病的发病率 C .人群中危险因素的暴露率 D.OR E. RR 在队列研究中,研究对象的分组原则是按( A ) A .是否暴露于某因素分组 B.随机分组 C.是否患病分组 D.人为随意分组 E.领导意图分组 属于实验流行病学特征的是(E ) A .由果及因,回顾性研究 B.属于观察法 C.获得因素与疾病联系强度的指标主要为比值比 D .不能确证因果关联 E.人为施加干预措施 关于临床试验中的对照组,正确的说法为( B ) A .是人群中的非患欲研究疾病者 B.是患欲研究疾病者,但在处理上不同于实验组 C .不具有某种暴露因素的人 D.与患欲研究疾病者同时入院的其它患者 E.所欲研究疾病的轻型患者 多选题: 下列所述中属于抽样调查优点的有( A C D ) A .工作量小 B.工作量大 C.省时间和人力、物力 D.工作易做到细致 E .特别适用于患病率很低的疾病调查 属于队列研究缺点的为( A C D ) A .观察时间长,花费大 B.易出现回忆偏倚 C.不宜用于研究发病率很低的疾病 D .设计的要求高,实施复杂 E.不能计算发病率、死亡率等 属于实验流行病学方法的有( A/C ) A .临床试验 B.普查 C.社区试验 D.队列研究 E.个体试验 反映诊断试验可靠性的指标是( E) A .灵敏度 B.特异度 C.约登指数 D.阳性似然比 E.符合率 为提高诊断试验的灵敏度, 对几个独立试验可(B ) A .串联使用 B.并联使用 C.先串联后并联使用 D .要求每个试验假阳性率低 E.要求每个试验特异度低 某病早期治疗效果好,漏诊后果严重,对此病的试验诊断应(A ) A .提高灵敏度 B.提高特异度 C.降低诊断的截断值 D.提高阳性预测值 E.提高阴性预测值 诊断试验的真实性是指(A ) A .被试验的测定值与实际值的符合程度 B.是重复试验获得相同结果的稳定程度 C .是观察者对测量结果判断的一致程度 D.是试验结果表明有无疾病的概率 E.指病例被试验判为阳性的百分比 流行病学是研究疾病、健康状态和事件在人群中的分布、影响和决定因素,用以预防科控制疾病、促进健康的学科。 流行病学研究的方法: 观察性研究 实验性研究 理论性研究 观察性研究: 描述性研究 (横断面研究(现况调查)比例死亡比研究 生态学研究) 、 分析性研究 (病例对照研究 队列研究(随访研究)) 实验性研究:临床实验、现场试验、社区干预试验和整群随机试验 理论性研究:流行病学方法研究理论流行病学 比例:是表示同意事物局部与总体之间数量上的比值,分子和分母的单位相同,且分子包含于分母之中。(构成比) 某医院住院病人中有15%的胃癌患者,该15%是: A. 患病率 B.发病率 C.构成比 D.相对比 例:某病患者409人,其中男性170人,女性239人,男女性构成比见右侧表所示。具体计算: 表 409名患者性别构成 男性患者数 男性构成比=⨯100% 男女性患者总数170 =⨯100%= 170+239 构成比的特点是各组成部分的构成比之和为100% 例如,某年某地出生婴儿中,男性婴儿有185人,女性婴儿有176人,则: 出生婴儿性别比= 男性婴儿数女性婴儿数 = 185176 = .比或相对比:是两个相关指标之比,说明两指标间的比例关系。两个指标可以是性质相同,如不同时期发病数之比;也可以性质不同,如医院的门诊人次与病床数之比。常用倍数或百分数表示。 两指标可以是绝对数、相对数或平均数。 相对比= 甲指标 ⨯100%)乙指标 3.率:表示一定时间内,实际发生某现象的例数与可能发生该现象的总例数之比,用以说明某现象发生的频率或强度,常用百分率(%)、千分率(‰)、万分率(1/万) 或十万分率(1/10万)等表示。 率= 说明某现象发生频率或强度的相对数是 某现象实际发生的例数 ⨯k 可能发生该现象的总例数 A. 率 B.构成比 C.相对比 D.百分位数 发病率 发病率= 一定时期内某人群某病新病例数 ⨯k 同期暴露人口数 用途:反映该病的风险。用来描述疾病的分布、探讨发病因素、提出病因假设、评价防治效果 1.描述疾病的发病率指标,计算时分子应为 A .新发病例数 B.新旧病例数 C.受检者中阳性人数 D.易感接触者中发病人数 2.发病率的分子是 A .患病人数之和 B.新病人数之和 C.感染人数之和 D.死亡人数之和 1. 描述疾病的患病率指标,计算时分子应为:B A. 新发病例数 B.新旧病例数 C.受检者中阳性人数 D.易感接触者中发病人数 2. 患病率:又称现患率或流行率。 患病率= 特定时间点某人群中某病新旧病例数 ⨯k 同期观察人口数 K=100%,1000‰,10 000/万或100 000/10万 时点患病率:调查时间一般在1个月内 期间患病率:调查时间超过1个月 影响因素:患病率=发病率×病程 用途:患病率通常用来描述病程较长的慢性病发生或流行情况 黄炳率与发病率的区别 1. 死亡率:指某人群在一定期间内(1年)死于所有原因的人数在该人群中所占比例。 K=1000或100 000/10万 死亡率= 某时期内死亡总数 ⨯k 同期平均人口数 2. 病死率:在一定时间内患某病的全部患者中因该病而死亡的比例。多用于病程短的急性病。表明疾病的严重程度。 病死率= 某时期因某病死亡的人数 ⨯100% 同期患某病的人数 3. 生存率:又称存活率。指患某病的人(或接受某种治疗措施的患者)经n 年随访,到随访结束时仍存活的病例数与随访病例的总数之比 n年生存率是评价慢性、病死率高的疾病远期疗效的重要指标。 n 年生存率= 1. 相对危险度(RR )或率比:指暴露组发病率与非暴露组发病率之比。反映了暴露于疾病的关联强度。RR= Ie/I0 RR=1,暴露与疾病无联系 RR1,暴露与疾病存在正联系(暴露是危险因子) 例:Doll 和Hill 调查了英国35岁以上男性吸烟习惯与肺癌死亡率的关系,不吸烟人群的肺癌死亡率为‰,中度吸烟者(15-24支/日)的肺癌死亡率为‰。RR= 说明吸烟者死于肺癌的危险性是不吸烟者的倍。 2. 比值比(OR ):又称优势比、交叉乘积比。指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。 发病率(死亡率)很低;研究对象代表性好—— OR≈RR 归因危险度(AR )或率差(RD ):是指暴露组发病率与非暴露组发病率之差,反映发病归因于暴露因素的 随访满n 年后仍存活的病例数 ⨯100% 随访满n 年的该病病例数 程度。AR= Ie-I0 =RR×I0-I0 =I0 (RR-1) AR 意义:暴露者中完全由某暴露因素所致的发病率或死亡率。 例:AR=‰‰=‰。表明在每日吸15-24支香烟当中由于吸烟所致的肺癌死亡率为‰ 归因危险度百分比(AR%):指暴露人群中有暴露因素引起的发病在所有发病中所占的百分比。 AR%= (Ie-I0)/Ie×100% 例:AR%=()/×100%= 表示在每日吸15-24支香烟者中有的肺癌是由吸烟所致。 现况调查:在某一人群中应用普查或抽样调查等方法收集特定时间内有关变量、疾病或健康状况的资料,以描述目前疾病或健康状况的分布及某因素与疾病的关联。 现况调查的种类 (!)普查:指在特定时间内,对特定范围人群的每一个成员所进行的调查,也称全面调查。 (2)抽样调查:是从总体人群中随机抽取有代表性的一部分人(样本)进行调查,以样本结果来估计总体人群的疾病或健康状况的一种调查方法。 抽样方法:非随机和随机抽样 现况调查优缺点 (1)优点:研究结果有较强的推广意义;可形成同期对照;是病因探索中的基础性工作 (2)局限性:难以确定心因后果;不能获得发病率资料;有可能低估患病水平 队列研究的原理是将特定的人群按其是否暴露于某因素或按不同暴露水平分为n 个群组或队列,追踪观察一段时期,比较两组或各组发病率或死亡率的差异,以检验该因素与某疾病有无因果联系及联系强度大小的一种观察性研究方法。 1. 队列研究主要用于: A .研究发病机理 B.研究职业种类 C .验证某种暴露因素对发病率或死亡率的影响 D.研究个体基因突变性 队列研究的特点: 时序是前瞻性研究 观察性对比研究 暴露组否分组 研究方向由“因”推“果” 追踪观察的两组间的发病率或死亡率差异,RR=[a/(a+b)/[c/(c+d)] 1. 队列研究的特点有 A. 属于观察法√ B.属于实验法 C.设立对照√ D.研究方向由因推果√ E.研究方向由果追因 队列研究的优缺点: (1)优点: 研究对象在疾病发生前按暴露情况分组且进行随访,所获资料完整可靠,无回忆偏倚可直接计算发病率或死亡率,因而能计算相对危险度和特异危险度等指标,直接估计暴露于疾病的联系强度大小可同时研究一种因素与多个疾病的关系, 有助于了解疾病自然史。暴露因素与疾病的时间先后顺序清晰,因此论证因果关系的 能力强。暴露因素的作用可分等级,便于计算剂量-效应关系。样本量大,结果较稳定。在有完整资料记录的条件下,可做回顾性历史队列研究。 (2)局限性: 观察时间长,费人力、费钱,不能在较短时间内得到结果;准备工作繁重,设计的科学性要求高,实施难度大。暴露人年计算工作量较为繁重。不适于研究发病率很低的疾病。由于随访时间长,所以容易产生失访偏倚 多选 1. 队列研究的用途有( ) A. 用于验证某种暴露因素对发病率的影响 B.用于传染病发病机理研究 C.用于检验职业人群 D. 用于人群干预研究 E.描述疾病的自然发展过程 病例对照研究: 选择患有所研究疾病的患者作为病例组,同时选择未患该病的人作为对照组,调查两组人群发病前对某个(些)因素的暴露状况,比较两组暴露率和暴露水平的差异,以研究该疾病与这个(些)因素的关系。 病例研究的优点 1. 在疾病发生后进行,研究开始时已有一批可供选择的病例 2. 研究对象按发病与否分成病例组与对照组 3. 研究因素的暴露状况是通过回顾获得的 4. 由果及因的推理顺序 5. 比较两组暴露率或暴露水平,分析暴露于疾病的联系。OR=ad/bc 1. 病例对照研究的因果顺序是:c A .由因追果 B.由因追因 C.由果追因 D.由果追果 2. 病例对照研究在时间上属于: b A. 现况性研究 B.回顾性研究 C.前瞻性研究 D.回顾加前瞻性研究 实例 目的:A 型性格与冠状动脉病变的关系 研究对象: 病例组:经冠状动脉造影确诊的冠心病患者 对照组: 医院对照(内对照):冠状动脉造影正常+ECG平板运动试验阴性的其他科室住院者 人群对照(外对照):中型企业健康普查人群完全随机抽样( ECG平板运动试验阴性) 信息采集: 信息采集: A 型性格:全国冠心病与A 型行为类型协作组1985年制定的《A 型性格问卷》,按确诊冠心病前两年的情况 其他危险因素:一般人口学特征,既往高血压、高血脂等心血管疾病史及家族史,烟酒及膳食习惯等。 冠状动脉病变指数:按造影所示病变部位及支数、狭窄程度及范围,结合美国心脏病协会规定的节段法进行评判。 研究对象例数:实际分析339人 病例组139人 医院对照83人 人群对照117人 主要结果: 病例组与医院和人群对照组之间在年龄、性别、居住地及工作年限、职业构成等方面经检验,均无显著性差异,说明各组间可比性较好 A 型性格发生冠心病的危险性: 男性:OR 值(95%CI:) 女性: OR值(95%CI:) 性格评分等级与冠状动脉病变的关系:呈明显剂量-效应关系 控制和调整了各因素的混杂后,A 型性格与冠状动脉病变的发生依然密切相关 表6-2 性格类型与冠状动脉疾病程度间关系的对比分析 实验性研究:又称干预研究,基本性质是研究者在一定程度上掌握着实验的条件,主动给予研究对象某种干预措施。 主要类型:临床试验、现场试验、社区试验、类实验 实验研究的特点: 1. 前瞻性研究:干预在前,效应在后 2.随机分组: 3. 设立对照组:来自同一总体 4.有干预措施:容易产生伦理学问题 临床试验是按实验法,运用随机分配的原则将试验对象分为试验组和对照组,给实验组某种治疗措施,不给对照组该措施或给予安慰剂(placebo ),经过一段时间后评价两种措施产生的效应,从而评价临床治疗、 预防措施的效果和进行病因研究。 诊断指标: 客观指标:仪器测定指标 主观指标:患者主诉 半客观指标:诊断者的主观感知(肿物的硬度、大小) 诊断标准:生物统计学方法、临床判断法、ROC 曲线法 真实性:有效性、效度或准确性。是指待评价试验所获得的测量值与实际情况(金标准测量值)符合程度。 灵敏度(真阳性率) 特异度(真阴性率) 误诊率(假阳性率) 漏诊率(假阴性率) 似然比 正确诊断指数 练习题 提高诊断试验灵敏度的办法是( ) A. 串联试验 B.并联试验 C.先串联后并联 D.先并联后串联 筛检试验:通过快速的检验、检查或其他措施,将可能有病但表面上健康的人,同那些可能无病的人区分开。 筛检的主要用途: 早发现临床前期的可疑患者(二级预防) 发现高危个体(一级预防) 流行病学监测 了解疾病的自然史 小王是北京海淀区万寿路社区卫生服务中心的一名健康管理师,需要针对本社区老年常见慢性病患者进行健康管理,计划两年之内增加高血压、糖尿病等的检出率、建档率和随访干预覆盖率,五年之内减少因高血压、糖尿病发病和死亡等指标,那么他应该从什么地方开始动手呢? 该小区人群一般人口学特征(如年龄、职业、婚姻状况、性别等)情况如何分布? 该小区人群常见慢性病(高血压、糖尿病、周围血管疾病、冠心病等)患病率如何? 影响这些慢性病患者的危险因素有哪些?如何进行干预? 社区中高血压、糖尿病患者的远期心血管病(主要是冠心病和脑卒中)发病和死亡风险如何,怎样预测?在进行12个月的干预后,如何评价效果?
一、 SAS统计软件 SAS 是英文Statistical Analysis System的缩写,翻译成汉语是统计分析系统,最初由美国北卡罗来纳州立大学两名研究生开始研制,1976 年创立SAS公司, 2003年全球员工总数近万人,统计软件采用按年租用制,年租金收入近12亿美元。SAS系统具有十分完备的数据访问、数据管理、数据分析功能。 在国际上, SAS被誉为数据统计分析的标准软件。SAS系统是一个模块组合式结构的软件系统,共有三十多个功能模块。SAS是用汇编语言编写而成的,通常使用SAS 需要编写程序, 比较适合统计专业人员使,而对于非统计专业人员学习SAS比较困难。SAS最新版为版。网址:。 SAS是美国SAS(赛仕)软件研究所研制的一套大型集成应用软件系统,具有比较完备的数据存取、数据管理、数据分析和数据展现的系列功能。尤其是它的创业产品—统计分析系统部分,由于具有强大的数据分析能力,一直是业界中比较著名的应用软件,在数据处理方法和统计分析领域,被誉为国际上的标准软件和最具权威的优秀统计软件包,SAS系统中提供的主要分析功能包括统计分析、经济计量分析、时间序列分析、决策分析、财务分析和全面质量管理工具等。 SAS系统是一个组合的软件系统,它由多个功能模块配合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理着用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。它除了可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各模块的安装及更新都可通过其安装程序比较方便地进行。 SAS系统具有比较灵活的功能扩展接口和强大的功能模块,在BASE SAS的基础上,还可以增加如下不同的模块而增加不同的功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、SAS /FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)等等。 SAS提供的绘图系统,不仅能绘各种统计图,还能绘出地图。SAS提供多个统计过程,每个过程均含有极丰富的任选项。用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。 目前SAS软件对Windows和Unix两种平台都提供支持,最新版本分别为和。与以往的版本比较,版的SAS系统除了在功能和性能方面得到增加和提高外,GUI界面也进一步加强。在版中,SAS系统增加了一个PC平台和三个新的UNIX平台,使SAS系统这一支持多硬件厂商,跨平台的大家族又增加了新成员。SAS 的另一个显著特征是通过对ODBC、OLE和MailAPIs等业界标准的支持,大大加强了SAS系统和其它软件厂商的应用系统之间相互操作的能力,为各应用系统之间的信息共享和交流奠定了坚实的基础。 虽然在我国SAS的逐步应用还是近几年的事,但是随着计算机应用的普及和信息事业的不断发展,越来越多的单位采用了SAS软件。尤其在教育、科研领域等大型机构,SAS软件已成为专业研究人员实用的进行统计分析的标准软件。 然而,由于SAS系统是从大型机上的系统发展而来,其操作至今仍以编程为主,人机对话界面不太友好,系统地学习和掌握SAS,需要花费一定的精力。而对大多数实际部门工作者而言,需要掌握的仅是如何利用统计分析软件来解决自己的实际问题,因此往往会与大型SAS软件系统失之交臂。但不管怎样,SAS作为专业统计分析软件中的巨无霸,现在鲜有软件在规模系列上与之抗衡。 二、 SPSS统计软件 SPSS是英文Statistical package for the social science 的缩写,翻译成汉语是社会学统计程序包,20世纪60年代末由美国斯坦福大学的三位研究生研制,1975年在芝加哥组建SPSS总部。SPSS系统特点是操作比较方便,统计方法比较齐全,绘制图形、表格较有方便,输出结果比较直观。SPSS是用FORTRAN语言编写而成。适合进行从事社会学调查中的数据分析处理。最新版为版。网址:。 SPSS原名社会科学统计软件包,现已改名为统计解决方案服务软件。是世界著名的统计分析软件之一。 20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,同时成立了SPSS公司,并于1975年在芝加哥组建了 SPSS总部。20世纪80年代以前,SPSS统计软件主要应用于企事业单位。1984年SPSS总部首先推出了世界第一套统计分析软件微机版本 SPSS/PC+,开创了SPSS微机系列产品的先河,从而确立了个人用户市场第一的地位。 同时SPSS公司推行本土化策略,目前已推出9个语种版本。SPSS/PC+的推出,极大地扩充了它的应用范围,使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS的自动统计绘图、数据深入分析、使用灵活方便、功能设计齐全等方面给予了高度的评价与称赞。目前已经在国内广泛流行起来。它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要是掌握一定的 Windows操作技能,粗通统计分析原理,就可以使用该软件进行各种数据分析,为实际工作服务。 SPSS for Windows是一个组合式软件包,目前已经开发出SPSS12版本,它集数据整理、分析功能于一身。用户可以根据实际需要和计算机的功能选择模块,以降低对系统硬盘容量的要求,有利于该软件的推广应用。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种统计图形和地图。 SPSS for Windows的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL及DBF数据文件,现已推广到多种操作系统的计算机上,最新的版采用 DAA(Distributed Analysis Architecture,分布式分析系统),全面适应互联网,支持动态收集、分析数据和HTML格式报告,领先于诸多竞争对手。 方便易用是SPSS for Windows的主要优点,同时也是SPSS不够全面的原因所在。 三、 BMDP统计软件 BMDP是英文Biomedical computer programs 的缩写,翻译成汉语是生物医学计算程序,美国加州大学于1961年研制,是世界上最早的统计分析软件。特点是统计方法齐全,功能强大。但1991年的 版后没有新的版本推出,使用不太普及,最后被SPSS公司收购。 四、 Stata统计软件 Stata统计软件由美国计算机资源中心(Computer Resource Center)1985年研制。 特点是采用命令操作,程序容量较小,统计分析方法较齐全,计算结果的输出形式简洁,绘出的图形精美。不足之处是数据的兼容性差,占内存空间较大,数据管理功能需要加强。最新版为版。网址:。 五、 EPINFO软件 EPINFO是英文Statistics program for epidemiology on microcomputer 的缩写,翻译成汉语是流行病学统计程序。美国疾病控制中心CDC和WHO共同研制,为完全免费软件。特点是数据录入非常直观,操作方便,并有一定的统计功能,但方法比较简单,主要应用于流行病学领域中的数据录入和管理工作。最新版为Epidata 版及EPINFO2000版。 六、 Minitab Minitab由美国宾州大学研制。其特点是简单易懂,很方便进行试验设计及质量控制功能。在国外大学统计学系开设的统计软件课程中,Minitab与SAS、BMDP并列,根据没有SPSS的份。最新版本为版,网址:。 七、 Statistica Statistica为一套完整的统计资料分析、图表、资料管理、应用程式发展系统;美国StatSoft公司开发。能提供使用者所有需要的统计及制图程序,制图功能强大,能够在图表视窗中显示各种统计分析和作图技术。 八、 SPLM统计软件 SPLM是英文Statistical program for linear modeling 的缩写,翻译成汉语是线性模型拟合统计软件程序。1988年由解放军第四医学大学统计教研室研制。系统特点是采用线性模型的方法,实现各种统计方法的计算。统计方法比较齐全,功能比较强大。SPLM采用FORTRAN语言编写完成。但1999年推出版后无新的产品推出。 九、 CHISS统计软件 CHISS 是英文Chinese High Intellectualized Statistical Software的缩写,翻译成汉语是中华高智统计软件, 由北京元义堂科技公司研制,解放军总医院、首都医科大学、中国中医研究院等参加协作完成。1997年开始研发,2001年推出第一版。CHISS是一套具有数据信息管理、图形制作和数据分析的强大功能,并具有一定智能化的中文统计分析软件。CHISS的主要特点是操作简单直观,输出结果简洁。既可以采用光标点菜单式也可采用编写程序来完成各种任务。CHISS用C++语言、 FORTRAN语言和delphi 开发集成,采用模块组合式结构,已开发十个模块。 CHISS可以用于各类学校、科研所等从事统计学的教学和科研工作。最新版为CHISS2004版。网址:。 十、 SASD统计软件 SASD是英文package for Statistical analysis of stochastic data 的缩写,翻译成汉语是随机数据统计分析程序包。它是由中国科学院计算中心研制。系统特点是以FORTRAN源程序形式向用户提供大量的子程序可供用户进行二次开发,统计方法比较齐全,功能比较强大。SASD采用FORTRAN语言编写完成,比较适合从事统计专业人员使用。但无新版推出。 十一、 PEMS统计软件 PEMS是英文package for encyclopaedia of medical statistics汉语是中国医学百科全书-医学统计学软件包。它以<中国医学百科全书>一书为蓝本,开发的一套统计软件。系统特点是实现各种统计方法的计算。统计方法比较齐全,功能比较强大。PEMS采用TURBOC和TURBOBASIC语言编写完成,比较适合从事医学工作的非统计专业人员使用。最新版为版。网址:。 十二、 EXCEL电子表格与统计功能 EXCEL电子表格是Microsoft公司推出的Office系列产品之一,是一个功能强大的电子表格软件。特点是对表格的管理和统计图制作功能强大,容易操作。Excel的数据分析插件XLSTAT,也能进行数据统计分析,但不足的是运算速度慢,统计方法不全。 十三、 DAS统计软件 DAS是英文Drug and Statistics的缩写,翻译成汉语是药理学计算软件,由孙瑞元等开发。特点是内容涵盖基础药理学、临床药理学,药学,医学统计学。能多种处理结果同时显现。EXCEL平台使用方便,智能化,图表直接插入文档。网址:。 十四、 SDAS统计软件 DAS是英文Statisticaldesign and analysis system的缩写,翻译成汉语是统计设计和分析系统。1992年由解放军总医院医学统计教研室开发。特点是窗口操作,操作方便,图表简明,与国内医学统计学教材一致。但只有DOS版,1995年后没新的版本。 十五、 Nosa统计软件 Nosa是非典型数据分析系统,1999年由解放军四军医大学医学统计教研室夏结来教授开发。特点是采用广义线性模型建模,从数据录入与管理、统计分析、绘图,到结果管理嵌入了当代数据处理技术。但只有DOS系统下使用。 十六 S-PLUS(此部分摘自厂家的软件宣传资料) Insightful公司是世界著名的商务智能软件提供商,产品涵盖分析统计、数据挖掘、知识获取、决策支持等多个领域。公司总部设在美国西雅图。 S-PLUS作为一个工业数据分析工具与数据分析应用开发平台,在各行各业已经有较长的使用历史。并曾获得著名的“美国计算机协会优秀软件奖。 S-PLUS提供了方便、灵活、交互、可视化的操作环境,帮助您找出数据之间的关系和趋势,让您做出更好地决策。在科学研究、市场营销、产品研发、质量保证、财务分析、金融证券、资料统计等各个方面,S-PLUS都有广泛的应用。 S-PLUS有流畅、直观的操作界面,广泛的输入输出功能,不论您的数据在何处、数据的格式如何,都可以轻松地存取,生成的结果可以以任意格式进行输出 (图形、文档、表格、网页)。特别是:S-PLUS的操作界面与Microsoft Office完全一致,用鼠标轻松点击,就可以把S-PLUS 的分析结果嵌入到Word文档和PowerPoint文档中;S-PLUS与Excel无缝集成,您可以在S-PLUS 环境中随意操作Excel数据,也可以在Excel环境中使用S-PLUS功能,无需花时间在Excel及S-PLUS之间,将数据来回转换;S- PLUS可以在Internet环境中进行数据分析和结果发布。 S-PLUS领先于业界的探索式图形技术,使得您可以直观地展现隐藏在数据中的关系和趋势,不致迷失在简单的统计数值及文字报表中。S-PLUS提供超过80种的二维和三维图形库,您可以轻松修改每一层图形的细节,包括线条、颜色、字体等,产生您想要的图形。 S-PLUS提供超过4200种统计分析函数,包含了传统和现代的统计分析、数据挖掘、预测分析的算法。软件所有的分析功能都是向导式的,使您轻松完成数据的分析任务。S-PLUS的开放性,允许您自己开发新的算法,集成到S-PLUS软件中。您也可以从S-PLUS网站或者其它统计网站上免费下载算法,集成到S-PLUS软件中。 通过S-PLUS的脚本语言,可以记录和存储分析过程;或者,用鼠标拖拉对象(如按钮、菜单等等)到命令窗口,会立即产生相应的执行指令;反之,拖拉指令到工具列上,会产生相应的功能按钮。使得您的分析过程可以进行存储、共享和重复执行,大大减少您的重复工作量。 S-PLUS还提供强大的编程语言——S语言,您可以使用它来开发专门适合于您的个性化系统,也可以建立企业级的应用系统。而且,S-PLUS几乎可以集成到其它任何系统中,如:在Unix系统上,S-PLUS的CONNECT/Java接口,可以让S-PLUS集成到Java程序中。在Windows系统上,S-PLUS的CONNECT/C++接口,可以在您开发的C++程序内使用全部的S-PLUS分析方法。另外S-PLUS的DDE及OLE接口,可以让您集成S-PLUS到其他Windows应用程序中,允许您从Excel或Visual Basic应用程序中执行S-PLUS功能。
205 浏览 3 回答
193 浏览 3 回答
113 浏览 2 回答
127 浏览 3 回答
216 浏览 3 回答
93 浏览 6 回答
106 浏览 3 回答
148 浏览 5 回答
323 浏览 2 回答
152 浏览 6 回答
291 浏览 4 回答
320 浏览 2 回答
139 浏览 5 回答
185 浏览 3 回答
282 浏览 3 回答