绪论流行病学属于预防医学范畴。研究的病种:临床医学=基础医学=流行病学研究的角度与方面:流行病学:从群体去研究疾病临床医学:从个体去研究基础医学:从组织、细胞、分子水平去研究 流行病学:是研究在人群中疾病与健康状况的分布及其影响因素,并研究如何防制疾病及促进健康的策略与措施的科学。
基本含义:1)它的研究对象是人群;
2)它不仅研究疾病,而且研究健康状态;
3)它的重点是研究疾病与健康状态的分布及其影响因素;
4)它的落脚点是为控制与消灭疾病及促进健康提供科学的决策依据。流行病学发展简史:①早期流行病学 ②近代流行病学 ③现代流行病学*流行病学的研究方法*流行病学与临床医学、基础医学的关系基础医学、临床医学与预防医学(包括流行病学)是现代医学的三大组成部分。基础医学:从微观角度临床医学:以单个病人为单位的角度预防医学(包括流行病学):从群体宏观的角度它们并不是研究的病种不同,而是从不同的角度进行研究。流行病学的用途与作用探讨影响疾病流行的因素;
②病因探讨;
③用于研究疾病预防与疾病监测;
④用于考核疾病防治的效果;
⑤用于研究与评价保健工作及其规划;
⑥用于研究疾病自然史及其它 流行病学研究的重要观点①群体观点;
②社会医学与生态学观点;
③比较的观点④多病因论的观点;
⑤概率论的观点疾病的分布疾病频率常用的测量指标:1.发病指标 2.死亡指标一、发病指标 1、 发病率:指一定时期内,特定人群中某病新病例出现的频率。K=1000‰,10000/万,或100000/10万分子:分子是一定期间内的新发病人数。若在观察期间内一个人多次患病时,则应多次计为新发病例数,如流感、腹泻等。暴露人口数:分母中所规定的暴露人口是指可能会发生该病的人群。意义:发病率是用来衡量某时期某地区人群发生某种疾病危险性大小的指标。发病专率:发病率可按不同特征(如年龄、性别、职业、民族、种族、婚姻状况、病因等)分别计算,此即发病专率。2、罹患率某年(期)某人群中发生某病新病例数同年(期)暴露人口数K=1000‰,10000/万,或100000/10万与发病率相同点:同是测量新发病例的频率指标。与发病率不同点:罹患率用于衡量小范围、短时间内新发病例的频率。时间可以用月、周、日或一个流行周期做单位。优点:1)可以根据暴露程度精确地测量发病几率。2)适用于局部地区疾病的爆发、或食物中毒、传染病及职业中毒等爆发 的情况。
3、患病率:也称现患率或流行率。指某特定时间内一定人群中某病新旧病例数所占的比例。某特定期间内现患病例数同期平均人口数K=1000‰,10000/万,或100000/10万影响患病率升高、降低的原因影响患病率升高的因素:①病程延长;
②未治愈者的寿命延长;
③新病例增加(发病率增高); ④病例迁入;
⑤健康者迁出;
⑥诊断水平提高;
⑦报告率提高。影响患病率降低的因素:①病死率高;
②新病例病例减少(发病率下降);
③健康者迁入;
④病例迁出。患病率与发病率、病程的关系:患病率的高低由发病率与该病的病程两个因素决定,既使人群中每年只有少数人患该病,假如该病系慢性病,人群中该病病例数将积累起来,结果某年患病率将超过发病率。若某病的病程是短促的或病例迁往他地,现患率则是低的。当某地某病的发病率与该病的病程在相当长时间内保持稳定时,患病率、发病率与病程三者的关系是:患病率=发病率×病程,即P=I×D。患病率的应用:患病率通常用来表示病程较长的慢性病的发生或流行情况。可为合理规划医疗设施、评价医疗服务质量与医疗经费的投入提供科学依据,也常用来研究疾病流行因素、防治效果等。4、感染率:是指在某个时间内所检查的人群样本中,某病现有感染者人数所占的比例。
意义:人感染某些传染病后,可不出现临床症状,但经微生物与血清学检验方法、皮肤试验可确定其是否已被感染。感染率常用于结核病、病毒性肝炎、寄生虫病等。它可估计某病的流行趋势,也可为制订防制措施提供依据。续发病例:系指家庭内或托幼机构一个班内发生传染病时,在前例病例(原发病例)后于最短与最长潜伏期之间出现的患同种病的病例。续发率:指在某些传染病最短潜伏期与最长潜伏期之间,易感接触者中发病的人数占所有易感接触者总数的百分率。
续发率可用于比较传染病传染力的强弱,分析传染病流行因素以及评价卫生防疫措施的效果等。
二、死亡指标1、死亡率:指某人群在一定期间内死于所有原因的人数在该人群中所占的比例。死亡率是测量人群死亡危险最常用的指标。K=1000‰,10000/万,或100000/10万粗死亡率:死于所有原因的死亡率是一种未经过调整的死亡率。死亡专率:按疾病的种类、年龄、性别、职业、种族等分类计算的死亡率。例:某10000人的人群中,某年总死亡人数100人,因某病死亡10人,试计算粗死亡率与某病死亡专率。答案:CMR=100/10000=1% 某病死亡专率:10/10000=1‰死亡率的应用:死亡率是用于衡量某一时期、一个地区人群因病伤死亡危险性大小的指标,反映一个人群的总死亡水平。是一个国家或地区文化、卫生水平的综合反映。既可反映一个地区不同时期人群的健康状况与卫生保健工作的水平,也可为该地区卫生保健工作的需求与规划提供科学依据。
某些病死率高的恶性肿瘤,死亡率与发病率十分接近,其死亡率基本上可以代表其发病率,而且死亡率准确性高于发病率,因此常用作病因探讨的指标。2、病死率:是表示一定期间内,患某病的全部病人中因该病而死亡的比例。某特定期间内因某病死亡人数同期患该病的病人数病死率的应用:病死率常用于病程短的急性病,用以衡量疾病对人生命威胁的程度;
它受疾病严重程度与医疗水平的影响,同时也与能否被早期诊断、诊断水平及病原体的毒力有关。因此,用病死率作为评价不同医院的医疗水平时,应注意不同医院入院病人的病情的严重程度及医院的医疗设备条件等因素的影响。3、生存率:又称n年存活率,是指患某种疾病的人(或接受某种治疗的某病病人)经n年的随访,到随访结束时仍存活的病例数所占的比例。P--生存率 ;
n--随访时间 ;
O--观察起始点生存率的应用:生存率反映了疾病对生命的危害程度,常用于评价某些慢性病如癌症、心血管病等疾病的远期疗效。疾病的分布:是以疾病的频率为指标,描述疾病在不同地区、时间与人群的分布现象。一、疾病的流行强度散发:某病在某地区人群中呈历年一般发病率水平。流行:某地区、某病在某时间的发病率显著超过历年该病的散发发病率水平。暴发:在一个局部地区或集体单位的人群中,短时间内突然发生许多临床症状相似的病人。疾病的三间分布:1、地区分布 2、时间分布3、人群分布1、地区分布地区分布划分方法:按行政区域划分:如国家、省、市、县等。按自然环境特征来划分:山区、平原、湖泊、森林或气温、降雨量、海拔高度等。1)疾病在国家间的分布有些疾病只发生在世界某些地区,如黄热病只在非洲及南美洲流行;
登革热则流行于热带、亚热带。有些疾病虽然在全世界均可发生,但其在不同地区的分布不一。2)疾病在国家内的分布例如:我国血吸虫病流行于长江以南13个省、自治区;
高血压的患病率是北方高南方低;
原发性肝癌集中分布于东南沿海地区;
鼻咽癌以广东省广州语系区为高发区;
食管癌多见于太行山两侧,以河南、山西、河北三省的交界处为圆心,死亡率以同心圆向周围扩散,逐渐降低。3)疾病的城乡分布由于生活条件、卫生状况、人口密度、交通条件、工业水平、动植物的分布等情况不同,造成疾病在城乡分布的差别。城市特点:①交通方便、人口稠密、居住拥挤,因此呼吸道传染病容易发生流行。②人口流动性大,外来人口多,容易带入传染病。③工业发达,空气、水、环境污染严重,肺癌等肿瘤发病率、死亡率高于农村。农村特点:①交通不便,人口稀少,因此呼吸道传染病不易发生流行。②供水与其他卫生设施不如城市,肠道传染病较城市高发。③因乡镇企业大发展,不少有毒物质排出,污染水源、土壤与空气,使农村慢性中毒事件日增。2、时间分布 1)短期波动 2)季节性 3)周期性 4)长期趋势 1)短期波动是指疾病在一集体或固定人群中,短时间内发病数突然增多。多见于传染病、食物中毒、化学毒物中毒等情况。2)季节性疾病的频率在一定季节内升高的现象。大多数传染性疾病的发病存在着季节性,非传染性疾病季节性不明显。季节性有两种表现形式:季节性升高:一年四季均可发病,但在一定的月份中发病率升高。严格的季节性:发病只集中在一年的某几个月内,其余月份则没有病例发生。
多见于节肢动物传播的传染病。3)周期性疾病每隔一个相当规律的时间间隔发生一次流行的现象。在无有效疫苗应用之前,大多数呼吸道传染病呈现周期性。4)长期趋势对于传染病来说,是指在一个相当长与时间内,通常为几年或几十年,或更长的时间内,疾病的感染类型、病原体种类及宿主随着人类生活条件改变、医疗技术的进步、自然条件的变化而发生显著变化。如猩红热:不仅发病率低,而且很少死亡。对于慢性病来说,是指在一个相当长的时间内,疾病的发病率、死亡率、临床表现等同时发生显著变化。如乳腺癌。3、人群分布 1)年龄;
2)性别;
3)职业;
4)种族与民族;
5)社会阶层;
6)婚姻状况;
7)行为;
8)流动人口1)年龄不同的人群有不同的免疫水平、不同的生活方式与行为方式以及对致病因子暴露的机会不同,几乎所有疾病的发病率或死亡率都与年龄有关。
不考虑死因死亡率年龄曲线呈“V”形。研究疾病年龄分布的分析方法①横断面分析:适用于分析潜伏期与病例程短的急性病或传染病的年龄分布。②出生队列分析:适用于分析潜伏期长的慢性病的年龄分布。2)性别疾病的死亡率与发病率分析表明,经常存在性别差异,通常男性死亡率高于女性,但某些疾病发病率通常女性高于男性。性别差异的原因:①男女两性暴露或接触致病因素的机会不同;②两性的解剖、生理特点及内分泌、代谢等生物性因素有差异;③两性生活方式、嗜好不同。3)种族与民族我国有56个民族,是个多民族国家,由于各民族间的遗传、生理、风俗习惯、卫生水平与文化素质不一,加上各民族间的定居点所处的自然与社会不幸不同,所以各民族间的病种与同一病种的流行特征差异很大。
美国:白人死亡率较高的是血管硬化性心脏病、乳腺癌、自杀与车祸等。黑人多死于高血压性心脏病、脑血管意外、宫颈癌、他杀与意外事故。4)职业不同职业对健康及其某些疾病的发病率、死亡率的分布有较大的影响。
职业暴露于不同物理因素、化学因素、生物因素及职业性的精神紧张均可导致疾病分布的不同。如煤矿工人易患矽肺,接触联苯胺的工人易患膀胱癌等。5)家庭与婚姻状况传染病往往有一定的家庭聚集性。近亲婚配出影响疾病的人群分布,在我国;
边远山区与农村近亲婚配较严重,这使先天畸形及遗传性疾病增加。婚姻状况不同对人的健康有明显的影响。国内外的许多研究证实,离婚者全死因死亡率最高,丧偶及独身者次之,已婚者最低。6)社会阶层是与工薪收入、职业、文化教育程度、生活状况相关的一个术语。例如脑栓塞多发生在富裕的上层社会人群里;经济文化层次较高地区人群脑卒中的死亡率高于工人居住地区。7)行为吸烟:肺癌、膀胱癌等;
酗酒:高血压、冠心病、食管癌、 肝硬化等;
吸毒、不良性行为、同性恋等:性传播疾病; 肥胖:糖尿病、冠心病等;
静坐生活方式:每周空闲时间体育活动少于三个20分钟。8)流动人口是传染病爆发流行的高危人群;
是疫区与非疫区间传染病的传播纽带;
对性传播疾病的传播也起到不可忽视的作用;
给儿童计划免疫的落实增加难度。4、疾病的人群、地区、时间分布的综合描述移民流行病学:是通过比较移民人群、移居地当地人群与原居住地人群的某病发病率或死亡率差异,分析该病的发生与遗传因素与环境因素的关系。分析原则:若某病在移民中的发病率或死亡率与原居住地人群的死亡率不同,而接近于移居地当地人群的率,则该病发病率或死亡率差别是由环境因素造成的;
若某病在移民中的发病率或死亡率与原居住地人群的发病率或死亡率相同,而不同于移居地当地人群的率,则该病发病率或死亡率的差别是由遗传因素造成的。第三章 描述性研究描述性研究:通过描述疾病或健康状况的三间分布情况,找出某些因素与疾病或健康状况间的关系,提供病因线索。它既是流行病学研究工作的起点,也是其他流行病学研究方法的基础。一.现况研究:又称横断面研究,也称患病率研究。是研究特定时点或期间与特定范围内人群中的有关变量(因素)与疾病或健康状况的关系。1.研究目的与应用范围①掌握目标群体中疾病或健康状况的分布;
②提供疾病病因研究的线索 ③确定高危人群;
④评价疾病监测、预防接种等防治措施效果 2.研究特点与研究类型 研究特点:①开始时一般不设对照组;
②现况研究的特定时间③在确定因果联系时受到限制④对不会发生改变的暴露因素,可提示因果联系研究类型①普查:调查特定时点或时期、特定范围内的全部人群(总体)。②抽样调查:随机抽样,调查特定时点、特定范围人群的一个代表性样本,以样本统计量估计总体参数所在范围。
3.现况调查的种类 1)普查与筛检;
2)抽样调查1)普查:为了解某病的患病率或健康状况,于一定时间内对一定范围的人群中每一成员所作的调查或检查。2)抽样调查:是指从全体被研究对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,以此推论全体被研究对象状况的一种调查。目的:是根据所得的样本资料估计与推断被调查现象的总体特征,根据抽取样本所调查出的结果可以估计出该人群某病的患病率或某些特征的情况。二.现况研究的设计与实施1、明确调查目的与类型根据研究提出的问题,明确调查目的根据具体研究目的确定是普查还是抽样调查2、确定研究对象根据研究目的规定对象的人群分布特征、地域范围以及时间点 ①某个区域内全体居民或其中一部分②某一时点上的流动人员③某些特殊群体3、确定样本量与抽样方法1)确定样本量:①预期现患率 ( P ) ②允许误差(d) ③显著性水平(α)计量资料样本大小估计公式 ;
计数资料样本大小估计公式t:统计学上的t值 d:容许误差 P:某病现患率 Q=1-P2)抽样方法:
①非随机抽样 ;
②随机抽样①非随机抽样:选择样本时,加入人主观因素,使总体中每个个体被抽取的机会是不均等的。
方法:典型抽样;
重点抽样;
任意抽样;
配额抽样典型抽样:试验者根据试验调查的目的、要求与被调查对象的总体情况,有意识地选择那些具有代表性的对象进行试验。重点抽样:只对总体中为数不多但影响颇大(标志值在总体中所占比重颇大)的重点单位调查。
②随机抽样:遵循随机化原则,保证总体中每一个对象都有同等机会被选入作为研究对象。
方法:单纯随机抽样;
系统抽样;
分层抽样;
整群抽样;
多级抽样单纯随机抽样(简单随机抽样):最简单、最基本的抽样方法从总体N个对象中,利用抽签或其他随机方法抽取n个总体中每个对象被抽到的概率相等系统抽样(机械抽样):按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。将总体各个个体单位按某种标志排列、连续编号根据总体数N与确定的样本数n,计算抽样距离(N/n)用单纯随机方法在第一组中确定一个起始号从此起始点开始,每隔K(K=N/n)个单位抽取一个作为研究对象整群抽样:将总体分成若干群组,抽取其中部分群组作为观察单位组成样本。分类:单纯整群抽样:被抽到的群组中的全部个体均作为调查对象二阶段抽样:通过再次抽样后调查部分个体 分层抽样:将总体单位按某种特征分为若干次级(层),然后从每一层内单纯随机抽样组成一个样本。分类:按比例分配分层随机抽样:各层内抽样比例相同最优分配分层随机抽样:各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大 多阶段抽样:将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同,即将以上抽样方法结合使用,在大型流行病学调查中常用。方法:从总体中抽取范围较大的单元(一级抽样)从一级单元中抽取范围较小的单元(二级抽样)依此类推…4、资料的收集:
①通过测定或检查的方法收集 ②直接用调查表询问研究对象5、资料的整理与分析:①检查资料完整性与准确性 ②按标准归类、核实 检查资料的完整准确性,补缺、补漏,删除重复,纠正错误对疾病或某健康状态按规定的标准归类核实按不同空间、时间、人群描述分布特征与差异,进行显著性检验按是否暴露研究因素进行分组作有对照组的比较分析6、偏倚及其控制 1)偏倚:从研究设计、实施、到数据处理与分析的各个环节中产生的系统误差,以及结果解释、推论中的片面性,导致研究结果与真实值之间出现倾向性的差异,从而错误地描述暴露与疾病之间的联系,称之为偏倚。
2)产生原因:①主观选择研究对象;
②任意变换抽样方法;
③调查对象不合作或因种种原因拒绝参加④调查到的对象均为幸存者,无法调查死亡者⑤回答不准确或回忆不清;
⑥调查偏倚;
测量误差3)偏倚的控制:①严格遵照抽样方法要求,确保随机化原则②提高研究对象的依从性与受检率③正确选择测量工具与检测方法;
④培训调查员,统一标准与认识⑤做好资料的复查复核工作;
⑥选择正确的统计分析方法,辨析混杂因素7、研究的优点与局限性优点:①常用抽样调查,结果有较强推广意义②有来自同一群体的自然形成的同期对照组,结果具有可比性③可同时观察多种因素局限性:①难以确定先因后果的时相关系②不能获得发病率资料③研究对象可能处于临床前期而被误定为正常人8、应 用掌握目标人群中疾病的患病率及其分布 提供疾病致病因素的线索 确定高危人群 对疾病监测、预防接种效果及其他资料的质量评价三.生态学研究1、概念:描述性研究的一种 群体的水平上研究某种因素与疾病的关系 以群体为观察与分析单位 描述不同人群中某因素的暴露状况与疾病的频率,分析该暴露因素与疾病的关系 2、研究目的:①提供病因线索,产生病因假设;
②评估人群干预措施的效果3、研究类型:①生态比较研究;
②生态趋势研究生态比较研究:应用较多的一种方法最简单的方法观察不同人群或地区某种疾病的分布,根据疾病分布差异,提出病因假设生态趋势研究:连续观察不同人群中某因素平均暴露水平的改变与(或)某种疾病发病率、死亡率变化的关系,了解变动趋势,比较暴露水平变化前后疾病频率的变化情况,判断某因素与某疾病的联系。
4、优点与局限优点:①经济,出结果快;
②提供病因未明疾病的病因线索③对个体剂量无法测量的情况,是唯一可供选择的方法④适用于研究因素暴露变异范围小,较难测量暴露与疾病的关系⑤人群干预措施的评价及估计疾病发展趋势局限性:①出现生态学谬误;
②难以控制混杂因素 ③存在多重共线性问题;
④难以确定因果联系第五章 病例对照研究一、基本原理1)以确诊患某种特定疾病的病人作为病例2)以不患该病但具有可比性的个体作为对照3)通过询问、实验室检查或复查病史,搜集既往 危险因素暴露史4)测量并比较两组各因素的暴露比例,经统计学检验该因素与疾病之间是否存在统计学关联病例对照研究特点:①回顾性;
②由果到因研究;
③观察法;
④不能验证病因二、研究示意图三、研究简史四、研究类型:①病例与对照不匹配;
②病例与对照匹配;
③衍生的研究类型1、病例与对照不匹配1)从设计所规定病例与对照人群中,分别抽取一定量的研究对象2)对照组人数≥病例组人数3)选择对照没有特殊规定2、病例与对照匹配 1)匹配/配比:要求:对照在某些因素或特征上与病例保持一致目的:对两组进行比较时排除匹配因素的干扰2)分类:①频数匹配;
②个体匹配 ①频数匹配(又称成组匹配):匹配因素所占的比例在对照组与病例组一致②个体匹配:以病例与对照个体为单位进行匹配3)匹配法注意事项 ①慎重选择匹配因素;
②可疑病因不作为匹配因素 ③比例一般为1:1,最多不超过1:4;
④避免 “匹配过度”4)匹配的目的:①提高研究效率;
②控制混杂因素的作用 3、衍生的研究类型 病例对照与队列研究作为病因研究的主要方法,有其各自的优势与不足,而且这些优势与不足相互补充,因此,在实践过程中产生了一些新的研究类型,结合使用这两种方法,扬长避短。1)巢式病例对照研究;
2)病例-队列研究;
3)单纯病例研究;
4)病例交叉研究;
5)病例时间对照设计1)巢式病例对照研究基本原理 ①按队列研究方式进行:选择一队列,收集基线资料,采集所研究的生物学标 志的组织或体液标本储存备用②随访:随访到出现能满足病例对照研究样本量的病例数为止③匹配:按病例进入队列的时间、疾病出现时间与性别、年龄等匹配条件,从同一队列选择1个或数个非病例作对照,抽取病例与对照的基线资料并检测收集的标本④资料处理:按匹配病例对照研究方法处理资料2)病例-队列研究基本原理 研究开始时,在队列中随机选取一组样本作为对照组观察结束时,队列中出现被研究疾病所有病例作病例组与随机对照组进行比较 这种研究模式,可同时研究几种疾病,不同疾病有不同病例组,但对照组都是同一组随机样本病例--队列与巢式病例对照研究的区别:对照是随机选取,不与病例进行匹配随机对照组中成员如发生被研究疾病,既为对照,又同时为病例1个随机对照组可以同时与几个病例组比较分析病例--队列与巢式病例对照研究的优点:①因果关系清楚;
②资料可靠;
③论证强度高;
④省时省力省钱;
⑤适合于分子流行病学研究3)单纯病例研究背景:1994年Piegorseh、Begs等提出:①遗传与环境的关系;
②交互作用;
③病例对照研究与队列研究的效率费用应用前提条件:在正常人群中基因型与环境暴露各自独立发生所研究疾病为罕见病(此时可用OR来估计RR值)基本原理:表5-1 环境暴露与基因型 G+G-E+abE-cdOR=ad/bc当ORge>1时, 有正相乘模型交互作用当ORge=1时, 无相乘模型交互作用当ORge<1时, 有负相乘模型交互作用4)病例交叉研究解决问题:1991年美国Maclure提出病例交叉设计 日常生活中一些突发事件之后,常会伴随某些结果的发生。究竟是这些突发事件导致了结果的发生,还是仅仅由于机会所致?基本原理:①暴露与某急性事件有关 ②比较相同研究对象暴露情况在急性事件发生前一段时间与未发生事件的某段时间,如果暴露与少见的事件(或疾病)有关,那么刚好在事件发生前一段时间内的暴露频率应该高于更早时间内的暴露频率。研究对象:病例与对照,两部分的信息均来自于同一个体 “病例部分” 危险期,疾病或事件发生前的一段时间 “对照部分” 对照期,危险期外特定的一段时间 研究是对个体危险期与对照期内的暴露信息进行比较五、研究设计与实施1、研究步骤1)提出假设 根据以往疾病分布的记录或现况调查得到的结果,结合文献资料,提出病因假设2)制定研究计划①选择病例与对照比较的方法:用匹配或成组比较法,或两者同时使用 如用匹配法,需确定病例与对照的比例及匹配条件②病例与对照的来源与选择方法,病例的诊断方法③样本大小的估计④根据病因假设与研究所具备的条件,确定调查因素的种类,数量及其检测方法,并考虑调查因素中的混杂因素⑤调查表的设计;
⑥偏倚及质量控制措施;
⑦调查的实施与期中分析⑧资料整理与分析的方法;
⑨所需费用的概算;
⑩人员分工与需要的协作单位3)培训调查员与预调查4)实施调查5)资料的整理与分析6)提出研究报告2、病例与对照的选择对照的选择是整个研究的关键之一 研究得出的结论是否可靠,首先要看对照的选择是否合理。病例与对照选择的基本原则:① 代表性;
② 可比性 选择方法:①抽样;
②匹配1)病例的选择选择病例的要求:①诊断可靠 使用金标准②选择确诊的新病例:回忆偏倚小、代表性好、容易合作、被调查因素改变少来源:①总体人群中全部病例或总体随机样本人群中全部病例:代表性好、工作开展比较困难、耗费人力物力②医院住院或门诊的病例病例:比较合作、资料易得到且比较可靠、与对照的可比性好、代表性差2)对照的选择原则:候选对象必须来自于产生病例的总体 意味着对照一旦发生所研究的疾病,就能成为病例组的研究对象。对照与病例比较的方法:①成组比较法 ;
②匹配法:频数匹配、个体匹配来源:①研究的总体人群或抽样人群;
②医院中患有其它疾病的病人;
③亲属、邻居、同事、同学等3、样本含量的估计有关参数:①人群中被研究因素的暴露率;
②RR的近似值→OR值(查阅文献或预调查获得)③α值;
④把握度方法:①查表法②公式法:求病例对照研究样本含量的公式③或近似公式 P1:暴露组患病率 P0:对照组患病率例:为研究某市肺癌与吸烟的关系,欲进行一次病例对照研究。某市普通人群中吸烟率 P0=30%,OR=5.0,α=0.05,把握度=0.90。问需要多少病例与对照?α、β值查表,Zα为1.64, Zβ为1.28代入公式得:病例组与对照组,各需28人。如代入近似公式计算,所得结果与原公式很接近(n=29.5)病例组与对照组例数不等时的公式:病例数:对照数=1:c 对照组例数为c*n1:1匹配设计总对子数4、资料来源与收集方法资料的收集在病例对照研究中十分重要方式方法不恰当,收集的资料就不可靠→统计处理无法纠正的系统误差1)资料来源 ①医院病案记录;
②疾病登记报告等摘录③致病因素数据需检测病人的标本或环境获得;
④询问调查获得2)调查含义及遵循原则①询问调查是个十分复杂而又细致的工作②调查是信息传达、接受与反映的过程,是属于行为科学的范畴。被调查者要通过感受、回忆、思维、联想与反映等过程来回答问题③从拟订调查表开始到调查完成,不论哪一步不恰当,都会产生偏倚调查表的设计需要多学科专家的参与(流行病学、临床医学、统计学、心理学、社会学)调查实施前:对调查员进行细致而严格的培训;
编写调查员手册;
监督与审查 总之,调查员的素质、调查的好坏是取得研究所需要的可靠资料的关键所在,应十分重视。六、资料的整理与分析1、均衡性检验;
2、成组比较法资料的分析;
3、1:1配对资料的分析 4、混杂因素作用的估计与分层分析1、均衡性检验检验两组在研究因素以外其它主要特征有否可比性两组间非研究因素均衡可比,才能认为两组暴露率差异与发病有关均衡性检验,应把两组的这些特征逐一加以比较,必要时作显著性检验2、成组比较法资料的分析χ2检验:是检验研究因素与疾病之间有否统计学联系? 可用传统的四格表公式,也可用Mantel-Haenszel (M-H)方法四格表法M-H法两种方法计算结果一致,表明吸烟与食管癌有联系,但联系强度如何,要计算OROR计算与可信限的估计及意义:病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值 与RR一样,优势比反映暴露者患某种疾病的危险性较无暴露者高的程度。前提条件:①所研究疾病的发病率(死亡率)很低②病例对照研究中所选择的研究对象代表性好,则OR值就很接近甚至等于RR值结果表明:吸烟者患食管癌的危险性是不吸烟者的2.87倍,95%的可信范围是在2.18~3.78之间3、1:1配对资料的分析匹配资料是由病例与对照结合成对子,分析结果时不应把对子拆开分析 先将资料列成表5-4的格式注意表内的数字a、b、c、d是病例与对照配成对的对子数食管癌发病因素的研究中发现,吸烟与发病有关,男性的资料归纳成表5-6χ2=11.28, OR=4.33,表明男性吸烟者患食管癌的危险性是不吸烟者的4.3倍 OR95%可信限4、混杂因素作用的估计与分层分析:1)配比法 2)分层分析按饮酒与食管癌的关系列表计算 χ2=31.9, RR=2.29,可见饮酒与食管癌有联系 ①按饮酒与否分层 计算OR值饮酒者中吸烟的OR(2.98)稍高于不分层OR(2.87) 不饮酒者中吸烟的OR(1.67)却低得很多表明饮酒是混杂因素,饮酒似可加强吸烟的作用②进行齐性检验 齐性检验→合并χ2与OR值 OR值无明显差别,则饮酒是混杂因素→合并OR值 OR值有显著差异,则饮酒是明显混杂? × 合并OR值 本例齐性检验无显著差异,计算合并OR与χ2计算合并OR与χ2值 公式(M-H法):合并合并表5-9 分层计算结果整理表 x2M-H=37.74 ORM-H=2.42经饮酒分层调整后,吸烟的χ2与OR(即合并χ2与合并OR)虽较未调整的χ2 (55.5)与OR(2.87)为低,但仍有一定强度与统计学上的显著性。吸烟与食管癌之间有显著的关联饮酒是吸烟与食管癌之间的混杂因素,似能加强吸烟的作用七、常见偏倚及其控制(一)病例对照研究中常见偏倚的种类1、选择偏倚产生原因:选择的研究对象不能代表总体人群最常见偏倚:伯克森偏倚选择医院的病人作为病例与对照,这些病人可以因为种种原因造成入院率的差异例如高血压、肿瘤、阑尾炎病人的入院率显然各不相同入院率的不同可造成偏倚。选择偏倚的控制:①尽量合理地选择病例与对照;
②尽可能地从多家(类)医院选择病例与对照2、信息偏倚:1)回忆偏倚,是病例对照研究的主要弱点,很难完全避免2)调查偏倚3、混杂偏倚:病例对照研究遇到很多混杂因素:①不易识别;
②不易确定 控制:①混杂因素作为匹配因素;
②分层分析;
③进行多因素分析(限制)(二)对照选择中的偏倚选择的对照缺乏代表性与所研究的可疑病因有关的其它疾病病人作为对照有意不暴露于可疑病因的疾病病人作为对照(三)匹配研究方法的偏倚1、匹配过度:将一些被研究因素或因果链的中间变量,或将一些不必匹配的因素作为匹配因素而造成2、匹配过度的影响:①可使研究得不出结果;
②真实的结果被歪曲了;
③ 浪费不少工作量3、匹配因素:用明确的混杂因素;
匹配因素不要过多如性别、年龄、种族、社会经济水平等(四)收集资料过程中的偏倚资料收集过程容易产生的信息偏倚回忆偏倚 :病例对照研究是回顾性调查,难避免回忆偏倚倾向性:被调查者与调查员均可能有倾向性,盲法可以克服八、实施病例对照研究应注意的问题1、假设目的是否清楚? 2、 疾病与暴露变量的定义明确?3、病例与对照的来源,诊断方法? 4、新发病例还是现患病例?5、排除标准是否明确? 6、抽样的方法与样本大小的估计是否明确?7、病例与对照是否匹配及匹配变量是哪些? 8、调查表是否完全?是否详尽?9、调查表是否能够收集到需要的数据? 10、调查表是否经过试用?11、调查表的真实性与可靠性是否经过评估? 12、调查员是否做了专门培训?13、调查员、质控员、编码员等工作手册是否编好?14、方法试剂是否符合标准?15、组织机构、人员、设备、经费是否已落实?16、结果的真实性与可靠性是否经过考核?17、资料整理、统计处理方法及分析内容是否明确?18、如何控制或调整混杂及其他偏倚?19、结论的真实性如何? 九、病例对照研究与队列研究优点与局限性的比较1、病例对照研究的优点特别适用于少见病、罕见病的研究省力、省钱、省时间,并易于组织实施还可用于疫苗免疫学效果考核及暴发调查等可同时研究多个因素与某种疾病的联系对研究对象多无损害2、队列研究的优点研究者亲自观察资料,信息可靠,回忆偏倚小 直接计算RR与AR等,反映疾病危险关联的指标 可证实病因联系 有助于了解人群疾病的自然史 分析一因与多种疾病的关系 样本量大,结果比较稳定3、病例对照研究的局限性不适于研究暴露比例很低的因素选择偏倚难以避免暴露与疾病时间先后难以判断,信息真实性差存在回忆偏倚不能测定暴露与非暴露组疾病的率4、队列研究的局限性不适于发病率很低的疾病病因研究 依从性差,易出现失访偏倚 耗费人力、物力、财力与时间,组织与后 勤工作亦相当艰巨 研究设计要求更严密第四章 队列研究病因与危险因素研究是流行病学研究的重要任务,病因研究的逻辑顺序应该是先有病因存在,然后有疾病发生。
因→果研究对象是加入研究时未患所研究疾病的一群人,根据是否暴露于所研究的病因或暴露程度而划分为不同组别(队列),随访观察不同组别结局。
暴露组的率>未暴露组的率,则可认为暴露与疾病存在联系,可能是因果联系。一、概念暴露:指接触过某种物质、具备某种特征或处于某种状态。
队列:有共同经历或有共同暴露特征的一群人。分为固定队列与动态队列危险因素:泛指能引起某特定不良结局(outcome),或使其发生的概率增加的因子,包括个人行为、生活方式、环境与遗传等多方面的因素。二、基本原理根据研究对象是否暴露于某研究因素或其不同水平将研究对象分成暴露组(E)与非暴露组(ē)随访一定时间,比较两组之间所研究结局(outcome)发生率的差异,以分析暴露因素与研究结局之间的关系主要特点:①观察法;
②设立对照;
③由因到果,符合时间顺序④确证暴露与结局因果关系三、研究目的:①检验病因假设;
②评价预防措施效果③研究疾病的自然史;
④新药的上市后监测四、研究类型:1.前瞻性队列研究;
2.历史性队列研究;
3.双向性队列研究1、前瞻性队列研究研究队列的确定是现在根据研究对象现在的暴露分组需要随访结局在将来某时刻出现优点:①时间顺序增强了病因推断的可信度②直接获得暴露与结局资料,结果可信③能获得发病率缺点:①所需样本量大,花费大,时间长;
②影响可行性前瞻性队列研究应用条件:①明确地检验假设;
②所研究疾病的发生率较高,一般不低于5‰③明确规定暴露因素与结局变量;
④可靠的测量手段⑤足够的观察人群与暴露情况;
⑥能完成随访的人群;
⑦足够的人、财、物力2、历史性队列研究根据研究开始时研究者掌握的有关研究对象在过去某时刻的暴露情况的历史材料分组不需要随访,研究开始时结局已出现优点:①短期内完成资料的收集与分析;
②时间顺序仍是由因到果③省时、省力、出结果快缺点:①资料积累时未受到研究者的控制,内容上未必符合要求②需要足够完整可靠的过去某段时间有关研究对象的暴露与结局的历史记录或档案材料3、双向性队列研究研究队列的确定是过去;
根据研究对象过去某时刻的暴露情况分组;
需要随访;
部分结局可能已出现五、研究实例:①反应停与先天性畸形;
②吸烟与肺癌;
③人工绝经与乳腺癌六、研究设计与实施(一)确定研究因素1、主要暴露因素:
在描述性研究与病例对照研究的基础上确定2、可能影响结局的因素:
混杂因素、 人口学特征等3、暴露测量:性质:
定性(quality) 、 定量(quantity)方法:
访谈、 实验室检查、 查阅记录(二)确定研究结局结局是研究队列中预期结果事件 发病或死亡、 血清指标、 分子标志的变化定性或定量一次研究可有多个结局结局的测量:采用国际或国内通用的标准(三)确定研究现场与研究人群1、研究现场:①有足够符合条件的研究对象;
②领导重视、群众支持③医疗条件较好,交通较便利;
④发病率较高;
⑤有代表性2、研究人群:①从目标人群中抽出的具有代表性的人②未患所研究疾病 ③分为暴露人群与非暴露人群暴露人群选择:①职业人群;
②特殊暴露人群;
③一般人群;
④有组织的人群团体非暴露人群选择:①内对照:一群研究对象内部②外对照:一群研究对象外部③总人口对照:整个地区现成的发病或死亡资料④多重对照:两种或以上的对照形式(四)确定样本计算样本量时需考虑的问题:①抽样方法②暴露组与非暴露组的比例③失访率影响样本量的因素:①非暴露人群或全人群中所研究疾病的发病率p0②暴露人群与对照人群疾病发病率之差P1-P0③第一类错误概率α;
④把握度(power)1-β样本大小的估计:①查表②公式计算(条件:暴露组与对照组样本含量相等):两个发病率的平均;
P1:暴露组预期发病率;
P0:对照组预期发病率已知p0=0.007,RR=2.5,α=0.05,β=0.1。计算样本量,根据上述条件,Zα=1.96, Zβ=1.282 ,q0=0.993,p1=p0×RR=0.0175,q1=0.9825代入公式得N=2310,考虑到失访,实际上每组需扩大10%,即2541人(五)资料的收集与随访1、基线资料;
2、随访;
3、资料收集1、基线资料:①暴露的资料;
②个体的其他信息2、随访:①随访对象、内容与方法;
②随访间隔;
③随访者④观察终点(研究对象出现了预期的结果)⑤观察终止时间(整个研究工作截止的时间)3、资料收集方式①查阅纪录;
②调查询问;
③健康或疾病检查;
④环境监测等4、质量控制①调查员选择;
②调查员培训;
③制定调查员手册;
④监督七、资料的整理与分析(一)资料的基本整理模式?病例非病例合计暴露组aba+b=n1非暴露组cdc+d=n0合计a+c=m1b+d=m0a+b+c+d=t表4-3 队列研究资料归纳整理表暴露组发病率=a/n1 非暴露组发病率=c/n0(二)人时的计算:①精确法;
②近似法;
③寿命表法(三)率的计算1、累积发病率;
2、发病密度;
3、标化死亡比;
4、标化比例死亡比1、累积发病率 CI=观察期内发病(或死亡)人数/观察开始时的人口数变化范围:0~1适用条件:样本大、人口稳定、整齐的资料报告时必须注明时间长短2、发病密度 ID=观察期内发病(或死亡)人数/观察人时变化范围: 0~∞适用条件:观察时间长、人口不稳定、存在失访、资料很整齐3、标化死亡比 变化范围:
0~∞适用条件:结局事件的发生率低、不宜直接计算率时预期发病(死亡)数的计算:预期发病(死亡)数=全人口某病的发病(死亡)率×观察人口数SMR的意义:被研究人群发生(死于)某病的危险性是标准人群的多少倍SMR=1:研究人群某病发病(死亡)危险=标准人群SMR>1:研究人群某病发病(死亡)危险>标准人 群,是标准人群的SMR倍SMR<1:研究人群某病发病(死亡)危险<标准人群4、标化比例死亡比 SMPR=实际死亡数/预期死亡数变化范围:0~∞适用条件:不能得到历年人口资料、仅有死亡人数、原因、日期与年龄预期死亡数计算:预期死亡数=全人口中某病死亡数×某单位实际全部死亡数/全部死亡数率的显著性检验①U检验;
②直接概率法;
③二项分布检验;
④泊松分布检验;
⑤2检验;
⑥计分检验(四)效应的估计1、相对危险度;
2、归因危险度;
3、归因危险度百分比4、人群归因危险度;
5、人群归因危险度百分比;
6、剂量反应关系1、相对危险度Ie:暴露组率 Io:非暴露组率意义:①E发病或死亡的危险是ē的多少倍②RR值↑暴露的效应↑暴露与结局关联强度↑意义:①吸烟者因肺癌死亡的危险是非吸烟者的10.7倍②吸烟者因心血管疾病死亡的危险是非吸烟者的1.7倍表4-5 RR与关联强度RR95%CIWoolf法lnRR的95%CI反自然对数即为RR95%CI2.归因危险度意义:①E与ē 人群比较,所增加的疾病发生数量②AR值 暴露因素消除后所减少的疾病数量表4-6 RR与AR的区别(1/10万人年)意义:①RR—吸烟对肺癌的病因学意义较大②AR—戒烟对心血管疾病的预防作用较大,即公共卫生意义较大 3.归因危险度百分比AR%(病因分值EF)意义:暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比4.人群归因危险度(population attributable risk, PAR)PAR=It-I0It:总人群 Io:非暴露组率意义:①暴露人群与一般人群比较,所增加的疾病发生率的大小②PAR值 暴露因素消除后所减少的疾病数量5.人群归因危险度百分比 PAR%或意义:PAR占总人群全部发病(或死亡)的百分比6.剂量反应关系——分析方法:①列出不同暴露水平下的发病率②以最低暴露水平组为对照,计算各暴露水平的RR与危险度差(RD)③必要时,应对率的变化作率的趋势性检验血清胆固醇水平↑患冠心病的RR↑,说明存在剂量效应关系八、偏倚及其控制1、选择偏倚;
2、失访偏倚;
3、信息偏倚;
4、混杂偏倚1、选择偏倚:研究人群在一些重要因素方面与一般人群或待研究的总体人群存在差异,而导致研究结果的偏倚。产生原因选择对象的方法不当 最初选定参加研究的对象中有人拒绝参加 历史性队列研究中部分档案丢失或记录不全 志愿者队列 研究开始时未能发现早期病人等控制:预防为主,抽样方法正确,严格按规定标准选择对象2、失访偏倚:研究对象因迁移、外出、死于非终点疾病或拒绝继续参加观察而退出队列所引起的偏倚。控制:1)设计:①选择便于随访的人群;
②在计算的研究样本的基础上扩大10%2)实施:①加强对随访员的管理;
②制定随访计划与监测措施;
③期中分析 3)整理资料:对于有缺项或漏项的对象进行补查3、信息偏倚:在获取暴露、结局或其他信息时所出现的系统误差或偏差产生原因:①疾病、暴露标准不明确;
②检验仪器不精确、检验技术不熟;
③询问技巧不佳记录错误,造假等控制:①提高临床诊断技术、明确各项标准;
②选择精确稳定的测量方法③事前调准仪器;
④严格实验操作规程⑤同等对待每个研究对象;
⑥培训调查员,提高技巧,统一标准 4、混杂偏倚:与所研究因素与结果均有联系的第三因素在暴露组与对照组的分布不均衡,混淆了研究因素与结果间的真实联系。
控制:1)设计阶段:限制研究对象,匹配2)分析阶段:分层分析、标准化或多因素分析九、优点与局限性1、优点①直接获得暴露组与非暴露组的发病率或死亡率;
②直接估计危险度;
③符合时间顺序,验证病因的能力较强;
④获得一种暴露与多种结局的关系;
⑤收集的资料完整可靠,不存在回忆偏倚;
⑥可研究疾病的自然史2、缺点①不适于发病率很低的疾病的病因研究;
②易发生失访偏倚;
③耗时,耗人力、物力、财力;
④设计要求严密,资料的收集与分析难度较大;
⑤随访过程中,已知变量的变化或未知变量的引入增加分析难度
推荐访问:疫情