短信预约提醒成功
特别推荐:临床执业医师考试预防医学考点串讲汇总
临床执业医师考试预防医学考点串讲,环球网校医学考试网搜集整理供即将参加考试的考生们参考,希望对大家有帮助。
第2单元 医学统计学方法
重点提示
本单元2000~2009年约考过35题,数值变量数据的统计推断18题,占本单元总出题量的一半多,是重点中的重点。数值变量数据的统计描述9题。本单元的历年出题量都很大,出题频率很高,几乎每年必考,题量在4道左右。
本单元最重要的出题点是关于数值变量数据的统计推断方面,其中,与均数的抽样误差相关的题目有4道,假设检验的基本步骤相关的题目有4 道,u/t检验相关的题目有l0道,题目类型多样,概念考查、理解分析等多种考查角度,尤其是理解分析题,难度颇大,要求考生在熟练掌握公式和概念的基础上,根据题目要求和题干叙述,灵活应用。这一能力的养成,需要平日的勤加练习和充分准备。
另一出题重点是数值变量数据的统计描述这一知识点,其中又以统计描述指标的出题量最多,历年来共出过7题。集中及离散指标的分类、用途是考试中的常考点,多以概念考查的形式,难度不大,但也需要扎实的理论基础。
考点串讲
一、基本概念和基本步骤
(一)统计学中的几个基本概念
1.根据随机化的原则从总体中抽出的有代表性的一部分观察单位组成的子集称作样本(2007)。
2.从同一总体中抽样,缦到某变量值的统计量和总体参数之间有差别,被称为抽样误差(2003)。
3.描述随机事件(如发病)发生可能性大小的度量为概率,常用P表示。P值的范围在0和1之间,P≤0.05或P≤0.01的随机事件,通常称作小概率事件(2005、2007)。
(二)统计工作的基本步骤
二、数值变量数据的统计描述
(一)集中趋势指标
1.算术均数 简称对数(mean).习惯上以X表示样本均, 以希腊字母μ表示总体均数。均数适用于对称分布,特别是正态或近似正态分布的计量资料(2006、2008)。
2.几何均数
3.中位数
(二)离散趋势指标
1.全距(R)
2.四分位数间距(Q) 常用于描述偏态分布以及分布的一端或两端无确切数值资料的离散程(2007)。
3.方差
4.标准差 标准差的应用(2004、2006、2007)。①说明观察值离散程度的大小。②与均数一起描述正态分布资料的特征。③计算变异系数。④计算标准误差。
5.变异系数(CV) 常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异度(2002、2008)。
(三)常见集中趋势的指标
均数(算术均数)
几何均数
中位数
众数
调和均数
1.算术均数
适用资料类型:对称分布计数资料
4.百分位数
百分位数是一种位置指标,用Px表示。一个百分位数Px 将一组观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大。中位数是一个特定的百分位数,即P50。
(四)离散趋势指标
1.全距(R):全距亦称极差,为一组同质观察值中最大值与最小值之差。它反映了个体差异的范围,全距大,说明变异度大。
2.四分位数间距(Q):为上四分位数Qu(即P75)与下四分位数QL(即P25)之差。其间包括了一组观察值的一半,故四分位数间距可看成是中间50%观察值的极差。
3.方差
5.变异系数:常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异度。 计算公式:
例:某地调查110名18岁男大学生,身高均数为172.73cm,标准差为4.09cm;体重均数为55.04kg,标准差为4.10kg,问:身高和体重哪个变异较大?
身高:
例题:
1.描述7岁男孩坐高的平均水平,宜用:
A 算术均数
B 几何均数
C 中位数
D 极差
E 标准差
答案:A
[答疑编号21060101]
2.下面哪项不属于描述计量资料集中趋势的统计学指标
A. 均数
B. 几何均数
C. 标准差
D. 中位数
E. 众数
答案:C
[答疑编号21060102]
3.两组呈正态分布的数值变量资料,但均数相差悬殊,若比较离散趋势,最好选用的指标为:
A.全距
B.四分位数间距
C.方差
D.标准差
E.变异系数
答案:E
[答疑编号21060103]
4.正态分布的数值变量资料,描述离散趋势的指标最好选用
A.全距
B.四分位数间距
C.方差
D.标准差
E.变异系数
答案:C
[答疑编号21060104]
5.变异系数越大,表示:
A.相对变异程度越大
B.平均数越大
C.标准差越小
D.样本含量越大
E.标准差越大
答案:A
[答疑编号21060105]
(五)正态分布的特点、面积分布规律
标准正态分查是均数为0、标准差为1的正态分布(2008)。
1.正态分布的特征
(1)正态分布曲线以均数为中心,左右对称。
(2)正态分布有两个参数,即均数μ与标准差σ,决定了正态分布曲线的形状。
(3)所有的正态分布均可经过变量变换转变为均数为0,标准差为1的标准正态分布(u分布)u=(X-μ)/σ
(4)正态分布的面积分布有一定的规律性
三、数值变量数据的统计推断
(一)均数的抽样误差
1.在遵循随机化原则的前提下,由样本算得的统计量与总体参数之问仍存在差异。这种由于抽样引起的样本统计量与总体参数之间的差异称为抽样误差(2003)。
2.样本均数的标准差(变签拯造误)是说明均数抽样误差大小的指标(2001、2005)。由于实际工作中σ往往是未知的,可用样本标准差s作为σ的估计值,计算标准误的估计值(2004)。
(二)总体均数可信区间及其估计方法
(三)假设检验的基本步骤
1.建立假设和确定检验水准(2002、2003、2006)
Ho(无效假设):μ=μ0 (或μ1=μ2)
H1(备择假设)双侧μ≠μ0(或μ1≠μ2)
单倾μ>μ0 (或μ1>μ2)或μ<μ0 (或μ1<μ2)
α(检验水准)=0.05或α=0.Ol
2.计算统计量t值
3.确定P值 根据自由度和t值查t界值表确定P值。
4.判断结果 当P≤α时,按检验水准拒绝H0,接受H1;当P>α时,按检验水准不拒绝H0(2001).
(四)u检验和t检验
t检验的应用条件是样本含量较小,两组观塞值的标准差相差不太大(2004)。样本含量较大时,样本均数的分布服从正态分布(u分布),可用u检验(2002)。
(1)小样本均数与总体均数比较的t检验(2003)。
(2)两个小样本均数比较的t检验(2001、2006、2007)。
(3)配对资料的t检验。
(五)假设检验的两类错误及注意事项
四、分类变量资料的统计描述
相对数常用指标及其意义
1.率 又称频率指标,指在大量观察的基础上,某现象实际发生数与可能发生该现象总数之比。用以说明某现象发生的频率或强度(2000)。
2.构成比 又称构成指标,为事物内部某组分例数与该事物各组分总例数之比。用以表示某事物内部各构成部分所占的比重(2008)。
3.相对比
五、分类变量资料的统计推断
(一)率 的抽样误差、总体率的可信区间及其估计方法
(二)u检验和X2检验
X2检验可用于两个及两个以上率或构成比的比较;两分类变量相关关系分析。其数据构成,一定是相互对立的两组数据,四格表资料自由度V永远=1(2000、2003、2005)。
六、直线相关和回归
(一)直线相关分析的用途、相关系数及其意义
相关系数是定量,表示两个变量(苁y)之间线性关系的方向和密切程度的指标,用r表示,其值在一1~+1,r没有单位(2006)。
(二)直线回归分析的作用、回归系数及其意义
回归方程式Y=bX+α中之斜率6,称为回归系数,表示X每变动一单位,平均而言,Y将变动b单位(2004)。
七、统计表和统计图
(一)统计表的基本结构和要求
(二)统计图形的选择,制图通则
直条图
(1)资料性质:适用于彼此独立的资料。
(2)分析目的:直条图是用等宽直条的高度和长短来表示各统计量的大小,进行比较(2003、2006)。
历年经典试题
1.下列有关概率与频率,说法正确的是(c)
A.概率常用符号M表示
B.频率常用符号P表示
C.概率是描述某随机事件发生可能性大小的指标
D.概率就是频率
E.概率的取值范围介于一l和+1之间
2.统计学中所说的样本是指(D)
A.从总体中随意抽取的一部分
B.按研究者的需要选取有意义的一部分
C.特别从总体中选择的典型部分
D.从总体中随机抽取有代表性的一部分
E.在限定时间内按先后顺序得到的一部分
3.可以全面描述正态分布资料特征的两个指标是(B)
A.均数和中位数
B.均数和标准差
C.均数和极差
D.中位数和方差
E.几何均数和标准差
4.比较身高和体重两组数据变异度大小宜用(A)
A.变异系数
B.方差
C.极差
D.标准差
E.四分位数间距
5.从一个呈正态分布的总体中随机抽样,X≠μ,该差别被称为(D)
A.系统误差
B.个体差异
C.过失误差
D.抽样误差
E.测量误差
6.均数为0,标准差为1的分布是(B)
A.正态分布
B.标准正态分布
C.正偏态分布
D.负偏态分布
E.二项分布
7.反映均数抽样误差大小的指标是(A)
A.标准误
B.标准差
C.变异系数
D.均数
E.全距
8.描述某种事物或疾病发生严重程度的指标是(A)
A.率
B.构成比
C.相对比
D.均数
E.标准差
9.统计推断的内容是(B)
A.计算样本率
B.检验统计上的“假设”
C.计算样本均值
D.计算标准化率
E.估计参考值范围