第二十二章 数据特征的测度
第一节、集中趋势的测度
学习要求:
1、 掌握众数的计算方法、特点和应用范围
2、 掌握中位数的计算方法、特点和应用范围
3、 掌握简单算术平均数和加权平均数的计算方法;掌握算术平均数的特点和应用范围;熟悉算术平均数的计算方法和主要用途。
4、 掌握简单几何平均数的计算方法和主要用途
具体内容:
集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。
集中趋势的测度,主要包括:
位置平均数----众数、中位数等
数值平均数----算术平均数和几何平均数等
【例题1:2004年单选题】以下属于位置平均数的是( )。
A.几何平均数
B.算术平均数
C.众数
D.极差
答案:C
解析:众数及中位数均属于位置平均数。
(一)、众数
1、涵义:众数是一组数据中出现频数最多的那个数值,用M0表示。
2、用众数反映集中趋势,非常直观,不仅适用于品质数据,也适用于数值型数据。众数是一个位置代表值,不受极端值的影响,抗干扰性强。
【例题2:课后题第5题】下面是抽样调查的10个家庭住房面积(单位:平方米):55;75;75;90;90;90;90;105;120;150。这10个家庭住房面积的众数为( )
A 90
B 75
C 55
D 150
答案:A
(二)中位数
1、涵义:把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数,用Me表示。中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。
2、中位数计算:
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n为数据的个数,其公式为:
n为奇数:中位数位置是(n+1)/2,该位置所对应的数值就是中位数数值。
n为偶数:中位数位置是介于n/2和(n/2+1)之间,中位数数值就是n/2所对数值和(n/2+1)所对应数值的算术平均数。
具体计算见教材例题:
3、中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数也是一个位
置代表值,不受极端值的影响,抗干扰性强。
【例题3:2004单选题】2003年,某市下辖六个县的棉花种植面积按规模由小到大依次为800公顷、900公顷、1100公顷、1400公顷、1500公顷、3000公顷,这六个县棉花种植面积的中位数是( )公顷。
A.1450
B.1250
C.1100
D.1400
答案:B
解析:n为偶数,中位数是介于数列中间的两个数的算术平均数。
中位数=(1100+1400)/2=1250(公顷)
【例题4:2008单选题】某小学六年级8个班的学生人数由少到多依次为34人、34人、34人、34人、36人、36人、37人、37人,其中位数为( )
A 34
B 35
C 36
D 37
答案:B
解析:n为偶数,中位数=(34+36)/2=35.
【例题5:课后题第8题】下面一组数据为9个家庭的人均月收入数据(单位:元):750;780;850;960;1080;1250;1500;1650;2000;则中位数为( )
A 750
B 1080
C 1500
D 2000
答案:B
解析:n为奇数,中位数位置为5,所对应的数值为1080。
(三)算术平均数
1、涵义:算术平均数是全部数据的算术平均,又称均值,用X表示。是集中趋势中最主要的测
度值。主要适用于数值型数据,但不适用于品质数据。
2、计算公式:
(1)简单算术平均数
简单算术平均数主要用于处理未分组的原始数据。
Xi——各组的组中值
fi——各组的频数
3、计算和运用算术平均数注意事项:
(1)算术平均数同时受到两个因素的影响:各组数值的大小、各组分布频数的多少。频数在算术平均数中起着权衡轻重的作用。
(2)算术平均数易受极端值的影响。极端值的出现,会使平均数的真实性受到干扰。
【例题6:2003年单选】集中趋势最主要的测度值是( )。
A.众数
B.中位数
C.均值
D.几何平均数
答案:C
解析:算术平均数也称为均值,是集中趋势最主要的测度值。
(四)几何平均数
1、涵义: n个观察值连乘积的n次方根就是几何平均数。
2、计算公式:
3、主要用途:
(1)对比率、指数等进行平均
(2)计算平均发展速度。
【例题7:08年单选】下列数据特征的测度值中,受极端值影响的是( )
A中位数
B 众数
C加权算术平均数
D位置平均数
答案:C
解析:中位数、众数均属于位置平均数,不受极端值的影响。
【例题8:2005年、2007年多选题】下列数据特征的测度值中,易受极端值影响的有( A.加权算术平均数
B.简单算术平均数
C.极差
)。
D.众数
E.中位数
答案:ABC
【例题9:2005、2006、2007年单选】下列集中趋势中,适用于品质数据的是( A.众数
B.简单算数平均数
C.标准差
D.加权算术平均数
【答案】A
【例题10:08年单选】算术平均数与众数、中位数具有共同特点是( )
A都适用于分类数据
B都适用于顺序数据
C都不受极端值的影响
)。
D都适用于数值型数据
答案:D
解析:众数、中位数、算术平均数均适用于数值型数据。
【例题11:2007年单选题】某连锁超市6个分店的职工人数有小到大排序后为57人、58人、58人、60人、63人、70人其算术平均数、众数分别为( )。
A.59、58
B.61、58
C.61、59
D.61、70
【答案】B.
【解析】出现频数最多的数值为众数,即58人
算术平均数=(57+58+58+60+63+70)/6=61人
【例题12:2006年多选题】对于经分组整理的数据,其算术平均数会受到( )等因素的影响。
A.各组数值的大小
B.各组分布频数的多少
C.组数
D.数据个数
E.极端值
答案:ABE
【例题13:2008年多选】下列统计指标中,可以采用算术平均数方法计算平均数的有()
A、产品产量
B、可支配收入
C、产品合格率
D、销售额
E、考试分数
答案:ABDE
解析:C属于相对指标,适用几何平均数方法计算平均数。
第二节、离散程度的测度
学习要求:
1、掌握测度离散程度的指标
2、掌握极差的含义和计算方法
3、掌握标准差和方差的计算方法和应用
4、掌握离散系数的计算方法和具体应用
具体内容:
离散程度是指数据之间的差异程度或频数分布的分散程度。
集中趋势的测试值是对数据一般水平的一个概括性变量,它对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测试值对该组数据的代表性就越差,离散程度越小,其代表性就越好。
离散程度的测度,主要包括极差、方差和标准差、离散系数等。
(一)极差
1、含义:极差是最简单的变异指标。它就是总体或分布最大的标志值与最小的标志值之差,又称全距,用R表示。
3、极差反映的是变量分布的变异范围或离散幅度,在总体中任何两个单位的标志值之差都不可能超过极差。极差计算简单,含义直观,运用方便。但它仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响。
(二)标准差和方差
1、含义:方差:总体所有单位标志值与其平均数离差之平方的平均数。
标准差:方差的平方根,用表示。
2、计算:
(1)未整理的原始数据
标准差和方差是应用最广泛的统计离散程度的测度方法。
见教材207页例题。
(三)离散系数(标准差系数)
1、极差、标准差、方差都是反映数据分散程度的绝对值,其数值大小收到变量值水平高低和计量单位的影响。
2、为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。
离散系数通常是就标准差来计算的,因此也称标准差系数。它是一组数据的标准差与其相应的算术平均数之比,是测度数据离散程度的相对指标,用
表示。
离散系数主要是用于比较对不同组别数据的离散程度。离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。
【例题14:2008年单选题】标准差系数是一组数据的标准差与其相应的()之比。
A算数平均数
B极值
C众数
D几何平均数
答案:A
【例题15:2004年单选题】某学校学生的平均年龄为20岁,标准差为3岁;该校教师的平均年龄为38岁,标准差为3 岁。比较该校学生年龄和教师年龄的离散程度,则( )。
A.学生年龄和教师年龄的离散程度相同
B.教师年龄的离散程度大一些
C.教师年龄的离散程度是学生年龄离散程度的1.9倍
D.学生年龄的离散程度大一些
答案:D
解析:平均值不同的情况下,用离散系数比较离散程度。
学生年龄的离散系数=3/20*100%=15%
教师年龄的离散系数=3/38*100%=7.89%
离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。
【例题16:2005年、2004年单选题】如果两组数据是以不同计量单位来表示的,则比较其离散程度的测度值是( )。
A.离散系数
B.标准差
C.方差
D.极差
答案:A
解析:为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数
【例题17:课后题第15题】反映数据离散程度的绝对值的指标是( )
A算术平均数
B 极差
C方差
D 离散系数
E 标准差
答案:BCE
因篇幅问题不能全部显示,请点此查看更多更全内容