搜索
您的当前位置:首页正文

随机抽样

来源:二三娱乐
李老师精品辅导系列——随机抽样 穷则独善其身,达则兼善天下

随机抽样

一、基本定义:

(1)总体:在统计中,所有考查对象的全体叫做总体.

(2) 个体:在所有考查对象中的每一个考查对象都叫做个体. (3) 样本:从总体中抽取的一部分个体叫做总体的样本. (4) 样本容量:样本中个体的数目叫做样本容量. 二、抽样方法:

(一)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。简单随机抽样常用的方法有抽签法和随机数表法.

【说明】简单随机抽样必须具备下列特点:①简单随机抽样要求被抽取的样本的总体个数N是有限的。②简单随机样本数n小于等于样本总体的个数N。③简单随机样本是从总体中逐个抽取的。④简单随机抽样是一种不放回的抽样。⑤简单随机抽样的每个个体入样的可能性均为n/N。

(1)抽签法的定义:一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。

抽签法的一般步骤:①将总体的个体编号;②连续抽签获取样本号码。

(2)随机数法的定义:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 怎样利用随机数表产生样本呢?下面通过例子来说明,假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,可以按照下面的步骤进行。

第一步,先将800袋牛奶编号,可以编为000,001,…,799。

第二步,在随机数表中任选一个数,例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行)。

16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 87 35 20 96 43 84 26 34 91 64 21 76 33 50 25 83 92 12 06 76 12 86 73 58 07 44 39 52 38 79 15 51 00 13 42 99 66 02 79 54 90 52 84 77 27 08 02 73 43 28 第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本。

随机数表法的步骤:①将总体的个体编号;②在随机数表中选择开始数字;③读数获取样本号码。 (二)系统抽样:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。

【说明】由系统抽样的定义可知系统抽样有以下特证:①当总体容量N较大时,采用系统抽样。②将

第 1 页 共 6 页 E -mail:dzlc@sina.com

李老师精品辅导系列——随机抽样 穷则独善其身,达则兼善天下 总体分成均衡的若干部分指的是将总体分段,一般是样本容量是多少,就分几段,分段的间隔要求相等,间隔kN,如果N不能被n整除,就从中用随机数表法剔除几个个体,使得能整除,因此,系统抽样nNn又称等距抽样(间隔一般为k=[]).③预先制定的规则指的是:从第1段中用简单随机抽样的方法抽取一

个个体,假设编号为 l ,然后就可以将编号为l,lk,l2k,...,ln1k 的个体抽出作为样本,实际就是从每一组抽取与第一组相同编号的个体。

系统抽样的一般步骤:①采用随机抽样的方法将总体中的N个个体编号。②将整体按编号进行分段,确定分段间隔k(k∈N,L≤k).③在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。④按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。

【说明】从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想。

(三)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。又称类型抽样。

【说明】应用分层抽样应遵循以下要求:①分层:将相似的个体归人一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。

分层抽样的步骤:①分层:按某种特征将总体分成若干部分。②按比例确定每层抽取个体的个数。③各层分别按简单随机抽样的方法抽取。④综合每层抽样,组成样本。

【说明】①分层需遵循不重复、不遗漏的原则。②抽取比例由每层个体占总体的比例确定。③各层抽样按简单随机抽样进行。

三、简单随机抽样、系统抽样、分层抽样的比较

类 别 简 单 随 机 抽 样 系 统 抽 样 分 层 抽 样 共同点 (1)抽样过程中每个个体被抽到的可能性相等 (2)每次抽出个体后不再将它放回,即不放回抽样 将总体分成几层, 分层进行抽取 分层抽样时采用简单随机抽样或系统抽样 总体由差异明显的几部分组成 将总体均分成几部 在起始部分 分,按预先制定的规则在各部分抽取 样时采用简 随机抽样 总体个数较多 各自特点 从总体中逐个抽取 联 系 适 用 范 围 总体个数较少 四、数据的收集:(1)做试验; (2)查阅资料; (3)设计调查问卷

第 2 页 共 6 页 E -mail:dzlc@sina.com

李老师精品辅导系列——随机抽样 穷则独善其身,达则兼善天下 1、下列抽样的方式是否属于简单随机抽样?为什么?

(1)从无限多个个体中抽取50个个体作为样本。

(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。

(3)人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌。

2、为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是

A.总体是240 B、个体是每一个学生 C、样本是40名学生 D、样本容量是40

3、为了正确所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是 ( )A、总体 B、个体 C、总体的一个样本 D、样本容量

4、从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为 ( ) A.99 B、99.5 C.100 D、100.5

5、从学号为0~50的高一某班50名学生中随机选取5名同学参加数学测试,采用系统抽样的方法,则所选5名学生的学号可能是 ( )

A.1,2,3,4,5 B、5,16,27,38,49 C.2, 4, 6, 8, 10 D、4,13,22,31,40

6、采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体人样的可能性为 ( ) A.8 B.8.3 C.8.5 D.9

7、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是 ( )

A.简单随机抽样 B.系统抽样 C.分层抽样 D.先从老人中剔除1人,然后再分层抽样 8、从忆编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是

A.5,10,15,20,25 B、3,13,23,33,43 C.1,2,3,4,5 D、2,4,6,16,32 9、分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层

抽样为保证每个个体等可能入样,必须进行 ( )

A、每层等可能抽样 B、每层不等可能抽样 C、所有层按同一抽样比等可能抽样

10、如果采用分层抽样,从个体数为N的总体中抽取一个容量为n样本,那么每个个体被抽到的可能性为

1n1( ) A.N B.n C.N D.N n11、某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为

A.15,5,25 B.15,15,15 C.10,5,30 D15,10,20 12、下列抽样中不是系统抽样的是 ( )

A、从标有1~15号的15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以

后为i+5, i+10(超过15则从1再数起)号入样

B工厂生产的产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验 C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止 D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈

13、一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是

14、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的

第 3 页 共 6 页 E -mail:dzlc@sina.com

李老师精品辅导系列——随机抽样 穷则独善其身,达则兼善天下 有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为 人,A型血应抽取的人数为 人,B型血应抽取的人数为 人,AB型血应抽取的人数为 人。

15、某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,每个学生被抽到的可能性均为0.2,若该校取一个容量为n的样本,则n=

16、某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是 抽样方法。

17、某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?

18、某校有学生1200人,为了调查午休对学习成绩的影响情况,计划抽取一个样本容量为60的样本,问此样本若采用简单随机抽样将如何进行?

19、某校高中三年级的295名学生已经编号为1,2,……,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。

20、某工厂中共有职工3000人,其中,中、青、老职工的比例为5∶3∶2,从所有职工中抽取一个样本容量为400的样本,应采取哪种抽样方法较合理?且中、青、老年职工应分别抽取多少人?

21、一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。

22、对某单位1000名职工进行某项专门调查,调查的项目与职工任职年限有关,人事部门提供了如下资料:试利用下述资料设计一个抽样比为1/10的抽样方法。 任职年限 5年以下 5年至10年 10年以上 300 500 200 人数

作业:

1、某校高一年级有学生x人,高二年级有学生900人,高三年级有学生y人,若采用分层抽样的方法抽 一个容量为370人的样本,高一年级抽取120人,高三年级抽取100人,该中学三个年级共有学生( ) A.1900人 B.2000人 C.2100人 D.2220人

2、某公司有职员150人,中级管理人员40人,高级管理人员10人,要从这200人中抽取40人进行身体检查,如果采用分层抽样的方法,则职员、中级管理人员、高级管理人员各应抽取的人数为( ) A. 25,10,5 B. 30,8,2 C. 30,6,4 D. 32,6,2 3、某班有学生52人,现用系统抽样的方法,抽取一个容量为4的样本,已知座位号分别为6,30,42的同学都在样本中,那么样本中另一位同学的座位号应该是 .

4、一个总体中有100个个体,随机编号0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为M,那么在第K组中抽取的号码个位数字与M+K的个位数字相同,若M=6,则在第7组中抽取的号码是________. 5、某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2:3:5,现用分层抽样方法,抽 出一个容量为n的样本,样本中A种型号产品有16件,那么此样本的容量n=______________.

6、某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是______。若用分层抽样方法,则40岁以下年龄段应_________

7、将参加数学竞赛的1000名学生编号如下:0001,0002,

0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部份,如果第一部份编号为0001,0002,…,0020,从第一部份随机抽取一个号码0015,则第40个号码为_______.

8、用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是___________.

第 4 页 共 6 页 E -mail:dzlc@sina.com

李老师精品辅导系列——随机抽样 穷则独善其身,达则兼善天下 参考答案:

1. (1) 不是,.由于被抽取样本的总体个数是无限的.

(2) 不是,由于不符合“逐个抽取”的原则,且抽出的结果可能是只有一个零件重复出现.

(3)不是, 简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样。 2.D 3.C 4.C 5.B 6.A 7.D

8.B 用系统抽样的方法抽取至的导弹编号应该k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k是1到10中用

简单随机抽样方法得到的数,因此只有选项B满足要求,故选B。

9.C 保证每个个体等可能入样是简单随机抽样、系统抽样、分层抽共同的特征,为了保证这一点,分层

时用同一抽样比是必不可少的,故此选C。

10.C 根据每个个体都等可能入样,所以其可能性本容量与总体容量比,故此题选C。

11.D 因为300:200:400=3:2:4,于是将45分成3:2:4的三部分。设三部分各抽取的个体数分别为

3x,2x,4x,由3x+2x+4x=45,得x=5,故高一、高二、高三各年级抽取的人数分别为15,10,20。 12.C 因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样。 13.

1n 14. 8 5 5 2 15.360 0.2 16.系统抽样 1060045075017.[分析] 简单随机抽样一般采用两种方法:抽签法和随机数表法。

解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应的轴的直径。 解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取的样本。 18.解:可用两种方法:

方法一:(抽签法)(1)编号: 将1200名学生进行随机编号为1,2, …,1200,(可按学生的学号或按学生的生日进行编号).(2)制签:做1200个大小、形状相同的号签,分别写上这1200个数,放在个容器里,并进行均匀搅拌.(3)逐个抽取:连续抽取60个号签,号签对应的同学即为样本. 方法二:(随机数表法)(1)编号: 将1200名学生进行编号分别为0000,0001,…, 1199,(2)选数:在课本附表1随机数表中任选一个数作为开始.(如从第11行第7列的数9开始) ; (3) 读数:从选定的数开始向右(或向上、向下、向左)读下去,选取介于范围的号码,直到满60个号码为止; (4) 抽取:抽取与读出的号码相对应的学生进行分析.

19.解:按照1:5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,59组是编号为291~295的5名学生。采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为k(1≤k≤5),那么抽取的学生编号为k+5L(L=0,1,2,……,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,……,288,293。

20.解:采用分层抽抽样样方法较为合理.由样本容量为400,中、青、老职工的比例为5∶3∶2,所以应抽取中年职工为400×

532=200人,应抽取青年职工为400×=120人,应抽取老年职工为400×=80人. 10101021.采用分层抽样的方法。

解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:

(1)将3万人分为5层,其中一个乡镇为一层。

(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。 300×3/15=60(人),300×2/15=100(人),300×2/15=40(人),300×2/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人。 (3)将300人组到一起,即得到一个样本。

第 5 页 共 6 页 E -mail:dzlc@sina.com

李老师精品辅导系列——随机抽样 穷则独善其身,达则兼善天下

1100,5年以下、5年至10年、10年以上103530人, 应抽取5年至10年为10050人, 的比例为3∶5∶2,所以应抽取5年以下为1001010220人. 应抽取10年以上的为1001022. 采用分层抽抽样样方法较为合理.由样本容量为1000

作业:

370120100370

900N11401,∴职员抽取的人数为15030;中级管理人员抽取的人数为408;2.B 析:抽取比为

5520051高级管理人员抽取的人数为102;选B

54812,3.18 析:在52个个体中剔除4个体后分段间隔k即分4组每组12个个体,故抽到的样本为:41.D析:

6,18,30,42;填18. 4.63 析:分段间隔k10010,当m=6时,第k组抽取的号的个位数字为m+k的个位数字, 10∵mk6713,个位数为3,故第7组中抽取的号码的个位数字为3 ,抽取号码为63.

nnn2k16,∴n80. ,∵抽到A产品数量为

2k3k5k10k10k2005,∵第5组抽出的号码为22,∴第6组抽出的号码应是27;第7组40401 ,而40岁以下年龄段2005120人. 5

5.80 析:∵产品数量之比依次为2:3:5,设A产品数量为2k,B产品数量为3k,C产品数量为5k,

∴抽取比为

6. 37 20 析:分段间隔k抽出的号码应是32;第8组抽出的号码应是37; 又抽取比例为

的人数为20050%100人,∴40岁以下年龄段应抽取的人数为1007. 0795 析:39100015795 508. 6 析:1261586

第 6 页 共 6 页 E -mail:dzlc@sina.com

因篇幅问题不能全部显示,请点此查看更多更全内容

Top