搜索
您的当前位置:首页正文

《统计学》课程大纲

来源:二三娱乐


《统计学》课程大纲

本课程从逻辑上讲由四个部分组成。第1章为第一部分,主要学习和了解统计的涵义、统计的产生和发展;了解统计研究对象、特点和作用;掌握统计活动方法、过程、任务和组织;理解并记忆统计学中的几个基本概念,从而对本书有整体印象。

第二部分包括2、3、4、5章,主要了解统计研究各个阶段及各种研究方法,即统计设计、统计调查、统计整理、描述分析和推断分析的有关内容。各阶段既有一定的独立性,相互之间又紧密联系,组成了一个完整的合乎逻辑的认识过程。通过学习,要明确统计研究各阶段的任务和特点,掌握各种统计研究方法,如统计指标体系的设计、统计分组的方法、总量指标和相对指标的计算和运用等。

第三部分包括第8章,主要介绍抽样推断的有关知识,包括抽样估计的意义和一般步骤、抽样方案设计的基本准则和抽样方案设计的主要内容。通过本章的学习,应明确抽样调查的概念、特点、作用;理解抽样误差的影响因素,掌握抽样平均误差的计算方法、抽样估计推断和必要抽样数目的确定方法,初步具备在实际工作中正确运用抽样方法收集资料并据以做出正确推断的能力。

第四部分包括第9、10、11章,介绍几种常用的统计分析方法,即时间数列分析、统计指数分析、回归分析与相关分析。学习目的是明确时间数列和统计指数的概念、种类、作用和编制原则,掌握相关分析和回归分析的特点和方法,从而更好地研究事物的变动趋势和相互关系。

第1章 绪论 一、学习目的与要求

统计学是一门关于数据的科学,是一门关于数据的收集、整理、分析、解释和推断的科学。本章提纲挈领地介绍了统计学的一些基础知识,使我们对统计学有了初步的认识。通过本章学习,应明确“统计”的涵义、统计的产生和发展;了解统计研究对象、特点和作用;掌握统计活动方法、过程、任务和组织;理解并记忆统计学中的几个基本概念,从而对全书有整体印象。

二、课程内容 1.1 统计学概述

1.统计的含义

(1) 对现象的数量进行搜集、整理和分析的活动过程。 (2) 通过统计实践活动取得的说明对象某种数量特征的数据。 (3) 是研究总体一定条件下的数量特征及其规律性的方法论学科。

统计研究的对象是一切自然与社会现象总体的数量特征及其相互关系,它具有数量性和总体性的特点。

2.统计学的产生和发展

统计是在社会生产的发展中为适应国家管理的需要,从人们社会活动的实践中产生出来的。“统计”一词有统计工作、统计资料和统计科学三种涵义。

17世纪末统计学逐渐成为一门科学并出现了一些有代表性的统计著作,开始形成不同的统计学派,主要有政治算术学派、记述学派、数理统计学派、社会统计学派、马克思主义统计理论体系。

3. 统计学的分类

(1) 理论统计学,研究统计的一般方法和理论; (2) 应用统计学,研究运用于某一特定领域的统计问题。 1.2 统计学的作用及学习方法 1. 为什么要学习统计学

(1) 统计学是通用的方法论科学,是通用的基础课。 (2) 统计学与我们的生活息息相关。

2. 学习统计学的数学基础

学习基础统计知识的数学基础:算术符号、分数、小数、四则运算、比例、乘方和开方、正负数、零的运算规则和简化。

学习高级统计知识的数学基础:平面解析几何、导数、微积分、概率论。 3.学习统计学的方法

理解统计思想、掌握统计术语、熟悉统计符号、记住统计公式、使用统计工具。

1.3 统计学的基本概念 1. 统计总体与总体单位

统计总体是根据统计研究的目的、客观存在的、在同一性质基础上结合起来的许多个别单位所形成的集合。构成总体的基本单位称为总体单位,也称为个体。

2.标志与变量

总体单位所具有的属性或特征的名称称为标志。标志可分为品质标志与数量标志。数量标志通称为变量,变量的各种不同的值称为变量值。

3.指标与指标体系

统计指标是反映自然与社会现象总体的数量特征的概念及其具体数值。指标可以分为数量指标与质量指标,或分为总量指标、相对指标与平均指标。

指标体系指具有某种内在联系的一系列统计指标所构成的整体。 第2章 统计数据的收集 一、学习目的与要求

统计学是关于数据的科学,数据是统计研究的起点,因此,如何收集数据就成为统计学第一步要研究的内容。从数据收集的角度讲,数据可以分为原始资料和次级资料。对原始资料的收集过程通常称为统计调查,次级资料的收集过程则基本上是一个阅览、查询的过程,本章对两种资料的收集方法分别进行了介绍。此外还介绍了统计测量尺度和调查误差的有关内容。学习本章时应重点掌握统计测量尺度的分类和应用、统计调查的分类、调查设计与问卷设计、调查误差的产生原因与控制。

二、课程内容 2.1 统计测量尺度 1.统计测量尺度概述

统计测量是使用某种方法使自然或社会事物量化,可以看作统计分类的过程。由于分类时依据的标准有所不同,就形成了不同的测量尺度。统计测量尺度通常分为四类,即定类尺度、定序尺度、定距尺度和定比尺度。

(1) 定类尺度是对事物的性质差异进行的辨别与区分。定类变量的不同类别间地位平等,没有高低优劣之分,定类变量的值是以文字表述的,不能以数字表述(或用数字表述,但只具有符号上的意义) 。定类尺度的例子如按性别的分类。

(2) 定序尺度是对事物顺序性差异进行的辨别与区分。定序变量的不同类别间存在顺序性差异,因此在表述或分析时不能随意排列,但其顺序性差异无法准确计量。定序变量确切的值也是用文字表述的,不能用数字表述(或用数字表述,但只具有符号上的意义) 。定序尺度的例子如按文化程度的分类。

(3) 定距尺度是对事物绝对差异进行的辨别与区分。定距变量的值以数字表述,有计量单位,可以进行加减运算,但没有绝对零点,不能进行乘除运算。定距变量的例子如摄氏温度。

(4) 定比尺度是对事物绝对和相对差异进行的辨别和区分。定比变量的值以数字表述,有绝对零点,可以进行加减运算和乘除运算。定比变量的例子如身高、产值等。

测量尺度的作用

(1) 决定数据的整理、显示方法; (2) 决定数据的分析方法; (3) 决定计算机的处理方法。 3. 测量层次与测量尺度的正确应用

从定类尺度依次到定序、定距、定比尺度,测量层次依次提高。在应用时应注意:对于不同的事物,要正确选用测量尺度;对于同一事物,要尽量使用高层次的尺度;对于指标体系,要使用相同的尺度。

2.2 原始数据的收集方法 1.统计调查概述

统计调查是按一定的方式收集原始数据的工作过程,它是统计过程的基础环节。按照调查的组织方式不同可将统计调查分为:

(1) 统计报表制度,指按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度。

(2) 普查,指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查。

(3) 抽样调查,指按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。

(4) 重点调查,指为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。

(5) 典型调查,在对调查对象有一定了解的基础上,有意识地选择少数典型单位进行调查的一种非全面调查组织方式。

2.统计调查方案

统计调查方案包括五个方面的内容: (1) 调查目的,即为什么调查;

(2) 调查对象与调查单位。调查对象是调查的物质承担者,是一个总体,调查单位则是总体中的每一个总体单位(注意区分调查单位与填报单位) ;

(3) 调查项目与调查表。调查项目即调查内容,若以规范的表格形式表现出来就形成了调查表;

(4) 调查时间,包括两项内容,一是调查资料所属的时间,即数据是现象在哪一时点或哪一时期的数量表现,二是调查全过程和每个调查阶段所需的时间;

(5) 制定调查工作的组织实施计划。 3.问卷设计

(1) 基本结构:说明词、主题问句、作业记录。 (2) 主题问句类型:开放式、封闭式。

(3) 问卷设计的基本要求:主题明确、提问科学、逻辑性强、容量适度。 2.3 次级资料的收集 1.次级资料的概念与特征

次级资料指已经被收集、整理的数据信息,如统计年鉴。次级资料的特征:已经加工成型;内容广泛;时效性相对较差;可靠性相对较差。

2.次级资料的主要收集渠道 (1) 查阅公开出版物; (2) 向政府统计机构咨询; (3) 向其他机构咨询; (4) 网上查询。 2.4 统计调查误差 1.调查误差概述

调查误差指收集的数据资料与真实情况之间的差异,它是一个相对的概念。 2.调查误差的种类与产生原因

按产生的原因,调查误差分为登记误差和代表性误差。

(1) 登记误差是由于人的主观故意或失误而产生的误差,如调查者在调查或整理过程中的错误记录,或被调查者在接受调查时有意隐瞒等。

(2) 代表性误差是用部分单位来推断总体时产生的误差,仅存在于非全面调查中。 3.调查误差的控制与消除

(1) 消除登记误差的措施:加强对调查人员的业务培训;合理设计调查表,不使被调查者产生误解;采用合适的调查组织方式,尽量避开人为因素的干扰。

(2) 消除代表性误差的措施:按随机原则抽取样本,或适当扩大样本容量。 第3章 统计数据的整理与显示 一、学习目的与要求

统计整理是统计工作的第三个阶段。统计调查所获取的统计资料主要是反映总体单位特征的原始资料,比较分散、零碎,因此,需要对这些调查资料进一步进行加工和整理。统计整理是根据统计研究的目的,把统计调查所收集的原始资料进行科学的加工,使之系统化、条理化、科学化,从而得出能够反映事物总体特征的资料,它在整个统计工作中起着承前启后的作用。通过本章学习,要明确统计整理的意义;了解统计分组的作用;理解并掌握统计分组的基本方法;掌握变量数列的编制方法;了解常用的统计图和统计表的形式和应用。

二、课程内容 3.1 统计整理与统计分组 1. 统计整理的意义和步骤

统计整理是将统计调查得到的原始资料进行科学的分组和汇总形成综合统计资料的工作过程。

统计整理的步骤:制定统计整理方案→对原始资料进行审核→数据处理→制作统计表或统计图。 2. 统计整理的基本方法——数据分组

统计分组是将总体中所有单位按一定的标志分为性质不同但又有联系的若干部分的过程。

统计分组的主要步骤:选择分组标志→确定分组体系→总体单位归类。

(1) 分组标志的选择。分组标志是将总体单位归到不同组中的依据。分组标志的选择要服从于特定的研究目的,如果可以使用不同的分组标志,应该选择最本质的标志。如研究与企业生产规模有关的问题时,应按规模对企业分组。

(2) 分组体系的确定。分组体系指对同一事物使用两个以上的标志进行分组时所形成的分组关系,分为平行分组体系和交叉分组体系。

(3) 总体单位归类。归类的基本原则是保证任何一个总体单位或原始数据都能且仅能归属于某一组,即符合互斥性和完备性。

3.2 分布数列的编制 1. 分布数列的概念与种类

分布数列是将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组在总体中所占的比重而形成的数列。分布数列由两个基本要素构成,一是标志的不同取值,它反映现象的变化种类或范围;二是次数或频率,表明总体单位在各组分布的情况。

分布数列按标志的类型可分为品质数列和变量数列。

(1) 品质数列是将现象按品质标志分组而形成的分布数列,它的特征是标志的各种取值以文字形式表述。

(2) 变量数列是将现象按数量标志分组而形成的分布数列。变量数列由两串数字组成,一串数字为变量的不同取值,另一串为次数或频率。变量数列按每个组的变量取值形式不同,分为单值数列和组距数列两种。

2.变量数列的编制

(1) 单值数列,即每个组值只用一个具体的变量值表现的数列。

(2) 组距数列,指每个组的变量值用一个区间来表现的变量数列。根据变量值变动区间的长度是否相等,又分为等距数列和异距数列。 组距数列的相关概念:

① 组限:每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限。 ② 组距:每组变量值变动区间的长度,为上下限之差。 组中值:每组变量取值范围的中点数值,等于(上限+下限) ÷2 等距数列的编制步骤:

① 求变异全距:

② 确定组距及组数:R≤组距(d) ×组数(m) ③ 定组限 计算次数

3.累计次数与累计频率

频率指各组单位数占总体单位总数的比重。累计次数或累计频率提供了取值大于(或小于) 某个变量值的总体单位的数量或比重的信息。

3.4统计图表 1.统计图

以点、线条、面积等方法描述、显示统计数据的形式,一般由坐标系、图形、图例三部分构成。常用的统计图有条形图、直方图、圆形图、线图、散点图。

2.统计表

统计表是用来显示经过整理的数据资料即统计数列的表格,具有容量大、方便计算的优点。 (1) 统计表的基本结构:总标题、主词栏、宾词栏、数据栏。

(2) 统计表的加工方法:主词栏的加工即对主体的分组,宾词栏的加工包括选择指标和分组两项内容。

(3) 统计表的编制规则:选择合适的总标题;主词栏与宾词栏各归其位;表的上、下端通常用粗实线或双线封口,左右两端开口;列数较多时,要在各列的文字标题下面设置编号加以标识;数据栏不能有空白,不应当有数据的或没有数据的用横线填上。

第4章 总体规模与相对数量关系的描述 一、学习目的与要求

统计分析是最后的、也是最为复杂的统计研究工作阶段。本章介绍的是统计分析方法中的一种——描述方法,首先阐述了总量指标的概念、类型和计算方法等,然后介绍了主要的国民经济总量指标,以便学生了解国家宏观经济统计指标;第三节介绍了相对指标的有关内容,即如何通过特定的相对数量关系来说明现象总体的某个特征;最后介绍了变量或指标的无量纲化方法。通过本章学习,要理解总量指标和相对指标的概念、作用和特点;熟练掌握几种相对指标的计算方法;明确计算和运用总量指标和相对指标的原则;了解几种重要国民经济总量指标的计算方法;掌握变量或指标的无量纲化方法。

二、课程内容 4.1总量指标概述 1.总量指标的概念与作用

总量指标是反映现象总体规模或水平的指标,即数量指标,也称为绝对数,它是对现象最基本的描述,是相对指标和平均指标的基础。

2. 总量指标的基本分类

(1) 从反映内容的角度可分为标志总量与总体单位总数。标志总量是总体单位某一数量标志的标志值总和;总体单位数反映的是狭义的总体规模,即总体所包含的单位数量。

(2) 从总量指标时间属性的角度可分为时期指标和时点指标。时期指标是一段时期内积累的总量,其数值严格随时间长短变化,且具有可加性;时点指标是某一时刻的总量,反映总体已经存在并经常变化的数量状态在某一个具体时刻的表现,其数值不严格随时间长短变化,没有可加性。

(3) 从计量单位的角度可分为实物指标、价值指标与劳动指标。实物指标是以实物单位来表示的总量;价值指标是以货币为单位来计算的总量指标;劳动指标是以劳动时间为单位来表示的总量指标。

3.计算方法

实物总量指标的计算通常可以直接相加或折算相加计算,价值总量或劳动总量指标往往需要根据相关要素进行平衡计算或推算。

4.2 主要国民经济总量指标的计算 1.生产总量及计算方法

生产的范围既包括货物生产也包括服务生产;生产的主体为一国的常住单位;生产活动应当具有社会性,即产品要能够在市场上出售,或至少能有偿或无偿地由一个单位向另一个单位提供;产品按使用方向可以分为中间产品和最终产品。

国内生产总值的三种计算方法:

(1) 生产法。生产法从生产角度即国内生产总值的形成角度来计算,具体计算公式为: 增加值 = 总产出 – 中间投入

(2) 收入法。收入法从国民经济初次分配角度来计算,具体计算公式为: 增加值 = 固定资产折旧 + 劳动者报酬 + 生产税净额 + 营业盈余 (3) 支出法。支出法是从最终产品使用的角度来计算的,具体计算公式为: 国内生产总值 = 总消费 + 总投资 +(出口 – 进口) 2.收入总量

收入是分配的结果,根据分配发生的不同阶段可分为初次分配收入和再分配收入。国民经济核算中的收入总量包括国民总收入(GNI) 、国民净收入(NNI) 。

国民总收入 = 国内生产总值 + 来自非常住单位的净要素收入 国民净收入 = 国内生产净值 + 来自非常住单位的净要素收入 = 国民总收入 – 固定资产折旧 4.3 相对指标 1.相对指标的概念及作用

相对指标是由数量对比形式表现的总体的数量特征,其本质特征在于 “数量对比”,即它所反映的是一个数量比之于另外一个数量的关系。相对指标便于在总体规模的基础上进一步描述总体的数量特征,便于进行对比分析。相对指标的基本表现形式为无名数形式,即没有计量单位。

相对指标使不能直接对比的现象找到共同的比较基础,可用来进行宏观经济管理和评价经济活动的状况。

2.相对指标的种类

(1) 结构相对数,反映总体当中的部分数值与总体数值的对比关系。 结构相对数 = 总体部分数值/总体全部数值

(2) 比例相对数,反映总体中某一部分数值与总体的另一部分数值的数量对比关系。 比例相对数 = 总体中某一部分数值/总体中另一部分数值

(3) 比较相对数,反映同类现象在不同空间的不同取值间的数量对比关系。 比较相对数 = 某空间范围的某指标数值/另一空间范围的该指标数值 (4) 动态相对数,反映同一事物在不同时间上的数量对比关系。 动态相对数 = 某指标报告期数值/该指标基期数值 (5) 计划完成程度相对数,用于检查各类计划的执行情况。

计划完成程度相对数 = 某指标实际数值/该指标计划数值

(6) 强度相对数,将一个总量与另一个相关联的总量进行比较,用比较的结构来说明其中一个总量所代表现象的强度、力度、密度、普及程度等内容。

强度相对数 = 观察强度指标数值/承载指标数值 3.使用相对指标应注意的问题 (1) 正确选择对比的基础; (2) 指标对比要有可比性;

(3) 相对指标要与总量指标结合运用; (4) 多种相对指标结合运用。 第5章 变量数列分析

一、学习目的与要求

统计数列是进一步进行统计分析的基础,其中变量数列是一种重要的分组数列,它是从横的方面,即现象的截面上反映总体的数量特征。本章介绍的是变量数列分析的理论和方法,主要包括:测定变量数列次数分布的集中趋势,用统计平均指标反映;测定变量数列次数分布的离中趋势,用标志变异指标反映。通过本章的学习,要正确理解平均指标和变异指标的概念、意义、作用;明确其种类及其区别;掌握平均指标和变异指标的计算方法、应用原则和条件。

二、课程内容 5.1集中趋势的测定 1.集中趋势的涵义和测定意义

集中趋势指总体中各单位的次数分布从两边向中间集中的趋势,变量数列的集中趋势可以用平均指标来反映。

测定集中趋势可以反映现象总体的客观规定性;对比同类现象在不同的时间、地点条件下的一般水平;分析现象之间的依存关系。

2. 平均指标的种类及计算方法

平均指标也称为平均数,指同质总体中各单位某一数量标志在一定的时间、地点条件下所达到的一般水平。平均数可以分为算术平均数、调和平均数、几何平均数、众数、中位数。

算术平均数

(1) 算术平均数的基本形式:

(2) 简单算术平均数,根据未分组资料计算的算术平均数,即将未分组资料中各单位的标志值总和除以总体单位总数。公式:

加权算术平均数,根据分组数列资料计算的平均数,对于单项式分组数列,它是各组标志值与各组次数乘积的总和除以各组次数总和;对于组距式分组数列,它是各组的组中值与各组次数乘积

的总和除以各组次数总和。公式:

(3) 算术平均数的性质

a.各标志值与算术平均数的离差之和等于零; b.各标志值与算术平均数的离差平方和最小。 调和平均数

调和平均数是总体各单位标志值倒数的算术平均数的倒数。 (1) 计算公式

简单调和平均数:

加权调和平均数:

(2) 调和平均数的应用:当已知分组数列的各组标志值和标志总量时,可采用调和平均法计算平均指标。

(3) 求解比值的平均数的方法:需要将其还原为构成比值的分子、分母原值总计进行对比,计算时需依据被研究指标的性质及具有的权数资料确定。

几何平均数

几何平均数是N个比率连乘积的N次方根,适于计算现象的平均比率或平均速度,反映现象比率的平均水平。计算几何平均数需满足两个前提条件:各个比率或速度的连乘积等于总比率或总速度;相乘的各个比率或速度不得为零或负值。

(1) 简单几何平均数

简单几何平均数是根据未分组资料计算的,公式为:

(2) 加权几何平均数

加权几何平均数是根据分组资料计算的,公式为:

众数

众数是指总体中出现次数最多的标志值。它是一种位置平均数,不受数列中异常标志值的影响。 (1) 由单项式分组数列确定众数,出现次数最多的标志值即为众数。

(2) 由组距数列确定众数,首先根据出现次数的多少确定众数所在的组,然后利用公式计算近似值。公式为

下限公式:

上限公式:中位数

将总体各单位的标志值按大小顺序排列,处于数列中点位置的标志值即为中位数。中位数的大小仅取决于它在变量数列中的位置,不受极端数值的影响。

(1) 由未分组资料确定中位数的方法。

根据公式

确定中位数的位次,据此找出对应的标志值即为中位数。

(2) 由单项式分组数列确定中位数的方法。

直接用公式确定中位数的位次,再根据位次用较小累计或较大累计次数的方法将累计

次数刚超过中位数位次的组确定为中位数组,该组的标志值即为中位数。

(3) 由组距式分组数列确定中位数的方法。

下限公式:

上限公式:

5.2 离中趋势的测定 1.离中趋势的涵义

离中趋势指各单位标志值背离分布中心的规模或程度,用标志变异指标来测定。离中趋势可以用来衡量和比较平均数代表性的高低,反映社会经济活动过程的均衡性和节奏性,测定变量数列次数分布较之正态分布的偏离程度。

2. 全距

全距也称极差,它是总体各单位标志值中最大值与最小值之差。全距越大,说明总体中标志值变动的范围越大。全距的计算公式:

3. 平均差

平均差是变量数列中各单位标志值对其算术平均数离差绝对值的平均数,它反映了各单位标志值对其算术平均数的平均离差。平均差越大,说明各单位标志值的差异程度越大。

(1) 简单平均差的计算公式:

(2) 加权平均差的计算公式:

4.标准差及方差

标准差是总体各单位标志值与其算术平均数离差平方的算术平均数的平方根,标准差的平方称为方差。

(1) 简单标准差的计算公式:

(2) 加权标准差的计算公式:

5. 变异系数指标

变异系数指标是标志变异指标与总体平均数的对比值,它消除了数列本身水平和性质的影响,反映了离散的相对程度。计算公式:

平均差系数

标准差系数

6. 是非标志的标准差及方差

只表现为是或否、有或无的标志称为是非标志。用来描述是非标志总体特征的统计指标主要有: (1) 成数。具有某种标志表现或不具有某种标志表现的单位数占总体单位总数的比重称为成数。具有某种标志表现的单位数所占的成数:

(2) 平均数。即具有被研究标志表现的单位数所占的成数,

(3) 标准差及标准差系数。计算公式:

第8章 抽样推断 一、学习目的和要求

抽样推断又称抽样调查或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体的数量特征的一种方法。它具有三个特点:按随机原则抽取调查单位;由部分推断全体;抽样误差可以事先计算并加以控制。本章介绍了四类常用的抽样方法,即简单随机抽样、类型抽样、等距抽样、整群抽样。通过本章的学习,应明确抽样推断的概念、特点、作用;理解抽样误差的影响因素,掌握抽样平均误差的计算方法,抽样估计推断和必要抽样数目的确定原理及方法;初步具备在实际工作中正确运用抽样方法收集资料并据以做出准确推断的能力。

二、 课程内容 8.1 抽样方案的设计

1. 抽样估计的意义和一般步骤 (1) 抽样估计的定义

按照随机原则从调查对象中抽取一部分单位进行调查,并以调查结果对总体数量特征做出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。

(2) 抽样估计的特点

① 按随机原则抽取样本单位; ② 目的是推断总体的数量特征;

③ 抽样推断的结果具有一定的可靠程度,抽样误差可以事先计算并控制。 (3) 抽样估计的运用 ① 不可能进行全面调查时 ② 不必要进行全面调查时 ③ 来不及进行全面调查时 ④ 对全面调查资料进行补充修正时 (4) 抽样估计的一般步骤

① 设计调查方案 ② 抽取样本单位 ③ 收集样本数据 ④ 计算样本统计量 ⑤ 推断总体参数 (5) 样本指标

样本平均数:

样本标准差: 和

样本成数:

成数样本方差:

抽样平均误差及抽样极限误差:

重复抽样:

不重复抽样:

2. 抽样方案设计的基本准则 (1) 随机原则 (2) 抽样误差最小 (3) 费用最少

3. 抽样方案设计的主要内容 (1) 编制抽样框

抽样框指包括全部抽样单位的名单框架,仅对有限总体而言。分为名单抽样框、区域抽样框、时间表抽样框。

(2) 确定抽样方法

重复抽样:同一总体单位有可能被重复抽中,而且每次抽取都是独立进行。

不重复抽样:同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行。 (3) 确定抽样组织方式

简单随机抽样——对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本。 类型抽样——将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。 等距抽样——将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。

整群抽样——将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位构成样本。

(4) 确定样本容量

重复抽样时:

不重复抽样时:

8.2 简单随机抽样的抽样误差测定 1.抽样分布

涵义:样本统计量所有可能值的概率分布。 (1) 平均数的抽样分布

① 全部可能样本平均数的均值等于总体均值,即:

② 从非正态总体中抽取的样本平均数,当n足够大时其分布接近正态分布。 ③ 从正态总体中抽取的样本平均数不论容量大小其分布均为正态分布。

样本均值的标准差为总体标准差的(2) 比率的抽样分布

① 全部可能样本比率的均值等于总体比率,即:

② 从非正态总体中抽取的样本比率,当n足够大时其分布接近正态分布。 ③ 从正态总体中抽取的样本比率,不论容量大小其分布均为正态分布。

④ 样本比率的标准差为总体标准差的

2.抽样估计量的优良标准:无偏性、有效性、一致性。 3. 抽样误差

指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差。

4.抽样平均误差

指每一个可能样本的估计值与总体指标值之间离差的平均数,即样本估计量的标准差。

重复抽样:

不重复抽样:5.抽样极限误差

指在一定的概率保证程度下,抽样误差不允许超过的某一给定范围。

重复抽样:

不重复抽样:

8.3 简单随机抽样的抽样估计 1. 点估计

指直接以样本指标来估计总体指标,也叫定值估计 2. 区间估计

(1) 区间估计的定义和原理

指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范围;其中,被推断的总体指标的下限与上限所包括的区间称为置信区间,估计的可靠程度也称为置信度。

(2) 总体平均数的区间估计

表达式:其中

为极限误差

(3) 总体成数的区间估计

表达式:其中

为极限误差

3.样本数目的确定

重复抽样条件下:

不重复抽样条件下:第9章 时间数列分析

一、 学习目的与要求

编制和分析时间数列是为了从动态上研究现象的数量方面及其发展变化的规律性,它在社会经济统计中具有重要意义。本章的学习主要应从两个方面来进行,即数值分析方面和因素分析方面。

通过本章的学习,应了解和掌握以下内容:时间数列的概念、种类和编制原则;时间数列的水平指标,即发展水平、平均发展水平、增长量、平均增长量;时间数列的速度指标,即发展速度、增长速度、平均发展速度、平均增长速度;时间数列的因素分析,尤其是长期趋势和季节变动的影响和测定。

二、课程内容 9.1 时间数列概述 1. 时间数列的概念

时间数列是把反映现象发展水平的统计指标数值按照时间先后顺序排列起来所形成的统计数列。它由两个基本要素构成,一个是现象发展水平的所需时间,一个是反映现象发展水平的统计指标数值。

2.时间数列的种类

(1) 按指标形式分为总量数时间数列、相对数时间数列、平均数时间数列。 (2) 按变量性质分为确定性数列和随机性数列。

(3) 按变化形态分为平稳性数列、趋势性数列、季节性数列。 3. 编制时间数列的原则

编制时间数列的基本原则是保证指标数值的可比性。对于时期数列,整个数列中时期长短应该相同;对于时点数列,要尽可能使各指标之间的间隔相等。时间数列中各项指标数值的计算方法和计算单位也必须一致。

9.2 时间数列的水平指标 1. 发展水平和平均发展水平

(1) 发展水平指时间数列中每个指标的数值。在绝对数时间数列中,发展水平是总量指标;在相对数时间数列和平均数时间数列中,发展水平表现为相对指标和平均指标。

(2) 平均发展水平是在时间数列中,把各个时期(或时点上) 的指标数值加以平均而求得的平均数,也称为序时平均数。

(3) 序时平均数的计算方法。 计算绝对数时间数列的序时平均数 ①由时期数列计算,采用简单算术平均法

②由时点数列计算 a. 由连续时点数列计算

间隔相等时:

间隔不等时:

b. 由间断时点数列计算

间隔相等时:

间隔不等时:

计算相对数时间数列的序时平均数

基本公式:

①a、b均为时期数列时

②a、b均为时点数列时

③a为时期数列、b为时点数列时

2. 增长量和平均增长量

(1) 增长量是说明现象在一定时期内增长的绝对数量的指标,它是报告期水平与基期水平之差。 (2) 平均增长量是说明某种现象在一定时期内平均每期增长数量的指标。 9.3 时间数列的速度指标 1.发展速度和增长速度

(1) 发展速度是指数列中某一报告期水平与基期水平之比,用以反映某一现象在报告期较基期发展的相对程度。根据比较时期的不同,它可以分为定基发展速度和环比发展速度。定基发展速度是报告期水平与某一固定基期水平之比,说明报告期水平对某一固定基期水平来说已经发展到多少倍;环比发展速度是指报告期水平与前一期水平之比,说明报告期水平对前一期水平来说已发展到多少倍。

(2) 增长速度是根据增长量与基期水平之比计算的,用以说明报告期水平比基期水平增加了若干倍。根据所采用的基期不同,分为定基增长速度和环比增长速度。

2.平均发展速度和平均增长速度

平均速度指标反映一个较长时期内逐年平均发展或增长变化的程度,可分为平均发展速度和平均增长速度。平均发展速度可以用几何平均法和方程法来计算。

(1) 几何法

(2) 方程法

的正根即为所求的平均发展速度。

9.4 时间数列的因素解析 1. 时间数列的构成因素 (1) 长期趋势(T)

长期趋势是指现象在较长时期内受某种根本性因素作用而形成的总的变动趋势,可能呈现向上发展、向下发展或水平发展的态势。

(2) 季节变动(S)

季节变动是指由于自然条件和社会条件的影响,客观现象在一年内随着季节的变化而发生的有规律的周期性变动。

(3) 循环变动(C)

循环变动是指客观现象以若干年为周期所呈现出的波浪起伏形态的有规律变动。 (4) 不规则变动(I)

不规则变动是一种无规律可循的变动,它又分为严格的随机变动和偶发性变动。

时间数列的组合模型: 加法模型:Y=T+S+C+I 乘法模型:Y=T·S·C·T 2.长期趋势的测定 (1) 移动平均法

移动平均法通过平均每一个连续数列值来修匀时间数列,是平滑法的一种。具体做法是对时间数列的各项数值,按照一定时距(项数) 进行逐期移动,计算出一系列序时平均数,形成一个派生的平均数时间数列。在新的数列中,可以大大削弱不规则变动,特别是周期性变动,显示出数列的长期趋势。

移动平均法的步骤:

① 确定移动时距。一般选择奇数项进行移动平均,若原数列呈周期变动,应选择现象的变动周期作为移动的时距长度。

② 计算各项移动平均值,并将其编制成时间数列。 (2) 趋势线拟合法

通过数学方法对时间数列配合一条理想的趋势线,使其与原数列曲线达到最优拟合,即要求原数列各期发展水平与各趋势值的离差平方和最小,从而较好地反映现象发展的长期趋势。

直线趋势方程:

曲线趋势方程:

趋势线拟合法的基本程序:定性分析→判断趋势类型→计算待定参数→利用方程预测

对于直线趋势方程

,用最小平方法求解参数a、b,有

第10章 统计指数分析 10.1 指数的概念和种类 1. 指数的概念和性质

广义上的指数是指反映社会经济现象总体数量变动的相对数,狭义的指数是反映复杂社会经济现象总体数量综合变动的相对数,其中所谓复杂社会经济现象总体是指那些由于各个部分的不同性质而在研究其数量特征时不能直接进行加总或对比的总体。指数具有相对性、综合性和平均性的特点。

2. 指数的分类

(1) 按照反映的对象范围不同,分为个体指数和总指数。个体指数反映由单一要素构成的简单现象总体的数量变动状况,总指数反映的是由多种要素构成的复杂现象总体的数量的综合变动情况。

(2) 按反映指标的性质不同,分为数量指标指数和质量指标指数。 (3) 按指数数列的基期不同,分为定基指数和环比指数。

(4) 按总指数的计算方法或表现形式不同,分为综合指数和平均指数。 10.2 综合指数 1. 综合指数的基本形式

综合指数是两个总量指标对比形成的指数,在总量指标中包含两个或两个以上的因素,将其中被研究因素以外的所有因素固定下来,仅观察被研究因素的变动情况,其特点是先综合后对比。

(1) 拉氏指数,数量指标指数和质量指标指数均采用基期的同度量因素。

拉氏价格指数

拉氏物量指数

(2) 帕氏指数,数量指标指数和质量指标指数均采用报告期的同度量因素。

帕氏价格指数

帕氏物量指数

(3) 马-艾公式(折衷公式) 。

(4) 费氏公式(理想公式) ,对拉氏指数和帕氏指数求几何平均数。

价格指数

物量指数

2.综合指数的一般编制原则和方法 ① 基本编制原理

首先根据客观现象间的内在联系,引入同度量因素,把不能直接相加的指标转化为可以加总的价值形态总量指标;其次,将同度量因素固定,以消除同度量因素变动的影响;最后,将两个时期的总量指标对比,以测定指数化指标的数量变动程度。

② 编制方法

a.数量指标综合指数的编制

编制数量指标综合指数的一般原则是采用基期的质量指标作为同度量因素,即:编制数量指标指数应以质量指标作为同度量因素,且需要将同度量因素固定在基期。计算公式如下:

b.质量指标综合指数的编制

编制质量指标综合指数的一般原则是采用报告期的数量指标作为同度量因素,即:编制质量指标指数应以数量指标作为同度量因素,且需要将同度量因素固定在报告期。计算公式如下:

3. 两种综合指数简介

① 不变价格指数,采用不变价格作为同度量因素计算产量综合指数。

② 成本计划完成指数,采用计划产量作为同度量因素计算产量综合指数。

10.3 平均指数 1.平均指数的概念

平均指数是个体指数的加权平均数,分为综合指数变形权数平均指数与固定权数平均指数。 2. 平均指数与综合指数的联系与区别 联系:在一定权数条件下,具有变形关系。

加权算术 平均指数公式 加权调和 平均指数公式 综合指数指数名称 公式 数量指标 总指数

质量指标 总指数

区别:

① 解决复杂总体不能直接同度量问题的思想不同。综合指数先计算总体的总量,然后进行对比,即先综合后对比;平均指数则是在个体指数的基础上计算总指数,即先对比后综合。

② 运用资料的条件不同。综合指数需要被研究总体的全面资料,而平均指数则既适用于全面资料,也适用于非全面资料。

③ 在经济分析中的具体作用不同。综合指数可同时进行相对分析与绝对分析,而平均指数除作为综合指数变形加以应用的情况外,一般只能进行相对分析。

3.平均指数的编制

(1) 综合指数变形权数的平均指数 ①加权算术平均指数

② 加权调和平均数

(2) 固定权数的平均指数

10.4 指数体系及因素分析法 1.指数体系的概念及基本形式

指数体系是由若干个经济上具有一定联系的指数所构成的一个整体,狭义的指数体系是指不仅经济上具有一定联系,而且数量上具有对等关系的三个或三个以上的指数所构成的一个整体。

指数体系的基本形式:

(1) 相对数形式,对象指数等于各个因素指数的连乘积。

(2) 绝对数形式,对象指数的增减额等于各因素指数影响的增减额之和。

2.指数体系的作用

(1) 利用指数体系可进行指数之间的相互推算; (2) 对单个综合指数的编制具有指导意义; (3) 利用指数体系可进行因素分析。 3.指数因素分析法的种类及应用 分类:

(1) 按分析现象的特点不同分为简单现象因素分析和复杂现象因素分析;

(2) 按分析指标的表现形式不同分为总量指标变动因素分析、相对指标变动因素分析、平均指标变动因素分析;

(3) 按影响因素的多少分为两因素分析和多因素分析。 应用:

(1) 总量指标变动的因素分析

① 简单现象总体因素分析,即对象指标直接表现为因素指标的乘积。其特点是相对数分析可以不引入同度量因素,但绝对数分析必须引入同度量因素。

② 复杂现象总体因素分析,即对象指标表现为因素指标乘积的和。应注意:各因素指标的性质具有相对性,需在两两比较的情况下判定;各因素指标应按照先数量指标后质量指标的顺序排列,两两相乘要有经济意义;测定其中某个因素的作用时,要将其余所有因素按综合指数的一般编制原则固定。

(2) 平均指标变动的两因素分析 1.平均指标变动因素分析的定义

利用指数因素分析法,从数量上分析总体各部分水平与总体结构这两个因素变动对总体平均指标变动的影响。

2.平均指标变动因素分析的方法

即:总体平均水平同时受各组水平和各组结构两个因素的影响。

第11章 回归分析与相关分析 11.1 相关分析 1.相关关系的概念

现象之间的确定性依存关系称为函数关系,对于自变量的每一个给定值,因变量都有一个确定值与之相对应,并且这种关系可以用一个数学表达式反映出来。相关关系反映的是现象之间的不确定性依存关系,当给定自变量的一个值时,因变量有若干个随机值与之对应,表现出一定的波动性。

2.相关关系的种类

(1) 按变量的个数,可分为一元相关和多元相关。

(2) 按变量之间相互关系的表现形式,可分为线性相关和非线性相关。 (3) 根据变量之间相互关系的方向,可分为正相关和负相关。 3.相关关系的测定

(1) 定性分析,是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系做出判断。

(2) 定量分析,在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数与判定系数等方法,来判断现象之间相关的方向、形态及密切程度。

① 相关表:将现象之间的相互关系用表格形式来反映,包括简单相关表和分组相关表。 ② 相关图,又称散点图,用直角坐标系的x轴代表自变量,y轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况。

③ 相关系数,在直线相关的条件下,用以反映两变量间线性相关密切程度的统计指标,计算公式为:

r>0 为正相关,r < 0 为负相关; |r|=0 表示不存在线性关系; |r|=1 表示完全线性相关; 0<|r|<1表示存在不同程度线性相关:

|r| < 0.4 为低度线性相关; 0.4≤ |r| <0.7为显著性线性相关; 0.7≤|r| <1.0为高度显著性线性相关。

11.2 一元线性回归分析 1. 回归分析概述

回归分析指根据相关关系的数量表达式(回归方程式) 与给定的自变量x,揭示因变量y在数量上的平均变化和求得因变量的预测值的统计分析方法。

回归分析与相关分析既有联系又有区别。 联系:

(1) 理论和方法具有一致性;

(2) 无相关就无回归,相关程度越高,回归越好; (3) 相关系数和回归系数方向一致,可以互相推算。 区别:

(1) 回归分析中必须区分自变量和因变量,而相关分析中两个变量是完全对等的; (2) 相关分析中x、y均为随机变量,回归分析中只有y为随机变量; (3) 相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。 2. 一元线性回归模型

其中截距a表示在没有自变量x的影响时,其他各种因素对因变量y的平均影响;回归系数b表明自变量x每变动一个单位,因变量y平均变动b个单位。

参数a、b的确定:最小平方法

基本数学要求:

分别对函数中a、b求偏导,并令其为零,有:

得到a,b的值为:

3.回归估计标准差

(1) 回归估计标准差是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实际值代表性的强弱;其值越小,回归方程的代表性越强,用回归方程估计或预测的结果越准确。

大样本条件下,可用如下公式计算:

(2) 离差平方和的分解

称为总离差平方和(SST) ,反映因变量Y的离散程度;

离差平方和(SSR) ,反映由于Y和X的线性依存关系所引起Y的变动部分;平方和(Q) ,反映其他因素对Y的影响部分。

(3) 判定系数

称为回归称为剩余

称为判定系数,用来衡量回归线对Y的总离差说明程度。判定系数的平方根即为相关系数。 4.线性相关的显著性检验

样本相关系数r的显著性检验(t检验) 的目的是检验总体两变量间线性相关性是否显著。其步骤为:

(1) 提出假设:

(2) 构造检验统计量:

; ;

(3) 根据给定的显著性水平(4) 确定原假设的拒绝规则:

,确定临界值

若,则接受

,表示总体两变量间线性相关性不显著;

若,则拒绝

,表示总体两变量间线性相关性显著。

(5) 计算检验统计量并做出决策。 5.回归估计与预测

估计的前提:回归方程经过检验,证明 X 和 Y 的关系在统计上是显著相关的。

(1) 点估计:对于给定的X值,求出Y平均值的一个估计值或Y的一个个别值的预测值。 (2) 区间估计:对于给定的X值,求出Y平均值的置信区间或Y的一个个别值的预测区间。

因篇幅问题不能全部显示,请点此查看更多更全内容

Top