1、 SPSS的几种基本运行方式:菜单操作方式, 程序运行方式, Include运行方式, Production Facility方式 P11
2、 SPSS的5个窗口:数据编辑窗口,结果管理窗口,结果编辑窗口,语法编辑窗口,脚本窗口。 结果管理窗口:也称为结果视图或者结果浏览器,用于存放SPSS软件的分析结果。整个窗口分为两个区:左边为目录区,是SPSS分析结果的目录;右边是内容区,显示与目录对应的内容。 3、 数据管理的特点:SPSS数据编辑器的每一行数据称为一个个案或记录,每一列数据代 表个体的属性。 P26
4、 SPSS数据编辑器的2个界面及特点:数据视图界面和变量视图界面. P28 数据视图界面的数据编辑区是数据的信息; 数据视图可执行工具栏的操作; 数据视图左边显示单元格和单元格所在列的变量名,右边显示单元格的内容。 变量视图的数据编辑区是变量的信息; 变量试图界面不含编辑区选择栏。 5、 变量视图的属性及其作用: P32 变量的名称:给出变量或者属性的名称。 变量类型:选择变量的显示方式.
a. 数值型.常见的尺度变量。默认的数值宽度为8,小数位为2
b. 逗号:整数部分用逗号分隔的数值。在整数部分,从个位算起,每三位数一个逗号,小数点仍然为“.” c. 点: 整数部分用点分隔的数值。在整数部分,从个位算起,每三位数用一个点分隔.小数点为”,” d. 科学计数法:表示数值型数据
e. 日期:显示格式格式为 dd-mmm-yyyy;mm/dd/yyyy。 f. 美元:数据前有美元符号。可以选择具体数据的呈现方式
g. 设定货币:选用客户设定的货币格式 。 方法为【编辑】→【选项】→选择“货币标签” h. 字符串:由英文字母和数字组成,在输入数据时不应输入双引号
变量宽度:对字符型变量,决定能输入的字符串的长度 小数位的宽度:设定小数位的宽度
变量标签:对变量名含义的进一步解释说明 列:设定变量数据视图中列的宽度 对齐方式:列数据的对齐方式
变量宽度类型:设定变量度量标准,有度量、序号、名义三种选择 6、 SPSS的文件格式:扩展名为 .sav P36
7、 读入数据的3种类型及其方法: P38 P45 P51 读入Excel数据:【文件】→【打开】→【数据】→文件类型选Excel→双击 .xls 在SPSS读入Excel文件时,必须先关闭要读的Excel数据文件,否则读入时会报告错误。
读入文本数据: 【文件】→【打开】→文件类型选 .txt /.dat 单击【打开】→“文本导入向导”:数据浏览—设置变量排列方式和变量名—设定从何处开始导入个案和导入个案数—设定个案内变量的分隔方式—对变量名及数据进行调整—指定是否保存及其格式选择 读入数据库数据:【文件】→【打开数据库】→【新建查询】 8、SPSS数据文件合并的2种方式及如何选择: 添加个案:适用于两个文件具有相同的属性(变量)。变量顺序、变量名称、变量个数可以不同。是行的添加。
添加变量:适用于具有不同属性的两个文件。是列的添加。 9、数据的拆分:【数据】→【拆分文件】(→【分析】→【描述性系统】→【描述】) 看书 P61
10、5个标识符检查:(图请看书) P88 不完全的标识符:显示具有不完全标识符的个案 重复的标识符:显示具有重复标识符的个案
规则描述:对单变量规则进行总结,显示数据校验所应用的规则的情况 变量摘要:是对变量违反规则的总结 个案报告:是对个案违反规则情况的报告
11、中心趋势的4个描述及基本意思 P111 均值:即数据的算术平均数,是数据中心趋势的主要度量指标,也是最常用的中心位置度量,受极端值影响
中位数:是重要的中心位置度量,受极端值影响小
众数:是指在观测值中发生频数最高的数据值,反映观测值的集中趋势,不受极端值影响。 众数可能不存在,也可能有多个众数(单峰,双峰,多峰),可用于定量或定性数据
5%截尾均值:把观测值升序排序后,剔除掉最小的5%和最大的5%后的数据的算术均值。这样计算的均值就避免了极端值的影响。
12、离散趋势的5种描述及含义: P113 4-20
极差:又称全距,是观测值中最大值与最小值之差,反映了变量的变异范围或离散程度。 方差:是每个观测值与均值的差值平方和。比较相同对象,描述个体的变异大小
标准差:即方差开平方。比较相同对象,用来衡量观测值偏离平均数的大小,可以直接描述数据偏离均值的程度。
分位数:分位数又称百分位数,它是一种位置指标。
变异指标:是衡量观测值变异程度的另一个统计量。可比较不同的对象,当进行两个或多个资料变异程度的比较时,若测量尺度或数据量纲相差较大,则需变异系数剔除影响。 13、分布的形状-偏度和峰度 要求:会看图 P116 4-29
偏度:当偏度>0时,分布为正偏或右偏,布图形在右边拖尾,分布图有很长的右尾,尖峰偏左;当偏度<0,分布为负偏或左偏,即分布图形在左边拖尾,分布图有很长的左尾,峰尖偏右 ;当偏度为0,分布对称。绝对值越大,偏度越大 。
峰度:>3,分布为高峰度,即比正态分布的峰要陡峭;<3,分布为低峰度,即比正态分布的峰要平坦些; =0,分布为正态峰
14、定性数据的图形描述:条形图,饼图,帕累托图 要求:会看会读 P124 4-48
15、定量数据的图形描述:直方图,茎叶图,箱图 要求:会看会读及绘制 P129 4-52 16、假设检验的4步骤:确定适当的原假设和备择假设;选择检验统计量;计算检验统计量观测值发生的概率,即p值; 给定显著水平α,并作出决策,如果p<α,则拒绝原假设 P140 17、单样本T检验:检验某个变量的总体平均值和指定值之间是否存在着显著性差异。 【数据】→【拆分文件】→【分析】→【比较均值】→【单样本T检验】 P146 5-14 18、什么时候用独立样本T检验,什么时候用配对样本T检验 P152 P161 5-20 两独立样本T检验:是分析两个独立样本的均值是否有显著性差异。例如比较男性和女性的身高,教育从业者和金融从业者的起始工资等。 前提条件:独立性(两样本来自的总体相互独立);正态性(样本来自的两个总体应服从正态分布);方差齐性(待比较的两个样本的方差相同,相差不大对结果影响不大)。
配对样本T检验:比较同一个总体的两次不同的测量。例如医学研究中,比较药物的疗效。 前提条件:两样本事配对的(受试对象年龄、性别、体重等相同或相似);两样本的总体应服从正态分布。
常用方法:同一受试对象处理前后的数据;同一受试对象不同部位的数据;同一样本用两种方法测试的数据;配对的两个受试对象分别接受两种处理后的数据
19、单样本非参数检验有哪5种方法及方法直接的比较 P165 6-8 二项式检验、卡方检验、K-S检验、Wilcoxon符号检验、游程检验
20、 K-S检验是一种利用样本数据推断样本来自的总体是否与某一理论分布有显著性差异的非参数统计方法,是拟合优度检验的方法之一.它适用于探索连续型随机变量的分布。K-S检验可以检验四种理论分布:正态分布、均匀分布、泊松分布、指数分布。 P188 22、两个独立样本非参数检验的4种方法: 6-34
Mann-Whitney U(曼-惠特尼U检验)、 Kolmogorov-Smimov Z(K-S Z双样本检验) 、Moses extreme reactions(极端反应检验)、 Wald Wolfwitz Runs(W-W游程检验) 23、多个独立样本非参数检验的3种方法:
Median test、 Kruskal-Wallis、 Jonckheere-Terpstra 24、散点图简介、绘制方法及实现: P208 简介:相关散点图是观察两个变量之间关系的一种非常直观的方法。散点图以横纵轴分别表示两个不同变量,通过点的分布形状、分布模式和疏密程度来形象描述两个变量间的相关关系。SPSS的图标构建程序和旧统计图对话框都可以完成散点图的绘制。 绘制:散点图—旧对话框:【图形】→【旧对话框】→【散点/点状(S)】→变量坐标选择 用图表构建程序绘制散点图:【图形】→【图表构建程序(C)】
25、简单线性回归检验的统计量3种:t检验,F检验,拟合优度 P229 26、单因素的方差分析除一般的分析外还应该做的2个分析:方差齐性分析;多重比较 P257 27、多因素方差分析在哪里打开: 【分析】→【一般线性模型】→【单变量】 P265 28、用协方差的话需要满足的前提条件:协变量与因变量之间是否有线性关系;可以通过绘制散点图来直接查看二者之间关系的强弱; 控制因素与协变量之间是否有交互作用。P272
分析题 1.
表1 10个厂家的投入产出 单位:万元
厂家 投入 产出
1 20 30 2 40 60 3 20 40 4 30 60 5 10 30 6 10 40 7 20 40 8 20 50 9 20 30 10 30 70 2.利用住房状况问卷调查数据,推断家庭人均住房面积的平均值是否为20平方米。
人均住房面积的基本描述统计结果
One-Sample Statistics N Mean Std. Deviation 12.70106
人均住房面积检验结果 One-Sample Test Sig. 人均面积 3.
t 94.788 df 2992 (2-tailed) .000 Mean Difference 22.00596 Test Value = 0 95% Confidence Interval of the Difference Lower 21.5508 Upper 22.4612 Std. Error Mean .23216 人均面积 2993 22.0060
4.
5. 利用数据文件“住房状况调查.sav”,推断本市户口和外地户口的家庭收入人均值有无显著性差异。
Group Statistics 户口状况 人均面积 本市户口 外地户口 人均面积 Equal Equal variances variances assumed not assumed Levene's Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper -6.96057 -3.02080 -7.91396 -2.06742 65.469 .000 -4.968 2991 .000 -4.99069 1.00466 -3.369 175.278 .001 -4.99069 1.48119 N 2825 168 Mean 21.7258 26.7165 Std. Deviation 12.17539 18.96748 Std. Error Mean .22907 1.46337 6.
7.
Test of Homogeneity of Variances 培训考试得分 Levene Statistic 4.637
ANOVA 培训考试得分 Between Groups Within Groups Total Multiple Comparisons 培训考试得分 Bonferroni Mean (I) 销售(J) 销售培训组 培训组 培训1天 培训2天 培训3天 培训2天 培训1天 培训3天 培训3天 培训1天 培训2天 Difference (I-J) * df1 2 df2 57 Sig. .014 Sum of Squares 2525.691 5974.724 8500.415 df 2 57 59 Mean Square 1262.846 104.820 F 12.048 Sig. .000 95% Confidence Interval Std. Error 3.23759 3.23759 3.23759 3.23759 3.23759 3.23759 Sig. .009 .000 .009 .249 .000 .249 Lower Bound Upper Bound -17.9740 -23.6856 2.0018 -13.6977 7.7134 -2.2745 -2.0018 -7.7134 17.9740 2.2745 23.6856 13.6977 -9.98789 -15.69947 9.98789 -5.71158 15.69947 5.71158 ****. The mean difference is significant at the 0.05 level.
因篇幅问题不能全部显示,请点此查看更多更全内容