金融分析软件spss统计分析软件教案

SPSS统计分析软件 主讲教师:漆世雄 公开信箱: spss20060901@126.com 密码:111111 交作业:bxqsx@126.com 内容简介: 《金融分析软件》是一门以SPSS统计分析软件作为工具, 对金融统计中的一些数据、指标和实证问题进行数据处理和统 计分析的综合课程。前半部分介绍SPSS的基本操作与统计分析 方法,包括数据文件的建立与编辑、数据操作、描述性统计分 析、相关分析、方差分析、回归分析、均值检验等内容;后半 部分为实际应用,内容包括货币与银行统计分析、证券市场统 计分析、外汇市场与汇率统计分析、国际收支统计分析和商业 银行统计分析等。www.2325.cc_【官方首页】-澳门威尼斯人 第一章 SPSS简介 目前,在我国境内最流行的统计软件两个,一个 是SAS (Statistical Analysis system),统计分析系统, 另一个是SPSS (Statistics Package SocialScience), 社会科学统计软件包。这两个软件的功能都十分强大, 前者适用于比较专业的统计分析,它的统计处理操作 主要是通过编程来进行,因此需要掌握大量的编程语 句和语法规则,但它的灵活性和适用性较强;后者也 能够编写程序,但同时它提供了功能丰富的菜单,用 户只要调用这些功能菜单,就能完成大部分常用的统 计处理,非常方便。www.2325.cc_【官方首页】-澳门威尼斯人 第一章 SPSS简介 20世纪60年代末,美国斯坦福大学的三位研究生研 制开发了最早的统计分析软件SPSS,同时成立了SPSS 公司,并于1975年在芝加哥组建了SPSS总部。20世纪 80年代以前,SPSS统计软件主要应用于企事业单位。 1984年SPSS总部首先推出了世界第一个统计分析软件 微机版本SPSS/PC+,开创了SPSS微机系列产品的开发 方向,从而确立了个人用户市场第一的地位。www.2325.cc_【官方首页】-澳门威尼斯人同时 SPSS公司积极推行本土化策略,目前已推出9个语种版 本(目前还没有中文版本)。 第一章 SPSS简介 SPSS/PC+的推出,极大地扩充了它的应用范围, 使其能很快地应用于自然科学、技术科学、社会科学 的各个领域,世界上许多有影响的报刊杂志纷纷就 SPSS的自动统计绘图、数据的深入分析、使用方便、 功能齐全等方面给予了高度的评价与称赞。SPSS使用 Windows的窗口方式展示各种管理功能和分析数据的 方法,使用对话框展示出各种功能选择项,只要掌握 一定的Windows操作技能,再粗通一些统计分析原理, 就可以使用该软件为特定的科研工作服务。www.2325.cc_【官方首页】-澳门威尼斯人 第一章 SPSS简介 SPSS Windows是一个组合式软件包,它集数据整理、分析功能于一身。SPSS的基本功能包括数据管理、 统计分析、图表分析、输出管理等等。SPSS统计分析过 程包括描述性统计、均值比较、一般线性模型、相关分 析、回归分析、对数线性模型、聚类分析、数据简化、 生存分析、时间序列分析、多重响应等几大类,每类中 又分好几个统计过程,比如回归分析中又分线性回归分 析、曲线估计、Logistic回归、Probit回归、加权估计、 两阶段最小二乘法、非线性回归等多个统计过程,而且 每个过程中又允许用户选择不同的方法及参数。www.2325.cc_【官方首页】-澳门威尼斯人SPSS也 有专门的绘图系统,可以根据数据绘制各种图形。www.2325.cc_【官方首页】-澳门威尼斯人 第一章 SPSS简介 SPSS Windows的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL及DBF数据文件,现已推 广到多种各种操作系统的计算机上,它和SAS、BMDP 并称为国际上最有影响的三大统计软件。www.2325.cc_【官方首页】-澳门威尼斯人和国际上几 种流行的统计分析软件比较,它的优越性更加突出。 在众多用户对国际常用统计软件SAS、BMDP、GLIM、 GENSTAT、EPILOG、MiniTab的总体印象分中,其诸 项功能均获得最高分。在国际学术界有条不成文的规 定,即在国际学术交流中,凡是用SPSS软件完成的计 算和统计分析,可以不必说明算法,由此可见其影响 之大和信誉之高。 第一章 SPSS简介 但是SPSS很难与一般办公软件如Office或是WPS2000 直接兼容,在撰写调查报告时往往要用电子表格软件 及专业制图软件来重新绘制相关图表,已经遭到诸多 统计学人士的批评;而且SPSS作为三大综合性统计软 件之一,其统计分析功能与另外两个软件即SAS和 BMDP相比仍有一定欠缺。 虽然如此,SPSS Windows由于其操作简单,已经在我国的社会科学、自然科学的各个领域发挥了巨 大作用。该软件还可以应用于经济学、生物学、心理 学、医疗卫生、体育、农业、林业、商业、金融等各 个领域。 第一章 SPSS简介 随着计算机系统软件的发展, SPSS的版本也在不断升级换 代,除了适应新的系统软件、不断增加新的统计方法和新的函 数以外,它的操作界面也在不断地改进,使得操作起来更加方 便。其中操作界面的最大一次改变,是出现在SPSS8.0到 SPSS10.0之间的变化,它第一次单独开辟一个窗口用于变量的 设置,从而使得变量的设置更加方便和直观。目前最新的版本 SPSS13.0版,其操作窗口相对于10.0、11.0和12.0版来说, 有了比较多的变化,其中最主要的变化是:1、它支持长变量名 (8个以上的英文字符);2、增加了许多新的统计方法;3、 它所包括的函数大大增加了,并且对函数做了归类。 第一章 SPSS简介 从易学、易用性来说,SPSS具有明显的优越性,它 更适用于非统计专业的人员使用,只要是初步掌握了一 些统计知识的人,都很容易上手。相比之下,SPSS在我 国的应用和普及程度要比SAS更广泛一些。 归纳起来,SPSS统计软件具有以下一些特点: (1)在SPSS中普遍使用Windows的窗口方式来管理 程序运行的全过程,通过对话框来实现各种命令参数的 设定,只要掌握了Windows的操作方法,又粗通一些统 计分析原理,就可以应用该软件得到具有专业水准的统 计分析结果。 第一章 SPSS简介 (2)SPSS具有强大的数据库互接功能,在其它数据 库软件中建立的数据库文件可以非常方便地导入到SPSS 中,包括dBASE、Excel、Foxpro、VF、MS access、text 等数据文件,利用SPSS进行统计处理。 (3)SPSS具有强大的图表功能,使用该软件不但 可以得到数字式的分析结果,还可以得到各种统计报表 和形象直观的统计图形。 第一章 SPSS简介 教材和参考书的选择: 在教学中的一些主要例题、数据文 件和练习题都是采用中国水利水电出 版社的是《SPSS实用统计分析》(郝 黎仁编著,SPSS 11.0),我们希望每 人都能拥有一本并把它作为一本工具 书来对待。在教学中另有一部分例题 和理论解释来自于《应用数理统计》 (中央广电出版社),并且采用excel 作为统计公式的计算、解释和验证, 对excel有关操作可参考任何一本关于 excel使用方法的书籍。 第一章 SPSS简介 马春庭主编:《掌握和 精通SPSS10.0》,中国机 械出版社出版。该书在介绍 SPSS的基本操作方法上, 具有直观、容易掌握的特点, 缺点是,没有对输出结果作 出必要的解释。有兴趣的同 学可以将这本书作为参考书。 第一章 SPSS简介 苏金明编著《统计软件 SPSS12.0 Windows应用及开发指南》,电子工业出版社。 对于本课程特别感兴趣、希望 能够继续深入学习的、将来有 志于从事这项工作的同学,我 们推荐这本书。该书有一部分 “二次开发”的内容介绍,适 合于高层次的专业人员的学习。 第二章 认识SPSS系统 SPSS程序主界面SPSS程序主界面和我们熟悉的Excel界面很相似,整个屏幕主 要是由一幅二维平面表格构成。 屏幕的第一行为标题拦。它显示目前数据文件的文件名。当 没有数据文件存在时,系统将指定一个默认的文件名:Untitled 屏幕的第二行为程序主菜单,它包括以下10个菜单项:(1)File 文件操作 (2)Edit 文件编辑 (3)View 视图 (4)Data 数据文件建立与编辑 第二章 认识SPSS系统 (5)Transform 数据转换 (6)Analyze 统计分析 (7)Graphs 统计图表的建立与编辑 (8)Utilities 实用程序 (9)Windows 窗口控制 (10)Help 帮助 屏幕的第三行为图标按扭,用来执行功能菜单中的常规任务。 第二章 认识SPSS系统 屏幕中间的主体部分(表格区)为数据编辑区,它有两个选 项卡:Data View 和Variable View,在“Data View”中可以进行数 据录入、或打开一个已经存在的数据库文件,在“Variable View” 中可以定义数据的类型。 数据录入数据录入的过程分为两个步骤:第一步,根据原始数据定义 每个变量的数据类型,如姓名、性别为字符型变量;身高、体重 为数值型变量,出生年月为日期型变量等等。第二步,将每个具 体的变量值录入相应的单元格内。 第二章 认识SPSS系统 定义变量的数据类型1、在启动SPSS后的主界面中,单击“Variable View”选项卡, 此时出现的界面与主界面相似; 2、在“Variable View” 选项卡的数据表格中定义变量的属性: Name 变量名 Type 变量的数据类型 Width 变量的字符宽度 Decimals 数值型变量的小数位数 Label 变量名标签 第二章 认识SPSS系统 Value 变量值标签 Missing 缺失值 Columns 列宽度 Align 对齐方式 Measure 测度标准 录入数据单击“Data View”选项卡,回到数据视图,选中将要录入数 据的单元格,将各变量值一一录入。 练习:将以下数据录入,并取名“学生”保存。 第二章 认识SPSS系统 学号 姓名 性别 年龄 身高 体重 13156.0 47.5 13155.0 37.8 13144.6 38.6 13161.5 41.6 13161.3 43.3 13158.0 47.3 13161.0 47.1 13162.0 47.0 13164.3 33.8 第二章 认识SPSS系统 简单统计分析利用我们录入的数据库文件“学生”,作一个简单的描述性 统计分析。步骤: 1、打开数据库文件“研究生”; 2、打开Analyze菜单项,选择Descriptive Statistics,单击 “Descriptives”,此时将出现一个对话框; 3、在左边的矩形框中选择想要作统计分析的变量送入右边的矩形 框内,如:选择“身高”送入右边的矩形框中; 4、单击“OK”按扭,系统随即开始按默认的选项进行统计分析, 并输出分析结果。 第二章 认识SPSS系统 在输出窗口中,将会看到以下表格: Descriptive Statistics MinimumMaximum Mean Std. Deviatio 成绩 20 75 92 84.9 5.241 Valid 20其中: Valid 有效数据的个数 Minimum 最小成绩 Maximum 最大成绩 Mean 平均成绩 Std.Deviation成绩的标准差 第二章 认识SPSS系统 其中: stdev第三章 创建数据文件 3、1变量 在SPSS中的变量与数学中变量的定义相同,可以取多种不同 值的量称为变量。在主界面表格中,每一个列都存放着同一个变 量的各种不同取值,每个列的顶端是变量的名称(系统默认的变 量名为var00001、var00002等)。 每个变量都有自己的属性,在定义变量时必须同时定义变量的属 性(Variable Type)。变量的属性有:变量名、变量的数据类型、 变量的字符宽度、数值型变量的小数位数、变量名标签等等。 第三章 创建数据文件 3、1、1变量名(Name) 在为变量命名时,直接在Name栏中键入变量名称即可,但要注 意以下几点: (1)变量名不能多于8个英文字符或四个中文字符; (2)第一个字符必须是字母或汉字,其后可以是数字或其它 字符(&、?、!、+、- 这些字符除外)。不能以下划线“_”和小数点“. ”作为最后一个字符。 第三章 创建数据文件 (3)变量名不能采用SPSS的保留字。这些保留字有:ALL、 AND、BY、EQ、GE、GT、LE、LT、NT、NOT、OR、TO、 (4)变量名中的英文字符不区分大小写(无论输入大小写,系统均按小写显示)。如ABC与abc被认为是同一个变量。 变量类型(Type)定义变量类型是指每个变量的数据类型。SPSS的变量有三 种类型:数值型(Numeric)、字符型(String)和日期型(Date)。 第三章 创建数据文件 1、数值型变量 数值型变量按不同要求又细分为五种: (1)标准数值型(Numeric):默认总长度8位(可修改),默认小 数位数2位(可修改)。 输入 1234 123456789 1.2E4 1.2E13 显示为 1234.00 1.23E+08 12000.00 1.20E+13 (2)带逗点的数值型变量(Comma):默认总长度8位(可修改), 默认小数位数2位(可修改)。显示时整数部分自右向左每隔三位 用一个逗点作分隔符。 第三章 创建数据文件 (3)带圆点的数值型变量(Dot):默认总长度8位(可修改),默认 小数位数2位(可修改)。显示时整数部分自右向左每隔三位用一 个圆点作分隔符,而用逗点代替通常的小数点符号。(此时键盘上 的小数点输入将会失效) (4)科学计数法(Scientific Notation):对于数值很大或很小的变量 可采用科学计数法,如1.23E+10或1.23E-10,其中的“E”可以用“D” 代替,也可以略去不写,如1.23D+10或1.23+10。 (5)带美元符号的数值型变量(Dollar):默认总长度8位,默认小数 位数2位。 如果用户认为以上五种数值类型仍不能满足要求,还可以自己 定义数值类型: 第三章 创建数据文件 (6)用户自定义类型(Custom Currency) 在SPSS中用户可以创建自己的数据类型。用户自定义的数 据类型最多不超过五种,这五种自定义数据类型分别被命名为 CCA、CCB、CCC、CCD和CCE。用户不能对这些命名进行修 例:将CCA定义为“¥****.**元”的数据类型。操作过程: 单击Edit Option,在单击Currency选项卡;在“Custom Output Formats”选项栏中选中“CCA”; 在“All Values”选项栏中,在“Prefix”后输入“¥”,在 “Suffix”后输入“元”; 第三章 创建数据文件 完成后,单击“确定”。 在“Decimal Separator”选项栏中,可选择小数点符号,Period 表示圆点(系统默认),Comma表示逗点。 2、日期型变量(Date) 日期型变量用来表示日期和时间,用户可以根据具体数据和 要求在列表框中选择一种格式。 在通常情况下,日期型变量不能直接参与运算,必须使用有 关函数将其转变为数值型变量后才能进行运算。例如: (mm/dd/yyyy) CTIME.DAYS(10/15/1582)=1 CTIME.DAYS(10/15/1583)=366 第三章 创建数据文件 例:对以下商业票据,计算票据天数、贴现天数和贴现金额:( 当天日期是09/12/2006)(贴现利率为6%=0.06) 票据 票据金额 开票日期 到期日期 当天日期 500012/11/2005 12/11/2006 800005/18/2006 11/18/2006 1000006/28/2006 09/28/2006 票据天数 贴现天数 贴现利息 贴现金额 第三章 创建数据文件 3、字符型变量(String) 默认总长度:8 字符型变量的值是一串字符,它所包含的字符最多不能超过 变量的总长度。用户可以定义两种字符型变量: 短字符变量:由8个以下字符组成(或4个汉字); 长字符变量:由8个以上字符组成。长字符变量在使用时会受到较 多的限制,建议尽量不要使用。 变量名标签(Label)为变量名设置标签,是为了进一步对变量名作出解释性的说 明。由于变量名受字符数的限制,有时不能充分表达其含义。通 过对变量名设置标签,可以输入一段解释性的文字,以进一步说 明变量的含义。用于变量名标签的字符数(英文字母)可多达255 第三章创建数据文件 例如,在Variable View窗口中,变量名“id”的标签是“编号”; “name ”的标签是“姓名”;“sex”的标签是“性别”等等,这在 SPSS的早期版本(如6.0版)中很有用,因为当时的版本变量名不 能使用汉字。 给变量名设置标签后,在Data View窗口中,当光标停留在 “sex”上时,会自动显示出该变量标签的内容“性别”。 练习:给数据文件“学生”的变量名建立标签。 变量值标签(Values)通过对变量值设置标签,可以对变量的每一个取值作进一步的附 加说明。虽然可以对任何变量设置值标签, 第三章 创建数据文件 但我们只需要对那些分类变量设置值标签。分类变量又称为分组 变量,可以利用它把全部的观测值分成不同的组(在Data View窗 口中,每一个行称为一个观测值,或称一个记录)。 练习:对于数据文件“学生”中变量“性别”,值“1”定义标签 为“男性”;值“2”定义标签为“女性”,然后按性别分组,进 行描述性统计分析,观察在输出窗口中有什么不同? 缺失值(Missing)在实际工作中可能会由于某种原因使记录的数据失真:如没有记 录到或记录错误。例如在对一个少年测量身高、体重时,测量了 身高体重,却没有填写年龄。但这个记录的其它数据还可以使用。 对于这个记录来说,年龄就成为缺失值。 第三章 创建数据文件 另一个少年记录中的身高为2.58米,显然是失真的,不能使用。该 项记录的身高也应作为缺失值处理。通过定义缺失值,可以对这 些非法数值加以限制,以便在数据分析时将它们排除。 定义缺失值的方法: 打开Missing Values对话框,可以看到有三个选项: missingvalues 无缺失值,这是系统默认的状态。 Discrete missing values 离散型缺失值,选择此项,可以在下面的 矩形框中输入三个确定的、可能在变量中出现的值作为缺失值。 也可以少于三个,但不能多于三个。 第三章 创建数据文件 Range plus one optional discrete miss 指定一个缺失值的数据范围, 另外还可以再指定一个该范围以外、单独一个确定的缺失值。 练习:在数据文件“data”中,改变四个记录的身高为:1.30、1.90、 1.95、2.03,然后定义缺失值的范围:1.90~2.03和1.30,作描述性 统计分析,观察输出结果。 列宽度(Columns)该选项可以为变量值显示时占用的宽度指定一个列数。指定 列宽度后,只影响数据在编辑窗口中的显示效果,并不影响变量 的总宽度和变量值的精确度。 第三章 创建数据文件 练习:改变数据文件“data”中“身高”的列宽度,观察 显示效果。 对齐方式(Align)Align的设定只是影响数据在编辑窗口中的显示效果, 有三种选择:中间对齐Center、左边对齐Left、右边对齐 Right。对于数值型变量,系统默认状态是右边对齐;对 于字符型变量,系统默认状态是左边对齐。 练习:改变数据文件“data”中“身高”的对齐方式,观 察显示效果。 第三章 创建数据文件 总体、个体、特征与数据1、总体 总体就是所研究对象的全体,称为总体(或母体) 2、个体组成总体的元素,称为个体。 3、指标或变量 表征个体特征(信息)的量,称为指标或变量。 第三章 创建数据文件 4、指标值(变量值)或数据(Data) 在研究一个总体时,所要研究的每个特征(指标或变量),在每 个个体上,都有一个反映该特征的具体描述(可以是数字,也可以 是文字),这些特征的具体描述被称为指标值(变量值)或数据。 获得数据的调查方法与问卷设计获得数据的方法,可以分为两大类:一是观察(调查)方法,二 是实验方法。其中观察(调查)方法,又可以分成两大类:一是普 查方法,二是抽样调查方法。本节仅讨论获得数据的调查方法。 第三章 创建数据文件 概念与基本方法(1)普查 普查是针对有限总体而言的。普查,就是收集有限总体中每 个个体的有关指标的指标值(或变量值)。 (2)部分调查与样本 部分调查是在总体中选择一部分个体进行调查,从所了解的局 部数据来了解总体情况。总体中,部分个体所组成的集合称为样 本集合。 部分调查又称为抽样调查。抽样调查,有两层含义:一是抽样 (抽取部分个体);二是调查(调查那些反映在个体上的、所要 研究的特征的数据)。调查样本个体(抽样所得到的个体)所得到 的数据,称为样本数据。 第三章 创建数据文件 (3)抽样方法 从总体中抽取个体的方法,可以分为两大类,一是非随机抽样; 二是随机抽样。 A、非随机抽样或判断性抽样 B、随机抽样或概率抽样 C、简单随机抽样 2、数据调查中的若干重要问题 A、问卷问题的产生 B、问卷问题设立的关键:能够获得诚实的回答 第三章 创建数据文件 凡是不能获得诚实回答的问题,都不应当设置在问卷中。 对“怀疑得不到诚实回答”的问题,应当在不同位置,设置相同、 相近、相反的问题,以求相互验证。 C、问卷问题写法的几个关键 对单选问题:备选答案应当是一个空间的完整划分 对单选问题:备选答案不应当是两个空间(层面)的混淆 但对于多选题,备选答案可以交叉,也可以处于不同层面 无论对多选题还是单选题(特别是对单选题),任何一个备选答案 都不能有多重含义 第三章 创建数据文件 无论对多选题还是单选题(特别是对单选题),备选答案之间不能 有包含关系 问题设计的用词要准确 问题设计的用语要含义明确 样本数据结构的基木特征:频次(频数)与频率如果样本数据集合中的数据总个数是n个,那么,某个样本值 出现的频率,就由下式计算: 某样本值的频率=该样本值出现的频次 第三章创建数据文件 观察样本数据基本特征(频次与频率)的图形方法1、表示频次与频率的饼图 绘制饼图要求不同的样本值的个数(指不重复的样本值的个数) 不能很多。否则,难以在有限的纸张上,把不同样本值的频次和 频率表示清楚。 2、表示频次与频率的条形图 表示频次和频率的条形图的构成是: (1)横坐标表示样本数据的不同取值。 (2)纵坐标表示相应的样本值出现的频次或频率。 第三章 创建数据文件 数据的编辑在SPSS中,对数据的编辑主要是通过“Data”和 “Edit”两个主菜单的功能来实现的,这两个主菜单的功 能叙述如下: (1)Data主菜单 Define Dates 自动生成时间系列周期 Insert Variable 插入一个变量(插入一个列) Insert Case 插入一个观测量(插入一个行) Go Case定位到指定的观测量 第三章 创建数据文件 Sort Case 按照某个变量的值对观测量进行排序(如按身 高排序、按体重排序等); Transpose 将数据文件转置(数据文件的行与列相互交换) Merge file 合并数据文件(将在以后介绍); Aggregate 对数据作分类汇总(例如按年龄分类,求身高 的均值;按性别分类,求体重的均值等等); Select Case 选择观测量(如设定条件选择、设定范围选 择等等); Weight Case 对观测量做加权处理。 第三章 创建数据文件 例:以下数据资料是某化工批发站两个年度销售的主要产品的数量 和价格,要求计算拉斯贝尔产量指数、派许价格指数和总销售额指 产品名称单位 基期产量 基期价格 报告期产量 报告期价格 硫酸 3500.000.6430 3850.00 0.6400 硝酸 300.800.4000 400.00 0.4115 盐酸 1265.500.3654 1500.00 0.3500 纯碱 1156.430.1154 1208.00 0.1170 烧碱 300.000.1085 450.00 0.1200 拉斯贝尔产量指数: 派许价格指数: 练习:对数据文件“cars.sav”中的变量 “horse”随机选择其中20个观测量,将 着20个观测量删除,使其成为缺失值。 第三章 创建数据文件 例:对以下分配数列计算工人平均日产量(件/人)。 工人按日产量(件)分组(x) 工人人数(f) 20 2412 25 10 26 合计:50 第三章 创建数据文件 例:对于以下数据资料,试计算ABC银行年利率的平均发展速度: 年利率发展速度(%)x 年数 11010 115 合计:25 解:年利率发展速度 25 103105 108 110 115 108.6456% 第三章创建数据文件 以上算式如果先取对数,则相对容易: lg(lg103 lg10810 lg110 lg115)25 2.036012 2.03601210 108.6456% 第三章创建数据文件 例:对于以下数据资料,计算1981~1997年的环比发展速度和环 比增长速度: 年份 1980 1981 1982 1983 1984 1985 1986 发电量(亿度) 5.60 6.76 8.25 7.74 7.16 9.40 11.59 年份 1987 1988 1989 1990 1991 1992 1993 发电量(亿度)13.84 15.24 16.68 16.68 19.56 20.31 22.34 年份 1994 1995 1996 1997 发电量(亿度)25.66 28.20 30.06 30.93 第三章 创建数据文件 例:将一枚骰子重复掷了10次,求“6点”出现0次、1次、2 次、……、10的概率。 “6点”出现0次的概率:“6点”出现1次的概率: 其中: 1615 第三章创建数据文件 “6点”出现2次的概率: “6点”出现3、4、5、6、7、8、9次的概率,省略。 “6点”出现10次的概率: 类似于这种形式的分布,在概率论中称为“二项分布”。 2907 380000000165 1010 10 10 10 第三章创建数据文件 以上的计算在SPSS中可使用函数PDF.BINOM( )计算二项分布的 概率值。 例如: PDF.BINOM(2,10,1/6)=0.29071 例:第三次全国人口普查登记的质量,经抽样检查表明质量相当 高,由于重报、漏报造成的人口数差错率仅为0.015%。若随机抽 取10000张普查登记表进行核实,求发现人口数差错为0、1、2、 3人的概率。要求分别采用二项分布和泊松分布计算,并比较它们 的差别。 解:二项分布: 第三章创建数据文件 泊松分布: 根据泊松定理,在二项分布中,当 很小而n很大时,可用泊松分布来近似计算相应的概率,此时 在本例中:p=0.00015,n=10000,所以 在SPSS中,可使用函数PDF.POISSON( )计算泊松分布的概率值。 第三章创建数据文件 例:某班共有学生20名,其中有5名女生。从班上随机抽选4名代 表,求这4人中,女生人数为0、1、2、3、4的概率。 解:用X表示抽到的4人中,女生的人数,则X可取0、1、2、3、4 这五个值。因为: 所以:P(X=0)=0.2817,P(X=1)=0.4696,P(X=2)=0.2167, P(X=3)=0.0310, P(X=0)=0.0010 类似于这种形式的分布,在概率论中称为“超几何分布”。 在SPSS中,用PDF.HYPER( )计算超几何分布的概率值。 例如: PDF.HYPER(3,20,4,5)=0.0310 第三章创建数据文件 例:某厂在生产管理中对工人完成某道工序的时间进行调查,发 现工人们完成该道工序的平均时间为10分钟,标准差为3分钟。假 定工人完成该道工序的时间服从正态分布,问 1、从该工序中任选一人,其完成该道工序的时间不到7分钟的概 率是多少? 2、为了保证生产连续进行,要求以95%的概率保证该道工序上的 工人完成工作的时间不多于15分钟,这一要求能否得到保证? 解:根据已知条件, 1、所求概率为: 0.1587或:=CDFNORM((7-10)/3)=0.1587 (左侧概率) 0.1587第三章 创建数据文件 2、工人完成工作的时间不多于15分钟的概率为: P(X<15)= Φ(15)= CDF.NORMAL(15 0.9522或:=CDFNORM((15-10)/3)=0.9522 说明该道工序可以0.9522的概率保证工人完成工作的时间不多 于15分钟。大于0.95。 例:某厂计划对占全厂5%的产量最高者发放一等奖;占全厂10% 的产量次高者发放二等奖;占全厂20%的产量较高者发放三等奖。 已知该厂工人平均日产量为3000件,标准差为40件。问发放一、 二、三等奖的产量标准应分别定在多少件? 解:因为 第三章创建数据文件 要给占全厂5%的产量最高者发放一等奖,就是要求x1值,使得 P(X>x1)=0.05,或者使得P(X大于;<= 小于等于;>= 大于等于;= 等于;~= 不等于。 逻辑运算符包括: 在SPSS中,用户可以使用的函数有10个类别共100多个函数。函数的表示方法是,在函数名后面的括号中添上一个或多个已知 参数,个参数之间用逗点隔开。如ABS(x)求x的绝对值,SQRT(x) 求x的平方根,MEAN(x1,x2,… xn)求x1,x2,xn的平均值等等。 这些函数我们将在需要的时候加以介绍。 第三章 创建数据文件 条件表达式if的运用: 通过条件表达式进行判断,可以有针对性地选择部 分观测量计算新变量的值,或者针对不同的观测量采用 不同的表达式计算新变量的值。 练习:在数据文件“成绩单”中,建立新变量“是否重 修”(字符型),然后挑出成绩低于60分的学生,标注 其值为“yes”。 第三章 创建数据文件 3、4从Excel电子表格中读入数据文件 利用SPSS的数据转换接口,可以从Excel电子表格中读入数据 文件,并转换为SPSS格式的数据文件,从而利用SPSS对数据文件 进行统计分析。 练习:将Excel格式的数据文件“复利系数表”读入SPSS数据编辑 窗口。 操作步骤: (1)在SPSS数据编辑窗口中,单击FileOpen,就会出现“Open File”目录框,找到文件所在位置,在“File type”下拉菜单中选择“Excel[*.xls]”; 第三章 创建数据文件 (2)单击“Open”,就会出现“Opening Excel Data Source”对话框: 选中“Read variable name from firstrow date”就会以Excel表格中的第一行数据作为SPSS数据表格中的变量名; 在“Worksheet”输入框中,可选择Sheet1、 Sheet2或 Sheet3; 在“Range”输入框中,可在一张表格中选择数据的范 (3)单击OK按扭。第四章 数据文件的操作及变换 对数据文件的操作可以通过主菜单Data的菜单项来 进行,它包括的操作功能如下: Define Dates 自动生成时间系列周期; Insert Variable插入一个变量(插入一个列);

页面底部区域 foot.htm