哑变量,是一个人为设定的变量,通常取值为0到N,以职业分类来说,0代表学生,1代表工人,2代表老师等等,哑变量就是通过这种取值方式,以此来反映某个变量的不同属性。 哑变量的设置......
2024-02-13 200 SPSS中设置逻辑回归的哑变量
哑变量,是一个人为设定的变量,通常取值为0到N,以职业分类来说,0代表学生,1代表工人,2代表老师等等,哑变量就是通过这种取值方式,以此来反映某个变量的不同属性。
哑变量的设置在各个回归模型中都非常重要与常见,今天我们就一起来学习下,如何在SPSS的逻辑回归模型中,设置哑变量。
一、哑变量参数解析
我们想要研究不同的种族之间对某种疾病的患病率是否有不同的差异,下面我们获取了三个不同的种族人群的身体健康数据,其中0表示其他种族;1代表美国黑人;2代表美国白人;3代表印第安人。
图1:演示数据
由于种族属于无序多分类变量,因此我们需要将种族转化为哑变量后,才能进行逻辑回归计算,点击【分析】--【回归】--【二元Logistic】。
图2:逻辑回归分析
我们先把逻辑回归的因变量和块填入相对应的内容,然后就可以点击“分类”按钮,为多分类的自变量“种族”设置哑变量。
图3:设置因变量和块
随后在分类协变量中填入“种族”项,参考类别根据自身数据进行填写,在本演示数据中,由于0表示其他种族,是参照组,因此参考类别我们选择“第一个”,如果参照组是最后一个,则参考类别就需要选择“最后一个”。
图4:参考类别
除参考类别外,我们还需要设置对比方法,可供选择的方法有7种,分别是“指示符”、“简单”、“差异”、“赫尔默特”、“重复”、“多项式”和“偏差”,它们的详细作用如下:
1、“指示符”和“简单”对比方法:用于将某一分类作为参照,其他各个分类分别与参照分类做对比。
2、“差异”对比方法:某个分类与其前面的分类平均值做比较;“赫尔默特”对比方法则是与其后面的分类平均值做比较,它们都常用于有序分类变量。
3、“重复”对比方法:即该分类变量的各个分类,均与前面相邻的一个分类比较,此时前一分类作为参照。
4、“多项式”对比方法:主要是分类类型不同,它只能用于数值型的分类变量。
5、“偏差”对比方法:除参照外,其余的每个分类都与总体水平做比较。
图5:对比方法
二、结论说明
由于本文的自变量种族是无序多分类,因此我们采用默认的“指示符”方法,点击确定后生成的逻辑回归结果如下图6。从结果中我们可以看到SPSS成功将种族转化为三个哑变量,分别是种族(1)、种族(2)和种族(3)。
图6:逻辑回归结果
经过上面的学习,我们就初步掌握了一种设置哑变量的方法,当然在SPSS中,还可以通过程序去生成更复杂场景中的哑变量。
标签: SPSS中设置逻辑回归的哑变量
相关文章
哑变量,是一个人为设定的变量,通常取值为0到N,以职业分类来说,0代表学生,1代表工人,2代表老师等等,哑变量就是通过这种取值方式,以此来反映某个变量的不同属性。 哑变量的设置......
2024-02-13 200 SPSS中设置逻辑回归的哑变量
灵活运用IBM SPSS Statistics做数据的统计和分析是每个数据分析师都应该掌握的技能,这款软件为用户提供了全面的数据分析方法,可以解决我们在数据分析过程中遇到的各种难题。 接下来小编就......
2023-11-17 203 SPSS相关性分析方法
我们制作完成某种文件之后,都会需要保存导出,比如大家经常使用的办公软件中的Word文档、Excel表格、PPT演示文档等,制作完成后都会保存导出备用。又比如打击使用PS,PR,剪映等软件制作......
2023-12-22 265 SPSS导出数据
相对危险度,又称为危险度比,是暴露组的危险度与对照组的危险度之比,相对危险度表明暴露组发病率或死亡率是对照组发病率或死亡率的多少倍,通过相对危险度,我们可以得知暴露指标与疾......
2024-02-13 201 SPSS利用交叉表计算疾病相对危险度
我们在进行数据分析的时候,并不是所有的数据都需要进行分析。这就要求我们要对数据进行按条件选择。本文我将用 IBM SPSS Statistics 演示如何进行按条件筛选数据。 1、打开数据 如图所示,......
2024-01-31 200 SPSS按条件选择数据