spss常用统计图绘制及编辑

发布于:2021-10-20 08:08:51

目录 第五章 常用统计图绘制及编辑 第一节 条形图的绘制 一, 条形图的概念 二, 条形图分类变量划分 三, 条形图特征值划分 第二节 线图 一, 线图分类变量划分 二, 线图特征值划分 三, 其他图形的绘制 第三节 统计图的编辑技巧 一, 图元素编辑 二, 图形编辑 三, 图模板的应用

1

第五章 常用统计图绘制及编辑 第五章
在统计分析中,统计图作为数据描述的重要方法之一,主要是通过点,线,条,面积等 的位置与大小的变化来表现或说明所研究问题的变化及其规律. 在数据分析的过程中, 数据 分析图与数据表格有时可同时产生,有时必须分开进行. 统计图具有简洁,直观,可读性强和易理解等特点,被分析者和信息使用者广泛使用, 因此, 数据分析人员在进行统计分析时, 掌握统计图的绘制与编辑是必不可少的数据分析技 能.在 spss 中,提供了用原始数据和表格中数据进行绘图的功能,数据图的种类也比较多, 可方便地供数据分析人员选用.

第一节 第一节 一,条形图的概念

条形图的绘制

1,条形图的含义 条形图(bar)用条的根数代表分类变量所分组的多少,或者选用变量的个数,用条的 高度反映各组分析指标值的大小,或者变量特征值的大小,各个条之间有间隔.它可以直观 揭示或比较频数变量的频数特征值, 分类变量在有关综述变量方面的特征值大小, 以此发现 重要组或类(group) . 2,分类轴(category axis) 条形图的横轴为分类轴,用来统计分类变量所分的组数.如果只有一个分类变量,这种 条形图称为简单条形图(simple bar),如果有两个分类变量,这种条形图称为复合条形图, 其中一个变量称为分组变量,另一个变量称为分层变量.根据分层变量绘图方式的不同,复 合条形图又分为分组分层条形图(clustered bar),分组分段条形图(stacked bars). 3,刻度轴(scale axis) 条形图的纵轴为刻度轴, 用来统计各个分组的特征值. 按照特征值描述的对象不同分为 以下三种类型: 一是组内特征值描述(summaries for groups of cases),即分类变量将统计个案分成 若干组,统计每个组的特征值,如统计各个组的频数,频率或其他能反映组特征变量在各个 组上的特征值,这类条形图简称为组特征值条形图或分组条形图. 二是*行变量特征值描述(summaries of separate variables),即选择若干个*行变 量(指性质相同,可放在一起进行比较的一组变量),对这些变量的特征值进行统计,这类 条形图简称为*行变量条形图,如被访者对 10 个产品分别打分,将 10 个产品的各自得分 可看作是 10 个*行变量. 三是个案值描述(values of individual cases),即直接描述数据库的原始数据而不再 进行统计计算,这类条形图简称为个案条形图.如果在数据分析的过程中,已经得到了分组 变量,*行变量的特征值,不必进行重新计算,可直接用数据作图.如用数据综述的方法得 到了*行变量的综述特征值表,用该表中的数据制图.该功能与 Excel 中的画图功能相似, 因此在分析时,可直接使用 Excel 工具绘图可能更方便.

二,条形图分类变量划分
条形图按照分类变量的选用情况分为简单条形图, 复合条形图两大类, 复合条形图按照 图形表达方法不同又分为分组分层条形图与分组分段条形图.三种图的区别如图 5-1(a) , 5-1(b) ,5-1(c)所示,从图中可以看出,简单条形图只选用了一个分组变量来分组,没 有进一步分层,各个条之间有间隔.分组分层条形图选用了一个分类变量(大类)和一个分
2

层变量(小类)来分组,属于同一组的条之间没间隔(小类不间隔),而不同组之间有间隔 (大类间隔).在分组分段条形图中,选用了一个分类变量和一个分层变量,条的个数为大 类标志所分组的个数, 而各层在每一条*此承蚍侄伪泶锍隼, 其分段长度代表了各个层的 指标值的大小,总长度代表了汇总值.
30.0 27.0

20.0 16.1 12.9 10.0 8.8 14.1 10.3 6.8 4.2 0.0

Percent

以 岁 g 1i6n ss Mi 下
年龄

图 5-1(a) 简单条形图
40.0

-2 16 0岁

-2 20 5岁

-3 26 0岁

-3 31 5岁

-4 36 0岁

以 岁 40 上

30.0

20.0

10.0

性别


Percent

0.0



以 岁 16 下
年龄

-2 16 0岁

图 5-1(b)分层条形图
70.0 60.0 50.0 40.0 30.0 20.0

-2 20 5岁

-3 26 0岁

-3 31 5岁

-4 36 0岁

以 岁 40 上
性别
男 女

Percent

10.0 0.0

岁 16 以 下
年龄

-2 16 0岁

图 5-1(c)分段条形图
3

-2 20 5岁

-3 26 0岁

-3 31 5岁

-4 36 0岁

岁 40 以 上

在 SPSS 中绘制条形图时, 需要对以上三种情况进行选择, 条形图选择窗口如图 5-2(a) 所示,各类图的绘制操作过程如下:

图 5-2(a)条形图选择窗口

图 5-2(b)条形图选择窗口

1,简单条形图(simple bar)的绘制 1)打开数据文件"服装市场调查数据库.sav" . 2)点击"graphs → bar" → 显示 bar charts 对话框,选择 simple bar,点击【define】 , 进入绘图参数输入窗口,如图 5-2(b). 3)在条图纵轴指标(bar represents)选项中选择频率选项(% of cases) ,在分类轴横轴 (category axis)中输入分类变量"q7" .如果不需要在图中显示缺失值统*峁,在 options 选项中去掉缺失值显示(display groups defined by missing values),其他均采用系统默认值. 4)确认【ok】 ,生成条图输出到"output"中,如图 5-1(a)所示,该图反映了分类变 量"q7"的各个组别出现的频率,即各年龄组的人数占总调查个案数的比例. 需要注意的是,条图的纵轴指标,也可以是综述变量的统计指标.在上述操作中,在选 择条图纵轴指标(bar represents)选项中选择计算综述值(other summary function) ,在 综述变量(variable)中输入变量"q6_1" ,统计指标选择均值(也可选择其他值,如汇总 值,方差等) ,在分类轴横轴(category axis)中输入分类变量"q7" ,这时生成的条图反映 的是各个年龄组别对某一品牌的评价情况. 2,分层条形图(clustered bar) 的绘制 1)打开数据文件"服装市场调查数据库.sav" . 2)点击"graphs → bar" → 显示 bar charts 对话框,选择 clustered bar,点击【define】 进入绘图参数输入窗口. 3)在条图纵轴指标(bar represents)选项中选择频率选项(% of cases) ,在分类轴横轴 (category axis)中输入分类变量"q7" ,在分层变量(define clusters by) 中输入分层变量 "q8" ,其他均采用系统默认值. 4)确认【ok】 ,生成条图输出到"output"中.如图 5-1(b)所示,该图的分类轴上, 包括了分类变量和分层变量共同的分组,分类情况直接标注在横轴上,分层情况则以图例 (legend)反映出来.该图反映了分类变量"q7"的各个组别中,不同性别的被访者出现的 频率. 与简单条形图相似,其纵轴指标,也可以是综述变量的统计指标.在上述操作中,在选 择条图纵轴指标(bar represents)选项中选择计算综述值(other summary function) ,并 输入综述变量即可.
4

3,分段条形图(stacked bars) 的绘制 1)打开数据文件"服装市场调查数据库.sav" . 2)点击"graphs → bar" → 显示 bar charts 对话框,选择 stacked bar,点击【define】 , 进入绘图参数输入窗口. 3)在条图纵轴指标(bar represents)选项中选择频率选项(% of cases) ,在分类轴横轴 (category axis)中输入分类变量"q7" ,在分段变量 define stacks by 中输入分层变量"q8" , 其他均采用系统默认值. 4)确认【ok】 ,生成条图输出到"output"中.如图 5-1(c)所示,该图的分类轴上, 只包括分类变量,分类情况直接标注在横轴上,分段情况标注在条上,并以图例(legend) 反映出来.该图反映了分类变量"q7"的各个组别中,不同性别的被访者出现的频率,与分 层条形图相比,较简洁. 与简单条形图相似,其纵轴指标,也可以是综述变量的统计指标.在上述操作中,在选 择条图纵轴指标(bar represents)选项中选择计算综述值(other summary function) ,并 输入综述变量即可.

三,条形图特征值划分
在绘制上面三种条形图时,图中的数据源选项(data in chart are)中,有三种选择, 如图 5-2(a)所示.不同选择,其条形图纵轴反映的指标值的含义不同,其绘制图形分别 称为组特征值条形图,*行变量条形图,个案值条形图,如图 5-3(a) ,5-3(b) ,5-3(c) 所示.从图中可以看出,图的外观没有太大的差别,其差别主要在于各种图的纵轴所揭示的 指标值不同.
30.0 27.0

20.0 16.1 12.9 10.0 8.8 14.1 10.3 6.8 4.2 0.0

Percent

以 岁 g 1i6n ss Mi 下
年龄

图5-3(a)分组变量的频数描述图
9.0

-2 16 0岁

-2 20 5岁

-3 26 0岁

-3 31 5岁

-4 36 0岁

以 岁 40 上

8.7 8.5

8.0

7.5

7.6 7.3

7.6 7.3

Mean

7.2 7.0

班 尼 路 意 满

图5-3(b)*行变量*均值描述图
5

真 维 斯 意 满 度

佐 丹 奴 意 满 度

堡 狮 龙 意 满 度

苹 果 满 度 意 度

U2 意 满 度

110.0

100.0

店 员 基 本 礼 貌

图5-3(c)个案值描述图 在数据分析的过程中,选用何种图,主要视分析的目标及数据库的情况而定,各类图的 绘制操作过程如下: 1,组特征值条形图(summaries for groups of cases)的绘制 1)打开数据文件"服装市场调查数据库.sav" . 2)点击 "graphs → bar" 显示 bar charts 对话框, , 选择 simple bar, 在数据源 (data in chart are) 选项中选择第一项 summaries for groups of cases,点击【define】 ,进入绘图参数输入 窗口. 3)在条图纵轴指标(bar represents)选项中选择频率选项(% of cases) ,在分类轴横轴 (category axis)中输入分类变量"q7" ,其他均采用系统默认值. 4)确认【ok】 ,生成条图输出到"output"中,如图 5-3(a)所示,该图反映了分类变 量"q7"的各个组别出现的频率,即各年龄组的人数占总调查个案数的比例. 2,*行变量特征值条形图(summaries for separate variables)的绘制 1)打开数据文件"服装市场调查数据库.sav" . 2)点击"graphs → bar" → 显示 bar charts 对话框,选择 simple bar,在数据源(data in chart are) 选项中选择第二项 summaries for separate variables,点击【define】 ,进入绘图 参数输入窗口. 3)在条图纵轴指标(bar represents)选项中输入*行变量"q6_1,q6_2,q6_3,q6_4, q6_5,q6_6" ,选择统计*均值,其他均采用系统默认值. 4)确认【ok】 ,生成条图输出到"output"中,如图 5-3(b)所示,该图反映 6 个品牌 满意度评价的对比. 3,个案值条形图(values of individual cases)的绘制. 1)打开数据文件"服务水*调查数据库.sav" . 2)点击"graphs → bar" → 显示 bar charts 对话框,选择 simple bar,在数据源(data in chart are) 选项中选择第三项 summaries for separate variables,点击【define】 ,进入绘图 参数输入窗口. 3)在条图纵轴指标(bar represents)选项中输入变量"q1" ,分类标签(category label) 系统默认为记录号(case number) ,也可以输入分类变量"store" ,其他均采用系统默认值. 4)确认【ok】 ,生成条图输出到"output"中,如图 5-3(c)所示,该图反映了变量"q1" 的 18 个个案值的大小对比.

Value
6

90.0

80.0

10

11

12

13

14

15

16

17

18

Cas e Num ber

1

2

3

4

5

6

7

8

9

根据以上的两种分类,在使用条形图工具时,可组合成 9 种不同的条形图绘制方法, 但常用的是横轴组别划分用简单的,分层的两种形式,纵轴数据描述用组特征值,*行变量 特征值两种形式,形成四种常用的条形图.在选择具体的制图方法时,主要根据分析的目标 进行灵活选择.另外有些条图在一些报表分析功能中,也可直接得到,而不必单独作图.

第二节 第二节

线图

线图 line 用点或折线将各个组别的指标值(或相关变量的成对指标值)连接起来,反映 各个组别的指标值的大小(或相关变量的变化趋势) ,以此发现重要组或重要的变化趋势. 线图和条图在原理上比较接*, 只是外观上有差别, 因此两种图形可以转换, 在分析过程中, 选用哪种图,与个人的*惯有关,如当分类轴的组别太多时,用条图就不好看,用线图表达 效果更好.此外,线图比条图应用范围更广,如果要反映两个连续变量之间的关系时,只能 用线图来表达.

一,线图分类变量划分
线图按照分类轴选用分组变量的情况分为单线图, 复合线图两大类, 复合线图按照图形 表达方法不同又分为多线图与垂线图,如图 5-4(a) ,5-4(b) ,5-4(c)所示. 从图中可以看出,单线图只选用了一个分组变量来分组,计算各个组别的特征值,并用 折线连接起来,只有一条线. 多线图选用了一个分组变量和一个分线变量来分组, 横轴为分组变量所分的组数, 纵轴 统计由分组变量和分线变量产生的各个组别的特征值, 并用折线将属于同一个分线变量的各 个数据连接起来,形成多线图,线的条数表示分线变量的分类个数. 垂线图选用了一个分组变量和一个分点变量来分组, 横轴为分组变量所分的组数, 每条 垂线上有若干点,与分点变量分类个数及其指标值大小对应.在垂线图中,用垂线将属于同 一大类的各个数据连接起来,形成垂线图. 垂线图与多线图计算原理是相同的, 只是数据的连接方式不同. 在比较由分线变量形成 的组的差别时,该图比较直观.在比较由分组变量形成的组的差别时,用垂线图比较直观.
40.0

30.0

20.0

10.0

Percent

0.0

岁 16
年龄

-2 16 0岁

-2 20

-3 26

-3 31

-4 36

岁 40

下 以

上 以

5岁

图 5-4(a) 单线图

0岁

5岁

0岁

7

40.0

30.0

20.0

性别
10.0

Percent

女 0.0 男

岁 16
年龄

-2 16 0岁

-2 20

-3 26

-3 31

-4 36

岁 40

下 以
40.0 30.0 20.0 10.0

上 以

5岁

图 5-4(b ) 多线图

0岁

5岁

0岁

性别

Percent

女 0.0 男

年龄

图 5-4(c) 垂线图 在 SPSS 中绘制线图时,需要对以上三种情况进行选择,线图选择窗口如图 5-5(a) 所示,各类图的绘制操作过程如下:

图 5-5(a)线图选择窗口
8

岁 16 以 下

-2 16 0岁

-2 20 5岁

图 5-5(b)线图选择窗口

-3 26 0岁

-3 31 5岁

-4 36 0岁

岁 40 以 上

1,单线图(simple)的绘制 1)打开数据文件"服装市场调查数据库.sav" . 2)点击"graphs → line" → 显示 line charts 对话框,选择 simple line,点击【define】 , 进入绘图参数输入窗口,如图 5-5(b)所示. 3)在线图纵轴指标(line represents)选项中选择频率选项(% of cases) ,在分类轴横轴 (category axis)中输入分类变量"q7" ,如果不需要在图中显示缺失值统*峁,在 options 选项中去掉缺失值显示(display groups defined by missing values),其他均采用系统默认值. 4)确认【ok】 ,生成线图输出到"output"中,如图 5-4(a)所示,该图反映了分类变 量"q7"的各个组别出现的频率,即各年龄组的人数占总调查个案数的比例. 需要说明的是,线图的纵轴指标,也可以是综述变量的统计指标.在上述操作中,在选 择线图纵轴指标(line represents)选项中选择计算综述值(other summary function) ,在 综述变量(variable)中输入变量"q6_1" ,统计指标选择均值(也可选择其他值,如汇总 值,方差等) ,在分类轴横轴(category axis)中输入分类变量"q7" ,这时生成的线图反映 的是各个年龄组别对某一品牌的评价情况. 2,多线图(multiple)的绘制 1)打开数据文件"服装市场调查数据库.sav" → 点击"graphs → line" → 显示 line charts 对话框,选择 multiple,点击【define】 ,进入绘图参数输入窗口. 2)在线图纵轴指标(line represents)选项中选择频率选项(% of cases) ,在分类轴横轴 (category axis)中输入分类变量"q7" ,在分线变量 define lines by 中输入分线变量"q8" , 其他均采用系统默认值. 3)确认【ok】 ,生成线图输出到"output"中.如图 5-4(b)所示,该图中,分类变量 的分组情况直接标注在横轴上,分线变量的分组情况则以图例(legend)反映出来,每条线 代表分线变量的一个分组.该图反映了分类变量"q7"的各个组别中,不同性别出现的频率 对比. 与单线图相似,其纵轴指标,也可以是综述变量的统计指标.在上述操作中,在选择线 图纵轴指标(bar represents)选项中选择计算综述值(other summary function) ,并输入 综述变量即可. 3,垂线图(drop-line)的绘制 1)打开数据文件"服装市场调查数据库.sav" . 2)点击"graphs → line" → 显示 line charts 对话框,选择 drop-line,点击【define】 , 进入绘图参数输入窗口. 3)在线图纵轴指标(line represents)选项中选择频率选项(% of cases) ,在分类轴横轴 (category axis)中输入分类变量"q7" ,在分线变量 define lines by 中输入分线变量"q8" , 其他均采用系统默认值. 4)确认【ok】 ,生成垂线图输出到"output"中.如图 5-4(c)所示,该图中,分类变 量的分组情况直接标注在横轴上,分点变量的分组情况则以图例(legend)反映出来,垂线 上的每个点代表分点变量的一个分组.该图反映了分类变量"q7"的各个组别中,不同性别 出现的频率对比. 与单线图相似,其纵轴指标,也可以是综述变量的统计指标.在上述操作中,在选择线 图纵轴指标(bar represents)选项中选择计算综述值(other summary function) ,并输入 综述变量即可.

二,线图特征值划分
在绘制上面三种线图时,图中数据源选项(data in chart are)中,有三种选择,不同
9

选择,其线图纵轴反映的指标值的含义不同. 第一种选择为 summaries for groups of cases, 该选项为默认值, 该图的纵轴描述的是, 按照一个频数变量或分类变量分组的各组特征值,简称为组特征值线图. 第二种选择为 summaries of separate variables,该图的纵轴描述的是,若干个*行变 量的特征值,简称为*行变量线图. 第三种选择为 values of individual cases, 该图纵轴直接使用原始数据库中的个案数值, 而不计算分组特征值或变量特征值,简称为个案线图. 如果在数据分析的过程中,已经得到了分组变量,*行变量的特征值,不必进行重新计 算,可直接用数据作图.该功能与 Excel 中的画图功能相似,因此在分析时,可直接使用 Excel 工具绘图可能更方便. 以上三种方式生成的线图如图 5-6(a) ,5-6(b) ,5-6(c)所示.从图中可以看出, 图的外观没有太大的差别,其差别主要在于各种图的纵轴所揭示的指标值不同.
40.0

30.0

20.0

10.0

Percent

0.0

岁 16
年龄

-2 16 0岁

-2 20

-3 26

-3 31

-4 36

岁 40

以 下



图 5-6(a)分组变量的均值线图.
9.0

5岁

0岁

5岁

0岁



8.5

8.0

7.5

Mean

7.0

尼 班 路 意 满 度

维 真 斯 意 满 度

图 5-6(b)*行变量*均值线图

丹 佐 奴 意 满 度

狮 堡 龙 意 满 度

果 苹 满 度 意

U2 满 意 度

10

110.0

100.0

店 员 基 本 礼 貌

5-6(c)两个变量对应个案值线图. 在数据分析的过程中,选用何种图,主要视分析的目标及数据库的情况而定,各类图的 绘制操作过程如下: 1,组特征值线图(summaries for groups of cases)的绘制 1)打开数据文件"服装市场调查数据库.sav" . 2)点击"graphs → line" → 显示 line charts 对话框,选择 simple,在数据源(data in chart are) 选项中选择第一项 summaries for groups of cases,点击【define】 ,进入绘图参数 输入窗口. 3)在线图纵轴指标(line represents)选项中选择频率选项(% of cases) ,在分类轴横轴 (category axis)中输入分类变量"q7" ,其他均采用系统默认值. 4)确认【ok】 ,生成条图输出到"output"中,如图 5-6(a)所示,该图反映了分类变 量"q7"的各个组别出现的频率,即各年龄组的人数占总调查个案数的比例. 2,*行变量特征值线图(summaries for separate variables)的绘制 1)打开数据文件"服装市场调查数据库.sav" . 2)点击"graphs → line" → 显示 line charts 对话框,选择 simple,在数据源(data in chart are) 选项中选择第二项 summaries for separate variables,点击【define】 ,进入绘图参 数输入窗口. 3)在线图纵轴指标 line represents 中输入*行变量"6_1,q6_2,q6_3,q6_4,q6_5, q6_6" ,选择统计*均值,其他均采用系统默认值. 4)确认【ok】 ,生成条图输出到"output"中,如图 5-6(b)所示,该图反映 6 个品牌 满意度评价的对比. 3,个案值线图(values of individual cases)的绘制 1)打开数据文件"服务水*调查数据库.sav" . 2)点击"graphs → line" → 显示 line charts 对话框,选择 simple,在数据源(data in chart are) 选项中选择第三项 summaries for separate variables,点击【define】 ,进入绘图参 数输入窗口. 3)在线图纵轴指标 line represents 中输入"q1" ,分类标签(category label)系统默认为 记录号(case number) ,也可以输入分类变量"store" ,其他均采用系统默认值. 4)确认【ok】 ,生成条图输出到"output"中,如图 5-6(c)所示,该图反映了变量"q1" 的 18 个个案值的大小对比.

Value
11

90.0

80.0

10

11

12

13

14

15

16

17

18

1

Case Number

2

3

4

5

6

7

8

9

根据以上的两种分类标志,在使用线图工具时,可组合成 9 种不同的线形图绘制方法, 但常用的是横轴组别划分用单线的,多线的两种形式,纵轴数据描述用组特征值,*行变量 特征值两种形式,形成四种常用的线图.在选择具体的制图方法时,主要根据分析的目标进 行灵活选择.另外有些线图在一些报表分析功能中,也可直接得到,而不必单独作图.

三,其他图形的绘制
1,饼图(pie) 与条线图绘制原理相同, 饼图类型线图按照反映指标值的不同分为以下三类: 一是描述 按照一个频数变量或分类变量分组的各组特征值, 简称为组特征值饼图或分组饼图. 二是描 述若干个*行变量的特征值, 简称为*行变量饼图. 三是直接描述原始数据库中的个案数值, 简称为个案饼图.如图 5-7(a)所示,从图中可以看出各个收入层所占的比例.
较高 中档 较低 Missing



图 5-7(a) 收入分类饼图 2,帕累托图(pareto) 也称排列图或主次因素图,实际上是将条形图按降序排列,并附上累计百分比的曲线. 通过累计百分比曲线, 可以很快判断主要因素和次要因素. 如图 5-7(b)所示, 从图中可看出, 前四个因素为主要因素.
50 00 10 0 40 00

Percent

30 00 50

20 00

10 00

Count

0

0

Mi g in广 ss推

购买品牌休闲服考虑的第一因素

3,控制图(control)

质 品

式 款

格 价 体 合 适 舒

图 5-7(b) 帕累托图

务 服 流 潮 贴 度 紧 名 知 牌 品 性 个 现 体

设 陈 及 修 装 铺 店

12

将一个时间序列以时间为横轴,在坐标系中依次用点表示出来,并用折线连接起来,同 时绘制上限 ULC 和下限 LCL 两条水*控制线及*均值线 Average, 以此判断数据的波动是 否在控制的范围内.控制图有多种绘制方法,如均值-极差-标准差绘制法(X-Bar,R,S) , 个案-移动极差法(Individuals,Moving Range) ,不合格品率绘制法(p,np) ,缺陷数绘 制法(C,U) .在品质控制中,控制图是最常用的工具.在分析销售数据波动时,也可使用 这一工具,如图 5-7(c)所示,该图是利用均值-标准差绘制法(X-Bar,S)绘制的,从图中 可以看出,每周销售额的波动情况以及突破控制线的时段.

Control Chart: 销售额
18171

12926

7680

销 售额 2434 UC L A v erage = 7679.80 -2812 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 LC L

Mean

S igm a lev el: 3

图5-7(c) 周销售额控制图 4,散布点图(scatter) 将两个或两个以上变量对应的值在坐标系中用点表示出来, 根据点的分布规律或离散程 度判断这些变量之间的相关性及其规律,如图 5-7(d)所示,从图中可以看出,尺码大小 与销售额之间没有明显的相关关系.
16000

14000

12000

10000

8000

6000

4000

销售额
13

2000 0 26 28 30 32 34 36 38 40 42

尺码

图5-7(d) 散布点图

在 spss 分析软件中,还提供了其他的制图工具,如直方图(histogram) ,面积图(area) , 概率图(normal p-p)和(normal q-q) ,高低图(high-low) ,误差图(error bar)等,可根据 实际需要选择,在此不一一叙述.

第三节 统计图的编辑技巧 第三节 一,图元素编辑
1,图中的各种文本标识 图中的文本标识主要包括图的名称,x 轴和 y 轴的名称,轴的刻度标签,图例等方面, 在进行图的文本编辑时,文字尽量简洁明了,不要重复,必要时删除多余的文本,增强图的 可读性.对文本编辑的操作如下: 1)在"output"窗口中,双击需要编辑的图,进入图编辑窗口,如图 5-8 所示. 2)单击需要修改的文本,出现选中框. 3)在快捷键或格式菜单(format)中,选择文本编辑功能(text) 4)显示文本编辑对话框,指定字体的类型及大小 5)确认【ok】 在以下各种图元素的编辑中,编辑方法与上面类似,遵循编辑什么,点击什么,选中之 后,选择相应的编辑功能进行编辑.对于大多数的编辑,还可采用双击的做法,可迅速弹出 相应的编辑菜单进行编辑.因此,下面只介绍图的编辑元素,编辑操作省略.

图 5-8 图编辑窗口 2,x 轴. 通常 x 轴作为分类轴(categories axis) ,编辑内容相对较少.X 轴的编辑窗口如图 5-9 所示,分类轴的编辑元素主要包括以下几个方面:

14

图 5-9 X 轴编辑窗口 1)x 轴的名称及对齐方式 在 x 轴显示方式(display axis)选项中,如果不作选择,将不显示 x 轴线,在该选项 下,还可修改标题名称(axis title) ,调整对齐方式(title justification) . 2)x 轴的标识 在 x 轴的标识(axis markers)选项中,有两个选项,一是刻度标记(tick marks) ,二 是垂直线标记(grid lines) .画垂直格线的目的是定位,如果格线太多,反而影响图的可读 性,因此是否需要格线应根据需要而定. 3)x 轴的标签 在 x 轴的标签(display label)选项中,有以下三个选择项目: 一是显示分类轴的标签数量.默认为全部显示(all labels) ,如果标签太多,可间隔显 示间隔大小视情况而定. 二是标签文本的修改(label text) . 三是标签的对齐方向(orientation) .有自动对齐(automatic) (默认值) ,水*对齐 (horizontal) ,垂直对齐(vertical) ,右倾对齐(diagonal) ,错行对齐(staggered)五种 方式选择. 在实际应用中,对 x 轴的编辑,主要包括对轴的名称,标识,标签对齐方向等方面,其 他项目采用默认值. 3,y 轴 通常 y 轴作为刻度轴(scale axis),编辑内容相比较复杂.Y 轴的编辑窗口如图 5-10 所 示,y 的编辑元素主要包括以下几个方面:

15

1)y 轴的名称及对齐方式 在 y 轴的名称(display axis)选项中,如果不作选择,将不显示 y 轴线,在该选项下, 还可修改标题名称(axis title) ,调整对齐方式(title justification) . 2)y 轴选用的尺度 在 scale 选项中,有以下两种选择,一是线性刻度,为默认选项.二是对数刻度.如果 需要作对数图时,选用此项. 3)y 轴值的范围 在 range 选顶中,有两个调整项目:一是数据库中的数据范围(data) ,一般由系统自 动识别.二是图中显示数据的范围(displayed) .可根据图的显示效果进行调整,通常是增 加最小的显示值,删除图中不必要的空白空间,从而使图中的线条显示效果更好. 4)主要刻度或次要刻度 在主刻度(major divisions)和辅刻度(minor divisions)选项中,可调整最小刻度, 一般由系统自动识别.此外,还有 y 轴标识选项,包括刻度标记(tick marks)和水*线标 记(grid lines) .水*线是用来确定数据大小的参考线,如果水*线太多也会影响图的可读 性. 5)第二坐标轴.在 spss 中提供了定义第二坐标轴的选项(display derived axis) .如果 图太大,需要在图的右侧显示刻度线时,可选择此项. 6)y 轴的标签 在 y 轴的标签(display label)选项中,有以下五个指定项目: 一是小数点的位数(decimal places) 二是前导符(leading character) ,如在数据前加货币符号. 三是后导符(trailing character) ,如在数据后加%. 四是数据用千分位表示(1000s seperator) .
16

五是数据缩小系数(scaling factor) ,默认为 1,即使用原数据,不作缩小. 在实际应用中,对 y 轴的编辑,主要包括图中数据显示范围,水*线,小数点位等,其 他项目均使用系统的默认值.

二,图形编辑
1,图形格式(format) 对图形格式的编辑功能,集中在图编辑窗口的 format 菜单中,也可直接使用快捷图标. 图形式格式编辑主要包括以下几个方面: 1)条的形状 (bar style) 填充方式 , (fill pattern) 颜色 , (color) 数据标识 , (bar label style) . 2)线的形状(line style) ,颜色(color) ,线中点的连接方式(interpolation) (包括孤立 点,折线 straight,阶梯线 step,跳跃线 jump,*滑线 spline 五种可供选择) ,点的标识符号 (marker) (对孤立点作图适用) . 3)坐标轴转置(swap) :当横轴标签太多时,通过坐标轴转置可改善图的显示效果. 4)缺失数据中断效果(break line at missing) .将缺失数据也在图形中表示出来. 2,图中使用的数据系列(series) 对图中使用的数据系列的编辑功能,集中在图编辑窗口的 series 菜单中,图形式格式编 辑主要包括以下两个方面: 1)增减图中线,条的根数(displayed) . 2)多线图中,分线变量和分组变量的互换(transpose data) .该功能对单线图不适用. 3,图形类型的变换 在 spss 图编辑窗口的 gallery 菜单,可实现条形图,线图,面积图,饼图之间的互相变 换.在多线图中,还可采用混合表达的方法(mixed) ,对不同的线使用不同的图表达方式, 在一张图中,可同时使用条,线,面积三种图形的混合表达.在转换的过程中,需要注意对 应关系.如多线图可转换为分层条图或分段条图,但转换成饼图时,每次只能将其中一条线 转为饼图. 4,图显示效果 为了增强图的可读性,改善图的外观,spss 图编辑提供了一些改善图编辑效果的功能, 这些功能集中在图编辑窗口中 chart 菜单中,除了前面提到的 x 轴和 y 轴的编辑之外,还包 括以下几个方面的内容: 1)添加参考线(reference) ,包括添加水*参考线(scale)和垂直参考线(category) . 如果制图时,没有加格线,但又需要在某些重要的位置加水*参考线和垂直参考线,可选用 此项编辑功能,指定参考线的位置.通过添加参考线,可提高对图观察精度. 2)图例(legend)的选择或编辑. 3)图的外框/内框(outer frame/inner frame)的选择 4)增加注释(annotation) .可在图中指定位置增加文字说明,具体显示位置由所指定 刻度轴的位置和分类轴的位置确定,如图 5-11(a)所示,该功能可进一步增强图的可读性.

17

20000

5. 1黄 金 周 10000

城市
华北 华东 0 1 2 3 4 5 6 7 8 9 10 11 12 华中

图 5-11(a) 增加注释窗口 5-11(b)加注释的线图 例:打开练*库中的数据文件\practice\明细销售数据库.sav,利用 Graphs 中的 line 功 能,绘制变量"sale"的多线图,分类轴用变量"month" ,分线变量用"dqbh" ,图绘制完 成后,给 5 月份和 10 月份加注释,方法如下: 双击需要加注释的图,进入图编辑窗口,在 chart 菜单中选择 annotation,弹出加注释 窗口,如图 5-11(a) 所示,在该窗口中,指定文本(text)的内容为"5.1 *鹬" ,指定文 本显示的位置:Y 轴位置(scale axis position)与分类轴的位置(category axis position) , 点击【add】按钮,添加到注释记录窗口,确认【ok】 ,结果如图 5-11(b)所示,通过加注 文字,能清楚反映 5.1 *鹬芟矍榭龅谋浠. 5)显示投影线(display projection) .通过指定投影线,可以加重某一段线的显示,以 示区分.该功能在 chart 菜单中的 options 中的 display projection 功能中进行. 在以上的各种编辑功能中,一些重要的功能均有快捷方式.在操作的过程中,要注意, 许多编辑功能是针对相应图形及其对应的图元素的,只有选择了图形并选中了相应的图元 素,才能使用相应的编辑功能.如果功能不能使用,可能的原因是该功能不能用于所选图的 编辑,也可能是没有选中所要编辑的图元素.

Mean 销售额
月份

三,图模板的应用
图模板(chart template)是由操作者根据自己需要定制的图外观,x 轴或 y 轴,颜色等 图属性的文件, 将输出图属性定义为自设的图模板之后,spss 数据分析输出的图将按自定义 的图模板输出并显示.这样做,一方面能使图输出符合需要,同时也有利于输出图外观的统 一美观.在 spss 系统中,图模板是在图编辑窗口中,对图进行编辑完成之后,将其另存为 图模板(save chart template) ,该文件的类型为*.sct.有了图模板,下次做图时,可以调用 该模板,能生产统一的图形格式,减少图编辑工作量.在使用 graphs 制图时,其中有一个 是否需要使用图模板的选项(use chart specification from) ,如果选用事先设计的模板,输出 图形将以模板格式输出.图模板也可在制图之前,通过编辑 edit 菜单下的 options 选项中的 charts 中的 chart template 设定. 例:将上例中编辑的线图保存为图模板 line.sct,再次制图,并调用图模板,生成单线 图,观察结果发现,与上例图完全一样,如果增加一条记录,只需要对该条记录增加注释.

18

思考题 1, 打开练*库中的数据文件\practice\服装市场调查数据库.sav, 绘制变量 "q2_1, q2_2, q2_3"的简单条形图,以性别为分层或分段变量,绘制分组分层条形图,分组分段条形图, 要求条形图中不显示缺失值,将该过程的语法记录下来. 2,打开练*库中的数据文件\practice\服务水*调查数据库.sav,以其中的 6 个变量的 *均调查值绘制简单条形图,将该过程的语法记录下来. 3, 打开练*库中的数据文件\practice\服装市场调查数据库.sav, 绘制变量 "q2_1, q2_2, q2_3"的单线图,以性别为分线或分点变量,绘制多线图,垂线图,将该过程的语法记录 下来. 4,打开练*库中的数据文件\practice\服务水*调查数据库.sav,以其中的 6 个变量的 *均调查值绘制单线图,将该过程的语法记录下来. 5,打开练*库中的数据文件\practice\明细销售库.sav,利用 Graphs 中的 line 功能, 绘制变量"sale"单线图,分类轴用变量"month" ,图绘制完成后,给 10 月份对应的点上 加"10.1 *鹬"注释. 6,将思考题 5 生成的图中的 Y 轴格式,文字,颜色等进行等编辑,并将编辑结果保存 为图模板,重复第 5 题操作,调用该图模板,看生成结果.

19


相关推荐

最新更新

猜你喜欢