数据探查
n数据探查让用户查看数据集的总体趋势,对数据集进行查询并假设数据集之间可能的关系。
n数据探查的一个重要组成部分为交互式、动态链接的可视化工具。地图、图形和表格在多视窗中显示并动态链接。因此,若从表格中选择一个或多个记录,在图形或地图中则自动突出显示相应要素。
图10.1
线状图。
图10.2
直方图(柱状图)
图10.3
累积分布图
图10.4
1990–2000 年间美国人口变化百分率对应2000 年美国各州18 岁以下人口所占百分率的散点图。两个变量之间存在较弱的正相关关系。
图10.5
泡状图。其中,沿x轴方向表示 1990–2000 年人口变化百分率;沿 y轴方向表示在2000 年时各州18周岁以下人口所占百分率;气泡符号的大小表示 2000 年各州总人口数。
图10.6
基于1990–2000 年人口变化百分率数据集的盒状图。
图10.7
盒状图(a) 提示数据服从正态分布。盒状图(b) 显示高值端附近的数据为正态偏向分布。 (b) 中的几个x可能代表超限误差,从盒状图形的末端算起,其长度超过1.5 个盒长。盒状图(c) 表示低值端数据较高聚集而呈负态偏向分布。
图10.8
1990-2000年人口变化百分率对应来自正态分布的标准化数值的QQ 图。
图10.9
显示爱荷达州105 个气象站年降水量的三维图。可以看出降水量呈由北向南递减的明显趋势。
动态图形
n当来自上一节的图形被显示在多个动态链接的视窗时,即成了动态图形。
n动态图形允许用户直接在动态视窗中对数据点进行操作。
图10.10
左边的散点图被动态链接到右边的地图。在散点图中“刷亮”两个数据点,则地图中同时高亮显示相对应的州(华盛顿和新墨西哥)。