全文2700余字,阅读约需5分钟。
箱型图,也叫箱线图,图形类似于股价图中包含上下影线的柱条,但箱型图的柱条有更宽的柱体,看上去像一个包含上下影线的箱子。
它能够展示一组数据的最大值、最小值、中位数和上四分位数及下四分位数。
什么是上四分位和下四分位?
是指在升序排序的数据中,通过三个点位将所有数据分成四个区间,第一、二、三个四分位数分别表示数据的25%、50%和75%分位点。下四分位即升序数据列表中第25%位置的值,上四分位则表示第75%位置的值。
如下图所示,这是一个单系列的箱型图,数据标签包含了五个点位的值和平均值。
从上图可见,中位数是中心线,箱子的上下边界分别是上四分位数和下四分位数,超出箱体的上线端是是最大值,下线段是最小值。
所以我们可以通过箱体的长度来表示数据的分散程度,了解数据的基本分布情况!
下面作者将通过两个数据示例来讲解不同数据场景的箱型图作用和制作。
我们来看只包含一组数据的源表,如下图所示:
现在通过插入工具栏来快速创建一个箱型图,首先选中数据源中的数值列,然后点击“插入-直方图-箱型图”,具体操作如下动图所示:
这里有一个注意点,创建箱型图一定要仅选中数值列,箱型图不会自动识别类别名称列,也就是数据源中的A列,当我们点击任意数据单元格或选中所有数据区域,来插入箱型图,得到的将是一个不包含箱体的图形,如下图所示:
下面来看一下系统生成的默认箱型图:
此时得到了一个简陋的默认箱型图,我们先来快速调整一下它的整体布局和格式。
双击纵坐标轴,进入格式设置界面,在“坐标轴选项”下的“边界”最小值手动调整为“50”。
这个操作是为了截取掉图表绘图区下方大片的空白,使箱体大致显示在图表中间位置。
随后再点击右侧“+”图标,勾选“数据标签”,图表将自动添加上箱体各位置的数据标签值;接着再点击箱体,在“填充与线条”设置“填充”选项为“无填充”,即不显示箱体的填充颜色。
最后我们再删除横向网格线,并添加图表标题,得到一个较为清晰的箱型图,如下图所示:
通过这个图表,我们能够直观地观察到一组数据中的最大值和最小值、上四分位和下四分位、中位数和平均值。
那么箱型图的这些点位值是怎么来的呢?
那当然是通过数学计算获取的,在excel中有一个函数专门用于计算一组数据的四分位值,即Quartile函数。
该函数的表达式比较简单,包含两个参数,第1参数数据区域,第2参数分位点类型。
表达式为:=Quartile(数据区域,分位点类型)
其第2参数分位点类型是指通过特定的参数值,来表示计算不同分位点的结果值。如上图所示,它包含5个参数值,分别是“0表示最小值,1表示下四分位点,2表示中位数,3表示上四分位点,4表示最大值”。
现在我们在表格输入公式,得到的结果与图表中的分位点值相比较,却发现函数公式得到的结果与图表自动添加的标签值并不相同!
作者:Excel教程学习
专栏简介:excel图表入门和制作,快速掌握图表绘制能力,用图展示想要表达的数据信息