首先,我们回顾下之前对于数据的定义:
数据是某类事务的度量。
这块我们分解下我们的一个表简单个大家介绍下,并借此个大家简单阐述下维度表跟事实表怎么去区分:
我们拿我们的地域消费举例:
我们先拆分我们的表,我们看到下边红色圈出来的部分,这部分就是我们所介绍的的分类部分,红色圈以外就是我们的度量部分。当前的这个表一般情况下就是我们所描述的事实表。
那维度表是什么意思的?
我们先简单的把维度表理解为对某类事务粒度的抽离及细化。
1、假定我们要按照日期趋势去分析我们的数据,一个日期的列对我们来说肯定是不够的,我们可能还需要根据年份,月份,季度,周,工作日/非工作日等维度去对我们的分析颗粒度进行喜欢,所以我们抽离出日期列,对其增加新列,如下:
具体日期表怎么创建,大家可以参考我之前的文章:
通过日期表这个例子我们可以理解维度表其实是我们抽离出来的每个类别,对该类别的细化再补充的一个过程。
2、假定我们需要根据城市类别对我们的地域属性进行粒度细化我们看看做完之后什么效果
上边的维度就是我们对每个城市进行了大区的划分,后期如果我们还想区分省会非省会,或者1/2/3/4线城市的时候就可以直接在维度表中添加。
我们简单总结下:
1、通过这篇文章的介绍,相信大家可以很好去区分维度表与事实表;2、维度表的出现,能够帮我们去除信息冗余,我们不必在几百万上千万的数据中再去添加年、月、季度等字段,这样数据量过大的话,我们整个数据量级会增大很多甚至翻倍;3、维度表可以帮我们将多个试试表串联起来,方便调用,如果有3张以上事实表,对我们分析来说的话,抽离出来一个维度表细化颗粒度(年、月、季度等)就会比多表添加方便很多,后期维护修改也方便很多。
更多问题,欢迎大家加群探讨交流!
举报/反馈

简快Excel

8获赞 151粉丝
分享传播大道至简的Excel技巧技能!
关注
0
0
收藏
分享