我们在日常生活中经常会遇到这种情况,看到某些报告里面说“去年人均月收入超过 2 万元”。看完这个数据之后,很多人会有如下感叹:
调侃之余,我们不防想想,为啥很多人觉得拖后腿?
回答这个问题,我们先搞搞清楚啥是平均值?从数学上来说,平均值有多种,比如算术平均值、几何平均值、加权平均值等。
我们日常生活中提到的平均值都默认是“算术平均值”,也就是“一组数据中,数据之和÷数据个数”。这个计算so easy,小学就会啦~
举个栗子:某高级小学班,有5个同学,数学的成绩分别是18,32,72,60,98,求班级数学平均分?
求解:这组数据的算术平均值是 (18+32+72+60+98)/5=56
请问:56 这个平均值能代表同学们的平均水平么?
NO!NO!NO!
so,有的时候,平均值并不能代表整体水平。因为平均值的计算样本是total,非常容易受到极端值的影响,比如 把你的年薪和马爸爸平均。。。
那什么情况平均值才有价值呢?
答:数据呈均匀分布或者正态分布的情况下平均值才会有意义。
然而,并不是所有的数据都是均匀分布,那又该怎么办呢?
再答:求均值前,先分组。比如,A公司今年年初至今,A品牌的人均贡献增长超过了50%,想了解下是哪一部分会员引领了人均贡献增长?我们继续用一个上一篇《【DEF函数应用】之占比计算》的数据,算算看~
结果如下图:
这种题型,DEF函数是最优解。按照惯例,先温习函数语法:
DEF(聚合指标, [维度1,维度2,...], [过滤条件1, 2,...])
DEF_ADD(聚合指标,[维度1,维度2,...],[过滤条件1, 2,...])
DEF_SUB(聚合指标,[维度1,维度2,...],[过滤条件1, 2,...])
然后我们再来看看DEF函数的具体实现步骤,follow me~
Step1
导入数据:
Step 2
指标计算,此处划重点
1、不同会员等级在各个品牌的平均交易额
2、品牌的平均交易额
此处的知识点:DEF_SUB的第二参数维度,可以忽略组件的维度
Step 3
制作仪表板
-
选择自定义图表
-
将【品牌】、【会员等级】拖入横轴,【不同会员等级在各个品牌的平均交易额】、【品牌的平均交易额】拖入纵轴
-
再将【品牌的平均交易额】的图形类型设置为“线”,指标基础表就完成了
当然,对美观有要求的同学,可以继续设置颜色、轴标签的文本方向等细节,这部分不是本文的重点,不再赘述啦,感兴趣的同学可自行尝试~
小结一下下
通过举例,我们了解了分组后求均值的计算过程。实际业务场景中,均值是一个很常见的计算指标,使用的时候,要注意其陷阱,它很容易受到极端数据的影响,很多选秀节目里最后计算分数时要去掉一个最高分和一个最低分,就是这个道理。整体平均值要在数据均匀分布或者正态分布下才会有意义。据此,我们引出了先分组再求均值的解决方案,但其实,先分组再求均值也并不能解决所有难题,因为还有著名的辛普森悖论。。。关于辛普森悖论,这篇就抛砖引玉,有兴趣的同学可以自行检索学习,或者,也可以点个赞,集齐30个赞,我们就单独聊聊。
好了,今天就酱紫啦,回见~
我是BI实战,关注我,带你在FineBI的世界飞 |