一、选手简介
1、选手介绍
帆软社区用户名上善若水,混迹于批发零售行业六七年,跑过业务带过班,目前是电商自由职业者,个人比较喜欢数据分析,今后也立志往这方面发展,希望通过这次大赛能检验自己的数据分析能力,查漏补缺,不断进步。
2、参赛初衷
- 希望通过比赛实践提升FineBI的使用方法和技巧。
- 评估自己的数据分析能力,以便查漏补缺。
- 和更多FineBI大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞。
二、作品介绍
1、业务背景
飞猪,作为中国广受欢迎的在线旅游平台之一,凭借着提供多样性旅游产品,沉淀了用户长期的在线行为数据。五一黄金周往往是用户旅行的活跃时段之一。本项目试图通过对2021年黄金周前后飞猪平台用户行为数据的解读分析,探寻用户其间的在线行为规律,以此来洞察隐藏在用户各个行为背后的寓意,从而为平台运营提供参考依据。因节选的数据集统计周期短,所以在分析中产生的结论还需其他样本集的进一步论证。
2、数据来源
数据来源阿里云天池:User Behavior Data from Fliggy Trip Platform for Recommendation
本项目基于分析目的,用户行为数据筛选其中2021/04/15-2021/05/15期间的行为记录。
3、分析思路
飞猪平台用户的行为主要包括clk浏览、fav收藏、cart加购和pay购买。其中“购买”是一笔订单完成的重要标志,也是平台运营的终极目标。因此本项目依据统计周期用户的购买频次将用户划分为“兴趣用户”(指从未购买的用户)和“购买用户”(仅购买过一次的用户)和“忠诚用户”(有复购行为的用户),再基于分组对用户做进一步的分析,为什么兴趣用户没购买?什么原因造成首购用户流失?忠诚用户有哪些特征?具体分析思路见下:

4、数据处理
(1)通过SQL语句筛选取子集、字段重命名、删除重复值、数据一致化、异常值检查等加工及清洗数据;(2)源数据已脱敏;(3)整理各表之间的关联(4)建立自助数据集:
(a)通过左合并功能将三张csv格式表格合并成一张宽表,后续操作都以此表为基础。

(b)过滤行为类型为pay的用户,筛选出所有购买行为的用户,再按用户ID等字段分组去重,购买频次统计求和汇总,过滤(购买频次=1)筛选出“首购用户”名单,按此思路再过滤出购买频次大于1)筛选出“忠诚用户”名单,并分别新增列用户类型赋值“首购用户”“忠诚用户”。

(c)首购用户表上下合并忠诚用户表得到所有购买行为的用户。
(d)将宽表和所有购买用户取差集得到兴趣用户行为表,将其按用户ID分组汇总去重得到兴趣用户名单,新增列“用户类型”赋值“兴趣用户”。




(e)将三类已赋值用户类型的用户名单上下合并得到全部已赋值用户类型的用户名单,右合并宽表,得到全部用户行为分析表,新增列“计数”并赋值1,以便后续分析时统计。
(f)行为类型转化分析数据集制作:全部用户行为分析表选字段用户类型,用户ID,商品ID,行为类型和时间,按用户类型,用户ID,商品ID,行为类型分组,最早时间汇总,新增列“行为”,按“用户ID+商品ID”组内字符串拼接“行为类型”赋值,按字段用户类型,“行为”分组去重,汇总“用户ID”去重计数便得到各个类型用户各行为组合的人数统计。
(g)选取全部用户行为分析表相关字段,按商品类目,商品ID,旅行目的地分组,用户ID去重计数汇总制作用户偏好分析数据集。
5、可视化报告
(1)报告框架

(2)图表选择

(3)样式选择
报告选取了FineBI内置的仪表板样式(复古风格),以深色调为主,概括性指标的图标也选取的蓝色色调,文字组件白色,图表说明深蓝色。
(4)报告内容
- 分析背景及目的、数据来源及分析思路

- 数据概括性指标及用户分组

-

概括性指标:用大号字及与深色背景鲜明对比的白色,用图片组件配上对应的图标,使其一目了然。
漏斗图:通过漏斗图反应各分类用户的占比及各行为环节的转化情况。
图表分析结论:
 
兴趣用户未购买商品的原因(假设检验分析法)
(1)提出假设
(2)收集证据
条形图:对比兴趣用户单一行为和组合行为的人数占比情况
柱形图:对比兴趣用户各行为组合的组内占比情况。
散点图:反应兴趣用户浏览的单品和品类间的相关性。反应平台单品销售次数和品类间的关系。


(3)得出结论

用假设检验分析法分析首购用户未复购的原因
(1)提出假设:假设这些用户是平台新用户
(2)收集证据
柱形图:反应每日平台首次活跃用户的人数对比情况。

(3)得出结论

忠诚用户特征
圆环图:反应忠诚用户各性别的占比
柱形图:忠诚用户排名前5的职业情况、居住地情况和旅行目的地偏好对比。
柱形折线组合图:反应随着时间的变化,日访客数和行为总数的变化趋势
树形图:反应忠诚用户关注度最高的5类商品及相应类目下的单品TOP5。
明细表:忠诚用户的基础特征、购买频次统计以及距今消费的时间差。





图表分析结论:

分析结论及建议

完整版报告效果图

|