请上传宽度大于 1200px,高度大于 164px 的封面图片
    调整图片尺寸与位置
    滚轮可以放大缩小图片尺寸,按住图片拖动可调整位置,多余的会自动被裁剪掉
取消
淡竹(uid:286654)
职业资格认证:FCA-FineBI | FCP-报表开发工程师 | FCP-FineBI | FCP-业务分析师
【2022BI数据分析大赛】如果FineBI恋上Python--直播电商用户流失分析
写在前面         FineBI如果集成了常用算法和模型,会是什么样子的?        本作品主旨在于探索FineBI在更深层次数据分析中的应用,涉及算法及模型的部分主要通过python来完成,本作品包括数据清洗、用户特征探索性分析、用户特征相关性分析、模型建立与优化和总结思考5个部分,数据来自天池https://tianchi.aliyun.com/dataset/dataDetail?dataId=124814,本文重点在于FineBI,涉及python的部分不详细展开讲述,有兴趣的小伙伴可以查看附件中的代码。希望通过这次机会,与评委、番薯们一起分享交流学习。         团队成员:积极热烈的淡竹,稳重靠谱的瞬间,有颜值有才华的CHH   一、问题背景及分析目的 (1)问题背景        客户流失的全部成本包括旧客户流失损失的收入和用新客户替换这些客户所涉及的营销成本,减少客户流失是每个公司的关键业务目标,预测和防止客户流失对每个产品/平台来说都是一个巨大的潜在收入来源。 (2)分析目的        客户流失分析主要是通过分析用户特征,寻找对用户流失影响较大的用户特征,根据电商领域业务知识,提出产品/平台的运营建议,从而提高用户粘性,降低用户流失率。   二、分析及设计思路 2.1 分析思路   2.2 设计思路 (1)布局设计     (2)配色与布局设计        作品以紫-蓝色为主色调(没什么含义,使用个人喜欢的颜色)。 对于同一个指标下的不同分类,遵循语义颜色一致性,即同一分类的颜色一致。 对于同一指标的不同数值,遵循数值颜色一致性,即数值大的颜色深,数值小的颜色浅。 尽量把分析过程相似的特征(如对用户维度特征的分析)放到tab页签中,力求界面简洁美观。 对于每个需要分析的模块,将分析结论在模块下方就近显示,让整个可视化分析“故事化”,整个看板即使直接用于会议和汇报,也很容易让初次接触的与会者快速读懂。 (3)新的尝试 尝试与python结合,进行更深入的数据挖掘分析 尝试用FineBI生成哑变量(虽然过程很繁琐,但是还是试出来了) 尝试制作箱线图,达到类似效果   三、数据清洗 3.1 缺失值处理        绝大多数情况下,建立模型需要一个完整的数据集,包含空值的数据会使数据挖掘过程陷入混乱,导致不可靠的输出,我们处理缺失值是为了更好地进行建模,因此,在具体实现之前,此步骤也可以放到模型建立之前,先用原始数据进行特征分析。        缺失值处理是对数据中的空值进行删除或者填充,简单的处理方法有直接删除、均值填充、中位数填充、众数填充和特殊值填充,更复杂的有插值填充、Knn均值填充等,这里不进行介绍。常用的缺失值处理方法如下:     (1)判断某指标的缺失值              排序后,如有缺失值,会出现在预览区的第一条数据中。        观察到需要进行缺失值填充的字段有:使用平台的时间、仓库到顾客地址的距离、使用APP时间、上月订单数量、订单数较去年增加、上月使用的优惠券数量、距上次下单天数。     (2)处理缺失值        对所有缺失值的列进行处理。以仓库到顾客地址距离这个指标为例,观察到该指标有明显的离群值,因此使用中位数填充。其他指标的处理缺失值方式类似,不进行赘述,处理缺失值的步骤如下:        Step1:新增列“仓库到顾客地址_中位数”            Step2:新增列“仓库到顾客地址_公里”       四、用户特征探索性分析 4.1 用户维度特征分析        用户维度特征,即描述用户的特征,包括常用登陆设备、城市等级、性别、年龄、婚姻状况、上月首选订单类型。分析思路如下:     (1)常用登陆设备分析            读图:使用Mobile Phone的总用户数远高于Phone和Pad,但是使用Phone的流失用户占比为22.4%,使用Pad的流失用户占比为19.8%,远高于Mobile Phone的12.5%        解图:建议产品团队测试phone和Pad终端的产品是否存在不稳定问题   (2)城市等级分析            读图:城市等级为3的流失用户占比为21.4%,城市等级为2的流失用户占比为19.8%,远高于城市等级为1的14.5%        解图:建议运营团队在城市等级为2和3的城市适当开展运营活动(如鼓励城市特色作品直播等),提高用户粘性   (3)性别分析            读图:女性用户是平台的主要用户,女性的流失用户占比为17.7%,男性的流失用户占比为15.5%,基本持平        解图:建议运营团队根据男性与女性喜欢的直播风格,进行直播内容定向推送,尝试降低其流失率   (4)年龄分析            读图:年龄分组为6的流失用户占比最高,为34.6%,其次是年龄分组为5,流失用户占比为22.5%        解图:建议运营团队鼓励更多年龄分组为5和6喜欢的直播内容和商品进驻,提高其留存率   (5)婚姻状况分析            读图:已婚的总用户数最多,且流失用户占比最低,是产品的优质用户群,单身的流失用户占比较高,为26.7%,远高于离异和已婚的用户        解图:建议运营团队在挖掘新用户时,更注意去吸引已婚的用户,对于现有的单身用户,采取积极留存措施   (6)上月首选订单类型分析          读图:上月主要订单为Mobile Phone和Household的流失用户占比较多,均超过了25%,其次是上月订单为Fashion的用户        解图:可能是由于Mobile Phone和Household的商品使用周期较长,用户购买该类商品后,很长一段时间不再有相同的购买意愿,从而造成用户流失   (7)用户维度特征分析总结: 使用Phone和Pad的流失用户占比远高于Mobile Phone,建议测试phone和Pad终端的产品是否存在不稳定问题 城市等级为3和2的流失用户占比远高于城市等级为1,建议在城市等级为2和3的城市适当开展运营活动,提高用户粘性 女性的流失用户占比与男性基本持平,建议根据男性与女性喜欢的直播风格,进行直播内容定向推送,尝试降低其流失率 年龄分组为6的流失用户占比最高,其次是年龄分组为5,建议鼓励更多年龄分组为5和6喜欢的直播内容和商品进驻,提高其留存率 已婚的总用户数最多,且流失用户占比最低,是产品的优质用户群,单身的流失用户占比远高于离异和已婚的用户,建议挖掘新用户时,更注意去吸引已婚的用户,并对于现有的单身用户,采取积极留存措施 上月主要订单为Mobile Phone和Household的流失用户占比较多,可能是因为Mobile Phone和Household的商品使用周期较长,用户购买该类商品后,很长一段时间不再有相同的购买意愿,因此造成用户流失 4.2 用户行为特征分析        用户行为特征,顾名思义,是用户在平台上的行为数据,包括:仓库到顾客地址的平均距离、订单数较去年增加、顾客对服务的满意度、距上次下单天数、上月订单数量、上月平均折扣金额、上月使用的优惠券数量、上月投诉次数、使用APP的时间、使用平台的时间和用户关注的主播数量。        通过分析各行为特征指标流失用户和非流失用户的均值,差异较大的特征指标为影响用户流失情况明显的指标,对这些特征进行分析。尝试制作替代版的箱线图,最大最小值用星星表示。在求百分位数的时候,需要使用函数PERCENTILE_AGG(),这个函数只能在实时模式下使用,抽取模式不能使用,不是很友好。            最终对用户行为特征分析如下:有着特征【使用平台的时间(月)越短,上月有过投诉行为,上月平均获得折扣金额越小,距上次下单天数越短】之一或者其中几个的用户,流失的可能性更大。       五、用户特征相关性分析 5.1 生成哑变量        哑变量也叫虚拟变量,引入哑变量的目的是将不能定量处理的变量(如性别、职业等)量化,以性别为例,如果将女性和男性设置为1和2,代入到模型中是不太合理的,因为女性和男性没有大小和顺序关系。特别在回归模型中,生成哑变量后,每个哑变量都能计算得到对应得回归系数,更容易解读模型的结果。            图中,由于性别_male和性别_female这两个变量是互斥的,可以只保留其中一个变量。一般情况下,如果有m种互斥的属性类型,在模型中引入(m-1)个虚拟变量。        下面以性别这一变量为例,展示FineBI生成哑变量的过程。其余需要生成哑变量的维度列有:常用登陆设备、城市等级、年龄、婚姻状况和上月首选订单类型,生成过程类似,在文中不进行重复阐述。当数据需要生成哑变量的维度列较多,各维度列的分类较多的情况下,FineBI整个生成哑变量的过程非常繁琐,仅供与各位番薯参考学习。更建议用python进行哑变量处理(代码见附件),方便快捷。 (1)行列转换        将清洗后的数据以Excel导入到FineBI中,点击编辑,选择行列转换     (2)生成哑变量值        新建自助数据集,新增对应的哑变量列,只保留性别_Female这个哑变量            最终的哑变量生成如下:     5.2 计算相关系数         用户流失标签的相关系数绝对值越大,与用户流失相关程度越高;>0.7为强相关,<0.3为弱相关,相关系数为正,与用户流失为正相关,否则,为负相关。        FineBI没法计算相关系数,因此本部分是通过python完成的。将处理好的数据以Excel形式导出,在python中读取Excel文件,计算相关系数并导出相关系数结果文件(python代码见附件)。最后导入FineBI进行分析。            分析结论如下: 使用平台时间_月相关系数为-0.32,因此,使用平台时间越短,用户越有可能流失 上月投诉次数相关系数为0.25,因此,上月投诉次数越多,用户越有可能流失 婚姻状况_Single相关系数为0.18,因此,单身用户越有可能流失 距上次下单天数_天相关系数为-0.16,因此,距上次下单天数越近,用户已经买到了心仪的物品,越有可能流失 上月客户的首选订单类别_Mobile Phone相关系数为0.15,因此,用户上次的首选订单类别为Mobile Phone的,越有可能流失   七、模型建立与优化 7.1 模型建立与模型评估        对数据进行缺失值处理和生成哑变量后,就可以建立机器学习模型,对数据进行挖掘分析。        常用的单模型有:逻辑回归模型、决策树模型、朴素贝叶斯模型、K近邻算法等,融合的多模型有:随机森林模型、AdaBoost模型、GBDT模型、LightGBM模型等。        机器学习模型效果的主要评估方法有:准确率、精确率与召回率、混淆矩阵、ROC和AUC等。本文使用ROC得分来评估机器学习模型的效果,ROC得分越高,机器学习模型的效果越好。        如果特征较多,需要进行特征提取,常用的特征选择方法有:相关系数过滤法、递归消除法、主成分分析法等,生成哑变量后共有29个特征,并不算多,因此没有进行特征提取。        本文不对模型及模型评估算法进行介绍(三言两语七嘴八舌也很难概括),感兴趣的番薯可以自行学习。        各模型在默认参数下的ROC得分整理成Excel文件,导入FineBI进行分析。            分析结果如下: LightGBM算法的学习效果最好,ROC得分为0.983,其次为随机森林模型,ROC得分为0.981 整体上看,融合的多模型ROC得分比单模型算法高,学习效果比单模型好 7.2模型优化        模型优化是个枯燥且需要耐心的过程,主要是寻找最优的模型参数,使得模型的准确度最高。这里用最常用且简便的GridSearch网格搜索寻找模型的最优参数。        GridSearch网格搜索是一种穷举搜索的参数调优手段,通过遍历所有的候选参数,循环建立模型并评估模型的有效性和准确性,选取最好的参数作为最终结果。 (1)模型优化步骤如下(python代码见附件): 选择学习效果最好的LightGBM模型,通过GridSearch网格搜索,找到其最优的模型参数。 使用最优的模型参数,建立LightGBM机器学习模型,计算器ROC得分,并输出最优模型参数下的特征及特征重要度。 (2)对优化后的模型结果进行分析如下: 参数调优后的算法ROC得分比调优前的高     根据参数调优的LightGBM模型,对用户流失影响最大的用户特征依次为:上月平均折扣金额、仓库到顾客地址的距离、订单数量较去年增加、使用平台时间和距上次下单天数,上述的用户行为特征与相关系数分析的略有差异,整体来说与探索性分析结果基本一致。     (3)根据分析结果,得出平台运营建议如下: 适当开展补贴活动,鼓励商家对消费者进行补贴; 增加发货仓库,降低商品的运输时间; 鼓励更多主播创造更多优质直播内容,鼓励用户收藏喜欢的主播,鼓励用户成为主播; 适当开展签到、每日任务等活动,提高用户使用平台时间,增强用户粘性; 对于长时间未下单的用户,平台对其进行精准消息推送,尝试召回用户。   八、案例价值        (1)简单化日常工作,半自动化生成可视化看板。本案例形成了数据上传、数据处理、数据可视化生成的半自动化闭环系统,提高制作可视化分析看板的效率超过60%。用户更新数据重新制作可视化看板只需要三步:        Step1:把原始的EXCEL数据集替换为新的数据,然后导出自助数据集处理好的EXCEL文件存到python程序对应的文件路径下。        Step2:跑一遍python程序,将python生成的结果文件替换掉FineBI中的文件(看板数据同步更新)        Step3:根据新的数据,微调可视化看板的结论。        当然,只能“半自动化”是因为案例使用了两种工具,如果能只用一种工具实现全流程,工作流程将更加简化。        (2)数据可视化与数据挖掘结合,分析更深入。取两者之长处,用FineBI进行用户特征展示,用python进行相关系数分析、模型建立和优化,输出对应模型结果,最终由FineBI整合形成可视化分析报告,更准确、深入地得出相应的业务问题结论,快速进行决策。        (3)为小数据量的数据挖掘和业务分析提供参考。案例中只有5630行数据,但是依旧可以通过常用的机器学习方法,进行数据挖掘。在很多企业的数据分析场景中,数据质量一直是个“老大难”问题,而数据质量的好坏决定了数据分析结果是否准确。我也在一直探索数据质量、数据量、分析效率和分析准确性之间的平衡,“从数据表中抽取出数据质量较好的行(数据)和列(指标)进行数据分析挖掘,得出对应的结论”,这也许可以成为一种平衡方案。在机器学习的结果解读中,不是研究因果,而是分析影响,不是研究某特征导致了用户的流失,而是分析某特征对用户流失的影响有多大,如果是正向的,则采取措施增强其影响,反之,降低其影响。在采取运营措施后,用户的数据的分析挖掘结果,又可反过来验证运营措施的有效性。 九、总结思考        在作品的最后,总结一下这次比赛的心得,也是一次复盘,希望积累的经验能够运用到未来的工作和人生中。        (1)熟悉业务,透过可视化展现看业务内涵:内行看门道,外行看热闹。一个可视化看板不仅仅是数据图表的堆叠,而是通过这些图表显示的信息,从而分析业务变化情况,寻找变化原因,给出业务建议。一开始写图表分析结论的时候,我也仅仅局限于“谁多谁少,谁大谁小”,平时熟悉的领域并非电商,这些数据的多少和大小意味着什么,该如何去解读,也是自己边做作品,边查资料,一点点想出来的。我想看到可视化图表里面的“门道”--原来里面隐藏了很多意思,而不仅仅只是看个“热闹”--这看板做得挺好看的        (2)保持期待,不给自己设限:FineBI作为一款近乎0代码的自助分析工具,可以通过拖拉拽的方式,快速制作数据可视化看板。FineBI是现在以数据可视化和简单分析为主,而不是以后它也只能做可视化和简单分析。我尝试去用FineBI进行缺失值处理、哑变量生成,或者制作类箱线图,虽然很麻烦,但是七拐八绕也达成了。FineBI以后是将自助分析做到极致,还是去发展新的功能(比如集成机器学习模块,零代码建模)?。我好奇并期待FineBI最后会发展迭代成为一个什么样的产品。换成人生鸡汤就是,现在不能做到的,不代表以后不能做,永远对自己的人生保持好奇和期待。可以只把自己熟悉的领域做到极致,也可以多尝试新事物。你会成为谁,取决于你自己。 附:最终效果图   附件:直播电商用户流失行为分析_python代码.html (613.03 K)
生如逆旅,一苇以航
为了真正掌握FineBI自助分析,将FineBI的细节点全过一遍,更好地将FineBI运用到开发和运营工作中,我报了FineBI工程师(企业版),现在五周的实战篇即将落下帷幕了,说说自己的一些感悟吧。 这五周大概是我毕业两年来最疯狂的五周了,是怎么过的呢?正好又赶上了工作最忙的一个月,另外还在进行其他的数据分析学习。中午的休息时间减半,用来看视频、做作业的仪表板和写作业视频,周一周二早上六点多七点起来写作业,忙着忙着,就不知道自己为什么要逼自己那么忙。 现在的忙,不过是为了多积累一点自己的能力,让自己在职场中更有价值。能够多赚点钱,有底气对自己喜欢的人说“跟着我,我能给你幸福”,能够养得起现在或者未来的一家人,年轻的时候不拖累生你的人,年老的时候不拖累你生的人。要是能够在这辈子干点自己喜欢的事情,干出点好的成绩,有时间和机会去看看国内和国外的世界,多去走走,见见不一样的风景,遇见不一样的人。这大概就是目前努力的意义了吧。 生如逆旅,一苇以航。没有人能一直顺风顺水,那就自己做自己的渡船,不断努力,去拼出一个属于普通人的未来。 我在BI学习班获得了什么: (1)对FineBI常用功能的理解和细节点的查漏补缺。 (2)掌握了制作数据大屏的技巧,在数据已经处理好,原型清楚的情况下,完成一份大屏的速度提高了不少。 (3)提高了自律性,且决心把自律性保持下去。 对BI工程师学习班的一些建议: 1. 关于作业。 (1)作业量过大。作为一个已经有一定FineBI使用经验的人,都觉得作业多。每周作业两份理论题,至少三道实操题,多的时候七八道,加上写作业文档,需要花大量的时间,更何况是没接触过FineBI,想靠这个课程学习FineBI的新番薯呢?每周作业做不完,必然会影响他们学习的积极性,最后的结果就是很多人不能按时完成作业,拖着拖着,干脆就不学了。 (2)理论作业与PPT重复量大。特别是后面几次的理论作业,都在觉得自己是从PPT复制答案到作业中,既然PPT中已经有,也会认真看和学习PPT,个人理解设置这个作业的目的是复习理论知识,但是我有时候会怀疑从PPT中复制文字到理论作业里面是否真的能够达到目的。 2. 关于课程的版本。 个人觉得课程中老师演示的FineBI版本较旧,不管是个人下载的版本还是而企业中用的版本,都是5.1以上了,与课件中有很大不同,理论作业答案也与新版本不一致了,但是助教批改作业的时候,还是会以旧版本去批改的。 总之,希望帆软能够越来越好,帆软的市场占有率越来越高,这样自己在职场的竞争力也会越来越大。 编辑于 2021-7-2 08:55
【2021夏季挑战赛】全面项目利润分析,以激励倒逼成本管控
恭喜本作品荣获“2021帆软BI可视化夏季挑战赛-最佳行业应用奖” 1、点击浏览在线作品 2、点击查看/编辑在线模板(完成问卷即可获取平台账号)   帆软专家点评: 完整的展现了业务问题解决的过程,首先对于项目成本监控的痛点有非常完整和详细的思路梳理,从业务问题还原到分析方案、原型设计、指标体系、可视化布局、数据开发、模型建立到最后分析结论,甚至包括前期的主题筛选也展示了清晰的思路;其次,在可视化上专门对分析面板的布局进行了思考,可读性比较高,但在配色上还可以有提高优化的空间;最后,在对业务的反哺支撑上是优秀的,如果能对分析过程展开更详细的解读则更为完美。     写在前面       本作品参考地产行业公司(不局限于本公司)区域项目成本监控的现状和业务痛点,响应公司数字化转型的政策和BI商业智能分析的运营推广号召,参与帆软举办的BI夏季挑战赛,作品的需求分析、原型设计、数据建模、可视化分析、项目总结等,高度模拟和还原了真实场景下BI项目的管理开发过程,对场景进行虚构,对数据进行脱敏。本作品结合《成本致胜:微利时代再造房企核心竞争力》等参考学习书籍,不对案例和数据的真实性负责,希望通过这次机会,与评委、番薯们一起分享交流学习。   一、团队介绍 1.1团队成员介绍 1、团队名称:無名队,不知道取什么名的时候,就叫無名队吧!佛说,“無即是有”。 2、团队成员       ①淡竹:队长,懒洋洋的假小子,有着天马行空的想法。现就职某世界 500 强企业,负责公司的可视化开发工作,精通 FineBI 和 FineReport 产品,已通过帆软的“资深报表工程师”认证,本次比赛主要负责数据整理、数据测试、文案编写及运营。       ②梅伟:队员,从事地产信息化工作8年,扎根成本产品线3年,目前就职于(号称:宇宙第一)房企,主要负责集团地产板块成本业务核心系统的产品工作,深入了解和认识帆软产品大约有半年左右时间,通过深入学习+实际应用,不仅开拓了眼界,认识到一个非常强大的工具,更加从思想上意识到数据挖掘、数据分析背后的逻辑和价值;本次参加比赛的目的主要是想借助帆软优秀的平台,认识更多有趣的小伙伴,同时也想全面提升自己在BI项目管理、数据分析、产品运营的能力,帮助团队为企业数字化转型提供有力的支持。       ③冥河:小组成员,平平无奇的大男孩。现就职某世界500强企业,熟悉FineBI和FineReport产品,负责公司的数据运营运维工作。本次比赛主要负责开发工作。       ④一切都值得:队员,18岁,单身可撩,除了冷漠,没什么特别的性格特点,有一个小目标:精通帆软的所有产品。现就职某世界500强企业,负责公司的可视化产品运营,曾担任过公司BI工具应用、BI项目管理、BI产品运营等课程培训讲师。本次比赛负责开发指导和部分文案编写任务。       ⑤瞬间:队员,致力深耕于BI可视化一条龙服务中去,追求商业智能的精髓,为企业带来更多的价值。生活工作中佛系、淡然处之,乐于助人。本次比赛负责“端茶递水”,解忧排惑。   1.2职责分工       团队的职责分工主要包括需求分析、原型设计、数据建模、数据可视化、数据测试和运营推广六个模块。       ①需求分析:对房地产成本业务进行调研分析,了解项目效益、成本控制和成本激励的专项分析中用户关注的重要指标,确定作品所应具备的功能点,对于每个指标,确定其取数逻辑。       ②原型设计:根据对业务需求的分析,设计作品的原型,为可视化分析做准备。       ③数据建模:根据取数逻辑,对各指标数据进行关联和整合,增强数据的可读性,基于企业对数据安全的要求,对数据进行加密和脱敏,通过ETL工具抽取到ADS表中,减少FineBI数据可视化时数据处理的工作量。       ④数据可视化:根据设计好的原型和ADS表,使用FineBI制作成本监控驾驶舱,使其满足业务的需要,对大屏的布局和细节进行调整,使其美观。       ⑤数据测试:包括但不局限于ADS表数据与仪表板前端展示数据的对应,边界数据的测试,前端界面还原原型的程度等。       ⑥运营推广:运营推广主要是借助“项目利润与成本激励驾驶舱”成果在集团内部进行FineBI产品宣传、自助分析培训、推广使用等系列活动。培养集团所有相关员工自主创新、自助分析的氛围。       团队成员的职责分工如下: 145888   二、案例背景 2.1业务背景       地产行业在规模不断集中化、利润回落的市场经济中,传统的粗放成本管理模式已经难以继续,需要的是更为精细化的成本管控。       标杆房企的成本管控模式,通常是建立在“三全”(全员、全过程、全成本)的基础上开展工作。基于房地产企业项目涉及的前期策划、规划、设计、施工、销售等开发全过程环节,由各业务条线全员配合,对上述全部成本构成要素进行规划、控制、细化、调优、再控制。但是,要做到开发全过程环节的成本管理,必须要解决核心问题:     (1)极简组织,极高效率:集团上下继续提高人均生产力,告别以往的“表哥表姐”,利用信息化手段,将复杂的工作简单化,不能让重复性高的工作占用太多时间,把时间腾出来去做创新性的工作,这样才能让企业充满活力和可持续竞争力。     (2)数据拉通,口径统一:地产开发全过程环节成本管理,首要条件是解决各个业务系统主数据拉通问题,需要借助数据分析平台,解决主数据拉通和规范性问题,实现数据口径的统一。     (3)以奖带省,摸清“家底”:知道哪些是好项目,哪些是坏项目,哪些区域做得好,哪些区域在怠工,哪些项目该给予激励,哪些区域该重点监控。   2.2建设目标     (1)数据分析,助力决策分析:管理层和执行层等不同角色用户在日常工作中,需要关注的成本指标不同,传统的ERP报表内容繁杂,性能较低,使用体验差,通过FineBI和FineReport制作的数据分析大屏,为不同角色用户定制个性化桌面,让用户能够高效找到需要的数据,提高用户使用体验和决策效率。     (2)数据拉通,助力多维度分析:通过数据拉通,实现各个业务系统主数据维度一致,借助其他业务系统为成本的数据分析决策加持,例如:某个项目获得了成本激励(成本结余高),通过客户关系系统接口数据分析,该项目存在园林绿化货不对板导致交楼时群诉事件,根据数据分析的结果,高层领导决定取消该项目的激励发放,并对相关责任人进行处罚。     (3)人人都是数据分析师:利用自助数据分析工具,关注区域、项目的利润情况和亏损情况,锻炼每个人的数据挖掘与分析能力,实现工作效率提升50%的目标,同时要通过数据具备发现亏损项目背后问题的能力。   二、需求分析       本次项目重点从集团、区域的高管进行了需求调研,在极简组织为背景的前提下,如何通过数据产品助力成本竞争力提升,通过业务调研总结出来的核心痛点主要有两个方面:     (1)极简组织的挑战。极简组织意味着人员减少,以往一个人负责一件事情,现在可能需要一个人负责三件事情,如何提高工作效率是核心需要解决的问题;     (2)数据在哪?怎么把数据立体化?全成本数据散落在各个子系统中,单一系统的数据分析不够全面,缺少全成本、多视角的立体分析,造成部分问题无法直观被发现。          针对总结业务的核心痛点,小组进行了激烈的讨论和分析,制定项目目标重点解决人员效率、数据共通问题,具体需求如下:     (1)效率提升       ①成本管控核心指标口径梳理(明确集团、区域重点关注和管控指标);       ②成本风险预警(从成本超支、利润下滑、收入下降、动态预亏四大类问题出发,建立预警监控机制,及时发现并解决问题);       ③整体产品设计思路为“事找人”,改变以往人找事的传统思维,借助数据BI产品,为数据建立属性和标签,根据不同角色用户推送数据,实现效率提升的目的。     (2)数据共通       ①梳理各子系统业务数据,形成大成本经营管控关键指标库(基础指标、计算指标、展示指标),构建成本指标体系。       ②通过数据中台,整合各子系统核心业务数据,利用中台建模和大数据运算的能力,实现数据BI前端稳定、高效的展示数据;       ③集团经营成本管理驾驶舱,包括了成本关键指标展示、利润分析、四大类风险监控及预警、收入&成本走势分析、成本激励数据分析、公告信息展示等应用场景。(本作品为项目利润和成本激励)   三、解决方案 1.1 业务方案       房地产成本管理主要包括三大阶段:成本策划、成本控制和成本测算。成本策划强调成本投放效果最大化,强调前期策划的结构最优化和过程的标准化;成本控制关注目标成本控制,强调目标成本控得住;成本测算则主要把注意力集中在“算的快、算的准”上。       贯穿成本管理三大阶段的三大指标主要是:成本、收入和利润。用最俗的话来说就是:“项目投入了多少钱”、“项目赚了多少钱”、“做了这个项目我能得到多少钱”。作品围绕这三个指标的分析和监控过程,制定了两个场景:       1、项目利润分析:通过区域、省份、城市、项目、城市级别、项目类别、时间等维度对项目利润进行统计、分析、趋势和问题探索。       2、成本激励分析:贯彻“以奖代省”原则,对区域、项目奖励进行排名公示;盈利有激励,亏损有风险,激励金额的计算因素之一是项目的盈亏情况,因此,对风险项目进行综合对比分析,以及对近一年的项目盈利和亏损进行趋势对比。   1.2 技术方案 1、技术方案概述 145740       说明:本项目的前端工具包括了FineBI和FineReport工具,其中本作品应用的是FineBI工具,作品应用了工具的联动、下钻、钻取等OLAP分析功能。   2、统计分析       统计分析是最基本的BI分析方法,包括基本的最大值、最小值、算术平均数等常规的数据统计。统计分析可以帮助决策者一目了然地掌握成本的整体情况。在FineBI中,选择分析的变量或指标,系统会自动生成分析变量的运算指标。       在本作品中,作品中运用统计分析的部分包括:主要指标监控、风险预警排名分析、成本激励关键指标展示、成本激励排行榜等。作品展示分别应用了指标卡、地图、柱形图、饼图、折线图、散点图、自由图表、分组表格等。   3、二八分析       二八分析由统计分析中常见的排行榜演变而来,核心思想是20%的对象产生80%的效果,运用到利润分析中,则是20%的区域贡献了80%的利润,20%的区域即为利润指标的重点区域。       二八分析的作用是找到对象中的重点因素,将对象分为重点和非重点两个部分,它让成本的管理和监控更有重点,也更有效率。作品以区域-净利润的组合来举例说明二八法则的具体分析步骤。       ①将各区域按净利润由大到小进行排列;       ②滚动计算各区域净利润占总净利润的比重;       ③找到占总销售额80%左右的那个节点;       ④这个节点以上的区域,就是20%那部分重点区域。       本作品将二八分析应用在区域利润分析上,效果示例图如下: 145741   4、趋势分析       趋势分析是对时间序列数据制作折线图。根据图像的趋势走向进行预测分析,得出最终的结论。趋势分析可以帮助决策者作品中运用趋势分析的部分包括:收入利润走势分析、风险项目数走势分析、激励项目利润走势分析。效果示例图如下: 145742   5、预警监控       预警分析通过在图表中设置警戒线,对超过警戒线的数据进行警示。预警分析可以使决策者未雨绸缪,把握成本、收入和利润内外动向,及时采取应对措施,方便决策者在项目的全生命周期不定期回顾动态成本情况。       作品中运用趋势分析的部分包括:风险项目平均数、四象限图等。效果示例图如下: 145743   6、四象限分析(波士顿矩阵)       四象限分析法是指将事物的两个重要属性(指标)作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法。比如,以属性A为横轴,属性B为纵轴,构建一个坐标系,在两坐标轴上分别按某一标准进行刻度划分,构成四象限,将要分析的每个事物对应投射至这四个象限内,进行交叉分类分析,直观地将两个属性的关联性表现出来,进而分析每个事物在这两个属性上的表现。       本作品波士顿矩阵应用在了成本与利润的四象限分布,其效果示例图如下: 145744   四、原型设计 4.1指标体系 1、统计维度       ①项目维度:项目类型、风险类型、       ②时间维度:日期       ③地域维度:区域、省份、城市、城市级别等 2、数值指标       ①项目数:历史项目的个数       ②动态收入:项目开工至当前时间节点,不含成本的直接收入总和       ③动态成本:项目开工至当前时间节点,包括“四费”的所有开支总和       ④动态净利润:项目开工至当前时间节点,项目收入减成本所得到的结果       ⑤激励金额:根据公司条款细则所计算出来的奖励金额。 3、派生指标       ①动态净利润率:动态净利润/动态成本*100%       ②利润达标率:达标项目个数/总项目个数*100%       ③其他占比指标:累计占比等   4.2布局设计 145745   4.3 设计思路说明       作品以“总-分”、“整体-局部”、“浅显-深入”为主要设计思路,以“整体情况-深入分析-趋势叙述-明细展示”为故事性分析思路。     (1)以六大指标卡为总述,一眼看尽主题--项目利润与成本激励的六大核心指标的整体情况;整个仪表板均围绕着六大指标进行分述;     (2)以项目分布地图为整体,了解各集团的净利润分布情况,以下钻至城市的省份分布地图为局部,了解各省份的净利润分布情况,再以地图左右两边的利润率及其达标率为局部,从城市级别和项目定位两个维度,分析净利润率及其达标情况;     (3)以区域利润二八分析、成本与利润的波士顿矩阵分析和趋势面积图为深入,分析净利润重点关注区域、重点发展区域和需要维护区域,分析近一年的利润走势情况;     (4)以利润核心指标明细为局部,业务人员不需要跳转,即可查看明细数据;     (5)以项目激励排名和区域激励金额统计为整体,展示获得激励金额的项目情况及各区域获得激励的总金额;     (6)以风险项目统计和风险类型占比为深入分析,盈利有激励,亏损有风险,从风险角度展示成本超支、利润下滑、收入下降、动态预亏四大类问题项目的情况;     (7)以项目盈亏走势和激励项目数及金额趋势分析为深入,展示激励金额及其取决因素之一--项目盈亏的近一年走势情况。   4.4配色说明       ①背景:采用深色调,深蓝色背景。       ②组件:统一标题和背景边框,以蓝色和绿色为主色调,遵循语义颜色一致和色系颜色一致原则。       ③预警:以红色、橙色、黄色作为多风险项目预警或者低于平均值预警,主要以红色为主。       ④着重:采用绚丽颜色、闪烁效果等来进行指标或图形着重展示。       ⑤整体:整体组件配色以蓝色系为主,后半部分由于预警和着重较多,没有“从众”使用蓝色系列配置,是为了保留其分析意义。   五、开发过程 5.1数据建模 1、ETL过程       根据业务方案和原型设计确定所需要的数据维度,在关系型数据库中进行数据整合,进行加密和脱敏处理后,利用ETL工具抽取到ADS表中。 2、数据清洗及加工处理       检查数据中可能存在的问题,对有错误或者有问题的数据进行处理。在本作品中,主要对空数据进行过滤,对明显有问题的数据(如成本为负值)进行替换,对省份、城市的显示格式进行统一。   5.2可视化开发 5.2.1 核心指标展示     (1)主要内容:进行统计分析,对项目利润与项目激励的主要指标进行展示,     (2)核心指标:项目数、动态收入、动态成本、动态净利润、动态净利润率和成本激励总额。     (3)展示效果: 145746 5.2.2 项目利润分析 1、项目净利润及净利润率达标展示     (1)主要内容:进行统计分析,展示各省市的动态净利润,同时,从城市等级和项目定位两个角度,对净利润率的达标情况进行分析。     (2)核心指标:净利润额、动态净利润率、目标净利润率。     (3)展示效果: 145747       ①动态净利润率地图:使用区域地图,创建省份-城市的钻取目录,将动态净利润额拖拽至颜色,可通过颜色深浅判断各省市净利润的大小,可对各省份进行下钻,查看对应城市的动态净利润同时,地图作为“隐形”的筛选器,用户可通过点击地图中的省份/城市,对其他组件进行联动。 145748       ②城市等级/项目定位净利润率达标分析:创意使用颜色表格和仪表盘的配合,通过将仪表盘悬浮在颜色表格上,能够掌握各城市等级/项目定位当前的动态净利润率以及动态净利润率的达标情况。 145751 145752   2、项目净利润深度分析     (1)主要内容:       ①对区域动态净利润进行二八分析,选择净利润占比前80%的区域作为利润重点区域;       ②对区域动态净利润和动态收入进行波士顿矩阵分析,重点关注动态成本和动态净利润都较高的区域,重点发展动态成本较低但是动态净利润较高的区域,需要维护动态动态成本和动态净利润都较低的区域;       ③进行趋势分析,展示集团近一年的动态收入、动态成本、动态净利润的趋势情况。     (2)核心指标:动态成本、动态净利润。     (3)展示效果: 146572       ①动态净利润二八分析:以区域的动态净利润、动态净利润累计占比为分析指标,制作商品二八分析图。其中柱形图为动态净利润、 折线图为动态净利润累计占比,并添加 80%线,方便找出占比前80%的利润重点区域。 145756       ②动态成本&动态净利润分析:以动态成本、动态净利润为分析维度,选择散点图展示,并分别用两条均线划分为四象限,以区分区域所处的位置。 145760       ③利润走势分析:以日期-年月为统计维度,动态成本和动态净利润为统计指标,创意使用面积图,下边界线为动态成本,可分析动态成本的走势;中间面积为动态净利润,可通过面积变化分析是动态净利润的变化情况;动态收入=动态成本+动态净利润,因此,上边界线为动态收入,可分析动态收入的走势。最后对上下边界线进行标注,方便用户的理解。 146423   3、利润核心指标明细展示     (1)主要思路:业务更喜欢在同一个页面展示明细数据,而非通过下钻到明细的方式,因此,制作项目利润核心指标明细表,方便对各区域的明细数据进行查看和核对。     (2)核心指标:动态收入、动态成本、动态净利润、动态净利润率、项目数、风险总数。     (3)展示效果:       使用明细表,将需要展示的维度和指标拖拽到数据中。 145763   5.2.3成本激励分析 1、成本激励整体情况统计     (1)主要内容:展示获得成本激励top10项目和获得激励项目主要分布的区域     (2)核心指标:成本激励金额     (3)展示效果: 145764       ①成本激励top10项目:以项目名称为统计维度,以成本激励金额为统计指标,选择条形图,按成本激励金额的大小进行排序。 145765       ②区域激励统计分析:以区域为统计维度,以成本激励金额为统计指标,选择矩形图,按成本激励金额的大小进行排序。 145766   2、风险统计及监控     (1)主要思路:对风险项目数和四大类风险进行统计分析,实时掌握风险项目情况。     (2)核心指标:整体风险项目数、四大类风险及其项目数。     (3)展示效果: 146447       ①风险项目数统计:创建钻取目录“区域-省份-城市”,以其为统计维度,风险项目数为统计指标,制作柱形图,添加平均值警戒线。 145767       ②四大类风险监控:以风险项目为统计维度,以风险项目数为统计指标,制作饼图,将风险项目名称、风险项目数、风险项目数占比放置到标签。 146426   3、盈亏项目及激励项目走势分析     (1)主要内容:分析盈利项目和亏损项目的近一年走势,以及成本激励项目数及激励金额的近一年走势。     (2)核心指标:盈利项目净利润率、亏损项目净利润率、成本激励项目数、成本激励金额。     (3)展示内容: 146448       ①盈利项目与亏损项目净利润率走势图:以日期(年月)为统计维度,盈利项目利润率和盈利项目净利润率为统计指标,选择自定义图表,图表类型依次选择为矩形图和饼图,创意性地将常用的折线趋势以圆点和矩形的形式展示,使整个驾驶舱的视觉展示更加丰富。 145769       ②成本激励项目及激励金额走势:以日期(年月)为统计维度,以成本激励项目数和成本激励金额为统计指标,选择自定义图表,图表类型选择饼图和折线图,创意性地将常用的折线趋势以圆点的形式展示,将常见的折线图的曲线改为垂直线,通过垂直的长度,表达相邻两个月的激励金额变化情况。 145771   六、分析结论       本文针对数据可视化的结果,对业务主要关注结果进行说明,具体的数据结果和分析结论将在视频进行讲解,欢迎各位观看。   6.1项目利润分析       ①进度:各城市级别的利润率集中在55%左右,达标率最低的是一线城市,达标率最高的是五线城市;各项目类型利润率也集中在55%左右,达标率最低的是别墅项目,达标率最高的是商业项目。       ②分布:四川省项目分布最多,数量为947个,利润为207亿元;区域05和区域10位于波士顿矩阵的第一象限,表示成本低,利润高,可重点学习该区域的成本管控办法。       ③趋势:2020年7月至2020年11月,项目成本和项目利润呈现增长趋势,并且于2020年11月到达了最高点,之后处于不规则波动状态。   6.2成本激励分析       ①排名:获得成本激励排名第一的项目为项目A021,激励金额为480.5万元;获得激励最多的区域为区域04,激励金额为6036万元。       ②对比:在四类风险项目占比当中,利润下滑项目和成本超支项目占比较大,都超过了30%;其中,风险项目最多的是区域04,风险项目最少的是区域01。       ③趋势:近一年成本激励项目数和金额区域平稳,获得激励的项目数在900上下浮动,激励金额在5000万上下浮动。   七、项目价值 1、报表自动化,成本更节省       将利润、成本、风险等指标通过固定报表和驾驶舱进行展示,避免重复报表工作,节省了大量的人力成本。预计节省成本为1500*25*104=390万/年。 2、数据可视化,决策更容易       通过观察利润、成本、风险等关键指标的对比、趋势,可快速还原业务场景得出相应的业务问题结论,快速进行决策。 3、工具智能化,分析更合理       利用FineReport和FineBI组合拳同时出击,根据业务需求合理选择工具,同时提供自助分析的培训学习支持,使得业务也能快速进行数据联动、钻取等OLAP分析。   八、心得体会        在作品的最后,总结一下这次比赛的心得,也是一次复盘,希望积累的经验能够运用到未来的工作中。     (1)抓住核心、化繁为简。作品的一开始定的主题是成本,众所周知,企业的成本是一个庞大且复杂的体系,从成本控制的不同角度,有不同的核心指标,指标的不同与丰富,也意味着分析思路的众多,选择哪些核心指标,是团队一开始面临的问题。最后团队选择了一个很普通,但又很核心的指标“利润”进行分析,毕竟不管是集团高管还是项目区域的决策者,乃至项目中的每一个普通员工,最关心的一定是“我能赚(分)多少钱”。分析成本控制成本,最终目的不就是为了多赚点钱吗?定下了分析的核心指标,繁复的“成本”大主题,就被简化成“利润和激励”的小主题了。     (2)推陈出新,融会贯通。在需求阶段,团队中有成员提出“利润这个指标很普通,而且都被说烂了,要不要换个新鲜的指标?”后来经过多次讨论,“指标很普通,那就让它带点特色,带点房地产的特色”。正如面食普通,带上北京的特色就成了炸酱面,带上武汉的特色就成了热干面。整个利润分析的思路,也可以运用到其他行业中,毕竟“一理通,百理融”。     (3)取长补短,2+3>5。团队一共有五名成员,每个成员都有自己的特长。队员梅伟从事地产信息化工作8年,对房地产成本业务较熟悉,就负责需求的分析和数据建模中数据体系的搭建;队员一切都值得的点子多,曾被戏称“对FineBI的熟悉程度比帆软大部分内部员工都高”,队员冥河和淡竹看着一切都值得修改仪表板,也从中学习到了很多FineBI的开发技巧;队员冥河说自己是个平平无奇的大男孩,实际上是个很努力的帅小伙,开发仪表板的时候为了找个合适的图表,把FineBI所有的图表控件都试了一遍;队员瞬间是队里的技术攻关,擅长FineReport和FineBI,是JS小能手,为人谦虚,技术问题找他,效果杠杠的!至于之前习惯一个人埋头苦干的队长淡竹,通过这次比赛发现了诸如“组织能力欠佳、协调能力欠佳、安排能力欠佳”的不足,并决定努力改进。     (4)坚持一下,终点就到。从队伍组建,到定作品的主题,接着到数据处理和开发,再到最终的作品完稿,迷茫有,困难有,最后还是坚持一下,咬咬牙,完成了作品。借用知乎上的一句话,作为心得体会,也是整个作品的结尾。         “觉得自己不行的时候,走在斑马线上,你我都是行人。”   作品结果展示:146531   146159作品视频讲解:Your browser does not support video tags. 编辑于 2021-7-3 21:03  
再见,再也不见
下次还会参加可视化挑战赛吗?答案是:不了!{:fange14gif:} 编辑于 2021-6-30 17:20
个人成就
内容被浏览94,705
加入社区4年363天
返回顶部