【2506】+【3316911】
整体学习中,由于时间很赶,有些功能还是运用的不是很熟练,数据处理还存在很多盲点,但这并不比影响我对BI学习后的震撼,原来繁杂的数据,我们需要几天处理,现在借助软件,我们仅需要极短的时间就可以完成。未来的工作方式就是熟练掌握运用AI软件,效率极高的人。
在这里记录一下,从拿到原始数据到产出最终的可视化仪表盘,主要需要经历以下几个步骤:
1. 确认仪表盘与图表需求 首先要明确最终需要哪些数据仪表盘和图表展示。这样才能倒推需要准备哪些数据,指导后续工作。
2. 原始数据准备与预处理
数据来源:通常是来自业务的非结构化数据,比如 Excel 文件。
数据预处理:如果有条件,最好进行一些预处理,例如建立标准格式的日期字段。这一步能让后续的数据清洗更加高效。
3. 数据维度与结构设计 这一步有点像设计关系型数据库的表结构和字段,核心在于思考如何存放数据才能让整个模型更高效、直观,并且易于后续使用和维护。
基本原则:将所有业务数据(如订单、流水)存放在“事实表”中,然后用“维度表”(如日期、产品、门店)来进行索引。
具体制作:基于设计好的结构,进行数据清洗和整理,最终制作出具体的事实表与维度表。
4. 建立表间关系 将负责存放核心数据的“事实表”与提供不同分析维度的“维度表”建立“一对多”的关系。这是实现图表动态筛选和交互的基础。
5. 制作图表 相比前面的步骤,这一步其实简单很多。我用的 fine BI 提供了非常方便且丰富的图表组件,通过拖拽操作,将对应的数据字段拖入图表,就能够实时展示结果。
目前项目的主要功能虽然已经实现,但还有一些地方需要进一步学习和完善:
多事实表的结构: 因为项目需要一个关于“库存周期”的图表,这就要求我再单独建立一个记录库存周期曲线的“事实表”。如何处理和应用多事实表的模型是我下一步要学习的。重复实践以加深理解: 打算之后再独立地把整个流程重新做一遍,巩固和加深理解。