关于数据资产目录的架构建立,可参考业务流程架构,如果企业还没有建立流程架构,可以按企业业务板块,形成数据资产架构的最上层——数据主题域,比如研发或IPD主题域、营销或LTC主题域、人力资源主题域。
再从流程或业务流中识别和归纳数据主题域的下一层——数据域。数据域一般是核心业务流程的按阶段点或流程功能模块,比如价格管理、商机管理、合同管理、供应商管理。
再下一层是具体的业务对象,承载业务运作和管理业务的重要信息,是业务领域涉及到的重要的事、物、人。比如客户基本信息、报价单、产品数据。
业务对象下一层是对业务对象进行描述的数据项,一般也称之为数据实体,比如报价信息、机会点信息、合同信息。而且一般每个信息都包括两个数据项表头信息(出货单表头)和内容信息(明细行),反映数据信息实体的最小粒度。
最下一层是数据属性,是用来描述数据项的维度信息、属性信息和数据特征信息,反映数据管理的最小粒度。
数据资产目录是数据架构的基础,它列出了企业所有的数据资产,包括数据的来源、类型、格式、用途等。数据资产目录有助于企业清晰地了解自身的数据资源,为数据的利用和管理提供依据。
自定义的数据资产目录模板,将数据按照层级结构汇总,检查和完善数据属性,经过评审确认形成企业数据资产目录。一旦有新的业务流程、新的业务系统、新的流程表单,以及涉及数据的变更时,需要及时更新数据资产目录。
数据资产目录是数据管理层面的输出,如果需要进一步将数据资产在应用系统或数据平台管理落地,再结合数据结构、表结构、数据存储的物理层级,形成数据字典。数据资产目录主要是面向业务人员和数据管理人员,数据字典一般面向数据管理人员和开发实施人员。
下面是数据资产目录实例:
L1~L2业务数据主题域
下面以最常见的研发和营销数据主题域为例,实例如下:
(1)研发数据主题域
(2)营销数据主题域
数据资产目录管理包括目录维护及目录安全权限管理,目录应用场景有数据资产的可视化应用、数据资产目录服务、数据分析应用场景等内容。
数据资产目录主要有如下 4 个价值。
(1)统一数据管理
企业的 IT 团队无法为越来越多的业务人员和数据分析师提供所需的所有数据,导致业务人员和数据分析师无法了解企业现有的数据集数量、数据集的内容以及每个数据集的质量和实用性。他们花费太多时间来查找和理解数据,经常重新创建已经存在的数据集,经常使用不正确的数据集,导致分析不充分和不正确,这也是精益数据方法所提到的浪费的核心根源。
所以帮助业务人员和数据分析师实现自助式数据生产是数据治理的根本,为此,要先实现数据的统一管理。
数据资产目录应该是企业唯一且统一的数据资产管理工具,也是企业单一可信的数据出口。所以,数据资产目录应该清晰、结构化地将所有的数据资产按类别或标签进行管理,让所有的用户能够在一套数据体系下、一个平台上获取、分析和利用数据,让数据更容易被理解,从而减少错误,降低风险,提高数据分析效率,从而实现数据自助服务和分析。
(2)自助式探索分析
数据资产目录应该对不同角色的用户提供对应的数据探索、浏览和分析的功能,从而让用户方便地根据业务需要,用自己熟悉的方式浏览、查找、探索数据。
(3)安全合规保障
数据资产目录对所有的数据、数据产品和服务进行分级、分类、分权限管理,根据不同的身份对用户授权,满足企业的数据安全合规的要求。
(4)高效协同生产
数据资产目录是所有用户访问数据的唯一入口,要让所有用户能够高效协同,比如提供统一的知识库、数据自服务、数据标签以及协同开发等功能。
在没有数据资产目录的时候,企业的数据生产全链路如下所示。
由于没有统一的数据管理工具,所有的数据相关的文档、数据产品和数据都分散在企业不同的系统中,所以当需要数据的时候,工作人员就只能通过分散的文档和各种沟通会议来获得数据,然后评估数据是不是完整,再进行数据的探索和理解。如果数据不准确或者不是所需要的,则又要回到原点去寻找数据。
在数据处理和数据分析阶段,相关人员如果需要更多的数据,就要寻找更多的数据文档和组织更多的沟通会议。从寻找数据开始,到数据分析结果出来,再到数据产品构建好,这个过程费时费力,并且新的数据分析结果和数据产品又变成了数据孤岛,当别人利用数据的时候依然需要沟通。这样的过程低效、随机性很大,并且很容易导致数据质量问题。
当企业构建起数据资产目录后,数据生产的全链路就形成了,如下所示。
数据资产目录是企业所有数据产品和元数据的管理工具,能够集中地注册、管理数据资产,全面地监控数据生产的过程,让用户对数据进行探索分析,把数据治理的工作分散融入数据生产全链路中。这样从寻找数据、获取数据、评估数据、理解数据、数据处理、分析数据,到最后数据结果和数据产品的分享,所有工作人员都可以实时通过数据资产目录协作,而且所有的操作都会被记录下来,不同人可以对数据进行点评、打标签,分享自己对这个数据的理解,从而帮助其他人更好地查找和利用数据。
数据资产目录的目标是提供快速且低成本的方式来盘点、分类和组织分散且杂乱无章的数据资产,让所有人用同一个工具进行数据的查找、访问和协作。数据资产目录帮助企业构建统一的一站式数据治理能力,是精益数据治理的典型实现方式。