详解BI的功能架构和技术架构

楼主
学无止境,精益求精
在开始详细介绍BI的功能架构和技术架构前先送大家一份BI项目的搭建指南。
本指南介绍了一套相对完善的企业BI项目搭建流程,系统回答了企业BI项目该做什么、该谁来做、该怎么做,以及如何在企业内把BI项目成功运营起来从而产出实际业务价值等问题。
企业BI项目建设不易,希望我们在本指南的经验总结对您有积极的意义。

BI 的功能架构

按照从数据到知识的处理过程,BI 的功能架构分为数据底层、数据分析和数据展示三个层级。其中数据底层负责管理数据,包括数据采集、数据 ETL、数据仓库构建等环节,为前端报表查询和决策分析提供数据基础;数据分析主要是利用查询、OLAP 分析、数据挖掘以及可视化等方法抽取数据仓库中的数据,并进行分析,形成数据结论,将数据转化为信息和知识;最终通过数据展示层呈现报表和可视化图表等数据见解,辅助用户决策。

具体地,对应到企业的决策与经营环节,BI 的运作流程如下图所示。首先从来自 ERP、OA、财务等不同业务系统以及外部的数据中提取出有价值的部分。接着进行数据的处理与存储,经过 ETL、数据清洗等过程,合并到企业级的数据仓库里,从而得到企业数据的全局视图。最后在此基础上利用合适的查询和分析工具、OLAP 工具等对其进行分析和处理,将数据信息转变为管理驾驶舱、中国式复杂报表、自助分析、多维分析等数据应用,从而为企业管理者和运营人员的决策过程提供支持。

BI 的主要技术

对照 BI 的功能架构,BI 的主要技术可以分为展示类、分析类和支撑类三个层级。

1、展示类技术

最核心的是展示类的数据可视化技术,抛开企业数据量级的不同和深度分析的需求,数据可视化技术能够满足最基本的 BI 目标,即将数据转化为信息并辅助决策;数据可视化的具体形式又分为报表和可视化图表两大类,其中报表是我国大多数企业目前的主要数据展示形式。

数据可视化旨在借助于图形化手段,清晰有效地传达与沟通信息。其基本思想是将数据库中每一个数据项作为单个图元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。例如柱形图、折线图和饼图等一些基础的图表就可以直观地展示出数据。当数据较为复杂时,可以通过复杂图表搭配多样的交互效果来将数据直观化。

2、分析类技术

其次是 OLAP、数据挖掘等分析类技术,能够基于现有数据提供更深入的洞察。数据挖掘技术需要一定数据量的支撑,而企业不一定要等到数据量足够大时才能应用 BI,结合我国企业的信息化现状,数据挖掘目前并不是 BI 系统的关键技术需求。

联机分析处理(OLAP,Online Analytical Processing)主要关注多维数据库和多维分析。OLAP 委员会对联机分析处理的定义为:使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互的存取,从而获得对数据更深入了解的一类软件技术。

3、支撑类技术

最后是支撑类技术,包括 ETL、数据仓库、元数据管理和大数据技术等,用于管理繁杂的、不断增长的企业数据,为整个 BI 系统体系提供持续的、强力的、稳定的支撑。数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。数据仓库的出现,并不是要取代数据库。大部分数据仓库还是用关系数据库管理系统来管理的,数据库、数据仓库相辅相成、各有千秋。

ETL 是 Extract-Transform-Load 的缩写,用来描述将数据从来源端 经 过抽取(Extract)、交互转换(Transform)、加载(Load)至目的端的过程。它是构建数据仓库的关键环节,数据仓库主要是为决策分析提供数据,所涉及的操作主要是数据的查询,所以 ETL 过程在很大程度上受企业对源数据的理解程度的影响,也就是说从业务的角度看数据集成非常重要。

大数据(Big Data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。顾名思义,大数据技术就是收集、存储、处理、分析大数据的相关技术。当前大部分企业已满足大数据的 5V特征,因此,BI 引入大数据技术,旨在从大数据中快速获取价值。

元数据(Metadata)又称中介数据、中继数据,用于描述数据属性的信息,是描述数据的数据(Data about data)。其使用价值主要在于在识别资源、评价资源、追踪资源在使用过程中的变化、实现简单高效地管理大量网络化数据、实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。由于元数据也是数据,因此可以用类似数据的方法在数据库中进行存储和获取。

本文节选自《商业智能(BI)白皮书 4.0》,本白皮书详细阐述了BI的概念(包括价值、功能、技术、类型)、应用(包括蓝图、工具选型、应用场景)和趋势(包括行业市场、产品方向、功能技术)感兴趣的可以下载~

分享扩散:

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表