干货:基于核心对象的一体化数据管理模式
2018年2月2日 浏览:149
“一个组织如果没有认识到管理数据和信息如同管理有形资产一样极其重要,那么它在新经济时代将无法生存”。在信息时代,数据被认为是一项重要的企业资产,需要进行有效的管理并逐步提升其质量,进而挖掘并发挥其价值,才能帮助企业领导者做出更准确的决策,保障企业的高效运转。
银行业是高度依赖数据进行决策的行业,数据管理理论研究与实践也走在了其它传统行业的前列。中国光大银行早在2008年就启动全行数据标准化工作,并于2012年开展全面数据治理工作,发布数据政策,规划数据体系,并制定数据体系建设任务蓝图,依照“以数据质量为核心、数据标准为基础、数据治理机制为支撑”的原则在全行范围内开展数据管理工作实践。
在数据管理理论研究与实践过程中发现,数据管理的各个领域既相互独立又互相依赖。数据管理的数据标准、元数据、主数据、数据质量等领域,都可以自成体系且复杂、庞大;同时各领域互为依赖,各种管理流程紧密关联。要全面、有序的在企业内部推动数据管理,是一项长期、艰巨且难以见效的工作。在有限的人力资源及数据管理基础下,达到推动数据管理工作实施、切实提升企业数据质量的目的,必须确定数据管理的核心对象并实施相应的工作。
本文通过分析数据管理各领域管理内容及相互关系,确定数据管理的核心对象,并阐述如何借助核心对象开展有效的一体化数据管理工作。基于核心对象制定数据管理的关键可行路径,提升数据质量并充分发挥数据管理价值。
一、数据管理的核心对象
在业务管理应用系统的实施过程中概念模型设计是一个非常重要的步骤,其方法是通过分析业务管理框架,抽象出实体以及实体之间的关系,即E-R图,其中E就是业务管理的对象,R是业务管理对象之间的关系。例如,在贷款业务的概念模型设计中,抽象的业务实体主要有贷款客户、合同(借据)、账户、交易、抵质押物等实体,所有的贷款业务流程及管理内容均借助这些实体进行流转与落实。
借助概念模型设计的原理,数据管理的核心对象是从数据质量管理、数据标准管理、元数据管理、数据架构管理、数据安全管理等领域涉及的业务流程中抽象出来的一组核心实体。我们将描述数据载体的最小单元称为数据元素,例如客户身份证号码即为一个数据元素。
围绕核心对象,对数据管理各个领域进行说明。数据质量管理是对各类的业务数据进行质量监测,持续发现数据质量问题并整改,其管理的关键内容对具体的数据元素指定的若干数据质量检核规则。数据标准管理的核心是对这些数据元素进行规范,在企业范围内实现业务与技术标准的统一。元数据管理的核心是定义并管理这些数据元素的业务描述、技术属性以及业务数据口径、加工路径等内容,促进及时、准确的了解数据含义及血缘关系。数据模型与架构管理则是将这些数据元素进行组合形成一个个业务实体,并明确这些业务实体的关系,同时确定这些业务实体在应用系统中的分布,从而有效支撑企业的业务运转。数据安全管理是明确这些数据元素的安全等级,并对相应的业务数据采取必要的安全措施。
从业务数据的角度看,可分为基础类数据与分析类数据。基础类数据是业务经营活动中产生的数据,根据行业经验和FS-LDM方法指导,可划分为客户、产品、客户资产、员工与机构、账户、营销活动、交易、渠道、财务和地理位置等数据主题,这些数据既彼此独立,又发生各种关联。分析类数据则是对基础数据进行加工汇总后用于经营分析决策的数据,指标与报表是分析类数据中两种典型类型。基于业务数据的分类,用于描述业务数据的数据元素表现为三种形式:一是基础类,描述信息项及相关的技术与业务属性;二是指标类,描述指标名称、约束条件、度量、维度、业务口径等内容;三是报表类,描述报表的行、列、显示内容以及各个单元格的取数口径等内容。
根据以上分析,业务数据的数据元素就是对数据管理各领域中所管理的核心数据元素进行抽象,进而形成数据管理的核心对象。为更明确的表达核心管理对象的含义,我们在这里分别称为为基础数据元、指标数据元及报表数据元。核心管理对象之间的关系,以及与数据管理各领域的关系如下图所示:
图1数据管理之核心对象
(注1:伴随业务需求的复杂和数据体系的发展,数据应用层次将逐步从描述阶段过渡到挖掘阶段。报表数据元重点对应描述阶段的数据应用,在挖掘阶段还会包括分析模型、挖掘模型等管理数据元。无论如何,整体数据管理模式类似,因此不再进行额外说明。)
二、核心对象与数据体系
基础数据元、指标数据元与报表数据元是数据管理活动的核心实体,借助核心实体的属性及实体之间的关系,可以帮助我们清晰的描述数据管理各领域活动以及跨领域之间的关联关系,打通数据管理各个环节并使之成为“有机、整体的”数据管理流程。下文将逐一列举重点流程,阐述如何通过核心对象打通各领域之间的关系以支撑数据管理工作。
元数据管理:(1)这三类数据元实体内的内容均为对业务数据的属性描述,是元数据管理的核心内容。(2)构建的报表数据元、指标数据元、基础数据元之间的关系数据,是血缘分析和影响性分析的重要基础。(3)通过基础元数据与数据字典之间的关系,数据管理各领域工作连接起来并深入到具体业务和系统中。
数据质量管理:(1)针对基础数据元设定检核规则,借助基础数据元与数据字典的关联关系,可以对所有应用系统中的同一信息项进行监测。如对“客户名称”设定合法性检查规则后,可对所有有“客户名称”这一字段的系统及相应表内数据进行检查。 (2)针对指标数据元设定检核规则,并通过指标数据元与基础数据元的血缘关系来确定影响指标数据质量的基础数据元,并可找到对应的系统、表及字段。例如检测发现两个指标数据不一致时,可通过分析指标的加工口径、数据来源等找到不一致原因。(3)数据质量问题整改时,可通过具体数据元信息,找到与问题数据有关的业务系统、业务品种,并关联到相关责任部门,从而开展分析、整改、监测工作。
具体的数据质量改进与监控流程如下:
图2:数据质量改进与监控流程
数据标准管理:(1)通过基础数据元与标准定义关联,可自动生成检核规则,检查各系统对数据标准落地执行的情况,例如可根据数据标准中的证件类型代码生成证件类型有效检核规则。(2)定期对指标数据元进行重检,对口径相同或相似的指标数据元进行标准化定义,以便在全行范围统一业务口径及技术口径,保证数据一致性。
数据架构与模型管理:(1)利用基础数据元与数据字典的映射关系直接生成数据分布现状,并可看出存在的同一数据多头存储、同一字段在不同系统定义不一致等对数据共享、数据整合有影响的各类问题。如客户规模存在多个系统,但业务定义、长度等均不一致。(2)通过不断完善各类数据元中的具体信息项,并对其合理分类以及构建各类之间的关系,可帮助快速建立企业级的数据模型,并对数据架构管理提供支持。
数据安全管理:(1)通过对基础数据元和指标数据元的安全分级与分类,并明确相应的数据安全处理要求。(2)通过数据字典与基础数据元映射关系实现数据安全要求在应用系统的落实。(3)通过指标数据元与报表数据元的关系,可落实报表数据的安全要求。
三、结束语
综合基础数据元、指标数据元、报表数据元这三个数据实体及其之间的关系,构成数据管理的E-R图并作为数据管理的核心对象,对数据管理各领域业务流程发挥核心的支撑作用。
通过分析数据管理核心对象及其关系描述,将数据数据管理各领域进行有机连接,最终建立全面、完整的一体化数据管理机制与流程。同时,以核心对象为管理目标,配套建立灵活、功能强大的数据管理平台,使数据管理工作迅速走向自动化和精细化,为实现数据管理的量化管理奠定坚实基础。
作者刘巍,中国光大银行信息科技部,多年数据治理与管理经验。
—————————————————————————————————————
本公众号为人工智能、大数据企业、求职者免费发布招聘、求职信息,有需要者请添加编辑微信:snogangel。
本公众号现面向人工智能和大数据爱好者征稿(无稿酬),如果您想让您的文章、观点分享给更多人工智能和大数据爱好者,请发邮件至351745027@qq.com。
欢迎扫码添加小编,加入人工智能和大数据公众号读者交流群,探讨、分享、交流!交流群每周会邀请行业专家进行在线分享!