“数据标准”一词是我国在21世纪初提出的,最早用于银行业的数据治理。数据标准工作一直是数据治理的重要基础内容,但不同的人对数据标准有不同的看法。有人认为数据标准极其重要。只要制定了数据标准,所有与数据相关的工作都会按照标准进行。数据治理的大部分目标都会随之而来;有人认为数据标准用处不大,梳理了很多,建立了一套全面的标准,最后被束之高阁遗忘,几乎没有起到作用。
其实这两种观点都是片面的。事实上,数据标准化工作是一项系统而长期的工作,它既复杂又涉及广泛的问题。虽然它不能快速工作,不能快速解决数据治理中的大部分问题,但也不是完全没有用。最后只剩下一堆文件——。如果数据标准工作的结果如此真实,只能说明这项工作做得不好,没有落实。
首先要明确数据标准的定义。有关组织对什么是数据标准没有共识。结合对数据标准的各种解释,从数据治理的角度,尝试给数据标准下一个定义。数据标准是对数据的表达、格式和定义的一致约定,包括数据业务属性、技术属性和管理属性的统一定义;数据标准的目的是使组织内外使用和交换的数据一致、准确。
比如对一个企业来说,营销、财务、总经理办公室等不同部门都可能产生“利润率”这个指标,所以需要统一“利润率”的指标标准。如果有许多不同口径的“利润率”需要同时存在,就必须用不同的限定词来区分,比如销售利润率、成本利润率、产出利润率、资本利润率、人均利润率。对于每一个指标,必须明确说明其特有的业务含义、计算公式、数据来源和限定范围(如时间范围、业务范围),必须保证该指标标准能够被业务部门和技术部门引用,并由专门人员维护。
如何设置数据标准
数据标准的来源很多,包括外部监管要求、行业通用标准、专家实践经验等。同时,还必须考虑企业内部数据的实际情况。通过数据收集、调查访谈、分析评估,整理出业务指标、数据项、代码等。最后形成和制定适用于组织的数据标准,并公布和宣传这些标准。制定数据标准的过程如图所示。
需要注意的是,由于组织内部业务的复杂性,没有必要将所有收集的参考标准纳入数据标准的管理,数据治理总监必须知道哪些标准适用于组织中当前的业务和数据。
数据的标准分类
根据DCMM的分类,数据标准可分为以下几类:
业务术语标准参考数据和主数据标准数据元素标准索引数据标准
业务术语是对已批准和管理的业务概念的描述。需要通过流程定义如何创建、审批、修改和发布统一的业务条款,以促进组织内部的数据共享和应用,如贷款展期、收息和赎回等银行业务条款。
参考数据是用来对其他数据进行分类或编目的数据,可以简单理解为数据字典和数据可能的取值范围。比如中国的省份总是在一个固定的可选范围内,比如性别分类和价值范围,货币分类和价值范围。主数据是需要在组织中的系统和部门之间共享的核心业务实体数据。由于其重要的价值,主数据被称为企业的黄金数据记录,如多个系统共享的客户、商品等核心业务实体的数据。
数据元素是使用一组属性来描述其定义、标识、表示和允许值的数据单元,是描述数据最基本的单元。数据元素由三部分组成,对象类、特征、表示范围和数据类型的组合。
索引数据是组织在业务分析过程中,对某个目标或事物进行度量的数据。一般由指标名称、指标说明、时限、其他条件限制、指标值等组成。如企业的人均利润率和季度周转率。
版权声明:内容来源于互联网和用户投稿 如有侵权请联系删除