大数据时代的到来,让政府和企业看到了数据资产的巨大价值,一边忙着出台激励政策,一边忙着探索应用场景、商业模式,建设技术平台。
而在建设大数据版图的同时,数据治理是无论如何都不能忽视的一环。如果没有数据治理,数据质量就没有保证,大数据的挖掘和应用就更无从谈起了。
数据治理看上去很高大上,其实就那么回事,我们没必要把数据治理想得那么复杂那么难。做好数据治理其实只需要做到两点:承上和启下。
呈上是指,与信息化类似,数据治理也是一把手工程,需要由高层来推动,协调各业务部门和技术部门的配合,否则数据治理就无法落地;
启下是指,技术部门和业务部门要对数据足够重视,数据治理是一个系统性工程,最终离不开技术人员的实施落地。
数据治理,到底是治理什么数据呢?
关于数据分类,每个人都有自己标准,这里我列举一种常见的分类方式,大家不必纠结。
通常来说,我们会把数据分为:主数据、交易数据、参考数据、元数据和统计分析数据(指标)。
我们对数据分类,不是为了分类而分类,而是在对每一类数据进行数据治理是,关注点、方法和效果都不一样,需要区别对待。
下面简单谈一下对各类数据的一个理解。
主数据:关于业务实体的数据,描述组织内的“物”,如人、地点、客户、产品等。通过上帝视角对企业主要的“人”和“物”有个全局把控,为其建立现实和数据领域的唯一标识。
交易数据:即过程数据,描述组织业务运营过程中的内外部时事件或交易记录的数据。如:销售订单,通话记录,供应商名单等数据。交易数据是BI分析的基础
参考数据:用于将其他数据进行分类或者标记整理的数据,光点科技成为数据标准。
元数据:即描述数据的数据,帮助理解、获取、使用数据,分为技术元数据、业务员数据等
统计分析数据:即对企业业务活动进行统计分析的数值型数据,也就是指标,如客户到达数等。
那什么是数据治理呢?
关于数据治理,不同软件厂商和咨询公司给出的定义都不同,但本质上是相似的。我这里就用光点科技多年来数据治理的经验给一个通俗的解释。
数据治理是一种带有强烈目的的实践活动,它以数据为核心对象,涉及政府、企业、个人等各类参与主体,覆盖数据全生命周期中的各种过程和状态,利用手段和活动释放、保护数据的价值。
数据治理是对数据资产进行规划、监控、执行、管理的一种带有强烈目的性的实践活动,目的是释放并保护数据的价值。
下面聊聊我个人在光点科技服务客户上的实践体会:数据治理和数据管控缺一不可,治理在前、管控在后。
数据治理针对的是存量数据,是个由乱到治、建立规范的过程;而数据管控针对的增量数据,是个有章可循,行不逾矩的约束。
做数据治理有什么好处?
我们做一件事,必定有这各自的目的。通常来说,企业做数据治理,目的无外乎以下几种:
提升数据质量
为共享数据建立清晰的决策规则和决策流程
提升数据资产的价值
提供解决数据问题的机制
促进IT和非IT人员共同参与决策
促进部门和业务单元之间的协作和相互依赖
为共享数据建立共同责任制
总的而言,数据治理主要有三个目的:保证数据的可用性、数据质量和数据安全。
因为你的企业面临很多数据问题,所以数据治理是一个绕不过去的坎儿。快别去想“要不要做?为什么要做?”的问题了。
遇到问题,解决问题,就行了!
简单的事情,简单做。
真没那么复杂。