数据治理,这个词也是近年来的大热门。企业都知道数据治理很重要,它是数字化转型的基础。数据找不到、看不懂、不准确、不及时,都会成为企业数字化转型路上的重大阻碍。数据治理,就是用统一的数据管理规则,确保数据质量,让企业的数据清洁、完整、一致。
可是,到底怎么才能做到这些呢?各部门之间数据语言不通,形成“数据孤岛”,怎么才能打通它们?怎么把控数据的质量?怎么让数据能被用起来?
这些问题困扰着很多企业,华为之前也都遇到过。
华为和大多数非数字原生企业一样,数据方面的历史包袱很重,从2007年开始启动清洁数据,到今天也只能说是“刚刚及格”。不过,我们很确定,数据治理是企业数字化转型的“牛鼻子”,必须得牵好这根绳。
即便只是及格,华为的数据治理也看到了显著效果。我们建立起了华为数据管理体系,实现了对业务数据的自动采集,也打破了相对独立的数据库,制定了数据的标准,给企业带来了“数据湖”的全新体验。华为的智能数据平台也已经在各个业务中发挥不可替代的作用。
所以接下来,我就想跟你分享一下,华为公司面对那些数据治理难题时具体是怎么做的。
两个经验
我想先问你一个问题,企业的数据治理工作应该谁来做?你会发现,大多数企业会把它当成一个IT问题,所以就交给IT部门去做。但事实上,数据治理不是IT问题,而是业务问题。
为什么这么说?我来给你讲一个关于鸡蛋的例子。
欧洲市场上售卖的鸡蛋,每一个上面都有一个编码,相当于这枚鸡蛋的身份证号。那一串数字代表什么呢?第一个数字,说的是母鸡饲养的方式,后面跟着的是生产国的代码,再加上具体出产地区、农场的代码,就是这个身份证号了。
别小看这几个数字,它们背后的规则是很严谨的。
就拿第一个数字“母鸡饲养方式”来说,有0、1、2、3四个级别,0代表生态饲养,这背后是什么规则呢?养鸡的场地室内每平方米最多6只母鸡,每只母鸡还必须保证室外活动,每只至少要有4平米的活动区域。这还不算,农场饲养母鸡总数还不能超过3000只。符合上面这几条,这只鸡蛋的身份证才能被打上0这个数字。
1代表野外饲养,刚刚说的那些指标就降低了一些,母鸡的活动范围小了,农场养鸡总数多了。2代表地面饲养,指标就更低一些,母鸡是不能外出活动的,3代表笼中饲养。你看,从0到3,是有非常严格的相应的指标规定的,不是随意制定的标准。
而且,这个鸡蛋的身份证号,全欧洲通用。
为什么讲这个例子?我是想说,如果你把鸡蛋身份证号的工作直接交给IT部门,他们能完成吗?不能,因为他们技术再先进,也没有办法准确定义业务,必须是那些走访农场的一线业务人员,了解母鸡饲养环境,了解农场经营状况之后,才能制定出这样的数据标准,才能完成给鸡蛋打上身份证号这项数据管理工作。
回到华为的数据治理经验,我们的做法就是每一个数据,必须由对应的业务部门承担管理责任,而且必须有唯一的数据Owner。
什么是Owner?Owner最基本的职责,就是要确保关键数据被识别、分类、定义以及标准化,确保数据的定义在公司范围内是唯一的。
除此之外,数据Owner还要保证自己管理的数据的质量,要关注自己的数据服务,去满足公司其他部门对自己管辖的领域数据的需求。如果数据问题出现争议,Owner还负责进行裁决。
数据Owner对华为的数据治理来说,至关重要。这是华为在数据治理上最为宝贵的一条经验,是数据治理体系能够发挥作用的基石。
那么问题来了,数据Owner可能是销售好手,是谈判高手,但不懂数据,缺乏数据思维,在数据管理这件事上就会出现数据Owner水平参差不齐的情况,这又该怎么办?
华为的做法是为每一个业务部门都配备一个数据管理部,这十几个数据管理部的责任,就是帮助每个部门的业务主管从专业的视角,按规范去定义数据。
这样还不够,我们还有一个公司级的管控组织,由各个领域的首席专家组成的委员会,在每周的会议上专门对数据架构进行评审,单个业务部门定不了的事儿,可以通过委员会讨论确定下来。
这就和我们这一讲的第二个关键词有关了,“体系”。
我发现很多公司把数据治理当成项目来说,甚至会当成一场“运动”。大家都在说要打破数据孤岛,可同时又总是忘了,孤岛没有了,意味着数据被打通连接了,意味着数据是在各个业务系统中流动的,企业各个部门都要用。
那当然就不能从某个时间、空间的节点来进行单点管理,必须要建立一个完整的体系。
所以,华为的第二个重要经验就是必须建立起一套企业级的数据综合治理体系。
首先,华为公司有数据管理的总纲,由任总签发,明确了华为数据治理的最基本原则。其次,还有三大政策,包括信息架构管理政策、数据质量管理政策和数据源管理政策。
总纲和政策的具体内容,你可以在《华为数据之道》这本书里看到。这些是华为数据治理的顶层设计,能够帮助企业里的所有人统一认知。
更重要的是,它在向每一个人传递一个明确的信号:数据工作对华为来说很重要,数据治理我们是认真的。
除了这些原则政策,华为还成立了一个公司级的数据管理部,代表公司制定数据管理的政策、流程、方法和支撑系统。同时,华为的数据还有一套完整的IT系统,所有的数据资产都要在上面登记注册。
你应该听出来了,这是一个完整的管理体系。有管理的原则、办法,有不同级别的管理组织,还有登记管理,跟一间工厂对生产原料、生产设备的管理方法差不多。没错,道理是一样的。
数据是一种新的生产要素,是企业的重要资产,那就应该像实物资产一样,有成体系的管理办法,才能为数据治理的高效运行提供保障。
三个陷阱
业务Owner有了,管理体系也有了,面对庞大到无限的数据,到底该怎么做?每个企业的业务不一样,数据治理的进度也不一样,华为的经验能复制吗?
我们梳理华为的数据治理经验,有三个治理陷阱,几乎是所有企业都会遇到的,希望华为的经验能够帮助你避开它们。
第一个陷阱就是数据不分类。华为公司一开始的数据也是很笼统的,但逐渐我们发现,这样会严重阻碍数据治理。所以,我们把数据分成结构化数据、非结构化数据,内部数据、外部数据,等等。
企业千万别想着用“一招鲜”的方式去做数据治理,不同的数据,对数据精度的要求不同,治理的成本、方法也就不一样。
举个例子,企业的主数据是最为重要的一个数据类别,对它的精度要求就很高。主数据一旦出错,治理的成本就会高出很多倍。对华为来说,主数据就是客户信息、产品信息,它们会被各个部门经常、反复调用,如果出错了,就会牵连面很广,合同、订单、物流等等都会跟着出错,企业的损失就大了。
华为是怎么避免这种情况的呢?拿公司名称来说,为了避免错字、漏字,我们的方法是不让你输入,而是直接选择。华为应该是第一个在企业业务系统中接入国家统一社会信用中心平台的,中国所有的注册公司在里面都有确切的名称信息,使用的时候输入关键字就可以直接勾选,不会出错。
第二个陷阱,我们管它叫“埋头苦干”。因为我们发现,很多企业把数据治理天然当成累活、脏活,认为是要“放长线钓大鱼”,从头开始慢慢干,先不想收益的事儿。
华为数据治理的经验是,就要盯着价值干。
我们的数据治理,从一开始就盯着业务痛点,哪里问题最大,就从哪里开始。比如华为在世界各地做生意,各国的行政区划就是个大痛点,一出错就牵连很多其他系统,可能供应链收发货都会出错。
数据管理部就从这个痛点入手,把全球的行政区划都梳理清楚,需要用到的业务部门都从统一的地方调用,增强了数据在系统中的一致性,大大提升了一线业务人员的工作效率。
这些看得见的价值,不只是让从事数据治理工作的同事得到正反馈,也让公司其他同事都看到了数据治理带来的收益,对华为的数据治理而言,就会形成良性循环。
还有一个陷阱,我一说华为的经验你就明白了:宁愿慢一点,也要想好了再做。比如华为之前就出现过,制度没成熟,业务也没定义清楚,但IT冲上去做了开发和系统搭建,结果就是需要花好几倍的精力去清理数据。
这就是华为关于数据治理“三个陷阱”的经验。
还是回到我开头讲到的,数据治理,华为做到了“及格”,要想达到“优秀”,还有很长的路要走。华为已经建立了数据综合治理体系,构建了“数据湖”数据底座,也拥有了数据感知能力,数据安全合规的能力。
华为数据治理的未来,是在数据确权的基础上,构建起企业的数据生态,让数据真正发挥出作为生产要素的强大作用,成为华为真正意义上的战略资源。