尽管企业越来越意识到元数据管理的重要性,但是在实际中很多应用并没有发挥应有的价值。
前不久与一个行业客户沟通,他提出让他们帮着总结一下元数据管理到底有哪些应用场景,他感觉元数据管理平台就是一种摆设呢?
说者无意听者有心。元数据管理是企业数据治理项目中的一环,其重要性不用多说。例如,
建立企业全域数据资产目录,防止数据冗余,提高数据抵抗风险的能力,还有支持数据探查和分析提高数据质量等等。
为什么,元数据管理平台会给IT人员一种“摆设”的感觉呢?这种感觉对供应商是一种悲剧,对企业更是一种资源的浪费。
冷静下来思考,一件物品成为“摆设”,就好比说一个演员是“花瓶”一样,最直接的原因是即便想用也用不上,用不了或用不好。
继续与客户沟通发现,有很多企业采购了专有的元数据管理工具,但是受限于各种原因,只能获取到部分元数据,无法形成全域元数据管理。
这是因为,目前国内企业的元数据管理多数是建立在新建系统或数据仓库项目的局部治理上,而不是企业级的元数据管理,特别是对于企业采购的套装软件的治理显得十分薄弱。
如果企业要将核心元数据仓库与套装软件产生的元数据进行匹配和映射,这意味着需要做大量的工作。所以,很少的企业愿意尝试在整个企业中使用和推广全域元数据。这在很大程度上限制了企业数据资产的共享或重用。
既然不是全域元数据,很多查询就无法得到理想的结果,所以久而久之,元数据管理平台只有有限的一群人在使用。
因此,元数据管理需要企业推行一个全域的、集中化的统一管理策略。
进一步与客户讨论。
既然知道全域元数据管理的价值了,是不是可以客服一下困难,力争采集到全域元数据,哪怕是手工采集。
但是,我们可能都忽略了手工元数据采集的难度。
一般情况下,企业元数据管理项目的实施中,需要花费很长的时间来完成元数据的梳理和定义、元数据适配器的开发、元数据的采集、元数据的维护等任务。
这些任务绝大多数是需要人工手动处理的,手动的元数据管理和维护十分烦琐且容易出错。这使得元数据管理的项目成本提高,交付的周期变长。不少人认为,这是典型的苦活累活。
如果只是苦活累活或许还能忍受,再加上复杂多变的数据类型,让元数据管理项目简直变成了沼泽泥潭。
为什么会这么说呢?客户道出心里的苦水。
随着越来越多的非结构化、半结构化数据渗透到企业的数字环境中,传统的元数据管理方式来采集、处理和检索元数据变得越来越具有挑战性,尤其是在处理复杂的数据关系时。
这么说吧,虽然人类很容易根据认知关联来判断两个或多个事物是否相关,但一般的元数据管理工具却很难做到。
怎么办呢,最终还得人工手动处理呗。看到这里,我们非常同情这些做元数据管理的了,真心不容易。
这还不算完,客户摇摇头说,元数据管理项目并非一次性项目,似乎永远做不了。
随着企业内部新数据的不断创建、数据的加工处理、存储和使用,企业的数据是在数据供应链中不断移动的。再加上新老数据不断抽取和转换,有关数据来源、血缘、转换过程、质量级别及与其他数据的关系,元数据也会随时变化。
企业希望将自动化算法和规则应用于元数据资产管理中,自动识别和生成元数据,从而最大程度地减少手动维护,从而确保元数据描述准确可靠。
客户感觉很无奈,前面好不容易构建企业全域元数据仓库,后面还要面对一个动态变化的元数据深渊。想想是不是有点崩溃的感觉。
如果不是企业对元数据管理最终价值有很高的评估,大部分企业会选择搁置、弃用。这也就不难解释,为什么有些IT人员觉得当前元数据管理平台就是个摆设的原因。
怎么元数据管理平台才不会沦为一个摆设呢?您有什么高见,欢迎发在评论区。