更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群
随着数仓及研发技术团队维护的数据量大、资源使用量大、成本越高、优化压力越大。如何主动发现无效或低效使用的资源,并且可以周期性高效的进行主动治理变为团队治理目标核心诉求之一。在传统情况下,资源优化多数依靠团队经验和人为意识管控。
目前,火山引擎大数据研发治理套件 DataLeap 提供资源大盘结合健康分监测,针对健康分大盘下钻到有问题的资源进行主动资源优化,明确有问题的资产库,以及资源消耗影响最大的个人或团队,主动进行催办,达到高效利用服务资源目标,有效降低企业资源成本。
对于治理负责人角色,在成本治理环节,目标是根据资产的整体情况降低存储和计算资源,从而降低管理成本。火山引擎 DataLeap 资源优化规则库可灵活丰富根据业务当前治理规划需要,按需选择适合当前整体治理策略;对于治理接口人角色,可以通过火山引擎 DataLeap 圈定自定义规则,如数据生命周期有效时间未设置、数据表长时间未被查询等。以达到提升资产整体健康分、节约存储的目的。
同时,对于长期未做治理和有治理需求的团队,火山引擎 DataLeap 数据治理平台会提供自动定期提醒能力;最终,再通过治理大盘验收资源优化的效果是否符合预期,将优化规则经验通用规则沉淀下来,可为其他团队直接引用。
火山引擎 DataLeap 资源成本治理重点功能:
火山引擎 DataLeap 为企业提供了统一的工具和规范,帮助企业根据业务现状开展相关资源治理
-
存储治理:支持查看存储资产明细情况,并提供公共规则及治理建议,可快速定位治理主要侧重点
-
计算治理:可对任务资源使用详情,队列资源合理性,计算健康分进行评估。治理接口人可直接使用平台公共规则如任务连续失败、产出表为空、产出表无热度、资源申请不合理等优化项,同时平台提出参数及推荐优化建议
-
诊断评率:平台提供的三种诊断频率,可根据实际业务需求进行配置。指定方案规则的诊断频率及结束时间
诊断一次:诊断规则立即执行,将会立即对治理域的资产进行规则扫描,后续不会再运行
每日诊断-最新结果:方案在结束日期前,每日根据规则运行,方案页面展示每日运行的最新结果。历史运行结果可在历史版本中查看,不与历史诊断结果累加。
每日诊断-累计结果:例如 1 月 1 日近 30 天没有访问,扫描出资产表 A。扫描后表 A 被查询了一次,第二日方案按时运行后,表 A 还会展示在列表中,起到常态化监控治理效果。在资源优化同时,极大释放人力成本。
火山引擎 DataLeap 资源成本治理优势:
-
低门槛自治:全生命周期的成本治理
-
低门槛优化:测算治理收益 ,存储计算有效期治理,热度监控
-
自助分析定位优化方向:对成本资源组成进行分析,快速定位优化方向
-
自主复盘:效果复盘,治理成果自主查看 ,支持最细到表与个人查看治理收益
重视成本优化有助于从全局视角统筹数据资产,不仅提升了治理过程中的协作效率,还能做到团队自驱动自执行,从而舍弃复杂的评估和执行体系。除了上述治理能力,火山引擎 DataLeap 还可以提供数据集成、数据开发、运维、资产等能力,帮助用户提升数据研发效率、降低管理成本,加速推动企业的数据化转型,目前已经应用于泛互联网、制造、新零售、汽车等领域。