经过一个多月的层层竞选,【阿里云数据湖 3.0 解决方案】从 130 多个方案中脱颖而出,荣获 InfoQ 2022 年度中国技术力量年度榜单《十大云原生创新技术方案》&《云原生十大场景化落地方案》双料大奖,这是头部技术媒体对阿里云存储的再一次认可。
近年来随着数据量的爆发式增长,以及数据作为企业核心资产的地位提升,各种各样的数据分析与处理的解决方案层出不穷,而数据湖无疑是其中最为火热的一个。阿里云作为业界领先的云计算公司,一直致力于通过云计算技术帮助客户更简单、更便捷地构建以数据为中心驱动业务发展与创新IT架构。因此,阿里云发布了数据湖 3.0 解决方案,支持了超过 10000+ 的客户在云上构建其数据处理与分析业务,我们也总结了客户对于数据湖方案的主要需求:
存算分离,资源灵活扩展
灵活分析,同时支持多种计算引擎
多级存储,通过生命周期管理来优化成本
安全可靠,需要企业级高可用,数据不丢不错
阿里云数据湖 3.0 解决方案通过下面的关键特性,充分满足了客户对于数据湖的需求:
实现云原生化的存算分离架构:基于阿里云 OSS 构建了数据底座,并全面兼容基于 HDFS 协议的 Hadoop 生态,使得基于 Hadoop 的客户无需改造适配,可以无缝地迁移到阿里云数据湖方案上来。同时,与高性能文件存储 CPFS 打通,在面向 AI 与 HPC 场景时让用户既能享受到对象存储的低成本、无限扩展等优点,同时也能满足业务的性能与协议兼容的诉求。
实现数据智能分层,成本优化最高可达 90%:阿里云数据湖存储提供了 5 种存储类型,分别是标准型、低频型、归档型、冷归档型和深度冷归档型,覆盖数据全生命周期,支持按照数据的最后修改时间和最后访问时间等条件设定指定目录或者标签的数据的生命周期策略。
实现多层级全场景的数据保护,业界最高可用性:数据作为核心资产,可用性与可靠性的要求越来越高,阿里云数据湖提供了多种不同层级的技术,比如版本控制、机柜机房冗余、同城冗余、跨区域复制、全链路数据校验等,实现了 99.995% 的可用性 SLA 以及 12 个 9 的可靠性,并且承诺在没有达到时进行全额赔付。
阿里云数据湖3.0解决方案两度登上InfoQ 2022年度榜单