在日新月异的大数据服务不断涌现的今天,我们可以看到作为数据基础底座的存储服务面临了越来越多的复杂环境和需求的挑战。无论是离线大数据存储,还是在线 KV 类存储,都服务了越来越多的数据应用场景。存储业务形态的多样化,催生了各种存储体系的演化,如字节跳动的超大规模大数据存储的应用实践,给我们带来了在数十 EB 的数据规模下,HDFS 架构上演进的一些新技术特性,通过多机房架构、分级存储以及有效的数据调度等,降低存储成本、保障数据的使用效率和安全。
数据存储应用往往也和上层计算有较多的联动,存算分离是一个比较前沿的演进方向,数据的量和业务的复杂性会对架构演进提出非常高的要求和挑战,我们可以听听 B 站日志系统在降本增效的大背景下是如何解决这些问题的。
图存储是一个非常有技术挑战的存储产品,在一些特定场景中它是不可或缺的,我们特地邀请了小红书的相关技术负责人来为我们分享图存储实践中如何应对万亿级社交关系带来的挑战。
对于在线应用来说,数据服务的稳定性和可用性至关重要,稳定性不仅包括了服务本身的可用性,也包含了数据时延的稳定性。关于这个方向,我们不妨听听来自字节跳动的 KV 存储在解决大规模多地域部署问题和挑战的最佳实践。
专题:数据存储应用实践
出品人:冯玮 字节跳动 大数据存储技术负责人
个人介绍:字节跳动大数据存储技术负责人,在分布式存储领域有 10+ 年技术与产品经验。目前负责字节跳动大数据存储产品的研发和运营工作。主要负责产品及方向包括 HDFS(自研),数据湖(存储)和火山大数据存储加速产品等,涉及数十 EB 数据的管理和治理。
演讲日程
毛琦 小红书基础架构存储负责人
个人介绍:先后在 EMC、华为、阿里云从事存储产品的核心开发和架构师角色,目前在小红书负责 NoSQL KV 数据库、图数据库、NewSQL 数据库的研发和架构演进。
演讲题目:小红书面对万亿社交网络关系的图存储实践
演讲提纲:小红书是一个社区属性为主的产品,它涵盖了各个领域的生活社区,并存储海量的社交网络关系。为解决社交场景下超大规模数据的更新与关联读取问题,并减少数据库压力和成本,我们自研了面向超大规模社交网络的图存储系统 REDtao,大大提高了系统稳定性,它将缓存和底层数据库封装起来,并对外提供统一的图查询 API,实现了访问收敛,同时在缓存中实现了高效的边聚合。
听众收益:图存储系统在社交网络关系的应用和收益。
田勇 字节跳动 HDFS 产品技术负责人
个人介绍:字节跳动 HDFS 产品技术负责人,参与过文件、对象、NoSQL 等多个分布式产品研发,在分布式存储领域拥有 10+ 年技术经验。之前在百度负责 Mola/Table 等 NoSQL 产品的研发。当前主要关注字节 HDFS 产品的技术架构演进、成本优化以及数十 EB 的数据治理等方向的工作。
演讲题目:EB 级存储规模 HDFS 在字节的探索与实践
演讲提纲:HDFS 是字节内部历史最久远、体量最大的存储系统,存储规模达到数十 EB,运营时间超过 10 年。支撑了大数据、机器学习、Flink/AP/MQ 等多种近离线场景。伴随着字节系业务的发展历程,产品和技术经历了一系列的演进,形成了字节独有的特色:包括采用单一大集群多机房部署形态,通过 C++ 重构版的 NameNode/DataNode 解决社区版存在的性能和启动效率等问题。构建分级存储体系,结合上层生态的数据访问范式管理数据在多级存储、跨AZ间的流动,降低数据存储成本,提升数据访问效率。此外,还进一步结合机器学习来识别用户的误删行为,提升数据安全保障等。本次分享主要围绕着字节 HDFS 产品在以上工作中的探索和实践展开:
-
字节 HDFS 的新特性;
-
多机房架构挑战;
-
分级存储实践;
-
数据安全防护实践
听众收益:
-
字节 C++ 重构版本的 NameNode/DataNode 引入哪些新 Feature?
-
如何结合大数据生态实现海量数据精细化治理来保障业务稳定性,达到成本最优?
-
多机房架构如何设计?如何解决跨机房访问带宽瓶颈?
-
如何结合 AI 实现数据误删保护?
徐明敏 bilibili 基础架构微服务负责人
个人介绍:2011年毕业,先后在阿里、微软、触宝、字节跳动以及B站工作,主要从事分布式缓存/分布式存储/服务治理/可观测等相关工作。加入B站之后作为微服务方向Leader,主要负责服务治理/消息队列/负载均衡/可观测性等方向建设。个人对分布式系统,性能优化以及新硬件应用比较感兴趣。
演讲题目:B站日志平台架构演进
演讲提纲:主要内容为B站的日志平台如何从1.0走到现在3.0的存算分离/离在线统一架构的。其中遇到了哪些困难,在架构上做了怎样的抉择和思考,如何在有限的人力以及资源下完成降本增效目标。
听众收益:
-
基于B站团队现状如何做技术选型和规划
-
B站日志平台是如何实现离在线统一的
-
B站日志平台是如何一步一步贯彻降本增效的
刘健 字节跳动 Abase 产品研发负责人
个人介绍:字节跳动 Abase 产品研发负责人,在分布式存储领域拥有 10+ 年技术经验。曾在百度参与 Mola,Aries 等存储系统的研发工作。当前主要关注超大规模的 NoSQL 数据库在稳定性、成本、数据生态、多地域支持等方向的工作。
演讲题目:Abase2:全球 NoSQL 数据库中的 CRDT 支持实践
演讲提纲:Abase 是字节内部使用最广泛,体量最大的 NoSQL 数据库之一,峰值 QPS 达到百亿级,数据规模达到 EB 级。支持了推荐、搜索、广告、头条、抖音、电商等几乎公司所有业务的在线 KV 存储场景。随着业务的发展,越来越多用户需要在不同物理地域间部署 Abase 集群及同步数据解决就近读写、容灾和资源瓶颈等问题;同时由于大量用户通过 Redis 接口访问 Abase,我们设计实现了 Abase2 的多地域部署架构,并且提供主要 Redis 命令的 CRDT 支持,因此本次分享将围绕 Abase2 在全球部署支持方面的工程实践展开。具体内容包括:
-
字节多地域部署的需求和挑战
-
Abase2 的架构介绍
-
CRDT (conflict-free replicated data type)解决方案介绍
-
String/Hset/Zset 命令的 CRDT 支持工程实践
听众收益:
-
如何解决数据库跨地域部署/同步/一致的需求
-
如何实现 Redis 主要命令的 CRDT 支持
-
如何在支持 CRDT 的同时实现高性能
-
如何在多地域部署过程中同时做到成本优化