系统架构设计师教程(十九)大数据架构设计理论与实践

news2024/11/19 17:47:39

大数据架构设计理论与实践

  • 19.1 传统数据处理系统存在的问题
  • 19.2 大数据处理系统架构分析
    • 19.2.1 大数据处理系统面临挑战
    • 19.2.2 大数据处理系统架构特征
  • 19.3 Lambda架构
    • 19.3.1 Lambda架构对大数据处理系统的理解
    • 19.3.2 Lambda架构应用场景
    • 19.3.3 Lambda架构介绍
    • 19.3.4 Lambda架构的实现
    • 19.3.5 Lambda架构优缺点
    • 19.3.6 Lambda与其他架构模式对比
  • 19.4 Kappa架构
    • 19.4.1 Kappa架构下对大数据处理系统的理解
    • 19.4.2 Kappa架构介绍
    • 19.4.3 Kappa架构的实现
    • 19.4.4 Kappa架构的优缺点
    • 19.4.5 常见Kappa架构变形
  • 19.5 Lambda架构与Kappa架构的对比和设计选择
    • 19.5.1 Lambda架构与Kappa架构的特性对比
    • 19.5.2 Lambda架构与Kappa架构的设计选择
  • 19.6 大数据架构设计案例分析
    • 19.6.1 Lambda架构在某网奥运中的大数据应用
    • 19.6.2 Lambda架构在某网广告平台的应用与演进
    • 19.6.3 某证券公司大数据系统
    • 19.6.4 某电商智能决策大数据系统


19.1 传统数据处理系统存在的问题

在信息爆炸时代,数据量呈现指数级增长,对数据管理系统提出了更高的要求。传统数据库系统在处理大量数据时显得力不从心,出现了各种性能瓶颈。为缓解这些问题,出现了如异步处理队列、数据分区等技术。尽管如此,传统架构在面对持续增长的数据压力时仍显不足,无法有效处理高并发请求和数据的实时性需求。

在这种背景下,大数据技术应运而生,其核心在于处理海量数据的高效存储、快速查询和分析。新技术如Kafka、Storm、Spark等,以及基于Hadoop的Map/Reduce管道,提供了更为灵活和高效的数据处理方式,尽管如此,这些技术仍面临数据处理时效性和系统复杂性等方面的挑战。

大数据系统架构设计理论的提出,旨在为处理海量数据提供有效的解决方案,确保系统性能在可接受的范围内。这包括数据的分布式存储、计算能力的弹性扩展、数据的实时处理和分析等方面。通过这些设计理念和技术的结合,可以更好地满足现代商业对于数据处理速度和价值的需求。

在这里插入图片描述
在这里插入图片描述

19.2 大数据处理系统架构分析

19.2.1 大数据处理系统面临挑战

大数据时代带来的挑战主要包括三个方面:

  1. 数据处理挑战:大部分数据(约85%)是非结构化或半结构化的,存在于社交网络、互联网和电子商务等领域。这些数据的不确定性表现为高维、多变和强随机性。因此,需要利用信息技术等多学科交叉来研究和处理这些数据,包括将非结构化数据转换为多维数据表或其他数据模型。
  2. 大数据复杂性与建模:大数据的复杂性及其不确定性特征的描述和建模是实现大数据知识发现的前提。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1417298.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AcWing 895. 最长上升子序列(DP序列模型)

[题目概述] 给定一个长度为 N 的数列,求数值严格单调递增的子序列的长度最长是多少。 输入格式 第一行包含整数 N。 第二行包含 N 个整数,表示完整序列。 输出格式 输出一个整数,表示最大长度。 数据范围 1 ≤ N ≤ 1000 , …

RS485Modbus转Profinet网关在工业现场的应用优势

在工业自动化领域,RS485Modbus转Profinet网关的应用愈发广泛,其优势在于简化系统架构、提高通信效率、降低成本和便于维护。接下来,本文将详细介绍RS485Modbus转Profinet网关在工业现场的应用优势、实施方案和注意事项。 应用优势&#xff1a…

cmake-find_package链接第三方库

文章目录 基本调用形式和模块模式使用方式 之前我们是使用了绝对路径来链接OpenCV第三方库,但是现在很多库一般会自己写一些cmake文件提供给用户,用户可以直接使用其中的内置变量即可。使用的命令就是find_package。 基本调用形式和模块模式 find_packa…

对Spring当中AOP的理解

AOP(面向切面编程)全称Aspect Oriented Programminge AOP就是把系统中重复的代码抽取出来,单独开发,在系统需要时,使用动态代理技术,在不修改源码的基础上,将单独开发的功能通知织入(应用)到系统中的过程,完…

【大数据】Flink 架构(六):保存点 Savepoint

《Flink 架构》系列(已完结),共包含以下 6 篇文章: Flink 架构(一):系统架构Flink 架构(二):数据传输Flink 架构(三):事件…

数据结构(二)------单链表

制作不易,三连支持一下呗!!! 文章目录 前言一.什么是链表二.链表的分类三.单链表的实现总结 前言 上一节,我们介绍了顺序表的实现与一些经典算法。 但是顺序表这个数据结构依然有不少缺陷: 1.顺序表指定…

深入理解TCP网络协议(1)

目录 1.TCP协议的段格式 2.TCP原理 2.1确认应答 2.2超时重传 3.三次握手(重点) 4.四次挥手 1.TCP协议的段格式 我们先来观察一下TCP协议的段格式图解: 源/目的端口号:标识数据从哪个进程来,到哪个进程去 32位序号/32位确认号:TCP会话的每一端都包含一个32位&#xff08…

分布式ID(3):雪花算法生成ID之UidGenerator(百度开源的分布式唯一ID生成器)

1 UidGenerator官方地址 UidGenerator源码地址: https://github.com/baidu/uid-generator UidGenerator官方说明文档地址: https://github.com/baidu/uid-generator/blob/master/README.zh_cn.md 这边只做简单介绍,详细说明请看官方说明文档。 2 Snowflake算法 Snowfl…

「 典型安全漏洞系列 」08.文件上传漏洞详解

文件上传功能可被攻击者用作一系列高严重性攻击的强大载体。本文最后将会展示如何绕过常见的防御机制来上传web shell,使你能够完全控制一个易受攻击的web服务器。 1. 简介 文件上传漏洞是指web服务器允许用户在没有充分验证文件名、类型、内容或大小等信息的情况下…

OJ_糖果分享游戏

题干 c实现 #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<vector> using namespace std;void ShareCandy(vector<int>& student) {int size student.size();vector<int> share(size); //保存每个同学交换前&#xff0c;糖果数量…

(java)idel中将对与json的相互转

1、目录结构 2、导入包 在模块下面建立lib目录将包导入模块中 包的百度网盘 链接&#xff1a;https://pan.baidu.com/s/1abNF8cOTeNb00rM7tp04iQ?pwd39wc 提取码&#xff1a;39wc 3、建立两个测试类person和dog类 public class Dog {private String name;private int age…

TypeScript(四) 运算符

1. 运算符 1.1. 描述 运算符用于执行程序代码运算。 1.2. 运算符主要包括&#xff1a; &#xff08;1&#xff09;算术运算符 &#xff08;2&#xff09;逻辑运算符 &#xff08;3&#xff09;关系运算符 &#xff08;4&#xff09;按位运算符 &#xff08;5&#xff09;赋值…

C#算法(11)—求三个点构成圆的圆心坐标和半径

前言 我们在上位机开发领域也经常会碰到根据三个点求出圆的圆心、半径等信息的场景,本文就是详细的介绍如何根据三个点使用C#代码求出三点构成的圆的圆心坐标、圆半径、三点构成的圆弧的角度。 1、3点求圆分析 A、B、C三个点都是圆上的坐标点,过向量AB做中垂线,过向量AC做…

STP生成树协议实验

实验大纲 一、什么是生成树协议 二、生成树原理 1.STP工作原理 2.STP主要参数 3.STP根网桥 4.STP协议版本 三、实验 1.构建网络拓扑结构图 2.配置IP地址&#xff08;8台PC机&#xff09;&#xff1a;192.168.7.1~192.168.7.8 3.配置SW1 4.配置SW2 5.配置SW3 6.配置…

【英语趣味游戏】填字谜(Crossword)第1天

谜题出处 柯林斯字谜大全&#xff08;6&#xff09;&#xff0c;Collins——Big Book of Crosswords&#xff08;Book 6&#xff09; Puzzle Number: 114 本期单词 横向 1、Situation involving danger (4) 包含危险的情境&#xff0c;4个字母 答案&#xff1a;Risk&#xff…

第十一章 Linux实际操作——进程管理(重点)

第十一章 Linux实际操作——进程管理&#xff08;重点&#xff09; 11.1 基本介绍11.2 显示系统执行的进程11.2.1 基本介绍11.2.2 ps详解11.2.3 应用实例 11.3 终止进程kill和killall11.3.1 介绍11.3.2 基本语法11.3.3 常用选项11.3.4 最佳实践 11.4查看进程树pstree11.4.1 基本…

微服务-微服务Spring-cloud-open-feign

1. LoadBalancerRestTemplate的缺陷 LoadBalancerRestTemplate进行微服务调用 BeanLoadBalancedpublic RestTemplate restTemplate() {return new RestTemplate();}//调用方式String url "http://mall-order/order/findOrderByUserId/"id;R result restTemplate.…

路由进阶

文章目录 1.路由的封装抽离2.声明式导航 - 导航链接3.声明式导航-两个类名自定义匹配的类名 4.声明式导航 - 跳转传参查询参数传参动态路传参两种传参方式的区别动态路由参数可选符 5.Vue路由 - 重定向6.Vue路由 - 4047.Vue路由 - 模式设置8.编程式导航 - 两种路由跳转9.编程式…

Nginx负载均衡下的webshell连接

一、WebShell简介 “web”的含义是显然 需要服务器开放web服务&#xff0c;“shell”的含义是 取得对服务器某种程度上操作权限。 webshell&#xff0c;顾名思义&#xff1a;web指的是在web服务器上&#xff0c;而shell是用脚本语言编写的脚本程序&#xff0c;webshell就是就…

漏洞原理MySQL注入布尔盲注入

1 判断MySql注入点是否存在 利用盲注入的方式 http://127.0.0.1/news/show.php?id46 and 11 # 正常显示 http://127.0.0.1/news/show.php?id46 and 12 # 不显示 2 获取数据库的长度 http://127.0.0.1/news/show.php?id46 and length(database())n n的范围是从 1 开始 h…