2023大数据-架构师案例（八）

2023大数据-架构师案例（八）

news2026/2/8 9:40:27

Lambda架构

nginx （b） Hbase （c）Spark Streaming （d）Spark （e）MapReduce

（f）ETL （g）MemSQL （h）HDFS （i）Flume （k）数据存储层
（l）kafka数据采集层（m）业务逻辑层

将上面分别填入其中（9分）

1 d spark

2 e MapReduce

3 k 数据存储层

4 g MemSQL

5 h HDFS

6 I kafka

7 flume

8 ETL

解析：

ETL采用Sqoop/Datax来数据迁移到分布式存储文件HDFS，之后通过Spark和MapReduce工具离线计算处理，将结果视图发送到hive数据仓库，将结果存储到HDFS。

Nginx则是用flume采集信息，通过kafka实时数据集成，Spark Steaming计算处理分析，把结果存储到MemSQL/Doris。

合并计算则是用Spark来将批处理和实时处理的数据合并存储到HBase。

数据源：HDFS

批处理层：Offline Hive/MR/Spark

加速层：Flink/Storm

数据迁移：Collector/DataX/Sqoop

服务层：MongoDB/HBase/Redis OneDataAPI

Kappa架构

Kappa则是去掉了批处理层，所以处理历史数据的能力比Lambda架构差点。

业务和技术需求方面：

Lambda架构依赖Hadoop，Spark，Storm技术。

Kappa依赖Flink计算引擎，偏流式计算。

Hadoop里的HDFS是用于海量存储，而MapReduce则是用于海量计算。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1985397.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

电机物理数学建模

电机物理数学建模

电机定义电机是以磁场为媒介，利用电磁感应作用进行能量转换与传递的电磁装置。机电能量转换装置，无论尺寸大小，从大型旋转电机如水轮发电机到小型机电信号变换器，虽然它们的用途和结构各异，但都基于相同的电磁场与运…

阅读更多...

Moretl 日志采集工具

Moretl 日志采集工具

使用咨询: 扫码添加QQ 永久免费: Gitee下载最新版本使用说明: CSDN查看使用说明功能: 定时(全量采集or增量采集) SCADA,MES等系统采集工控机,办公电脑文件. 优势1: 开箱即用. 解压直接运行.插件集成下载. 优势2: 批管理设备. 配置均在后台配置管理. 优势3: 无人值守采集端…

阅读更多...

E2000 RGMII0通讯异常问题总结

E2000 RGMII0通讯异常问题总结

最近让新来小朋友做了一款E2000Q的板卡，使用了E2000Q上的两个RGMII资源，外接YT8521转出了电口。但是他调试中遇到了一个比较奇怪的问题，两套YT8521的电路都一样，但是一路通一路不通。也就是框图中MAC2（芯片RGMII0，系统对应eth1）那路网络不通，图中MAC3（芯片RGMII1，…

阅读更多...

开发Chrome浏览器插件 - 第一步

开发Chrome浏览器插件 - 第一步

目录 1. 准备工作 2. 创建基础文件 3. 编写manifest.json 4. 编写popup.html 5. 编写background.js 6. 编写content.js 7. 加载插件 8. 测试和调试 9. 发布插件 9.1 创建开发者账号步骤 9.2 提交Chrome扩展程序步骤 1. 准备工作安装Chrome浏览器：确保…

阅读更多...

C# 中引用类型的探讨

C# 中引用类型的探讨

引用类型的变量不直接包含其数据；它包含对其数据的引用。如果按值传递引用类型参数，则可能更改属于所引用对象的数据，例如类成员的值。但是，不能更改引用本身的值；例如，不能使用相同引用为新对象分配内存…

阅读更多...

根据年月将数组拆分为以年月为key的二维数组

根据年月将数组拆分为以年月为key的二维数组

处理前：处理后： public function lists(): array{$field = change_type,change_amount,left_amount,action,create_time,remark;$lists

阅读更多...

飞腾X100芯片GPU状态查询

飞腾X100芯片GPU状态查询

本文档对在linux系统下查看X100芯片GPU状态信息进行说明，可以帮助大家了解芯片的实时工作状态。板子系统信息： # cat /etc/os-release NAME="Kylin" VERSION="银河麒麟桌面操作系统V10 (SP1)" VERSION_US="Kylin Linux Desktop V10 (SP1)" I…

阅读更多...

模块化RAG：RAG新范式，像乐高一样搭建万字长文

模块化RAG：RAG新范式，像乐高一样搭建万字长文

1. RAG系统的发展历史与问题 RAG（检索增强生成）通过访问外部知识库，检索增强生成（RAG）为 LLMs 提供了关键的上下文信息，极大地提升了其在知识密集型任务上的表现。RAG 作为一种增强手段，已在众…

阅读更多...

vue3中使用i18n实现中英文切换，引入封装+全局切换

vue3中使用i18n实现中英文切换，引入封装+全局切换

目录 1.安装 2.引入 3.页面中使用 4.切换语言前言名称由来：全称是 internationalization，插件名取了首字母 i 和尾字母 n，中间一共有 18 个字母，所以组合起来就叫 i18n。作用：通过手动配置多种语言的翻译，且可快速切换。正文开始↓ 1.安装 npm install vue-i18…

阅读更多...

ADAS-GPM

ADAS-GPM

文章目录 AbstractIntroductionmain contribution Related work特征融合上下文信息和注意力机制超分辨率锚框分配 MethodExperiment link Abstract 微小目标检测最近的一个趋势是引入更细粒度的标签分配策略，为分类和回归提供有希望的监督信息。然而，以…

阅读更多...

RN环境遇到的问题

RN环境遇到的问题

空闲学习，记录一下遇到一些问题 RN中文网问题1：npm error code CERT_HAS_EXPIRED 原因是本地证书过期解决办法参考 npx react-native init testProject报错： npm error code CERT_HAS_EXPIRED npm error errno CERT_HAS_EXPIRED npm er…

阅读更多...

20240806吃干榨尽飞凌OK3588-C的8+64的核心板的eMMC存储空间resize2fs

20240806吃干榨尽飞凌OK3588-C的8+64的核心板的eMMC存储空间resize2fs

20240806吃干榨尽飞凌OK3588-C的864的核心板的eMMC存储空间 2024/8/6 11:25 缘起，使用了飞凌OK3588-C的864的核心板，但是默认的LINUX R4版本的SDK编译的IMG固件，刷机之后貌似默认只使用了32GB？的eMCC空间。联系飞凌提供了resize2…

阅读更多...

【ML】为什么要做batch normlization，怎么做batch normlization

【ML】为什么要做batch normlization，怎么做batch normlization

为什么要做batch normlization，怎么做batch normlization 1. batch normlization1.1 批量归一化是什么：1.2 为什么要做批量归一化： 2. feature normalization2.1 特征归一化是什么：2.2 为什么要做特征归一化： 3. batc…

阅读更多...

Linux中apache服务安装与mysql安装

Linux中apache服务安装与mysql安装

目录一、apache安装二、MySQL安装一、apache安装准备环境：一台虚拟机、三个安装包（apr-1.6.2.tar.gz、apr-util-1.6.0.tar.gz、httpd-2.4.29.tar.bz2) 安装过程： tar xf apr-1.6.2.tar.gz tar xf apr-util-1.6.0.tar.gz tar xf http…

阅读更多...

怎么限制电脑不能打开某个网页或网站（四个方法你可一定要学会）

怎么限制电脑不能打开某个网页或网站（四个方法你可一定要学会）

老板：我公司的员工真的很让人头疼。朋友：怎么了？ 老板：我一不在就有人偷偷打开某些违法网站，画面不可描述啊！ 朋友：难道你还不知道可以禁止员工打开某个网站？ 老板：…

阅读更多...

传奇三职业复古单机版+无需虚拟机一键安装

传奇三职业复古单机版+无需虚拟机一键安装

今天给大家带来一款单机游戏的架设：传奇单机版。沉默版本三职业数值不变态 ，没有花里胡哨的东西（比如切割，生肖，时装等功能），客户端为16周年客户端。另外：本人承接各种游戏架设&a…

阅读更多...

[论文阅读笔记34] LISA (LISA: Reasoning Segmentation via Large Language Model) 代码精读

[论文阅读笔记34] LISA (LISA: Reasoning Segmentation via Large Language Model) 代码精读

LISA是一个很好的Reason Segmentation的baseline, 其利用特殊的token [SEG]来微调多模态LLM和SAM的decoder来实现复杂逻辑下的prompt的推理分割. 其整体框图如下, 本篇文章精度此代码并作简单复现. 1. 推理流程流程如下： 1.1 加载Tokenizer与模型首先利用trans…

阅读更多...

为什么越来越多的企业走上了数字化转型之路？

为什么越来越多的企业走上了数字化转型之路？

原因很简单，只要我们稍加了解就能明白的。一方面是国家政策支持，另一方面是市场竞争的压力（什么产能过剩、服务过剩、经营维度低等因素都是导致企业不得不转型提升利润的关键点）。而恰恰数字化转型是能给企业带来效率提升、成本…

阅读更多...

MS2201以太网收发电路

MS2201以太网收发电路

MS2201 是吉比特以太网收发器电路，可以实现超高速度的全双工数据传输。它的通信遵从 IEEE 802.3 Gigabit Ethernet 协议中的 10 比特接口的时序要求协议。 MS2201 支持数据传输速率从 1Gbps 到 1.85Gbps 。主要特点 ◼ 电源电压： 2.5V 、 3.3V …

阅读更多...

【Qt】管理创建子项目

【Qt】管理创建子项目

新建项目打开是这样，无法添加子项目 pro添加 TEMPLATE subdirs有了点击添加子项目其他项目-子目录项目 （空的子项目，只有pro，无h、cpp） 子目录名字直接创建子目录下子项目选择有无界面或者其他类型项目 …

阅读更多...

推荐文章

最新文章