大数据技术体系架构

news2024/9/20 20:43:20

大数据技术体系图

数据源

社交媒体平台

云平台

网站资源

物联网(IOT)

数据库

特点

分布式

数据源一般分布在不同的设备上,这些设备通常由网络连接在一起,网络空间的安全及其重要;

异构性

数据的来源广泛,比如社交媒体平台、云平台、网站资源、 物联网(IOT)、数据库;

多样性

数据的格式多样,比如关系型数据库,非关系型数据库;

流式产生

数据是实时产生的,这些实时的数据会被近实时或实时的收集,从而可以让系统及时的进行分析。

数据收集层

定义

数据收集层是与数据源直接对接的模块,负责接近实时或实时的收集数据源中的数据。

特点

拓展性

可以灵活的适配不同的数据源,在接入大量数据源的情况下,也不会产生系统瓶颈;

可靠性

数据传输过程中没有数据丢失,但也有部分系统在特定场景下可以容忍丢失少量数据;

安全性

在收集敏感数据的场景下,应该有完善规范的机制保证数据收集过程中不会产生安全隐患;

低延迟

在数据流量巨大的情况下,数据收集系统应该能够保证以低延迟的条件下将数据传输到后端的存储系统之中;

注意

在需要关联分析和挖掘的应用场景下,需要将数据收集到一个中央化的存储系统中。

数据存储层

定义

负责海量结构化与非结构化数据的存储。

特点

拓展性

伴随着数据量的递增,当现有集群存储系统存储能力快达到上限时,需要及时的增加新的机器来扩充存储能力,因此要求集群存储系统本身具备非常好的线性拓展能力;

容错性

配备完善的容错机制来确保系统及相关设施出现故障时不会导致数据的丢失;

存储模型

支持结构化、半结构化、非结构化数据的存储。

资源管理与服务协调层

资源管理

定义

集群资源共享,对资源进行统一的管理及使用,使用轻量级隔离方案对各个应用进行隔离,搭建轻量级弹性资源管理平台。

优势

资源利用率高

充分利用集群中的资源;

运维成本低

集群资源共享,集群少从而维护成本低;

数据共享

集群资源共享,无需进行跨集群数据传输。

服务协调层

定义

负责分布式集群系统中Leaer选举、服务标示、分布式队列、分布式缓存、分布式锁等通用功能的支持。

计算引擎层

定义

针对不同的应用场景需要设计不同的计算引擎层,主要考虑的问题有在线/离线处理数据、实时性要求程度、系统吞吐率要求程度。

分类

批处理

时间要求低,处理时间周期为分钟-小时,甚至是天,高吞吐率(单位时间内处理的数据量尽可能大),典型的应用场景有搜索引擎构建索引、批处理数据分析等;

交互式处理

时间要求高,处理时间周期为秒,这种场景一般涉及人机交互,典型的应用场景有数据查询、参数化报表生成等;

实时处理

时间要求高,处理时间周期为秒,典型的应用场景有广告系统、舆情监测等。

数据分析层

定义

面向用户应用程序提供易用、高效、多样化的数据处理工具,主要包括应用程序API、类SQL查询语言、数据挖掘SDK等。

数据可视化层

定义

运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。它涉及计算机图形学、图像处理、计算机辅助设计、计算机视觉及人机交互技术等多个领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2119279.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Qt常用控件——QRadioButton和QCheckBox

文章目录 QRadioButtonQAbstractButton信号实现简单的点餐页面QCheckBox QRadioButton QRadioButton是单选按钮,可以让我们在多个选项当中选择一个 作为QAbstractButton和QWidget的子类,它们的属性和语法,对于QRadioButton同样适用 QAbstrac…

springboot+vue+mybatis计算机毕业设计医护系统的设计与实现+PPT+论文+讲解+售后

近些年来,随着科技的飞速发展,互联网的普及逐渐延伸到各行各业中,给人们生活带来了十分的便利,医护系统的设计与实现利用计算机网络实现信息化管理,使整个医护系统的发展和服务水平有显著提升。 本文拟采用Eclipse开发…

【尚跑】2024陕西淳化天然氧吧半程马拉松赛149顺利完赛

1、赛事背景 奔跑美丽淳化,畅游天然氧吧。9月8日上午,2024淳化天然氧吧半程马拉松赛在淳化县润镇东街鸣枪开跑,4000名马拉松爱好者相聚美丽淳化,赏荞麦花海、闻硕果飘香,共同开启这场挑战自我、超越极限的奔跑之旅 本次…

EasyRecovery破解版下载无需注册,easyrecovery数据恢复软件免费版激活码密钥

EasyRecovery易恢复是一款功能强大的数据恢复软件,为无数人群解决了数据丢失的烦恼,为工作生活带去了便捷。无数使用者在使用过后,都肯定了其强大的数据恢复功能。具体来说,EasyRecovery易恢复可以恢复多方面的数据,Ea…

如何规避SQL注入漏洞

1 引言 对于很多初学者而言,SQL注入攻击是一种很容易被忽略的安全漏洞,其原理很简单,在日常编码中需要注意规避,养成良好的系统安全意识。 2 原理 SQL注入漏洞产生的根本原因,就是在编码过程中手动拼接sql参数造成的…

os模块函数

1、常用命令 os.getcwd() 返回当前工作目录 os.listdir() 返回指定文件路径下的文件夹列表或者文件列表 os.mkdir 创建文件夹,不能创建递归文件夹,也就是上一层文件夹必须存在,不存在时会报错,同时在指定目录下有相同的文件夹名称,再创建会报错 os.makedirs 可以创建…

[基于 Vue CLI 5 + Vue 3 + Ant Design Vue 3 搭建项目] 01 安装 nodejs 环境

文章目录 下载安装测试 这里让我们去看看如何安装一下 nodejs 的环境 下载 通过官网进行下载安装包 官网 https://nodejs.org/zh-cn点击 下载 Node.js (LTS) 开始下载 安装 下载完成之后,双击进行安装 开始进行安装了 这样,node.js 就安装好了 测试 …

计算机毕业设计 | springboot旅行旅游网站管理系统(附源码)

1,绪论 1.1 背景分析 随着人们生活水平的提高和对休闲旅游的日益重视,旅游业已成为全球最大的经济产业之一。越来越多的人选择通过在线方式进行旅行预订,这种趋势为旅游网站提供了巨大的商机。用户体验是决定旅游网站成功与否的关键因素。良…

TD综合教程——粒子切换和音轮(附思路和工程文件)

一、粒子切换 整体思路: 给constant中的color实时滑条数值但是没有变化 解决办法:在这里使用的rgb不是0-255的色域,而是0-20,使用Math CHOP改变即可 二、音轮 整体思路: 在math中输入双声道音频后,可以使…

WinCC V7.5与S7-1200 PLC 通信

自WinCC V7.2版本起,软件新增加了 "SIMATIC S7-1200, S7-1500 Channel"通道,用于WinCC与 S7-1200/S7-1500 PLC之间的通信。此驱动只支持以太网通讯,使用 TCP/IP 协议。 工控人加入PLC工业自动化精英社群 文档示例的软/硬件环境硬件&#xff1…

QLORA:高效微调量化大型语言模型

人工智能咨询培训老师叶梓 转载标明出处 传统的16位精度微调需要超过780GB的GPU内存,对于参数量极大的模型,如65B(即650亿参数)的模型,在资源有限的情况下大模型的微调几乎是不可能的。华盛顿大学的研究者团队提出了一…

您的计算机已被.rmallox、.hmallox勒索病毒感染?恢复您的数据的方法在这里!

导言 近年来,勒索病毒攻击手段不断升级,其中双重勒索策略更是成为了攻击者们的“新宠”。这种策略不仅通过加密受害者的文件来要求赎金,还进一步威胁要泄露或公开其敏感数据,实现了对受害者的双重打击。面对如此严峻的网络安全形…

[ubuntu]opencv4.9.0源码编译报错undefined reference to ‘TIFFReadRGBxxxxx‘及解决方法

今天在编译Opencv4.89.0的时候报了上面这个错误,原因是和anaconda环境冲突,因为此时是在激活的conda环境下编译的。 解决方法:conda deactivate 关闭conda环境,再进行编译,就OK了。记得要删除build缓存重新cmake然后ma…

【OpenCV-直方图与傅里叶变换】图像的基本变换、傅里叶变换、直方图

import cv2 #opencv读取的格式是BGR import numpy as np import matplotlib.pyplot as plt#Matplotlib是RGB %matplotlib inline def cv_show(img,name):cv2.imshow(name,img)cv2.waitKey()cv2.destroyAllWindows()1 直方图 1.1 cv2.calcHist(images,channels,mask,histSize,ra…

浪潮信息:构建高效、安全数据存储底座的领航者

浪潮信息在最新IDC发布的《中国企业级外部存储市场跟踪报告,2024Q1》中表现抢眼,以11.4%的市场销售额占比稳居中国存储市场第二,同比增长率高达13.6%,领跑头部厂商。这标志着浪潮信息在推动中国存储市场持续增长中扮演了关键角色&…

智能语音技术在人机交互中的应用与发展

摘要:本文主要探讨智能自动语音识别技术与语音合成技术在构建智能口语系统方面的作用。这两项技术实现了人机语音通信,建立起能听能说的智能口语系统。同时,引入开源 AI 智能名片小程序,分析其在智能语音技术应用场景下的意义与发…

电商平台的仅退款,如何“卷”出一个千亿IPO?

“快递柜第一股”,丰巢登陆港交所 当英国走进工业革命时代,狄更斯曾经这样形容那个充满着激情、创造和无限可能的世界,“这是最好的时代,也是最坏的时代。” 如今,随着运费险、仅退款、直播带货的出现,中…

【最新华为OD机试E卷-支持在线评测】字母组合(200分)多语言题解-(Python/C/JavaScript/Java/Cpp)

🍭 大家好这里是春秋招笔试突围 ,一枚热爱算法的程序员 💻 ACM金牌🏅️团队 | 大厂实习经历 | 多年算法竞赛经历 ✨ 本系列打算持续跟新华为OD-E/D卷的多语言AC题解 🧩 大部分包含 Python / C / Javascript / Java / Cpp 多语言代码 👏 感谢大家的订阅➕ 和 喜欢�…

【Power Compiler手册】9.时钟门控(6)

使用安全寄存器插入时钟门控 你可以使用同一个时钟门控来门控三模冗余(TMR)寄存器,对所有安全寄存器进行操作,而不需要触碰或修改投票逻辑。 Design Compiler NXT 工具会自动检测是否使用了安全寄存器,并相应地插入时钟门控。该工具始终确保同一安全组内的安全寄存器共享…

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创 作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能教育公司 ,宣布将长期致力于AI原生教育。 近日&#xff…