公司大数据CDH技术选型升级为EMR集群的技术调研

news2024/11/30 8:46:07

大数据技术栈现状

大数据技术整体设计图

在这里插入图片描述

当前大数据各组件版本

ZooKeeper 3.4.5
Spark 2.4.0
Hue 4.3.0
Hive 2.1.1
Hbase 2.1.4
Hadoop 3.0.0
Kafka 2.2.1
Phoenix 5.0.0-cdh6.2.0
Dolphinscheduler 3.0.0
Yarn 3.0.0-cdh6.3.2
Logstash 7.7.0
Kibana 7.7.0
Elasticsearch 7.7.0
Grafana 8.0.0
Anaconda 3
Flink 1.13.2

现状的难题与挑战

  • 海量数据的近实时条件查询效率问题。如:HBASE中的信号经纬度条件查询。
  • 统计分析业务开发和维护复杂度高的问题。如:在线计算模块的统计。
  • 缺乏专业大数据运维人员。
  • 免费版的CDH支持的组件版本相对落后,无法更友好的支持其他非CDH的大数据生态技术,导致部分技术不兼容。如:FLINK的Hive Catalog不兼容,无法更加友好地处理小文件问题。
  • 申请资源比较困难,现有资源较难以支撑越来越丰富的业务诉求。
  • 无法支持近实时的统计分析业务场景。
  • 无法支持即席查询的条件查询业务场景。
  • 现有技术栈较复杂,开发人员学习成本高,维护成本也高。如:同时存在hive、spark、flink技术栈。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/527900.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

反涉网犯罪研究 | 电商平台自动收货代码审计

0x00 免责声明 本文仅限于学习讨论与反诈知识的分享,不得违反当地国家的法律法规。对于传播、利用文章中提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,本文作者不为此承担任何责任,一旦造成后果请自行承担…

信息发布系统在医院体检中心的运用

随着生活水平条件的提高,大家的健康意识更加强,重视体检的人数也越来越多,因此体检中心,医院体检门诊中心人流量都很大,健康市场空间前景大,各种医疗健康机构快速发展,市场竞争激烈,…

Linux——互斥和同步(二)

目录 信号量 读写信号量 互斥量 RCU机制 虚拟串口驱动加入互斥 完成量 习题 信号量 前面所讨论的锁机制都有一个限制,那就是在锁获得期间不能调用调度器,即不能引起进程切换。但是内核中有很多函数都可能会触发对调度器的调用(在中断的…

Win10笔记本开机黑屏出现白色错误英文无法启动怎么办?

Win10笔记本开机黑屏出现白色错误英文无法启动怎么办?有用户电脑正常开机之后,出现了问题,系统无法正常的启动,出现一些英文错误代码。那么遇到这个情况怎么去进行解决呢?一起来看看以下的解决方法分享吧。 准备工作&a…

C语言数据结构注意点-线性表

目录 关于指针 LinkList L和LinkList *L的区别 初始化注意点 scanf()的操作 顺序表相关操作符号的确定 关于指针 ①指针和指针变量是两个不同的概念,但要注意的是,通常我们叙述时会把指针变量简称为指针。 ②指针变量其实是一个变量&…

FL Studio21中文完整版All Plugins Edition及切换教程

说到制作电音的软件,coco玛奇朵一定会把FL Studio放到第一个来讲。水果是一款为了电子音乐而生的的宿主软件。水果,独特的节拍音序器组件和通道机架与混音台模块打造的编曲“块”的思路。是极为适合于电子音乐的编排。而且随着水果版本不断地升级&#x…

Vite的基本介绍以及优劣势(一文读懂vite)?

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一、Vite是什么?二、为什么选Vite?1、现实的问题2、缓慢的服务器启动3、缓慢的更新 三、Vite的优势?四、Vite的劣势?五、Vite以…

深入理解双亲委派机制

一、双亲委派机制委派流程 双亲委派机制,就是JVM虚拟机加载类的时候,会优先委派上级类加载器进行类加载。 1、如果上级类加载器能找到这个类,那就由上级类加载器加载,并且对下级共享,反之不共享。 2、如果上级类加载…

【#ifndef, #define, 和 #endif】

前言 学习AFNetWoring源码的时候,在AFN的h借接口文件又看到了这几个宏定义,学习记录一下。 作用 #ifndef, #define, 和 #endif是C/CPP的预处理指令,常常用来条件编译和防止头文件重复包含。 简介 #ifndef 它是if not define的简写&…

SpringBoot 使用 Sa-Token 完成注解鉴权功能

注解鉴权 —— 优雅的将鉴权与业务代码分离。本篇我们将介绍在 Sa-Token 中如何通过注解完成权限校验。 Sa-Token 是一个轻量级 java 权限认证框架,主要解决登录认证、权限认证、单点登录、OAuth2、微服务网关鉴权 等一系列权限相关问题。 Gitee 开源地址&#xff1…

生信步骤|EffectorP批量预测病原物效应子

EffectorP软件利用机器学习原理,通过事先收集已知的效应子制备训练集,从而实现病原真菌和卵菌的效应子预测[1]。 EffectorP发展史[2]: 1.0版本最初在16年发表于NEW PHYTOLOGIST,实现了机器学习初步预测效应子。 2.0版本在18年发表…

OPPO官宣:哲库解散,哲库是 OPPO 旗下的芯片厂,类似华为海思的角色,有近 3000 名员工

大家好,我是二哥呀。 这两天,互联网最大的声音之一就是,OPPO 将终止芯片业务,相信大多数小伙伴和二哥一样,第一眼看到这则消息的时候,震惊的同时并惋惜! ZEKU 是 OPPO 旗下的芯片厂&#xff0…

Java面试知识点(全)-JVM面试知识点

Java面试知识点(全) 导航: https://nanxiang.blog.csdn.net/article/details/130640392 注:随时更新 JVM内存结构 内存结构 Java虚拟机在运行程序时会把其自动管理的内存划分为以上几个区域,每个区域都有的用途以及创建销毁的时机&#xf…

【JavaScript】手写Promise

🐱 个人主页:不叫猫先生 🙋‍♂️ 作者简介:2022年度博客之星前端领域TOP 2,前端领域优质作者、阿里云专家博主,专注于前端各领域技术,共同学习共同进步,一起加油呀! &am…

五. AMS实践,Hook启动未注册的Activity

Activity任务栈解析 正常情况下我们的app中的所有Activity都是运行在同一个任务栈(ActivityStack)里面的,也就是我们app的build.gradle文件中的applicationId那个任务栈. 如何实现Activity运行在不同的任务栈呢? 需要在Intent启动这个Activity的时候,给这个intent赋值,设置代…

【KVM虚拟化】· 存储池、存储卷

目录 🍁虚拟磁盘文件 🍂基于文件系统的KVM存储 🍂基于设备的KVM存储 🍁使用KVM存储池 🍂存储池概念 🍁virsh中存储池命令 🍁virsh中存储卷命令 🍁命令实例 🍂创建存储池 …

一个开源的即时通讯应用 Tailchat

今天给大家介绍一款即时通讯应用,这个开源项目是:Tailchat,它是一个基于 React Typescript 的现代开源 noIM 应用程序。 简单介绍 相信大家都或多或少了解过 Discord / Slack 这样大火的即时通讯应用。两者分别在各自的领域有很大的成就。…

http强缓存和协商缓存的介绍和应用案例,简介明了

http强缓存和协商缓存的介绍和应用案例,简介明了 http缓存方式简介缓存机制案例1. Expires老版本的方式:2. cache-control新版本的方式:3.Etag和If-None-Match http缓存方式简介 强缓存:强缓存使用Expires(老版本&…

el-table实现可编辑表格的思路;el-table删除不正确:表格中的el-select下拉数据项有值,但输入框中value值不显示

目录 一、问题 二、原因及解决方法 三、总结 tips:如嫌繁琐,直接看总结即可! 一、问题 el-table实现可编辑表格的思路: 1.要写一个可编辑的表格:表格中的一列是下拉框。实现方法很简单:在el-table-column(elemen提…

PMP课堂模拟题目及解析(第9期)

81. 一位经验丰富的项目经理在到达一个重大开发里程碑之前识别到一个问题,项目经理采取相应的行动,并能够按时解决问题。两周后,发起人通知项目经理,客户发出了处罚费。若要避免这个问题,项目经理应该事先做什么&…