Hadoop学习----Hadoop介绍

news2025/1/16 12:23:17

Hadoop介绍

Hadoop是Apache软件基金会的一款开源软件。底层是由java语言实现。
功能:允许用户使用简单的编程模型实现跨机器集群对海量数据进行分布式计算处理。

Hadoop核心组件:
Hadoop HDFS(分布式文件存储系统):解决海量数据存储
Haqdoop YARN(集群资源管理和任务调度框架):解决资源任务调用
Hadoop MapReduce(分布式计算框架):解决海量数据计算

官网:http://hadoop.apache.org/

Hadoop现状

HDFS作为分布式文件存储系统,处于生态圈的底层与核心地位;
YARN作为分布式通用的集群资源管理系统和任务调度平台,支撑各种计算引擎运行,保证了Hadoop地位;
MapReduce作为大数据生态圈第一代分布式计算引擎,由于自身设计的模型所产生的弊端,导致企业一线几乎不再直接使用MapReduce进行编程处理,但是很多软件底层依然在使用MapReduce引擎来处理数据。

Hadoop特性优点

1、扩容能力
Hadoop是在可用的计算机集群间分配数据并完成计算任务的,这些集群可方便灵活的方式扩展到数以千计的节点。集群调整非常灵活,不需要停机。

2、成本低
Hadoop集群允许通过部署普通廉价的机器组成集群来处理大数据,以至于成本很低。看重的是集群整体能力。

3、效率高
通过并发数据,Hadoop可以在节点之间动态并行的移动数据,使得速度非常快。

4、可靠性
能自动维护数据的多份复制,并且在任务失败后自动地重新部署(redeplay)计算认为有,所以Hadoop的按为存储和处理数据的能力值得信赖。

Hadoop架构变迁

Hadoop 1.0
     HDFS(分布式文件存储)
     MapReduce(资源管理和分布式数据处理)

Hadoop 2.0
     HDFS(分布式文件存储)
     MapReduce(资源管理和分布式数据处理)
     YARN(集群资源管理、任务调度)
在这里插入图片描述
Hadoop 3.0架构组件和Hadoop 2.0类似, 3.0着重于性能优化
通用方面:精简内核,类路径隔离,shell脚本重构
Hadoop HDFS:EC纠删码,多NameNode支持
Hadoop MapReduce:任务本地优化,内存参数自动推断
Hadoop YARN:Timeline Service V2,队列配置

在这里插入图片描述

Hadoop集群整体概述

Hadoop集群包括两个集群:HDFS集群,YARN集群
两个集群逻辑上分离,通常物理上在一起
两个集群都是标准的主从架构集群

HDFS集群介绍
主角色:NameNode      从角色:DataNode         主角色辅助角色:SecondaryNameNode
YARN集群介绍
主角色:ResourceManager     从角色:NodeManager
在这里插入图片描述
HDFS 一主加三从,额外再配一个秘书
YARN 一主加三从

MapReduce没有集群,MapReduce是计算框架,代码层面的组件,没有集群之说。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/93770.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大道至简——工具类产品的几个思考方向

因为之前没有接触过摹客的产品,对于一个经常使用Axure的产品经理,仅仅通过两周摹客的使用体验写出的体验文档确实不够严谨,所以以下除了表层的几点用户体验,重点还是谈一下对工具类产品发展方向的思考。 体验篇 一款产品的诞生肯…

4.2 YOLOv3算法

文章目录一、林业病虫害数据集和数据预处理方法介绍1.1 读取AI识虫数据集标注信息1.2 数据读取和预处理1.2.1 数据读取1.2.2 数据预处理**随机改变亮暗、对比度和颜色等****随机填充****随机裁剪****随机缩放****随机翻转****随机打乱真实框排列顺序****图像增广方法汇总**1.2.…

Oracle云服务器安全配置

在Oracle云上申请了一个免费云空间,据说是永久免费,这里记录一下安全配置问题。 一、访问Oracle云服务器 1、云服务器申请 如何在oracle注册申请云服务可自行搜索一下,有很多文章介绍。 甲骨文Oracle云服务器详细申请教程步骤及注意事项 …

如何计算香港服务器公网带宽的实际下载速度?

如何计算香港服务器公网带宽的实际下载速度?下面分享香港服务器带宽实际下载速度对照表及计算方法: 香港服务器带宽实际下载速度计算方法 香港服务器以1Mbps公网带宽为例,香港服务器1M带宽实际下载速度峰值128KB/S,为什么不是1M/S&#xff0…

电脑重装系统后重启电脑黑屏是怎么回事

​电脑重装系统后重启电脑黑屏怎么回事?最近有用户反映自己在重装电脑系统后,开机出现了黑屏的现象,检查后发现硬件设备没有故障,那么是怎么回事呢?有可能是显示器不支持该显卡显示的分辨率或者是重装系统后的显卡驱动…

结构建模设计——Solidworks软件之使用钣金折弯功能做一个带折弯固定口的铝合金面板

【系列专栏】:博主结合工作实践输出的,解决实际问题的专栏,朋友们看过来! 《QT开发实战》 《嵌入式通用开发实战》 《从0到1学习嵌入式Linux开发》 《Android开发实战》 《实用硬件方案设计》 长期持续带来更多案例与技术文章分享…

31岁才转行程序员,目前34了,我的经历和一些感受

按惯例,先说下我基本情况。我是85年的,计算机专业普通本科毕业。在一个二线城市,毕业后因为自身能力问题、认知水平问题,再加上运气不好,换过多份工作,每份工作都干不长。导致我30多岁时,还一事…

背包问题:蜣螂优化算法(Dung beetle optimizer,DBO)求解背包问题(Knapsack Problem,KP)提供Matlab代码

一、背包问题 1.1背包问题描述 背包问题(Knapsack Problem,KP)是一种重要的组合优化问题,在生活的许多领域都有着十分广泛的应用。背包问题可以描述为:给定一个背包和n种物品,其中,背包的容量为VVV ,第i …

C++11标准模板(STL)- 算法(std::min_element)

定义于头文件 <algorithm> 算法库提供大量用途的函数&#xff08;例如查找、排序、计数、操作&#xff09;&#xff0c;它们在元素范围上操作。注意范围定义为 [first, last) &#xff0c;其中 last 指代要查询或修改的最后元素的后一个元素。 返回范围内的最小元素 st…

[附源码]Python计算机毕业设计个人资金账户管理Django(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等…

PMP考试有用吗?

有用&#xff0c;对于项目管理岗位来说&#xff0c;PMP 就是一个最基础的必备的证书&#xff0c;你说含金量有多高不见得&#xff0c;但是没有这个证书找工作可能会受阻。 下面这两种情况对 PMP 的需求是硬性要求&#xff0c;很现实&#xff0c;有证才能获得资格&#xff0c;没…

图算法在风控场景的应用

​导读&#xff1a;本文将分享图算法在风控中的应用。 今天的介绍会围绕下面四点展开&#xff1a; 图算法和风控简介 图算法在风控的演化 相应平台的心得 展望未来 分享嘉宾&#xff5c;汪浩然 互联网行业资深风控和图计算专家 编辑整理&#xff5c;戴杰 永辉超市 出品社…

Mybatis学习笔记

1.Mybatis是什么 MyBatis 是一款优秀的持久层框架&#xff0c;它支持定制化SQL、存储过程以及高级映射。MyBatis 避免了几乎所有的 JDBC代码和手动设置参数以及获取结果集&#xff0c; 它可以使用简单的XML或注解来配置和映射SQL信息&#xff0c;将接口和 Java 的 POJOs(Plain …

Docker入门(基础篇)

Docker入门Docker相关概念为什么需要DockerDocker的理念容器与虚拟机的比较Docker的安装与使用安装Dockerdocker 的三要素Docker常用命令Docker相关概念 为什么需要Docker 为什么会出现Docker了&#xff1f;现在我们假设你在开发一个项目&#xff0c;你使用的是一台笔记本电脑…

前端显示分页详解(一)

我们在浏览页面的时候&#xff0c;是不是经常看到网页经常是以页面的形式给我们展现出来的&#xff0c;我们以淘宝的页面为例&#xff08;如下图&#xff09;&#xff0c;那这样按照页面呈现有什么好处呢&#xff1f;这篇文章让我们来深入探究了解这其中的奥秘。 优点&#xff…

分享10个比B站更刺激的网站,千万别轻易点开

作为一个码龄8年程序员&#xff0c;到现在还能保持着浓密的头发和健壮的身体&#xff0c;全靠这10个网站让我健&#xff08;偷&#xff09;康&#xff08;偷&#xff09;生&#xff08;摸&#xff09;活&#xff08;鱼&#xff09;&#xff0c;今天就把我收藏夹里的网站无私分享…

@Windows server 2022 搭建 AD 域服务器

文章目录1.AD(Active Directory)Windows Server环境准备2.配置AD环境3.添加角色和功能4.配置域控服务器5.配置 AD 域 OU 和用户6.Client计算机加入域控管理7.使用AD账号测试登录客户端1.AD(Active Directory)Windows Server环境准备 主机名称IP角色AD_Server192.168.1.221AD服…

Omnet+Sumo+Veins安装配置总结(Windows 10按照配置成功)

** 写在前面 ** 博主是一枚车联网小白&#xff0c;该博客只是完整记录了博主安装配置&#xff08;Veins 4.7.1SUMO 0.30.0OMNeT 5.4.1&#xff09;环境的过程&#xff0c;电脑是win10操作系统&#xff0c;期间主要参考官网给的教程和网上其他大佬的文档。 第一步&#xff1a…

数图互通高校房产管理——货币化补贴管理

数图互通房产管理系统在这方面做得比较全面&#xff1b; 1、货币化补贴 住房补贴主要分为按月补贴、一次性补贴、差额补贴、级差补贴和职务职称变动补贴&#xff0c;系统可自动计算补发金额及之后每月的应发补贴金额。系统可导出学校每月的住房补贴发放明细表&#xff0c;可以…

毕业设计-基于大数据的移动图书馆个性化推荐系统-python

目录 前言 课题背景和意义 实现技术思路 实现效果图样例 前言 &#x1f4c5;大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科…