大数据:分布式资源调度框架YARN,核心架构,主从结构,辅助结构,yarn和MapReduce部署与配置,蒙特卡罗法求圆周率PI

news2024/10/6 10:28:16

大数据:分布式资源调度框架YARN,核心架构,主从结构,辅助结构,yarn和MapReduce部署与配置,蒙特卡罗法求圆周率PI

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试


文章目录

  • 大数据:分布式资源调度框架YARN,核心架构,主从结构,辅助结构,yarn和MapReduce部署与配置,蒙特卡罗法求圆周率PI
    • @[TOC](文章目录)
  • 大数据:分布式资源调度框架YARN
  • yarn的架构,核心架构和辅助架构
  • yarn的辅助架构
  • MapReduce和yarn部署
  • MapReduce和yarn初体验
  • 提交MapReduce任务去yarn执行
  • 蒙特卡洛算法求pi
  • 总结

大数据:分布式资源调度框架YARN

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
yarn管理资源和调度
在调度过程中可以实现MapReduce

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
学校几万人,有教室就可以管了
调度就好办了
有效运行
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
集群中最好
在这里插入图片描述
集群大管家

在这里插入图片描述
分配资源,分散计算,汇总都靠yarn监管,分配

在这里插入图片描述
申请
在这里插入图片描述
yarn可以调度资源
剩下的别人用
在这里插入图片描述
三大组件,基本就OK了

存储,计算,资源调度。

yarn的架构,核心架构和辅助架构

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
一个存储,一个资源调度
各是各的
在这里插入图片描述
跟工厂一样
总的董事长resourcemanager

各个厂长nodemanager

在这里插入图片描述
懂事长总体安排
剩下的厂长各自安排即可

客户只需要问resourcemanager要资源即可
在这里插入图片描述
在这里插入图片描述
container容器
在这里插入图片描述
集装箱,一个个箱子
在这里插入图片描述去找集装箱就行
你不能多装
只能装这么多
RM关了一堆NM
在这里插入图片描述
还是主从管理结构
老大管整体
老二管单机

yarn的辅助架构

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
辅助提高安全性
在这里插入图片描述
给yarn提供安全保障就行

历史,记录
在这里插入图片描述
感觉就是辅助干活
在这里插入图片描述

隔离资源
在这里插入图片描述
在这里插入图片描述
干脆整一个统一记录日志的服务器
美滋滋
在这里插入图片描述
在这里插入图片描述
统一收集日志
美滋滋
舒服

这就是辅助架构
在这里插入图片描述
主从角色
辅助角色
在这里插入图片描述

MapReduce和yarn部署

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
部署,就是要启动主从辅助节点

MapReduce运行在yarn上的
不需要启动进程,只需要修改配置哦

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
为啥给node1上配置那么多内存
它承担的东西很多

在这里插入图片描述
各种配置MapReduce即可
在这里插入图片描述
yarn也要配置各种环境
在这里插入图片描述
配置resourcemanager和nodemanager
本地日志
历史服务器端口日志
代理服务器,安全
在这里插入图片描述
三台服务器都这样玩
在这里插入图片描述
hdfs那边也是这么玩的
yarn也是这么玩
–daemon

mapred是历史服务器的启动

在这里插入图片描述
在这里插入图片描述

hdfs是9870端口
8088是yarn集群的监控界面
在这里插入图片描述
init 0关机
在这里插入图片描述
MapReduce不需要单独启动进程哦

MapReduce和yarn初体验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
主从,辅助中的代理服务器
历史服务器需要单独启动
在这里插入图片描述
在这里插入图片描述

提交MapReduce任务去yarn执行

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
hive用的就是MapReduce

不需要写代码
spark和flink需要写代码
性能快
在这里插入图片描述
在这里插入图片描述
jar代表运行程序
程序代码在jar中
java类是我们要用程序中的wordcount类
输入文件
输出结果要不存在wc文件夹

在这里插入图片描述
在这里插入图片描述
结果
美滋滋

在这里插入图片描述
工作历史服务器
记录历史

在这里插入图片描述
map个数
样本数量
在这里插入图片描述
求pi
在这里插入图片描述

蒙特卡洛算法求pi

在这里插入图片描述
圆周率是一个比例,算的就是整个正方形的面积,乘比例
牛逼 了
在这里插入图片描述
在半圆内就是距离小于1就是内部
落到半圆内的点个数统计一波
就是圆周率/4

最后easy求出来了pi


总结

提示:重要经验:

1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/601383.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Cloudreve】正确地用Webdav服务把网盘挂在Windows上

Cloudreve是一款基于Web平台的在线云存储管理系统。它支持各种常见云存储服务(如Google Drive、OneDrive、Dropbox等)的管理和集成,用户可以通过Cloudreve将这些云存储服务连接起来,方便地管理自己的云存储文件。同时,…

Redis7实战加面试题-高阶篇(Redlock算法和底层源码分析)

当前代码为8.0版接上一步 当前文档源码,接上一篇博客 Redis7实战加面试题-高阶篇(手写Redis分布式锁) 逐步深入,引入Redlock 自研一把分布式锁,面试中回答的主要考点 1.按照UC里面java.util.concurrent.locks.Lock接口规范编写…

【Linux】程序内获取文件系统挂载信息

Linux shell可通过查看/etc/mtab或者/proc/mounts文件来获取当前文件系统挂载信息,示例: 程序内读取/etc/mtab或者/proc/mounts,解析字符串较为繁琐,可以使用mntent提供的方便函数: FILE *setmntent(const char *file…

Linux下socketpair系统API调用使用说明

目录 1.socketpair函数说明 2.socketpair使用举例 在阅读nginx源码时,发现其调用socketpair来实现master和worker进程之间进行数据交互。其代码如下: 思考:master和worker进程是父子关系,有亲属关系的进程通过pipe/pipe2&#x…

Genio 500核心板,MT8385安卓核心板定制方案

Genio 500(MT8385)核心板搭载Arm Neon引擎的四核Arm Cortex-A73和Cortex-A53,提供必要的处理能力,可以通过2D/3D图形加速器进行增强,然后在高分辨率触摸屏显示器上进行可视化。为了提供先进的多媒体应用和服务&#xf…

电商后台管理项目vue3+express

目录 源码 1.系统功能设计 技术栈:采用前后端分离的开发模式前端:Vue3、Vue-router、Element-Plus、Axios、Echarts后端:Node.js、Express、Jwt、Mysql、Sequelize 2.项目初始化 打开cmd,输入vue ui(vue-cli版本要…

Java程序设计入门教程--日期类Date

java.util.Date类是一个简单的日期处理类,它包含了一些关于时间和日期的操作方法,精确到毫秒。它的常用方法如表所示: 方法 说明 public Date() 构造方法,分配 Date 对象并用当前时间初始化此对象,以表示分配它的时…

2023年6月DAMA-CDGA/CDGP数据治理认证你考了吗?

DAMA认证为数据管理专业人士提供职业目标晋升规划,彰显了职业发展里程碑及发展阶梯定义,帮助数据管理从业人士获得企业数字化转型战略下的必备职业能力,促进开展工作实践应用及实际问题解决,形成企业所需的新数字经济下的核心职业…

NUC980编译错误,arm-linux-gcc: Command not found

报错问题: make: arm-linux-gcc: Command not found /bin/sh: 1: arm-linux-gcc: not found dirname: missing operand 昨天编译的时候,还小甜甜,今天就牛夫人了。啥也没干啊! -----------------------------------------------…

亚马逊云科技与涂鸦智能持续赋能开发者,推动全行业的数智化创新

近几年,智能产品已渗透至人们生活的方方面面,IoT技术市场规模也随之获得较快增长,据IoT Analytics的数据,2023年IoT市场规模将增长19%,或成为经济波动周期的一大黑马赛道,但下游应用场景与需求的高度碎片化…

从零开始Vue3+Element Plus后台管理系统(17)——一键换肤的N种方案

暗黑模式 基于Element Plus和Tailwind CSS灵活的设计,我们很容易在项目中实现暗黑模式,具体可以参考之前的文章《从零开始写一个Vue3Element Plus的后台管理系统(二)——Layout页面布局的实现》 换肤方案 如果需要给用户提供更多主题,更丰…

【Android项目开发】聊天功能-主界面设计(对标企业需求)

文章目录 一、引言二、详细设计1、解决需求(1)图形问题(2)文本长度问题(3)时间转换问题 2、UI设计(1)主界面(2)适配器 3、Adapter适配器4、测试参数 三、附录…

龙芯2K1000实战开发-USB/PCIe/HDMI外设开发

文章目录 概要整体架构流程技术名词解释技术细节小结概要 提示:这里可以添加技术概要 本文主要针对2k1000的PCIE和USB外设的国产化设计 整体架构流程 提示:这里可以添加技术整体架构 使用2k1000自带的以太网pcie控制器,USB控制器。 考虑到龙芯没有HDMI接口,选用龙讯半…

从小白走向进阶:如何系统的学习it技术

无论是初学者还是有经验的专业人士,在学习一门新的IT技术时,都需要采取一种系统性的学习方法。那么作为一名技术er,你是如何系统的学习it技术的呢。 一、it技术介绍 1. Spring、SpringMVC、MyBatis、MyBatis-Plus、tkMapper,Spri…

分享一组真实的按钮

先看效果图&#xff1a; 再看代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>发光的按钮</title><style>* {border: 0;box-sizing: border-box;margin: 0;padding: 0;…

VMware ESXi 8.0U1a macOS Unlocker OEM BIOS (标准版和厂商定制版)

VMware ESXi 8.0 Update 1a macOS Unlocker & OEM BIOS (标准版和厂商定制版) ESXi 8.0U1 标准版&#xff0c;Dell HPE 联想 浪潮 定制版 请访问原文链接&#xff1a; https://sysin.org/blog/vmware-esxi-8-u1-oem/&#xff0c;查看最新版。原创作品&#xff0c;转载请保…

pytorch实战 -- 初窥张量

张量的创建 张量&#xff08;Tensors&#xff09;类似于NumPy的ndarrays&#xff0c;但张量可以在GPU上进行计算。 所以从本质上来说&#xff0c;PyTorch是一个处理张量的库。一个张量是一个数字、向量、矩阵或任何n维数组。 下面分别展示了0维张量到n位张量&#xff1a; im…

SVN客户端的下载和安装(图文超详细)

目录 0.准备工作 1.SVN客户端安装包安装 2.安装语言包 0.准备工作 博主安装环境&#xff1a;windows x86 SVN客户端下载地址&#xff1a;下载 SVN (tortoisesvn.net) 【下载地址中需下载符合电脑版本的安装包&#xff0c;以及语言包】 注&#xff1a;下载两个包后&#…

Linux操作系统相关介绍

目录 一、认识Linux 二、Linux特点总结 三、Linux版本 &#xff08;1&#xff09;Linux内核版 &#xff08;2&#xff09;Linux发行版 一、认识Linux • 1991年&#xff0c;芬兰的一名大学生Linus Torvalds开发了linux内核 • Linux是一种开放源代码的、自由的、免费的类…

Zookeeper面试这一篇就够了

谈下你对 Zookeeper 的认识&#xff1f; ZooKeeper 是一个分布式的&#xff0c;开放源码的分布式应用程序协调服务。它是一个为分布式应用提供一致性服务的软件&#xff0c;提供的功能包括&#xff1a;配置维护、域名服务、分布式同步、组服务等。 ZooKeeper 的目标就是封装好…