大数据就业路线

news2024/9/23 1:32:06

✨博文作者:烟雨孤舟
💖 喜欢的可以 点赞 收藏 关注哦~~

✍️ 作者简介: 一个热爱大数据的学习者

✍️ 笔记简介:作为大数据爱好者,以下是个人总结的学习笔记,如有错误,请多多指教!

 

 

数仓:主要以SQL语言为主离线数仓(目前基本状态)和实时数仓(趋势)
    SQL语法包括mysql中的sql、hive中的hive sql(重点),spark中的    spark sql,flink中的flink sql
    离线数仓需要掌握:
        hadoop(HDFS,MapReduce,yarn)
        hive(重点,hive底层原理,hiveSQL及调优)
        Spark(spark会用及了解底层原理)
        Oozie(调度工具,会用即可)离线数仓建设(搭建数仓,数仓建模规范)维度建模(建模方式常用的有范式建模和维度建模,维度建模是重点)
    实时数仓需要掌握:
        hadoop(这是大数据的基础,必须掌握)
        kafaka(重点,大数据领域唯一的消息队列)
        flink(重点,实时计算的老大)
        hbase(会使用,了解底层原理)
        druid(会用)

大数据开发工程师:
    写代码为主,以java和scala为主。大数据开发分两类,第一类是编写hadoop、spark、flink的应用程序,第二类是对大数据处理系统本身进行开发,如对开源框架的扩展开发,数据中台的开发。
    需要掌握的知识:
        java和scala
        linux
        hadoop
        hive
        spark
        kafaka
        flink
        hbase

ETL工程师:
    ETL是抽象转换加载,ETL工程师是对接业务和数据的交接点,所需要处理上下游的关系,对上游需要和业务系统的人打交道,要对业务系统比较熟悉;对下游需要和数据开发工程师打交道,将准备好的数据(数据的清洗、整理、融合)交给下游的数据开发和数据科学家
    需要掌握的知识:
        java和python
        shell脚本(熟悉)
        linux(基本使用)
        kettle(需要掌握)
        sqoop
        flume
        mysql
        hive
        hafs
        oozie(任务调度框架会使用一个即可)

数据分析工程师:
    数据工程师准备好数据维护好数仓,就到数据分析师了,根据业务分析结论制定业务策略或者建立模型,创造新的业务价值并支持业务高效运转。数据分析师在后期分为数据爬虫、数据挖掘和算法工程师三个分支。
    需要掌握的知识:
        数学知识(数据分析师的基础知识如统计学、线性代数)
        编程语言python、R语言
        分析工具(Excel是必须的,还要Tableau可视化工具)
        数据敏感性    

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/673378.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

English Learning - L3 作业打卡 Lesson7 Day46 2023.6.19 周一

English Learning - L3 作业打卡 Lesson7 Day46 2023.6.19 周一 引言🍉句1: If your life were a book and you were the author, how would you want your story to go?成分划分弱读连读语调 🍉句2: That’s the question that changed my life foreve…

ps beta爱国版下载全过程

​前言: 前段时间也是写了一篇ps beta版本下载的全过程呀,当时那篇文章还没有将软件变成永久免费试用,所以ps beta只能进行7天的免费使用,很多朋友可能意犹未尽呀,所以现在继续,将软件变成永久免费使用​。…

步长(stride) | 填充(padding) | 扩长(dilation)

这几个名词中文真的好难翻译,不是大佬就不要造名词了,后面还是老老实实用英文吧!(标题是机翻的 。) stride stride 很好理解,stride 就是卷积核移动的步长。 如下图: stride1 stride2 paddi…

【嘉立创EDA】复合焊盘的引线居中对齐,typc接口引线对齐方法

文章路标👉 文章解决问题主题内容小结文章解决问题 1️⃣ 嘉立创EDA中对齐工具越发完善,但一些特殊的器件引线中,由于对齐属性设置等原因,部分引线无法与焊盘完全居中对齐,影响了线路的表象美观度与里内信号铺面。本文主要讲述如何应用嘉立创EDA的其他技巧将器件引线与…

基於Hadoop HA 在kerberos中配置datax

概要 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 概要 前言一、基於HADOOP HA 搭建datax二、基於HADOOP HA 配置好的datax去配置kerberos1.在datax的配置文件中進行配置2.在shell腳本中加入認證語句 总结 前言…

detrex | 面向detr系列的目标检测开源框架

DETR作为Transformer应用于目标检测领域的开山之作,后续有大量的算法都是在其基础上改进而来,如Deformable-DETR,DAB-DETR,DN-DETR,DINO等。这些模型尽管都是采用DETR的基本架构,但其改进创新却各有千秋&am…

人工智能时代,你知道ai绘画如何使用吗?

在数字时代的今天,人工智能正逐渐渗透到我们生活的方方面面,艺术创作也不例外。ai绘画软件作为一种创新的工具,为艺术爱好者、设计师和创作者提供了崭新的创作方式。但是,对于初次接触这类软件的人来说,可能会感到一些…

EMC学习笔记(四)地的设计

地的设计 1.接地的含义2.接地目的3.基本的接地方式3.1 单点接地3.2 多点接地3.3 浮地3.4 以上各种方式组成的混合接地方式 4.关于接地方式的一般选取原则4.1 单板接地方式 接地是抑制电磁干扰、提高电子设备EMC性能的重要手段之一。正确的接地既能提高产品抑制电磁干扰的能力&a…

静音或取消静音?苹果AirPods17Beta版推出全新功能

近期,苹果的AirPods系列耳机推出了一些新功能,iOS 17 Beta版用户已可解锁尝试。 其中,第一项功能是静音或取消静音,适用于AirPods Pro(第一代和第二代)、AirPods(第三代)和AirPods …

【C++11】右值引用和移动语义 万能引用和完美转发

文章目录 1 右值引用和移动语义1.1 左值引用和右值引用1.2 右值引用的使用场景1.3 新的类功能 2 万能引用与完美转发2.1 万能引用的基本介绍和使用2.2 完美转发2.3 完美转发的实际应用场景 3 可变参数模板3.1基本语法3.2递归函数方式展开参数包3.3逗号表达式展开参数包3.4 可变…

javaee sql注入问题

jsp页面 <% page language"java" contentType"text/html; charsetutf-8"pageEncoding"utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> &…

第三章 GoogLeNet网络详解

系列文章目录 第一章 AlexNet网络详解 第二章 VGG网络详解 第三章 GoogLeNet网络详解 第四章 ResNet网络详解 第五章 ResNeXt网络详解 第六章 MobileNetv1网络详解 第七章 MobileNetv2网络详解 第八章 MobileNetv3网络详解 第九章 ShuffleNetv1网络详解 第十章…

基于Java软件科技公司信息管理系统设计实现(源码+lw+部署文档+讲解等)

博主介绍&#xff1a; ✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战 ✌ &#x1f345; 文末获取源码联系 &#x1f345; &#x1f447;&#x1f3fb; 精…

STM32启动模式

M3/M4/M7内核复位后&#xff0c;做的第一件事&#xff1a; 从地址0x00000000处取出堆栈指针MSP的初始值&#xff0c;该值就是栈顶地址。从地址0x00000004处取出程序计数器指针PC的初始值&#xff0c;该值是复位向量。 芯片厂商可能会把0x00000000和0x00000004地址映射到其它的…

ADC(模数转换)详解

ADC&#xff08;模数转换&#xff09;详解 前言ADC的定义ADC简介ADC特性ADC时钟工作模式单通道单次转换练习多通道扫描模式单次转换 前言 在STM32微控制器中&#xff0c;ADC代表模数转换器&#xff08;Analog-to-Digital Converter&#xff09;。ADC是一种用于将模拟信号转换为…

【Linux】程序地址空间?进程地址空间

目录 程序地址空间回顾进程地址空间什么是进程地址空间&#xff1f;进程地址空间与PCB、物理内存、页表和磁盘之间的关系为什么要存在虚拟地址空间&#xff1f;重新理解地址空间 程序地址空间回顾 了解进程的运行&#xff1a; 1 #include <stdio.h>2 #include <unist…

Web安全——HTML基础

HTML 一、对于前端以及后端的认识以及分析二、HTML认知1、网页的组成2、浏览器3、Web标准 三、简单的HTML页面架构四、HTML常见标签1、meta标签2、标题标签3、文本属性4、form表单5、a 标签6、锚文本7、img 标签8、table 表格9、列表标签9.1、无序列表9.2、有序列表 10、框架的…

个人工作总结和计划怎么写

工作总结和计划怎么写1 20__年就快结束&#xff0c;回首年的工作&#xff0c;有硕果累累的喜悦&#xff0c;有与同事协同攻关的艰辛&#xff0c;也有遇到困难和挫折时惆怅&#xff0c;时光过得飞快&#xff0c;不知不觉中&#xff0c;充满希望的_年就伴随着新年伊始即将临近。可…

C++ 重载函数

文章目录 前言一、什么是重载函数&#xff1f;二、重载函数的类型&#xff0c;作用。1. 构造函数重载&#xff1a;2. 运算符重载&#xff1a;3. 函数重载&#xff1a;4. 成员函数重载&#xff1a; 总结 前言 一、什么是重载函数&#xff1f; 在C中&#xff0c;函数重载&#x…

【Linux工具篇】---vim的基本使用

个人主页&#xff1a;平行线也会相交 欢迎 点赞&#x1f44d; 收藏✨ 留言✉ 加关注&#x1f493;本文由 平行线也会相交 原创 收录于专栏【Linux专栏】&#x1f388; 本专栏旨在分享学习Linux的一点学习心得&#xff0c;欢迎大家在评论区讨论&#x1f48c; 目录 &#x1f370…