211大数据专业大四学生,放弃字节转正,选择老家大型国企,听听他怎么说?...

news2024/11/24 22:25:00

点击上方 "大数据肌肉猿"关注, 星标一起成长

点击下方链接,进入高质量学习交流群

今日更新| 1052个转型案例分享-大数据交流群

d5669e1170adfe77fcb181de32690f93.png

分享学习群一位大数据专业同学的秋招学习和求职经历,他是211大四学生,年初才开始学习,但还好赶上了春季实习,拿了一些大厂的实习offer,其中包括字节、阿里美团等,最后选择了去字节实习。

但几个月的字节实习经历以及他对生活的规划,让他不想继续待在北京,于是秋招全身心投老家地方国企和中厂,也收割了一些offer,最终签了一家省内大型国企。

3e966ff18a1ff60a9b88932f344db5d6.jpeg

背景介绍

211本科大数据专业大四学生,虽然是大数据专业,但学校主要教学的是数学和统计相关的深度学习导向的课程,跟大数据没有任何关系。

到大三的时候发现算法方向自己不是很感兴趣,而且学习和求职门槛都比较高,于是想转大数据开发。刚开始计算机基础非常薄弱,没有学习过Java语言,上课学过一点C,需要补足的地方还很多。

学习过程

从大三下才开始跟着峰哥安排的计划开始学习,那个时候已经非常晚了,而且我是一个零基础的状态,但峰哥说还来得及,也给我吃了颗定心丸。

从Java基础开始,然后就是hadoop、spark和hive等框架,中间穿插着算法和八股文面经的学习。大概在刚开始学没多久,春招实习就已经开始了,刚开始很犹豫,觉得自己什么都不会就不敢投递。但峰哥鼓励我早点学完项目就可以投,后面到4月份的时候边投递边学习,慢慢有了笔试和面试的机会。

现在回过头来看,觉得学习大数据开发可以从Java和计算机基础、大数据框架、项目三个方面来学习。

Java和计算机基础

编程语言基础:Java基础是所有后续大数据学习的基石。我最开始是通过看书学习,看完后没有什么感觉,后面峰哥推荐了跟着对应的视频学习,每一个知识点都讲的非常全面,也会有详细的案例。如果你是零基础,建议看视频入门,代码一定要自己敲一遍,切忌眼高手低!Java 的书就推荐《Java编程思想》。

此外,还有Scala语言,因为后续要学到 Spark、Flink等框架,这些框架采用Scala编程极为灵活,所以需要学习Scala的编程规范。关于Scala学习,建议在spark学习之前学习。

我认为计算机科学和基础还是很重要的,软件工程师分为两种:一种充分理解了计算机科学,从而有能力应对充满挑战的创造性工作;另一种仅仅凭着对一些高级工具的熟悉而勉强应付。这两种人都自称软件工程师,都能在职业生涯早期挣到差不多的工资。

然而,随着时间流逝,第一种工程师不断成长,所做的事情将会越来越有意义且更为高薪,不论是有价值的商业工作、突破性的开源项目、技术上的领导力或者高质量的个人贡献。

对于计算机基础的学习,如果时间还比较充分的同学建议花时间弄懂操作系统、计算机网络和数据库。如果有志于打下扎实的计算机基础,可以参考github的自学项目,有很多经典的高校课程。如果时间不算很充裕或者英文水平没有很好,可以阅读工业出版署翻译过来的黑皮书。

大数据框架

学完Java之后就可以开始学习hadoop,是大数据框架的基础。然后可以学习hive,之后可以分别学习批流计算的主流框架spark和flink。单独学习完这几个框架之后就可以开始项目的学习,在项目中将剩余的组间边用边学。

项目学习

第一步我们首先是看视频做项目,很多过程中如果没有演示自己很难发现错误在那个地方。我们跟着视频学完,代码可以不需要跟视频里一模一样,最好要有自己的理解,然后找一些可以优化的地方,不断优化,这就体现出和别人的差别了。

比如我们学习的都是数仓项目,我们投递金融公司的时候可以跟量化结合,怎么去存储股票等相关数据;我们投递电商公司就与电商数据结合;投递的是做视频平台的就可以与视频流数据结合,让我们的项目有特点。但这也不是绝对的,具体可以咨询峰哥修改建议。

做完之后可以将代码上传到github或者gitee上,简历上贴出自己的地址,是一个不错的加分项。

第二步我们可以去github上找一些项目甚至是框架源码来看,首先我们保证能根据文档将整个代码运行起来,我们首先知道项目代码有什么作用,才能找到对应的模块去看懂代码。

实习简历投递和面试

我在一个月的时间内快速学习了Java和hadoop、Hive和项目之后就开始投递简历,简历上主要就是我上面学习过程中提到的三个部分,主要的亮点我认为在于项目的展示,将自己的亮点在项目中展示出来,遇到了什么困难,自己是怎么解决的,有什么思考和提升。

然后边投边继续补充实时项目以及一些面经,面试也是一个很好的学习过程,千万不要等全部准备好再开始面试。

面试所问的题部分偏基础,部分考察面试者的思想,因为比较多我就贴一下字节实习时候的面经:

一面(1h10min)

1.自我介绍一下
2.介绍一下你的项目
2.1 Mysql全量数据规模
2.2 既然Mysql能存储,为什么要导入到hive中
3.说一下MySQL的ACID特性
4.脏读和幻读分别是什么含义
5.spark持久化的级别和作用
6.spark任务出现数据倾斜有哪些方法解决
7.hive没办法创建分区怎么理解,怎么解决。
8.常见的工厂模式有哪些
9.介绍一下TCP连接,三次握手。
10.为什么要三次握手,如果两次握手会出现什么问题呢?
[算法题]
1.情景题:客户端发送请求,batch数
数组题,面试官手打。
2.判断一棵树是否是二叉搜索树
说一下什么是二叉搜索树。

二面(1h20min)

1.自我介绍
2.深挖项目
2.1 项目需求
2.2 最终交付的成果,数据从哪里,对交付方有什么帮助
2.3 怎么理解数仓建模
2.4 举一个真实的例子,介绍你负责的项目
2.5 介绍一下你是怎样建模,为什么要这么建模的。
3. 数据爬取,爬虫是怎么拿到数据的,根据你介绍的聊后续扩充
3.1 你写一个爬虫,为什么能拿到你想要的数据,中间经历了什么
3.2 扩展,当你需要爬取的数据量增大,你怎么处理
3.3 并行爬
4.如果多个任务都在爬取网站,如何保证吞吐量尽可能高的同时不让爬取的网站宕机或任务崩溃(大概是这样)
5.收到大量的url,如何选择任务分发模式(分布式场景)
6.介绍一下MapReduce的过程
7.map端的数据如何保证分发到reduce数据的准确性
8.Java中的集合、类有用过嘛
9.SQL题
很简单的多表查询单列聚合。
10.Linux命令,一个进程很慢,你会查看什么指标,用什么命令去分析,可能是什么原因
11.算法题:链表
链表求和的变式:https://leetcode.cn/problems/sum-lists-lcci/

实习经历和感悟

写在最前面,对于开始的比较晚的我找实习其实是一段很痛苦的经历,除了自己的努力更需要一定的运气。我想不论找到实习还是没有找到实习都会焦虑,这很正常,重要的是我们如何为后来的秋招做更加充分的准备。

刚开始进入部门实习的时候没有接触过框架这么复杂的代码,什么都不懂,后来看觉得这很正常。刚入职的时候不要不好意思问问题,只要能够提高工作效率,完成工作任务就去问。mentor也跟我说不用担心问问题,最担心的是自己什么也不说,最后一问什么都没做出来,一个人闷在那。尽快熟悉业务实习代码,提高效率,快速成长起来才是我们需要专注的。

然后刚进去的时候可能会想,不想做一些边缘的事情,比如机械化的CRUD,但是后来实习后发现,不通过一些简单的小项目直接上手整个部门的业务是比较困难的。而且工作以后很多事情,不是自己能把控的,接受工作的安排,然后在工作中去提升自己。

总体来说,在字节的实习对我的成长帮助是很大的,相比于阿里对于实习生的照顾,字节会在半个月后就开始安排工作,整个人会被push着去学习新的东西完成手头上的工作,部门内的氛围很好,和大家沟通都很顺利。但是下班之后几乎没有自己的业余生活了,食堂七点开饭,吃完饭之后晚上会回到工位继续工作到将近十点下班,大家都很年轻很有干劲。综合来看去到大城市大厂实习是非常重要的。

秋招经历和感悟

虽然实习的时候对于技术的提升非常热衷,但是个人对于以后生活的质量和工作与生活的平衡更加看重,特别是在北京生活几个月感觉生活非常单调,所以在秋招的时候并没有再去冲互联网的大厂,转向了自己家乡那边的中厂以及国企。

所以也放弃了字节转正的机会,这期间也拒绝了一些地方大厂给出的比较可观薪资的offer,知道了自己想要什么之后就不会迷茫,最终选择了一个省内的大型央企进去继续从事大数据的开发工作。

--end--

扫描下方二维码

添加好友,备注【交流】
可围观朋友圈,也可私信交流

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/79996.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

181.基于Django的云文件存储使用方式——七牛云存储

1.文件云存储 1.1 概述 在Django项目中,用户上传的文件以及项目中使用的静态文件,默认读书存储本地,保存在服务器中,但是,其实我们也可以将他们保存在云存储中,譬如七牛云存储、阿里云存储、亚马逊云存储…

【网络安全】提防黑客来“敲门”

前言 互联网在给我们带来便捷高效的同时,也给一些不法分子提供了可乘之机。网络诈骗、窃取个人信息等花样层出不穷,骚扰电话、垃圾短信扰乱着我们的正常生活,使网络空间抹上一笔灰色。网络安全与每个人都息息相关,所以我们必须理…

Python测试进阶(三)

文章目录性能测试JMeter测试计划模拟并发结果分析分布式性能监控grafanaFluxPrometheus小结性能测试 为什么做性能测试?主要是解决这些问题 什么是性能测试 模拟多个用户的操作,看对服务器性能的影响 指标 TPS:transaction per secondRT&…

基于Kubeadm快速部署一个K8s集群

目录kubeadm概述安装要求准备环境安装kubelet、kubeadm、kubectl使用kubeadm引导集群下载各个机器需要的镜像初始化主节点安装网络组件常用shell命令测试kubernetes集群部署dashboardkubeadm概述 kubeadm是官方社区推出的一个用于快速部署kubernetes集群的工具。 这个工具能通…

索引创建、删除的sql语句

目录 创建索引 使用ALTER TABLE 语句创建索引 使用CREATE TABLE 语句创建索引 删除索引 使用ALTER TABLE 语句删除索引 使用DROP INDEX 语句删除索引 创建索引 1、创建表的同时,指定给某个字段创建索引(name) create table cat(id …

SaaS 产品的文档策略

作者:Vaijayanti Nerkar 和 Priya Shetye,BMC Software 几年前,当 BMC Software 决定进军 SaaS 市场时,该公司开始投资开发基于云的产品。20多年来,BMC Software 产品都是典型的本地产品,因此,…

2022.12.11-YOLOv5使用NCNN将模型部署到Android端教程(1)部署自己的训练模型到Android实现静态图片检测

文章目录1. 前言2. 模型转换2.1. NCNN2.1.1. 简介2.1.2. ncnn2.1.3. ncnn-android-yolov52.2. 项目准备2.2.1. 安装Android studio2.2.2. 下载解压源码2.3. 安卓源码重新编译2.3.1. 构建工程2.3.2. 修改源码2.3.2.1. 修改CMakeLists.txt中的路径2.3.2.2. 重新重新ysnc project2…

【华为上机真题 2022】相对开音节

🎈 作者:Linux猿 🎈 简介:CSDN博客专家🏆,华为云享专家🏆,Linux、C/C、云计算、物联网、面试、刷题、算法尽管咨询我,关注我,有问题私聊! &…

【无需注册账号】只需两步, Ai Studio上也可以玩[ChatGPT]了

☆ 只需两步, Ai Studio上也可以玩[ChatGPT]了 ☆ 无需账号即可体验喽~ 体验地址 只需两步, Ai Studio上也可以玩[ChatGPT]了 文章目录☆ 只需两步, Ai Studio上也可以玩[ChatGPT]了 ☆0 Fork后进入项目应用中心体验☆本页面下方体验☆注意…

5G无线技术基础自学系列 | 勘测准备

素材来源:《5G无线网络规划与优化》 一边学习一边整理内容,并与大家分享,侵权即删,谢谢支持! 附上汇总贴:5G无线技术基础自学系列 | 汇总_COCOgsta的博客-CSDN博客 基站在详细的勘测之前需要做的准备包括…

CN_UDP协议

文章目录UDP协议UDP概述UDP的首部格式UDP数据报封装入IP数据报UDP校验伪首部真首部UDP数据报处理例UDP vs TCPUDP协议 User Datagram Protocol - Wikipedia 1Attributes2Ports3UDP datagram structure4Checksum computation 4.1IPv4 pseudo header4.2IPv6 pseudo header 5Reli…

百度安全查询,查询网址是否存在百度安全风险的方法

如果网站被百度安全识别为风险网站,或者是提示该页面可能存在虚假信息,该页面可能已被非法篡改,那么就不妙了。 怎样才能知道自己的网是否存在百度安全风险? 查询网站百度安全的方法: 第一步、打开SEO综合查询工具 第二步、添加…

[附源码]Python计算机毕业设计SSM基于的校园失物招领平台(程序+LW)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

线程池 (通俗易懂)

线程池一、线程池是什么二、标准库中的线程池三、实现线程池3.1 思路与细节3.2 完整代码四、标准库里的构造方法一、线程池是什么 之前我们已经认识过"池":String,字符串常量池;MySQL JDBC,数据库连接池(DataSource)……

【案例实践】EKMA曲线及大气O3来源解析

【查看原文】EKMA曲线及大气O3来源解析实践技术应用 目前,大气臭氧污染成为我国“十四五”期间亟待解决的环境问题。臭氧污染不仅对气候有重要影响,而且对人体健康、植物生长均有严重损害。为了高效、精准地治理区域大气臭氧污染,首先需要了…

【OpenCV学习】第14课:边缘检测与自定义线性滤波(卷积, Rebert算子, Sobel算子, 拉普拉斯算子)

仅自学做笔记用,后续有错误会更改 参考文章:http://t.zoukankan.com/whw1314-p-12007928.html 理论 卷积的概念: 在图像上使用卷积的目的:模糊图像, 提取边缘轮廓, 图像锐化等 卷积如何工作: 下边给出…

MATLB|基于燃料电池混合动力汽车双层凸优化

💥💥💥💞💞💞欢迎来到本博客❤️❤️❤️💥💥💥🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清…

算法基础篇-01-时间复杂度和空间复杂度

1. 用什么表示算法的运行快慢? n 代表是算法里面的问题规模,n越大,运算越慢,比如n1和n100肯定是不一样的;机器不一样,相同的算法代码运行所消耗的时间也不一样; 2. 借用生活中的案例 类比生活中…

[附源码]Python计算机毕业设计SSM基于的校园卡管理系统(程序+LW)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

鸿蒙开发初体验以及遇到的几点坑

今天尝试了一下鸿蒙开发,有一些经验跟大家进行分享。建议大家先看完我的文章,再去尝试鸿蒙。 我安装好了开发工具,并且跑通了Hello World程序。同时,我还跑通了小鸿网课Java版本项目: 感觉,还好吧… 操作…