运维工程师,刚入职一个之前没有运维的公司,该做什么?

news2024/11/15 18:00:23

在这里插入图片描述

运维工程师,刚入职一个之前没有运维的公司,该做什么?

下面内容,只谈技术工作方面的,人情世故的方面自己体会吧。。。。

前言

写这个,主要是有一个朋友,也是运维工程师,五年以上运维经验了吧,中小公司都待过。最近又入职了一家公司,这家公司开发团队大概十多个人,三十多台服务器,测试、开发、正式环境没有做好区分,开发人员都是手动上线,服务器在阿里云三个账号下,中间件比如对象存储、MySQL、Redis、MQ都用的云服务。最近这家公司换了领导,好像也是打算梳理一下业务,就招了一个专职运维。

我这个朋友感觉

之前没有运维,现有的工作一团乱麻,且现在都用了云服务,运维还能干啥?
万一出现裁员,运维还是第一波被裁

现在刚入职连干劲都没了。。。。我也是服了。

接着昨天的文章来写,说一下我的一些看法。

对于一些中小型公司,开发团队10人一下,有时候还真的没必要专门招一个运维工程师。服务器规模太小,业务也处于快速迭代阶段,开发、测试、正式,没有区分,再正常不过了。出现了问题,就及时改,反正用户量不大,客户不多,影响不大。甚至开发一天发布上线十多次都不在话下。没有测试、外面找的UI/UE,LNMP架构甚至就搞定了。

但是当业务趋于稳定,开发团队规模上来之后、服务器规模不断变大,比如20-30人团队,服务器在30台以上,肯定要招专门的UI/UE、测试工程师、运维工程师、小程序、安卓、IOS、产品经理、项目经理,不会只是前端、后端,甚至只有几个兼职全栈。

记住一句话:专业的人做专业的事,才能得到专业的结果!

回到正题,在这种情况下,到这种规模和团队的公司,怎么开展工作?

1. 梳理资源

要梳理运维负责的范围内的所有资源,比如:

云资源:
用的都有哪几个云厂商?有几个云账号?都在谁手里?谁在管理?
云账号下都有哪些资源?CDN、对象存储、关系数据库、缓存数据库redis、MQ、SLB、域名、CA证书等等,都用了哪些?
服务器有多少台?怎么登陆的?是直接SSH,还是通过VPN(大概率不会是VPN,一个是付费,还有开源的并不好配置)
这些云资源,有没有快到期的,比如域名、CA证书要续费
这些云资源,配置是什么样的?每个月使用情况怎么样?每个月大概需要花多少钱?
云服务有没有专门的供应商对接群?有没有优惠?

费用:
购买云服务需要走什么流程,报销该怎么走?
(记住:购买云服务绝对不要自己垫钱,然后走报销流程!!!)

权限管理:
梳理所有的账号及权限,都在谁手里?需要不需要运维管理?

备份:
有没有数据备份策略?如果有的话,大概多少天备份一次?
是用脚本做的备份?还是云厂商有备份策略?

代码管理:
是自建的,还是用的云服务,用量怎么样?

容器:
有没有用到docker、k8s

监控与告警:
有没有监控告警?有自建的监控告警系统吗?是基础的系统告警,还是带有业务、访问、带宽更高级一些的?

域名:
有几个域名,都关联的什么业务?后面对应的什么服务?什么语言?怎么部署的?

数据库与中间件:
都用了哪些?哪些服务用到了?量大吗?自建的还是云服务的?

自建机房:
有些公司还有硬件设备,一些老的服务器,之前没有用上,运维来了,就得用上。
服务器在哪?有没有专线?自建机房还是托管机房?有没有公网IP?有多少台服务器?服务器跑着没有?配置怎么样?有几台能用的?
要不要用到VPN?交换机和防火墙什么配置?能不能直接做端口映射?
服务器要不要做超融合,还是用破解的Vcenter+Esxi,还是用其它虚拟机平台开源方案?

2. 熟悉流程

现有的代码开发流程是什么样的?

前后端开发代码都部署到那里了?

开发、测试、正式,有没有做大区分?就是至少域名、服务器全分开

一般多长时间发版一次?什么时间发版?怎么发版?发版流程是什么样的?发版的时候需要运维配合什么?

这么报销的?都哪些可以报销?

日常加班吗?加班有补助还是有调休?还是义务加班?

3. 提出建议与计划

上面的1、2和这个3,并不是孤立的,很可能是交叉着来的,甚至有时候领导安排了一个新活儿,你要先去干其他的
当你摸清楚情况后,只有你一个人,领导还要看到你的工作成绩,就要提出自己的工作计划与建议

针对上面的一些情况,可以作出一些安排

对于云资源和云服务,以及云服务付费,可以汇总成一个表格,统计好相关的情况,每周、每月汇报一次。
第一次可能会比较麻烦,但是后面就是修修改改了。可以试试用CMDB了。

开发的权限、运维的权限,做好梳理后,就是进一步规范,谁能做什么,怎么做?草台班子要一步步走向正规,权限细分是必须的。
可以尝试用到堡垒机了。

代码管理,如果用的是云的,那就还让开发来管。

监控告警,可以考虑用夜莺、zabbix,或者grafana+prometheus+alert,或者云服务。服务器基础告警、业务流量带宽告警、页面可用性告警,能想到的都安排上。

前后端分离、高可用、CDN缓存、弹性伸缩,等等,都安排上。

容器化如果之前没有用上,可以不着急推,因为刚开始的配置管理很麻烦,用起来之后倒是很省事。

日志收集与分析系统,安排上,elk那一套就行,用云服务也行,只要不怕花钱。主要是可以用来分析用户访问情况(收集nginx日志)、排查程序出错(收集程序日志)。

程序发布,要不要用jenkins做流水线发布?

主要围绕下面几个方向来考虑:

  1. 数据库管理
  2. 中间件管理
  3. 云服务管理
  4. 服务器管理
  5. 流水线发布
  6. 容器平台
  7. 监控告警系统
  8. 日志收集与分析系统
  9. 代码管理
  10. 域名与证书管理
  11. 域名配置管理
  12. 网络安全与VPN
  13. 云服务费用管理
  14. CDN
  15. 自建机房与超融合、自建虚机平台

上面的这些,摊开来做,每一项都需要花一段时间。有的甚至你一个人就搞不定。
所以,别怕没活干!

4. 按照计划逐步推进

1 2 3,都了解完,做完了,估计就要一段时间了,然后按照计划逐步推进就行了。让领导看到你干活了,让开发看到你干活了。
把这些东西跑顺了之后,活就好干了,就不会那么忙了。

上面的工作,你自己想要搞定,没有半年以上的时间是不行的!
正常进度,对于一家公司来说,有些需要两三个运维才能搞定。甚至对于刚开始烂摊子状态,一年也不一定能搞完,只能搞完一部分。
有些模块,对于一些公司来说,没那么重要。看需求来做就行。
这个过程中,也可能会招新人。如果不招新人,那就慢慢干,有进度就行

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1966694.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【STL】之 list 使用方法和模拟实现

目录 前言: list是什么? 节点类 迭代器类: list类 list的迭代器失效问题 前言: 之前我们分别手撕了string类和vector类,今天我们来跟list类打打交道~ list是什么? 通过查c文档可知,list…

(2)基于巴法云+MQTT+微信小程序控制esp8266点灯

目录 1、wifi配置指令表 2、连接连接wifi网络 3、连接巴法云MQTT (1)配置用户属性ATMQTTUSERCFG ① 命令格式: ② 命令参数: ③ 实际配置方式: (2)配置ESP 设备连接的 MQTT broker ① 命令格式…

【AI大模型】自动辅助驾驶的“大模型”时代

🎈边走、边悟🎈迟早会好 一、自动辅助驾驶实现与设计 1. 系统架构 1.1. 传感器系统 摄像头:提供前视、侧视、后视等多角度图像数据,用于检测车道线、交通标志、行人和其他车辆。雷达(RADAR)&#xff1a…

【python】PyQt5中QRadioButton的详细用法教程与应用实战

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

论文速递 | Operations Research 6月文章合集

编者按: 在本系列文章中,我们梳理了运筹学顶刊Operations Research在2024年6月份发布的9篇相关文章的基本信息,旨在帮助读者快速洞察领域新动态。 推荐文章1 题目:Tight Guarantees for Multiunit Prophet Inequalities and On…

list模拟实现--用节点封装的迭代器问题

目录 一、list的使用 1.1list的构造 1.2list的iterator ​编辑 1.3 list的capacity 1.4 list的element access ​编辑 1.5list的mdifiers ​编辑 二、list的迭代器失效问题 三、list的模拟实现 3.1定义一个节点类 3.2用节点去封装迭代器 编译器对->的优化问题 …

JavaScript做网页是否过期的处理

通过路由上的参数生成唯一md5和路由上token做验证_md5 token-CSDN博客 前言:基于这篇文章我们做网页是否超时,网页是否过期的处理。打开一个网页允许他在一定时间内可以访问,过了这个时间就不可以访问了,encrypt是h5加密方法&…

数据仓库基础理论—维度建模(图文详解)

数据仓库基础理论—维度建模 维度建模是数据仓库设计中的一种核心方法,旨在以业务角度组织数据,使其更易于理解、查询和分析。 1. 维度模型的基本概念 1.1 事实表(Fact Table): 事实表是维度模型的核心&#xff0…

ARM编程指令二

一、算术指令 1. add指令 功能: 将两个操作数相加,并将结果存储在目标寄存器中。 ADD R0, R1, R2 // R0 R1 R22. sub指令 功能: 将第二个操作数从第一个操作数中减去,并将结果存储在目标寄存器中。 SUB R0, R1, R2 // R0 R1 - R23.ADC指令- 带…

强化学习机械臂

一.前言 这里记录一下我学习强化学习的一些知识,并希望在今后可以通过仿真成功验证算法,如果时间允许的情况下希望可以结合到真实机械臂上。 二.学习过程 机械臂强化学习实战(stable baselines3panda-gym) 这里我先用anaconda创…

【原创教程】电气电工常用剥线钳和压线钳(入门篇)

今天我们来看一下电气电工经常会用到的工具,剥线钳和压线钳。 首先我们看剥线钳做什么用?主要就是剥线,让内部的铜丝裸露。我们来看一下,我们经常用到的剥线钳。 1、带刃口剥线钳 2、自动剥线钳 3、鸭嘴剥线钳 下面看压嘴剥线钳…

Nodejs的使用

1.安装nodejs服务器。 java 项目可以运行在 tomcat 服务器,开始完成前后端完全分离。前端有自己独立的工程。我们需 要把前端独立的工程运行起来。 --- 运行在 nodejs 服务器下。 理解为 tomcat 服务器 安装成功后在命令窗口查看 1.1 安装npm java 项目需要依赖…

finalshell连接kali-Linux失败问题略谈

如果你正在使用fianlshell或者xshell等终端软件远程连接Linux进行工作,但是突然有一天,你死活连不上了,报错提示如下: java.net.ConnectException: Connection refused: connect 就像这样: 哪怕是重装虚拟机&#xff0…

HardSignin _ 入土为安的第十二天

有壳 55 50 58 用010 把vmp改成upx ctrlf2,查找main函数 点第三个 Ctrlx交叉引用 把花指令改了90 一共三处 找db按c 找函数按p封装,按f5反编译函数 smc 用pythonida绕一下 from ida_bytes import * addr 0x00401890 for i in range(170):patch_byte(addr i,…

排序算法----冒泡,插入,希尔,选择排序

冒泡排序 原理 冒泡排序实际上是交换排序,将大的数据通过交换的方式排到一边,依次进行 代码实现 void Swap(int* p1, int* p2) {int temp *p1;*p1 *p2;*p2 temp; }void BullerSort(int* a, int n) {for (int end n - 1; end > 0; end--){for …

卷积神经网络理论(CNN)·基于tensorflow实现

传统神经网络的输入是一维的数据(比如28*28的图片,需要转化为一维向量)。 而卷积神经网络的输入是一个三维的(比如RGB)。 结构 卷积神经网络有以下结构: 输入层卷积层池化层全连接层 输入层 顾名思义,输入层就是输入数据(可以是图片等数…

仅缺一位作者,年内书号

《工程测量学概论》缺第三 《风景园林设计与施工技术研究》缺第二 《对外汉语教学方法与实践研究》缺第三 《基于视觉传达设计下的民间艺术发展研究》缺第三 《英语教学基础与翻译技巧》缺第三 《博物馆学体系与博物馆探究学习》缺第三 《新时期高校辅导员工作与队伍建设研究》…

迈向数智金融:机器学习金融科技新纪元的新风采

个人名片: 🐼作者简介:一名大三在校生,喜欢AI编程🎋 🐻‍❄️个人主页🥇:落798. 🐼个人WeChat:hmmwx53 🕊️系列专栏:🖼️…

怎么通过 ssh 访问远程设备

文章目录 什么是 SSH背景环境配置前置准备在 linux 系统中安装 ssh 组件 什么是 SSH ssh 全称是 Secure Shell, 有时候也被叫做 Secure Socket Shell, 这个协议使你能通过命令行的方式安全的连接到远端计算机。当连接建立就会启动一个 shell 会话,这时你就能在你的…

Kubernetes中间件监控指标解读

监控易是一款功能强大的IT监控软件,能够实时监控和分析各种IT资源和应用的状态,为企业提供全面而深入的监控服务。在Kubernetes中间件监控方面,监控易提供了详尽的监控指标,帮助用户全面了解Kubernetes集群的运行状态和性能表现。…