工作进入第八年,还在成长的一年

news2024/9/29 19:26:41

        这一年没有写太多的技术博客,是因为工作内容发生了较大的改变,岗位也发生了调整。随着ChatGPT的爆火,无论从公司的领导层,还是从现场的用户,人工智能算是被彻底颠覆了,每个人对生成式人工智能的期待太高,胃口也被吊的太高。无论什么会议,哪怕一个技术讨论会,都会提ChatGPT。各种奇奇怪怪的需求层出不穷,搞得我这个门外汉一头雾水、抓痒挠腮。

       既然入了人工智能的部门,没办法,只能按着领导的要求去研究。从最初的ChatGLM到Llama、Baichuan,再到现在的ChatGLM4,大模型的发展真的是日新月异,百花齐放。从6月份开始,集团成立了柔性的大模型研究小组,由公司副经理级别领导牵头(公司的副经理是副处级干部,虽然没有行政职位,但相当于一个县城的副县长,也终于让我体会到了一些人的阿谀奉承、溜须拍马),一开始2个月时间,还是在写汇报PPT,真的是各种PPT,集团领导的,总部领导的,两周一汇报,每次汇报都要加三四天的班,甚至有的时候要到凌晨两三点。对于一直奋战在一线写代码的我,这一次真的对写文档和汇报PPT有了新的认知和了解,其他同事真的是各种PPT模板,各种贴图,而我啥也没有,各种图都要自己去找和画,自己画出来的还非常丑,没有效果,甚至我的思路都是不清晰的。领导看在眼里,旁敲侧击的提了一些要求,虽然她没点我名,但我知道她说的是我。

        有了6、7月份的初步探索,研究了模型的各种微调方式,但始终达不到满意的效果。到了8月份,开始走出去交流,先后找了阿里、华为、百度做了关于大模型构建的交流,其中给我印象最深刻的阿里,真佩服达摩院的技术研发能力,也明白了大模型的构建流程和效果。这里先列一些观点:

  • 模型的微调并不能使模型能够很好的学习专业领域知识,模型的泛化能力并不会得到较好的扩展;

  • 模型的思维链在参数量至少百亿级以上才能体现,在预训练阶段形成;

  • 模型的微调效果仅对训练集数据有较好的效果;

        基于上面的交流结果,领导意识到通用的开源大模型并不能满足具体的业务需求,所以开始思考大模型的整套构建流程,包括预训练、增量训练、微调、强化学习等。后来,领导决定先建立算力中心,小组就被拆成了2个部分,在很短的时间内,就完成了148张A800的采购,不得不佩服领导的决断力和眼界,因为后来美国发布了禁售令。当时大家都在开玩笑,做个中间商,这一批躺着赚钱啊。集团也开始扩充研究小组的人员,开展长期集中办公,由于我个人原因,想退出这个小组,结果惹的大领导一顿发火,最终,我的部门领导带着我和新补充的小伙子登门道歉解释。

        在参与大模型研究小组工作的同时,部门另外一个图像组惹出了一些事情,部门同事对图形工作根本没有任何规划和想法,导致很多工作毫无进展,公司大领导又非常重视,无奈之下,领导让我过来做管理,把具体事情细化,要求件件有着落,就这样,我又被推进了图像组。这里真的要吐槽下在国企里躺平的一些人,有一件事从3月份就开始分配给一个人,直到10月份,快比赛的时候,一点事情没做,找一大堆理由和借口,害的我临时救急,拉着一帮小弟通宵干活,最后并没有好的结果,我只能说我尽力了。

       这一年的工作难而杂,但我从中也学到了很多。比如如何和领导打交道,如何写汇报PPT,如何写汇报文档,技术能力上或许没有太大的提升,但文档能力有了一定的提高,也是一种经历,希望自己下一年再接再厉,也给出一点建议吧。

  • 和大领导打交道,少说话,多做事。
  • 和并不熟的合作关系同事打交道,分工明确,该拒绝拒绝。
  • 和自己的直属领导打交道,把事情做好,不给领导惹麻烦,能解决的事情尽量自己解决。
  • 工作上一定要自己有规划,能力其次,态度第一。
  • 提升自己的文档能力和写文档的逻辑能力。

        上面总结了工作,下面总结下生活。这一年主要的生活内容就是陪闺女成长,带她到处玩,陪她去了5次动物园,记不清次数的游乐场,当然还有几乎每月必去一次医院。带她去了杭州西湖、千岛湖、北京,她开心的不得了,本来计划在去趟上海,结果她又感冒了。我自己和同事去爬了趟黄山,可惜两天都大雨,幸运的是看到了极美的日落。对了,今年参加了一次半马,集团的篮球赛也获得了冠军。接下来的一年,也给自己定了几个目标,希望可以实现。

  • 如果中签,跑两次半马;
  • 三次旅行。去趟珠海、澳门、香港、广州;去趟上海;去趟三亚或云南;
  • 深入了解中国历史,以后给闺女讲故事;
  • 读五本书;
  • 提高英语听力和口语水平。

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1407469.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

架构篇24:排除架构可用性隐患的利器-FMEA方法

文章目录 FMEA 介绍FMEA 方法FMEA 实战小结 前面的专栏分析高可用复杂度的时候提出了一个问题:高可用和高性能哪个更复杂,根据墨菲定律“可能出错的事情最终都会出错”,架构隐患总有一天会导致系统故障。因此,我们在进行架构设计的…

Intel Atom + Artix-7 100T FPGA,CompactRIO单板控制器

模拟和数字I/O,RMC,DisplayPort,1.33 GHz双核CPU,1 GB DRAM,4 GB存储容量,Artix-7 100T FPGA,CompactRIO单板控制器 CompactRIO控制器是搭载了实时处理器和用户可编程FPGA的嵌入式控制器。其产…

低代码(Low-Code)技术简化开发难度,快速搭建应用

目录 一、低代码技术定义 二、低代码技术优势 1.提高企业的工作效率 2.降低企业的开发成本 3.提高应用程序和业务流程的质量 三、稳定性和生产率的最佳实践 三、最后 随着数字化时代的到来,低代码(Low-Code)技术已经成为了企业数字化转…

如何使用Docker本地部署Jupyter Notebook并结合内网穿透实现远程访问

📑前言 本文主要是Linux下通过使用Docker本地部署Jupyter Notebook并结合内网穿透实现远程访问的文章,如果有什么需要改进的地方还请大佬指出⛺️ 🎬作者简介:大家好,我是青衿🥇 ☁️博客首页:…

别不信❗️你离数据专家只差一个CDMP证书

1⃣️为什么选择CDMP证书? 🌟🌟亲爱的朋友们,如果你在寻找一个能让你在数据管理领域大展拳脚的证书,那么CDMP(Certified Data Management Professional)证书就是你的不二之选!&#…

JavaScript进阶:WebAPIs重点知识整理2

目录 1 对节点的相关操作 1.1 查找节点 1.1.1 查找节点的父节点 1.1.2 查找节点的子节点 1.1.3 查找节点的兄弟节点 1.2 新增节点(先创建,后追加) 1.3 克隆节点 1.4 删除节点 2 M 端(移动端)事件 3 JS清空表…

hadoop集群规划部署

一、集群规划 三台硬件资源,部署hadoop版本,hadoop-3.3.5 ,部署后配置文件。 Hadoop配置文件分两类:默认配置文件和自定义配置文件。 hadoop102hadoop103hadoop104HDFS NameNode DataNode DataNode SecondaryNameNode DataN…

深度强化学习Task3:A2C、A3C算法

本篇博客是本人参加Datawhale组队学习第三次任务的笔记 【教程地址】 文章目录 Actor-Critic 算法提出的动机Q Actor-Critic 算法A2C 与 A3C 算法广义优势估计A3C实现建立Actor和Critic网络定义智能体定义环境训练利用JoyRL实现多进程 练习总结 Actor-Critic 算法提出的动机 蒙…

Matlab|基于改进遗传算法的储能选址定容(可任意设定储能数量)

目录 主要内容 部分代码 结果一览(以3个储能为例) 下载链接 主要内容 该模型采用改进遗传算法优化配电网系统中储能选址位置和容量,程序以IEEE33节点系统为分析对象,以网损最小为目标,采用matpower实现系…

谷粒商城-微服务架构图

整体架构 分布式划分图

蓝牙运动耳机什么牌子的好?蓝牙运动耳机品牌排行榜前十名

​运动耳机是耳机中使用场景最广泛的一类,特别适合户外运动、健身和骑行等场景。在众多运动耳机中,哪一款更值得入手呢?今天我将向大家推荐几款相当不错的运动耳机,它们不仅音质上乘,还能满足不同运动场景的需求。 1.…

ozon促销活动100+店铺如何多店铺批量加入活动产品?ozon促销产品怎么删除?

很多Ozon卖家为实现店铺引流,会参与许多官方促销活动,如果每个活动都需要单独管理,会消耗不少的时间成本,操作起来也会非常困难。 尤其是随着运营店铺数量的增加,多个店铺多个促销活动来回切换管理,不仅耗…

modbus poll测试工具测试modbus tcp与PLC设备连接使用方法

socket默认端口是502,socket连上之后, 按照modbuspoll工具设置的读写参数 生成的RTU命令格式去组装读PLC的设备数据 modbuspoll工具配置,以v9.9.2中文破解版为例: 首先点连接菜单(connection)建立连接&…

Database history tablesupgraded

zabbix升级到6之后,配置安装完成会有一个红色输出,但是不影响zabbix使用,出于强迫症,找到了该问题的解决方法。 Database history tables upgraded: No. Support for the old numeric type is deprecated. Please upgrade to nume…

C++:优先队列-Priority_queue

目录 1.关于优先队列 2.priority_queue的使用 1.构造方法 2.empty();判空 3.size(); 4.top(); 5.push(val); 6.pop(); 3.优先队列模拟实现 4.用优先队列解决数组中第K个大的元素 1.关于优先队列 在C中,可以使用STL(标准模板库)中的p…

【第十五课】数据结构:堆 (“堆”的介绍+主要操作 / acwing-838堆排序 / 时间复杂度的分析 / c++代码 )

目录 关于堆的一些知识的回顾 数据结构:堆的特点 "down" 和 "up":维护堆的性质 down up 数据结构:堆的主要操作 acwing-838堆排序 代码如下 时间复杂度分析 确实是在写的过程中频繁回顾了很多关于树的知识&…

C++基础语法和用法

文章目录 1.hello world2.引入namespace(命名空间/域问题)3.输入输出4.缺省参数/默认参数5.函数重载6.引用7.内联函数8.auto关键字&#xff0c;基于范围的for循环&#xff0c;空指针NULL8.1 auto8.2 基于范围的for循环8.3 nullptr 1.hello world #include <iostream> us…

diffusion入门

1. diffusion model 概念 https://zhuanlan.zhihu.com/p/638442430 这篇博客写得很好&#xff0c;顺便做一点笔记记录一下。 原博客附带的代码也很清晰易懂。 1.1 前向过程 后一个过程等于前一个结果的均值乘上sqrt(1-beta_t), 再加上方差beta_t的噪声。 这样下去可以得到 x…

EasyCVR视频融合平台铁路抑尘喷洒监控系统视频搭建方案

一、建设背景与需求分析 随着我国铁路建设的迅猛发展&#xff0c;铁路抑尘喷洒设备质量监控系统在技术和管理方面都取得了显著的进步&#xff0c;面临安全压力也随之加大。为了确保铁路运输的安全和稳定&#xff0c;车站监控室、喷洒区域、操作间以及安全防护区域等关键区域都…

08章【文件与IO】

文章目录 File类IO流字节流字符流字节字符转换流缓冲流打印流对象流字节数组流数据流字符串流、管道流、合并流 RandomAccessFileProperties文件操作文件压缩与解压缩装饰者模式常见字符编码New IO File类 File类的基本概念 File类&#xff1a;表示文件和目录路径名的抽象表示…