Qcon2023: 大模型时代的技术人成长(简)

news2024/11/16 3:41:37

我目前致力于操作系统相关的研发, 公司的目标是打造物联网时代的智能原生操作系统。如何实现操作系统的AI Native 呢?带着这样的疑问我参加了Qcon2023 北京站的大会。 与Qcon 2022 北京站不同的是, 身份变了, 上次是分享者, 这次是出品人, 出品的专题是——大模型时代的技术人成长。

在大模型时代, 技术人如何成长呢?划分为3个话题:

  1. 大模型时代的特点是什么?对个人提出了哪些新的要求?我们如何应对?

  2. 大模型时代新的开发范式是什么? 通过新的开发范式,我们可以发现哪些新的机会?并如何去把握这些新机会?

  3. 对我们已有的业务, 如何通过大模型为其赋能?在应用大模型相关技术的时候,我们又应该注意些什么呢?

三位分享的老师非常给力,三场演讲的效果在一定程度上达到了预期,因为现场还是出现了站票的同学。

大模型时代的个人成长

首先登台的是首都在线的吴锦晟老师,话题是大模型时代下的个人成长。

d6d6856e65b9072f3d8bf07f931a99f1.png

从国内大模型的发展开始, 重点谈到了大模型的核心能力——涌现

  • Translation 60B 

  • Math 60B 

  • In-context Learning 130B 

  • Chain-of-thought reasoning 130B

  • Knowledge combination 530B  

  • Emotion Perception 530B

进而讲到了应该了解的一些常见应用场景——

ab752483c60b32068f6e0a136e431851.png

面对大模型,对我们的技术体系提出了新的要求,例如:

5a0c0bdbdc455c0393056df0ac9682d2.png

每个人都是独立的个体, 都应该根据自己的条件有着自己的思考。

cca24b6c465d17710ff0a79af4a4acfc.png

如果时间充裕一些, 随着技术成长相关话题的展开, 我认为肯定可以给大家带来更多的帮助。

大模型时代的创业机会洞察

第二场分享对应着我们的第二个问题,但在会前我收到宜博老师的PPT时,我被惊到了,159页的讲稿对于我们的专场45分钟简直是不能完成的任务。感谢宜博老师的大幅裁剪,现场的版本是精简版定制播放。

4876df970ba60159e2610fd8c3d015b8.png

分享中以大量的落地场景开始,让我们了解到大模型不再是坐而论道,除了chatGPT之外,基于大模型的应用已经在我们身边落地生花了。

64a9ef0ab7a3d73c00a4220413b78354.png

大模型训练有三个要素:数据集数量,训练强度和参数,人与AI的协同模式同样有三种:embedding,copilot 和agent,但重要的还是开发范式的变化。

5710f85fa6c512907f83839891f39568.png

宜博老师深入浅出地讲解了大模型开发范式的6个层次,并以LLMFarm为例阐述了如何应用这一方式开发我们的AI App。

4bc1684543fa35a39ac5b5fe4d961249.png

其中的第一性原理是:AI First 就是没有大模型就不成立的应用。

⼤模型时代创业:给⾼瞻远瞩的你三个建议

最后登台的是老朋友一乐,蓝莺IM在大模型火爆之前就已经是一款很不错的产品了,那么大模型又为这样一款IM产品赋能了什么呢?

87b47079ff6d6708da3183f6a5a8771b.png

一乐认真地分享了应用大模型中所遇到的挑战:⼤模型能⼒涌现需要⼤参数,以及胡编乱造的⼤模型⽆法解释,以及使用大模型服务的三种模式——PromptOnly,Embedding 和Fine-tune。重要的是,指出了大模型应用中的常见错误观点:

f80289b7110bb5d05cea9aa046cb308a.png

82cf5d30cc0cb889210d2f6898db141c.png

进而,一乐给出了三点建议:

建议⼀:有出海的勇⽓,也要有冷静的思考

建议⼆:AI First,也要 AI Right

建议三:看得远才⾛得远,⾛⼀步看三步

蓝莺IM 应用大模型的示例贯穿始终,包括让人眼前一亮的知识库联邦架构——

9719ce556e1bde44babe7c99251019ff.png

三场演讲,内容都是相当的充实,导致我只能被迫压缩互动环节,每一场分享都留下了些许的遗憾。

ddbc2b98dc67871df9f30944aef42614.jpeg

感谢各位老师的大力支持, 本专题所有讲稿PPT都是开放的, 感兴趣的朋友可以到Qcon2023 北京站的大会官网——大模型时代的技术人成长专题下载所有讲稿,有问题可以留言或者与老师们直接联系。

意犹未尽,青山不改,后会有期!

【关联阅读】

  • 一文读懂“语言模型”

  • 解读Toolformer

  • 解读TaskMatrix.AI

  • 知识图谱的5G追溯

  • 图计算的学习与思考

  • AI系统中的偏差与偏见

  • 老码农眼中的大模型(LLM)

  • LLM的工程实践思考

  • 解读大模型的微调

  • 解读ChatGPT中的RLHF

  • 系统学习大模型的20篇论文

  • QCon:工程师成长的金字塔思维

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/973102.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【校招VIP】前端JavaScript语言之跨域

考点介绍: 什么是跨域?浏览器从一个域名的网页去请求另一个域名的资源时,域名、端口、协议任一不同,都是跨域。跨域是前端校招的一个重要考点,在面试过程中经常遇到,需要着重掌握。本期分享的前端算法考点之…

电商API对接流程,简单讲解!

电商API接口对接流程一般包括以下几个步骤: 1. 确定需求:首先确定您的电商平台需要与哪些其他系统或服务进行对接,以及需要传递哪些数据。 2. 寻找合适的API:根据您的需求,在开放平台或者第三方API市场中选择适合的API…

文件上传漏洞学习小结

目录 一、漏洞简介 二、上传的原理或本质 2.1 文件上传的本质 2.2 文件上传的过程及代码演示 三、文件上传常见触发点 四、文件上传常见检测方式 4.1 前端js检测 4.2 content-type (MIME)检测 4.3 黑名单检测 4.4 文件头检测 4.5 .htaccess文件…

软件评测师之数的表示

目录 一、数的进制(1)十进制:D(2)二进制:B(3)十六进制:H(4)八进制:O/Q 二、其他进制转十进制(1)二进制转十进制(2)十六进制转十进制(3)八进制转十进制 三、二进制与十六进制/八进制进行转换四、考法 一、数的进制 (1)十进制&…

微波系统中散射参量S、阻抗参量Z及导纳参量Y之间的关系及MATLAB验证

微波系统中散射参量S、阻抗参量Z及导纳参量Y之间的关系及MATLAB验证 用HFSS设计了一微波元件,仿真出了其散射参量S、阻抗参量Z及导纳参量Y,用MATLAB验证他们之间的关系 HFSS设计螺旋线圈 用HFSS设计了一个螺旋线圈,如上图所示。 进行仿真&…

无涯教程-JavaScript - DAYS360函数

描述 DAYS360函数返回基于360天的年份(十二个月为30天)的两个日期之间的天数,该天数用于会计计算。 语法 DAYS360 (start_date,end_date,[method])争论 Argument描述Required/OptionalStart_dateThe two dates between which you want to know the number of days.Required…

ElasticSearch第三讲:ES详解 - Elastic Stack生态和场景方案

ElasticSearch第三讲:ES详解 - Elastic Stack生态和场景方案 本文是ElasticSearch第三讲,在了解ElaticSearch之后,我们还要了解Elastic背后的生态 即我们常说的ELK;与此同时,还会给你展示ElasticSearch的案例场景&…

Django框架中使用drf框架开发

一、drf框架特点: 全称 Django REST framework 两大部分:序列化/反序列化 和 增删改查序列化:把数据库数据提取出来变成python常用格式的过程反序列化:把数据写入到数据库的过程增加 : 校验请求数据 -> 执行反…

OpenWrt编译自己的应用程序

编译OpenWrt的应用程序可以参考OpenWrt内部其他应用程序的例程,来编写成自己的应用程序 一、OpenWrt源代码获取与编译 1.1、搭建环境 下载OpenWrt的官方源码: git clone https://github.com/openwrt/openwrt.git1.2、安装编译依赖项 sudo apt update…

2023年Tik Tok在印尼的市场分析,怎么开通海外娱乐公会?

2023年 印尼的TIKTOK用户 字节跳动广告资源发布的数据显示,到2023年初,TikTok在印度尼西亚有1.099亿18岁及以上的用户。 字节跳动的数据显示,2023年初,抖音广告在印尼18岁及以上的成年人中占56.8%。 与此同时,今年年…

2022年09月 C/C++(八级)真题解析#中国电子学会#全国青少年软件编程等级考试

C/C编程(1~8级)全部真题・点这里 第1题:道路 N个以 1 … N 标号的城市通过单向的道路相连:。每条道路包含两个参数:道路的长度和需要为该路付的通行费(以金币的数目来表示) Bob and Alice 过去住在城市 1.…

msvcr120.dll找不到是什么原因

今天,我将为大家分享关于电脑msvcr120.dll丢失的6种不同解决方法。希望这些方法能够帮助到正在面临这个问题的朋友们。 首先,让我们来了解一下msvcr120.dll是什么文件。msvcr120.dll是Microsoft Visual C 2012 Redistributable Package的一个组件&#x…

CMA和CNAS的区别?

测试资质 一、定义不同CMA:即实验室资质认定,也称为计量认证。它是根据《中华人民共和国计量法》、《中华人民共和国认证认可条例》等有关法律法规,对向社会提供公证数据的检验机构进行强制性检查的一种方式,是政府对第三方实验室…

浏览器中怎样查看前后端传值

路径:F12–>Network -->Fetch/XHR,选择一个接口地址。 在payload里面是前端发送给后端的参数。也即客户端发送给服务端的请求数据,即接口地址入参。 Preview和Response里都是后端返回给前端的。Preview是格式化过的,比较容易看。Resp…

Seata 解决分布式事务理论与实践

文章目录 1.分布式事务问题1.1.本地事务1.2.分布式事务1.3.演示分布式事务问题 2.理论基础2.1.CAP定理2.2.BASE理论2.3.解决分布式事务的思路 3.初识Seata3.1.Seata的架构3.2.部署TC服务3.3.微服务集成Seata3.3.1.引入依赖3.3.2.配置TC地址3.3.3.其它服务 4.动手实践4.1.XA模式…

合并两个有序链表(每日一题)

“路虽远,行则将至” ❤️主页:小赛毛 ☕今日份刷题:合并两个有序链表 题目描述: 将两个升序链表合并为一个新的 升序 链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 示例1: 输入:l1 …

GeoServe Web 管理界面 实现远程访问

文章目录 前言1.安装GeoServer2. windows 安装 cpolar3. 创建公网访问地址4. 公网访问Geo Servcer服务5. 固定公网HTTP地址 前言 GeoServer是OGC Web服务器规范的J2EE实现,利用GeoServer可以方便地发布地图数据,允许用户对要素数据进行更新、删除、插入…

系统错误码指示确立+日志模块手动配置

1,系统错误码指示确立 对于前后端分离的系统设计中,后端建立错误码指示对于前端非常重要可以指示错误存在地方;以用户注册为例; public interface SystemCode{int SYSTEM_USER_ERROR_ADD_FAIL 10000;int SYSTEM_USER_INFO_ADD …

C#,《小白学程序》第十四课:随机数(Random)第一,几种随机数的计算方法与代码

1 文本格式 /// <summary> /// 《小白学程序》第十四课&#xff1a;随机数&#xff08;Random&#xff09;第一&#xff0c;几种随机数的计算方法与代码 /// 本课初步接触一下随机数。 /// </summary> /// <param name"sender"></param> ///…

《TCP/IP网络编程》阅读笔记--地址族和数据序列

目录 1--IP地址和端口号 2--地址信息的表示 3--网络字节序与地址变换 4--网络地址的初始化与分配 5--Windows部分代码案例 1--IP地址和端口号 IP 地址分为两类&#xff1a; ① IPv4 表示 4 字节地址族&#xff1b; ② IPv6 表示 16 字节地址族&#xff1b; IPv4 标准的 4 …