大模型技术工程师:抓住时代机遇,成为行业精英_

news2024/12/25 9:22:03

伴随AI大模型的火热,中国科技大厂们正在掀起一场「跑步AI化」的风暴。从顶层战略到业务线重构,AI无疑已成为大厂们押注未来的新故事。

大模型时代已经到来

大模型已成为全球竞争热点,一个大模型时代已经到来。

大模型具备三个特点:规模大,需达到百亿参数级别;涌现性,能够产生预料之外的新能力;通用性,不限于专门问题或者领域。由于这三个特点的存在,以ChatGPT为例,ChatGPT采用“人类反馈的强化学习(RLHF)”方法,这使得ChatGPT能够理解和遵循人类指令,输出符合人类偏好的内容,这种特点使它适用于广大的应用领域。

GPT知识空间里,参数达到数百亿规模的复杂系统涌现现象“融会贯通”,虽然尚不可解释,但是确实存在。ChatGPT在多项考试中表现超过人类水平,具备能够根据纯文字说明,具备生成图像或草图的整合能力,也拥有高等数学/复杂数学问题求解的数学能力。GPT-4则大幅降低幻觉率,而据估算,当幻觉率达到5%以内,接近人类水平(保守),就可作为大模型规模商用落地的基准幻觉率。

人工智能生态包括基础软硬件、基础模型和创新应用三个层次。人工智能基础模型能够支撑赋智经济与社会各类应用,也将带动基础软硬件智算体系的发展。

从当前的产业现状来看,超大规模智能模型生态在全球屈指可数,其原因是受制于应用、数据量、算力、算法等因素。谷歌由于掌握核心专利、搜索引擎积累的海量数据、通过Android能够更好地服务移动用户等原因,而走在了前列。当成为大模型标志,接受了微软投资之后,OpenAI也脱颖而出。谁会是世界上大模型第三强呢?恐怕接下来比拼的就是生态,因此,人工智能之争最终是生态之争。

对于CIO们来说,2000年以前是信息(Information)时代,2020年以前是网络(Internet)时代,而2020年以后就属于智能(Intelligence)时代了。因此,CIO们接下来需要关注两个人工智能的重大转变,首先是从信息智能到实体智能,其次是从“静态融通”到“动态涌现”,未来有望通过类脑智能实现真正的AGI。

今天,ChatGPT有强大的智能,影响深远。未来3年,除了语言,大模型正在迅速扩展视觉、听觉、具身、行动等通用智能,影响将更大。未来10年,智力革命已经打响,就像工业革命解放体力,就像电力革命解决能源流通,智力革命将是全新生态的构建,开源开放生态终将胜利。未来20年,ChatGPT是数据驱动的静态智能,未来是时空环境驱动的具体智能,智能载体不是今天的人工神经网络,而是类脑的脉冲神经网络。到2045年,还会出现结构仿脑、功能类脑、性能超脑的超人“电子大脑”。

抢占优势领域,产品路径的「合」与「分」

大模型狂飙大半年以来,从模型端到应用端,一个共识是,最初由chatGPT所带来的大模型热潮已逐渐走过了令人热血沸腾的惊喜期,随着大批AI原生应用进入扩散期与大模型流入主流开发者中,如红杉资本在其报告中所定义的“生成式AI正在经历一个从技术驱动向客户驱动转变的过程。”

对中国的科技大厂们而言,在冷静期中,从抢技术到抢客户的转变,体现种种具体的动作中。

大厂们其中一类的策略就是对旧市场与旧业务的升级与重构,但从产品路径而言,也有微妙的异同。

相同点在于,大厂们都在利用AI夯实业务入口价值,不同点在于入口价值实现的路径差异。

阿里、腾讯与字节的动作主要是针对现有优势业务的「修补」。比如,在腾讯的优势阵地社交与泛娱乐领域,腾讯音乐曾推出AI社交产品「未伴」与机器人辅助创作功能,并同步测试「AI一起听」和AI伴侣「小琴」等。

阿里则率先在电商与生产力场景利用AI重塑业务。如淘宝目前在内测的AI原生应用「淘宝问问」,本质上是通过AI提升用户搜索行为的效率,实现AI导购的功能。而在学习办公场景,此前钉钉的AI PaaS化与夸克的AI化,也体现出阿里多条业务线正在全面接入AI能力。

字节跳动也低调地推出了两款「AI神器」——提供AI工具的小悟空(前身是悟空搜索)和AI对话产品「豆包」,又一口气在Github上发布两个AI视频项目,一个是多模态动画生成的MagicAvatar,另一个则是专注文本导向的视频编辑MagicEdit。

百度则野心更大,与OpenAI与微软的思路类似,通过插件构建生态,打造超级流量入口。

前不久百度发布了文心一言插件生态平台「灵境矩阵」,百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰将大模型与插件的关系定义为「大脑与手脚」:“如果大模型是一颗聪明的大脑,那么插件就是大模型的手和脚,有了插件,大模型不仅能回答通识问题,还能精通专业问题,既是通才、也是专才。”

不难看出,无论是基于原有的业务利用AI夯实入口价值,还是通过大模型插件打造超级流量入口,大厂们在原有庞大的用户基数下,集成大模型能力,降低AI的使用门槛,为后续的规模化应用做准备。

另一个相似点则是,将AI接入前端业务的「产品全家桶」。比如,百度在前端产品上,包括百度搜索、百度文库、百度输入法与文心一言APP都进行了升级,阿里也已实现了AI对旗下出行、娱乐、生活、办公、搜索等业务线产品的赋能。

与此同时,大厂们也在将自身云业务与AI结合,用AI更好地「卖云」。互联网云从早期举力做「集成商」到如今各司其职「被集成」的路线变化,自身优势技术产品与角色定位日益清晰。而随着大模型的落地,云厂商以MaaS(模型即服务)的模式既能一站式地实现产品的标准化,更好地落地行业,又能对外输出AI能力与AI算力,提升利润健康表现。

据「硅基研究室」的不完全统计,今年8月至今,阿里云、腾讯云在政务、金融等领域收获多个大单,展现出强势姿态。其中,阿里云拿下了8月份市场上最大的项目——浙江省大数据发展管理局政务云资源租赁-云服务项目,该项目金额达到了2.68亿元。而在10月,阿里云中标京能国际9亿AI算力大单。

一位百度智能云人士此前在接受《财经十一人》采访时也提到,百度追求销售标准产品,希望更聪明地做集成。因此,更多从行业、场景实际需求出发,帮部分客户提供必要的集成服务。

可以肯定的是,大厂跑步AI化,从具体实现路径来看并没有明显的差异,原因在于AI对当下的业务重构是并非一个静态的过程,而是需要一定的周期。

AI应用的深度与广度,背后依赖大厂内部算力等资源的调配、业务的优先级等,这之中,不乏一些不确定的因素。一个典型例子就是近期宣布离职创业的百度副总裁、小度原CEO景鲲。作为百度AI生态落地的重要之一,关键人物「小度之父」的离职也为这家独角兽未来的走向增添了更多的不确定性。

大模型时代的机遇

生成式AI在中国也发展地十分迅速。如阿里、百度、讯飞等大公司,以及许多初创公司都已经进入了这个领域。然而,随着越来越多的大模型的出现,我们不禁要问:它们的优势到底在哪里?真正的应用价值和产业价值在哪里?

1、有护城河吗?

人们常常会问,这个领域是否存在护城河呢?(是否有供应链、是否有生态、是否有数据?)目前看来,这个领域发展地非常快,还没有形成系统性的护城河。公司规模是护城河么?不一定是。例如,在ChatGPT出现之前,我们从未想过,像Google这样的大搜索公司会受到一家创业公司的冲击。尽管OpenAI很出名,但与Google相比,无论是在工程师数量、系统复杂性还是产品影响力上,都不在一个量级。可以看到,生成式人工智能可以让一个相对初创公司对大规模公司产生非常有力的冲击。微软和OpenAI的结合又打造了一个非常优秀的联盟。

在这个领域中,新的算法层出不穷,但随着算法的发表和开源,单个算法创新不是护城河。数据非常重要。从数据角度而已,生成式人工智能是在收集整个互联网的数据做一个压缩。传统的网上公开数据已经不再构成护城河。

未来的发展方向可能是在场景中打造真正需要的产品,将产品、算法和工程系统真正地结合起来。OpenAI的创始人在采访中提到,ChatGPT的成功并不是一个单点技术的成功,而是一个系统化的结合。

2、价值将在哪里积累?

当前,生成式人工智能总营收的10%-20%将流向云服务提供商,而应用程序公司平均将20%-40%的年收入用于推理和定制化的微调,同时模型提供商也将一半的收入投入到云基础设施上。在这个过程中,最大的赢家是生产硬件的公司。因为,无论是哪一家公司,它在快速迭代和探索中,都会有一个共同的依赖,那就是底层对GPU卡的需求。就目前来看,直接看到的最大收益者是GPU的生产商和云厂商。

3、谁与争锋?

1)大模型技术能对企业产生重大影响

一家值得关注的公司是Midjourney。这家公司在2021年成立,不到一年的时间就吸引了千万级别的用户,并在去年实现了过亿美元的营收。这家公司的员工数量极少,今年上半年只有11名员工,其中4名本科在读,8名研发工程师,另外3名员工负责法务、财务和后台工作。然而,这家公司产生的图片质量却非常高,覆盖了建筑设计、平面设计、用户界面设计和技术创作等多个领域。这家公司打破了“规模决定一切”的传统观念,向我们证明了少量的员工也能产生巨大的影响力和价值。从这个案例中,我们可以看到大模型技术能对企业发展产生非常大的影响。

2)大模型的产业应用

国内市场也正经历着非常迅速的发展。预计在2022年至2025年间,其年化增长率将超过40%,这是一个惊人的数字。人工智能未来在金融、医疗、教育、游戏设计等行业应用落地有不少空间。

3)大模型的应用边界

在过去的几个月里,大语言模型的应用边界得到了极大的拓展,其中一个焦点是代理(agent)。代理是指在大语言模型基础上增加规划、反馈和使用工具的能力。它作为大模型与场景间价值传递的桥梁,能极大地拓展大模型的应用边界,使其成为一种系统性的超级应用。

只有大公司才能做大模型吗?我认为并不是这样。小模型可以知识蒸馏。虽然现在大多讨论的是千亿模型参数、万亿模型参数,但我们发现,在某些特定领域,百亿、甚至十亿级的模型参数就能取得很好的效果。此外,国产替代也正在逐渐发挥作用。

4、大模型作为生产力工具的挑战

然而,大模型在真正转化为生产力的过程中会面临一系列挑战。

首先,在生成能力上,如何实现可信可靠,避免出现“幻觉效应”?其次,对于复杂的应用场景,如何实现信息的动态集成?这包括代理如何调用外部数据库?大模型本身如何快速、动态地集成和更新?这些都是技术领域的挑战。此外,海量数据的获取和算力方面也需要重点关注。据MIT团队预测,在2026年,我们可用的公开数据将全部耗尽。那么,未来的数据将从何处获取?如何获得大规模的算力支持?这些都是需要解决的问题。

AI时代的职场新潮流

听说AI要来抢工作了?别担心,新岗位可比旧岗位有趣多了!想象一下,你从搬砖工升级成了机器人操作员,从算盘小能手变成了大数据分析师,这不是美滋滋吗?所以,社会生产效率提升了,我们也能更轻松地工作。不过,想成为AI界的佼佼者?那就得赶紧学起来,不然就会被同行们甩得连AI的尾巴都摸不着了!

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
img

四、AI大模型商业化落地方案

img

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1835966.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue3-国足18强赛抽签

Vue3国足18强赛抽签 国足遇到这个对阵&#xff0c;能顺利出现吗&#xff1f; 1、系统演示 Vue3模拟国足18强赛抽签 2、关键代码 开始抽签 <script setup> import FenDang from "/components/chouqian/FenDang.vue"; import {ref} from "vue";le…

CHATGPT说这个运算放大器是比较器,我说这是运放典型的同相比例放大器,一个光控电路分析

纠正 图1 光控电路 该电路来自一个问题&#xff0c;链接见文末。 因GPT的分析有误&#xff0c;特此纠正。 引用图片和答案用于分析&#xff0c;如侵权请联系本人。 电路分析&#xff1a; 该电路为光控灯电路&#xff0c;灯光为LED发光二极管 D。 光敏电阻RG的阻值和光线强度关…

重学java 72.正则表达式

人长大之后就在频繁地离别&#xff0c;相聚反而时日无多 —— 24.6.17 一、正则表达式的概念及演示 1.概述 正则表达式是一个具有特殊规则的字符串 2.作用&#xff1a;校验 3.String中有一个校验正则的方法&#xff1a; boolean matches(String regex) —— 校验字符串是否…

从11个视角看全球Rust程序员4/4:深度解读JetBrains最新报告

讲动人的故事,写懂人的代码 8 Rust程序员最喜欢用什么工具调试程序? 用println!或dbg!宏来调试一下 2022年:55%2023年:55%在IDE里玩玩UI调试 2022年:27%2023年:29%在控制台里调试调试 2022年:11%2023年:10%不调试,任性 2022年:5%2023年:6%有其他奇思妙想 2022年:1%…

开源的数字孪生平台

欧洲对工业4.0的追求体现在三个方面&#xff1a; 数字孪生、智能制造和万物互联。 资助2440万欧元的开源数字孪生平台 源代码&#xff1a; http://www.gitpp.com/ccdan/dpqq-digital-twins 这套数字孪生是工业4.0整体规划中的中的一项技术&#xff0c;实现了一种称为“数字…

Python武器库开发-武器库篇之链接提取器(六十)

Python武器库开发-武器库篇之链接提取器&#xff08;六十&#xff09; 链接提取器介绍 链接提取器&#xff08;Link Extractor&#xff09;是一种用于从网页中提取链接的工具。它可以从网页的源代码中识别出所有的链接&#xff0c;并将这些链接提取出来。链接提取器可以用于各…

Java技术驱动的智能ERP系统:打造企业高效管理与创新发展的数字化引擎

随着数字化浪潮的席卷&#xff0c;现代企业对于高效、稳定、易于扩展的管理系统需求愈发迫切。为了满足这一需求&#xff0c;我们倾力打造了一款基于Java技术的企业级资源规划&#xff08;ERP&#xff09;管理系统。该系统以Spring Cloud Alibaba、Spring Boot、MybatisPlus、R…

MySQL操作数据库语句

mysql关键字不区分大小写 1. 创建数据库 CREATE DATABASE [IF NOT EXISTS] westos (带[ ]表示该语句可有可无) 2. 删除数据库 DROP DATABASE [IF EXISTS] westos 3.使用数据库 -- tab键的上面&#xff0c;如果你的表名或者字段名是一个特殊的字符&#xff0c;就需要带 …

基于Redis实现共享session登录

搭配食用&#xff1a;Redis&#xff08;基础篇&#xff09;-CSDN博客 项目实现前的 Mysql中的表&#xff1a; 表说明tb_user用户表tb_user_info用户详情表tb_shop商户信息表tb_shop_type商户类型表tb_blog用户日记表&#xff08;达人探店日记)tb_follow用户关注表tb_voucher优…

jquey+mybatis-plus实现简单分页功能

这篇文章介绍一下怎么通过JQuery结合mybatis-plus的分页插件实现原生HTML页面的分页效果&#xff0c;没有使用任何前端框架&#xff0c;主要是对前端知识的应用。 创建Springboot项目 Intellij IDEA中创建一个Springboot项目&#xff0c;项目名为pager。 添加必须的依赖包 修…

modbus流量计数据解析(4个字节与float的换算)

通过modbus协议从流量计中读取数据后&#xff0c;需要将获得的字节数据合成float类型。以天信流量计为例&#xff1a; 如何将字节数据合并成float类型呢&#xff1f;这里总结了三种方法。 以温度值41 A0 00 00为例 目录 1、使用char*逐字节解析2、使用memcpy转换2、使用联合体…

【每天学会一个渗透测试工具】Nessus安装及使用指南

&#x1f31d;博客主页&#xff1a;泥菩萨 &#x1f496;专栏&#xff1a;Linux探索之旅 | 网络安全的神秘世界 | 专接本 | 每天学会一个渗透测试工具 其他扫描工具&#xff1a; AWVS和Xray&#xff1a;应用漏洞扫描工具 fscan&#xff1a;虽然能扫主机&#xff0c;但比较老了…

【ajax基础03】常用ajax请求方法和数据提交以及axios错误处理

一&#xff1a;请求方法 什么是请求方法&#xff1a; 浏览器对服务器资源&#xff0c;要执行的操作 常见请求方法如下 二&#xff1a;axios中应用 语法格式&#xff1a; method:为请求方法&#xff0c;默认情况下为get&#xff08;获取数据&#xff09; data&#xff1a;…

Nginx Proxy 代理测试

目录 https://blog.csdn.net/Lzcsfg/article/details/139781909 一. 实验准备 二. 配置反向代理 三. 配置二层代理 解释流程 一. 实验准备 关闭防火墙和selinux&#xff0c;准备三台同一网段的虚拟机 localhostRoucky_linux9.4192.168.226.20localhostRoucky_linux9.419…

STM32单片机-BKP和RTC

STM32单片机-BKP和RTC 一、Unix时间戳1.1 时间戳转换 二、BKP(备份寄存器)三、RTC(实时时钟)3.1 RTC工作原理 四、代码部分4.1 BKP备份寄存器4.2 RTC实时时钟 一、Unix时间戳 Unix时间戳定义为从伦敦时间的1970年1月1日0时0分0秒开始所经过的秒数&#xff0c;不考虑闰秒时间戳…

RoboDK试用期间提示无效或过期的许可证

问题描述 RoboDK下载下来在试用期间提示如下信息&#xff0c;不知道什么原因 临时解决方法 将C:\Users\${username}\AppData\Roaming\RoboDK该目录下的文件全部删除掉&#xff0c;便可以正常使用RoboDK应用了&#xff0c;但是等软件关闭后还是会出现上面的问题&#xff0c;…

【anaconda】本地永久设置镜像源

【anaconda】本地永久设置镜像源 可以通过命令行设置全局的 pip 配置&#xff1a; pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

Windows系统下制作Windows 11系统U盘启动及安装指导

Windows系统下制作Windows 11系统U盘启动及安装指导 一、准备工作 U盘不得小于8G(推荐使用usb3.0接口)&#xff1b;下载好对应的系统镜像&#xff1b;下载RUFUS或者软通碟U盘制作启动软件&#xff1b; 二、Windows操作系统下制作U盘启动&#xff08;这里以使用RUFUS软件为例&…

【ARMv8/ARMv9 硬件加速系列 4 -- 加解密 Cryptographic Extension 介绍】

文章目录 ARMv8.0 Cryptographic ExtensionFEAT_AESFEAT_PMULLFEAT_SHA1FEAT_SHA256ARMv8.2 扩展FEAT_SHA512FEAT_SHA3FEAT_SM3FEAT_SM4ARMv8.0 Cryptographic Extension ARMv8.0引入了加密扩展(Cryptographic Extension),旨在加速加密和解密操作。这一扩展通过新增专用指令…

BarTender软件最新版下载-bartender条码标签打印软件下载

​​BarTender​​是一款遵循“look and feel”标准的​​条码打印​​软件。​​BarTender​​条码打印软件能够帮助用户挥洒自如&#xff0c;轻松制作出标签条码&#xff0c;包括文本、图形、​​条形码​​和大多数序列化功能。BarTender条码打印软件功能强大、操作简单&…