智能体、多模态化大势所趋,探大模型的未来!

news2025/1/12 18:22:53
导语 | 今年以来,以 ChatGPT 为代表的生成式 AI,在最具挑战性的自然语言处理领域实现革命性突破,在行业掀起新一轮发展热潮。开源大模型正成为人工智能领域的新潮流,AI 大模型在未来将走向何方?今天,我们特邀了丁香园 CTO、腾讯云 TVP 范凯老师,他将为我们带来关于 AI 大模型的独到思考与精彩观点。

作者简介

范凯,丁香园 CTO,腾讯云 TVP,2003 年创办 JavaEye 技术网站,是国内最早推广开源软件 Hibernate,Spring 的开发者之一。2010 年 JavaEye 网站成为国内第二大开发者社区,同年被第一大开发者社区 CSDN 并购;2010-2013 年担任 CSDN CTO,推动中国开发者的移动和云计算技术的普及。2015 年至今,担任丁香园 CTO,组建了丁香园大数据和医疗知识图谱团队。

从 ChatGPT 推出到今天,还不到一年的时间,生成式 AI 其实已经迭代了多次。在技术革命的发展历史上,可以称得上是绝无仅有的进化速度。伴随人工智能技术的飞速发展,大模型近期出现了哪些新趋势呢?

一、大模型的开源化发展趋势

众所周知,Meta 开源了 Llama 之后,改变了商业大模型的竞争态势。特别是在 Llama 2 推出以后,形成了非常完整的 Llama 的开源生态,基于 Llama 出现了各种各样的衍生功能增强的大模型,例如很擅长写代码、做数学题的 Llama,以及善于诊断医疗问题的模型等等。

开源大模型高度的「可玩性」带来了衍生模型的繁荣,这也带来一个全新的 To B 的市场:基于开源的基座大模型,去开发垂直行业大模型,增强大模型在某个垂直领域的能力,让大模型在特定的行业可以落地。

毕竟通用大模型无法面面俱到,无法照顾到每个垂直细分行业的领域知识。而有了开源基座大模型,就给了垂直行业公司机会,去训练自己的垂直大模型。

现在不仅是 Llama 开源。国内也出现了好几个优秀的开源基座大模型,如智谱的 ChatGLM 2,百川的 Baichuan 7B 等。目前已经有很多垂直行业的头部公司基于这些模型去训练和发布自己的垂直大模型了。

我们可以预见,开源大语言模型将在各个领域发挥越来越重要的作用,将全面推动人工智能普及。

二、生成内容基础上,大模型有望成为智能体

用大模型来实现智能体,是当下热门的发展方向。在美国有拿了巨额融资的 Inflection.AI,还有 Character.AI,Adept 等等。

AI 智能体未来在 To C 的方向上的前景也十分可观。现在的智能手机,我们需要安装许多不同功能的 App:购物,打车,外卖,订机票,查询餐厅等。每个 App 都有相应的学习成本和使用成本,但实际上我们只是希望利用 App 来完成我们生活中各种各样的需求。

在未来,当 AI 智能体足够聪明时,它对主人的需求足够了解,并且能够接入所有的服务之后,我们的生活中便不再需要 App,只需要和智能体对话即可。甚至智能体在足够了解主人的情况下,主动帮助主人完成很多事情。

因此,目前移动时代的应用,在未来的 AI 时代,将会被推翻和重塑。未来将呈现一个 AI 时代全新的用户交互方式:人人都将和各种各样的智能体打交道,而非停留在 App 上。

三、大模型的多模态化

GPT-4 最近发布了 Vision 版本,不仅仅可以通过文字来对话,还可以通过语音和图片进行沟通。此前,OpenAI 发布会曾经演示过一个案例:创始人 Brockman 在纸上画了一个网站的原型,然后通过手机把原型图拍摄下来传给 ChatGPT,ChatGPT 就可以根据原型图自己创建一个简单的网站出来。

这意味着大语言模型不仅仅可以理解文字,现在还能够理解图像内容,那么理论上也可以理解视频的内容。可以预想到未来的大模型接上手机摄像头,就像长了眼睛一样,它可以理解我们生活的物理世界,帮助人类完成更多的工作。

比如给机器人安装上一个多模态的大模型,它就变成了真正的智能机器人了,不仅可以看和听,还可以说,当然还可以执行指令和操作。所以多模态的大模型很可能会真正使得机器人普及化。

另外,特斯拉最新的自动驾驶软件,也在测试完全使用大模型去操纵汽车。本质上自动驾驶的大模型就变成了电动汽车的大脑,它通过摄像头去分析路况,然后生成指令去操作汽车。

值得一提的是,在 7 月 6 日,腾讯也发布了混元大模型,它是由腾讯全链路自研的实用级大模型,拥有超千亿参数规模、预训练语料超 2 万亿 tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。腾讯已将大模型技术深度应用到多个业务场景中,包括腾讯会议、腾讯文档、微信搜一搜等在内的超百个业务和产品,已经接入腾讯混元大模型测试,期待混元大模型未来在多模态方向的更多应用。

如果说大模型仅支持文字对话,那么大模型只能影响软件世界,但当大模型支持了多模态,就从软件世界走到了真实的物理世界,开始影响我们所生活的环境。

随着技术的不断进步和应用的深化,我十分期待生成式人工智能在创造性、智能化和个性化方面的突破和创新。我相信,在不久的将来,由 AI 大模型控制的各种智能设备,将会像现在的智能手机一样普及。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1105193.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

众和策略:多少成交量才算放大?

成交量是股市中非常重要的指标,常常被用于判别商场活跃度及股票价格涨跌起伏等。可是,要想了解一个股票何时扩展,又需求考虑哪些要素呢?在本文中,我们将从多个角度进行剖析,以便更好地了解多少成交量才算扩…

物联网AI MicroPython传感器学习 之 AHT21B 温湿度传感器

学物联网,来万物简单IoT物联网!! 一、产品简介 AHT21B是一款极具性价比的数字温度传感器,其基于AHT21开发的集成式温湿度传感器模块,模块内部配有一个全新设计的ASIC专用芯片、一个经过改进的MEMS半导体电容式湿度传感…

电商独立站小程序开发方案

随着移动互联网的迅速发展,电商行业也逐渐向小程序平台转移。开发一款电商小程序对于拓展销售渠道、提高用户体验、增加用户忠诚度等方面都有着重要的意义。本文将围绕电商小程序的开发背景、需求分析、技术选型、开发流程、风险控制、商业模式和市场前景等方面进行…

【前端学习】—函数防抖(十)

【前端学习】—函数防抖&#xff08;十&#xff09; 一、什么是函数防抖 函数防抖&#xff1a;事件被触发n秒后再执行回调&#xff0c;如果在这n秒内又被触发&#xff0c;则重新计时。 二、代码实现 <script>const searchElement document.getElementById("searc…

目标识别跟踪器

目标识别跟踪器支持热红外视频或者可见光视频单输入或双输入模式。 热红外视频输入支持BT.656视频&#xff0c;可以提供集合热红外相机的版本。 可见光视频输入支持网络RTSP或MIPI&#xff0c;支持主流的变焦相机&#xff0c;可以提供变焦机芯与识别跟踪器一体化版本。 目前支…

喧闹后的思考,比特币现货 ETF 能否成为行业新的曙光

出 品&#xff5c;欧科云链 研究院 作者&#xff5c;Matthew Lee 10月16日&#xff0c;Cointelegraph 丢出重磅炸弹声称 SEC 批准贝莱德的 iShares 的比特币现货 ETF。根据 OKX 的数据&#xff0c;比特币价格在消息公布后立即飙升&#xff0c;达到 $30,535 的高点。但稍后贝莱…

建议收藏!国家公布的非法期刊目录(内含假刊鉴别方式)

非法期刊的基本特征 非法期刊包括&#xff1a;未经新闻出版部门批准&#xff0c;擅自印刷的出版物&#xff1b;伪造假冒别人名称印刷的出版物&#xff1b;没经过国家新闻出版总署批准&#xff0c;非法进口的境外出版物&#xff1b;买卖书号、刊号、版号的出版物。 辨认难度比…

游戏录屏怎么录自己的声音?看这篇就够了!

在游戏过程中&#xff0c;录制屏幕是很重要的&#xff0c;它可以帮助玩家记录游戏中的精彩瞬间&#xff0c;与其他玩家分享游戏的乐趣。同时&#xff0c;录制自己的声音也可以为游戏视频增色添彩&#xff0c;让玩家更好地沉浸在游戏的氛围中。可是游戏录屏怎么录自己的声音呢&a…

【ARM裸机】ARM入门

1.ARM成长史 2.ARM的商业模式和生态系统 ARM只设计CPU&#xff0c;但是不生产CPU 3.为什么使用三星&#xff1a;S5PV210 4.各种版本号 0. ARM和Cortex Cortex就是ARM公司一个系列处理器的名称。比如英特尔旗下处理器有酷睿&#xff0c;奔腾&#xff0c;赛扬。ARM在最初的处理器…

工程设计软件AutoCAD2023版本安装注册图文教程_设计软件AutoCAD安装图文详细步骤说明

1、下载文件&#xff0c;如下图&#xff0c;让后解压文件&#xff08;https://pan.92zl.cn/&#xff09; 2、打开文件夹&#xff0c;双击Setup.exe安装 3、这个界面需要等待一会&#xff0c;没有那么快的 4、点击我同意&#xff0c;再点击下一步 5、选择适合自己的安装路径&…

2023年中国背光模组产业链、竞争格局及行业市场规模分析[图]

背光模组也称模组&#xff0c;是指在背光的基础上&#xff0c;继续集成液晶面板等部件&#xff0c;使其成为具备完整显像功能的组件。背光模组是液晶显示器的重要部件&#xff0c;通过简单加工即可成为液晶显示器。 背光模组产业链上游市场由组件供应商组成&#xff0c;涉及光学…

拼多多订单查询接口 查询卖家订单API

pdd.order.list.get 订单列表查询接口&#xff08;根据成交时间&#xff09; 更新时间&#xff1a;2023-10-16 14:43:20 基础API必须用户授权 根据成交时间查询订单列表&#xff08;只能获取到成交时间三个月以内的交易信息&#xff09; 注&#xff1a;虚拟订单充值手机号信…

Windows运维相关经验技巧

常用工具 在线PS Photoshop在线 FAQ 电脑能上网&#xff0c;浏览器上不了网 # 错误原因&#xff1a; 设置了网络代理&#xff0c;浏览器无法通过网络代理上网# 解决办法 关闭网络代理 &#xff08;1&#xff09;wini&#xff0c;打开设置 &#xff08;2&#xff09;网络和I…

数字IC前端学习笔记:门控时钟

相关阅读 数字IC前端https://blog.csdn.net/weixin_45791458/category_12173698.html?spm1001.2014.3001.5482 门控时钟(clock gating)技术作为一种传统的动态低功耗技术被广泛应用于现在的数字集成电路设计中&#xff0c;这是RTL级别的低功耗优化技术。门控时钟即使用逻辑门…

多测师肖sir_高级金牌讲师___python之xlrd模块

python之xlrd模块 python之xlrd模块 &#xff08;1&#xff09;xlrd是可用于读取excel表格数据&#xff08;不支持写操作&#xff0c;写操作需要xlwt模块实现&#xff09; &#xff08;2&#xff09;支持xlsx 和xls 格式的格式的表格&#xff08;不支持csv文件&#xff0c;csv…

Linux/Ubuntu 安装 Java运行环境

linux下安装Java运行环境 1、下载安装包 .tar.gz 先在官网下载 JDK 点击这里 在这里要选择对应的 JDK 版本&#xff0c;一般我们目前选择JDK8 点击这里 2、在 /usr/local/ 目录下创建Java文件夹 cd /usr/local/ mkdir java3、将下载的文件通过FTP程序上传到刚刚创建的Java文…

什么是Sectigo证书?

在今天的数字时代&#xff0c;保护网络通信和数据安全变得愈发重要。Sectigo 证书&#xff0c;作为全球领先的数字证书颁发机构之一&#xff0c;扮演着保护网站和在线服务的关键角色。本文将深入探讨 Sectigo 证书的重要性、种类以及如何选择适合您需求的证书。 Sectigo 证书的…

MySQL学习(六)——视图和触发器

文章目录 1. 视图1.1 视图语法1.2 检查选项1.3 视图的更新1.4 视图的作用 2. 触发器2.1 介绍2.2 语法介绍2.3 触发器示例2.3.1 插入数据触发器2.3.2 修改数据触发器2.3.3 删除数据触发器 1. 视图 视图&#xff08;View&#xff09;是一种虚拟存在的表。视图中的数据并不在数据…

Docker安装GitLab及使用图文教程

作者&#xff1a; 宋发元 GitLab安装及使用教程 官方教程 https://docs.gitlab.com/ee/install/docker.html Docker安装GitLab 宿主机创建容器持久化目录卷 mkdir -p /docker/gitlab/{config,data,logs}拉取GitLab镜像 docker pull gitlab/gitlab-ce:15.3.1-ce.0运行GitLa…

如何设计 API?

在前后端分离的设计中&#xff0c;不管使用什么语言&#xff0c;后端都需要提供 WebAPI 给前端使用。如果是一个平台级的产品&#xff0c;还有可能需要将平台的公共 API 提供给第三方系统使用&#xff0c;这些都要考虑到 API 的设计。 本文聊下 API 设计可能遇到的问题以及处理…