TVP走进腾讯:直面变革浪潮,合力拥抱AI新时代

news2024/12/25 9:25:53

引言

自 ChatGPT 问世以来,以通用人工智能为代表的 AI 技术发展开始“狂飙”,多家企业和研究机构入局大模型赛道,新应用场景不断涌现。如何理解通用人工智能技术将带来的巨大影响,并把握随之而来的机遇和挑战,是我们面临的两大关键问题。

5 月 13 日,「直面 AI 的新一轮变革浪潮」TVP 走进腾讯活动重磅召开,活动邀请了来自产、学、研等领域的技术专家,闭门畅聊 AI 前沿热点、未来趋势,以多元视角碰撞出众多深度观点与精彩火花。

一、大模型时代的学科交叉研究:以政治人物建模为例

复旦大学大数据学院副教授、数据智能与社会计算实验室负责人 魏忠钰带来了题为《大模型时代的学科交叉研究:以政治人物建模为例》的主题分享。

魏忠钰老师首先分享了现如今人类进入大模型时代,大模型为学科交叉研究带来的机遇与挑战,并以政治人物建模为例,剖析大模型对学科交叉研究的影响。

(一)人类进入大模型时代

在自然语言处理领域,每个时代都有对应的范式。经历专家系统、浅层机器学习及深层学习这三个发展阶段,随着 ChatGPT 及 GPT-4 的出现,人类进入新的范式——由基座模型-指令微调-人类反馈形成的框架。

魏忠钰老师分析到,作为当下最前沿的技术力量,相较于传统范式,大模型优势更明显:

  • 特征表示上,专家系统是基于规则的办法;浅层机器学习具备明显的手工特征;深层学习采取低维稠密的建模方式;大模型升级到用简单结构化数据,处理大规模高维复杂数据的水平。
  • 模型构建上,传统范式只能根据任务,制作对应的定制模型,如分类模型、生成模型、检索模型等;大模型以生成式框架完成多种任务,实现模型的大统一。
  • 泛化能力上,过去每个模型只能解决一个指定任务或者一组相关任务;而预训练的大模型可以在几乎所有自然语言处理任务中进行小样本甚至零样本的适配使用。

(二)大模型为学科交叉带来的机遇与挑战

大模型通过构建基座模型、利用交叉数据微调,在人机交互中不断优化,实现快速开发具备一定动态交互能力的智能系统,解决了传统范式在学科交叉领域上存在的数据样式多变、难以泛化与复用、交互能力弱等问题。

魏忠钰老师分析到,大模型为学科交叉带来新机遇,提供统一的建模范式、实现知识迁移、提高建模效果以及重塑学科交叉的技术框架。但大模型也有局限性,它以语言模型为基础,仅能处理文本序列数据,对真实场景中存在的其它蕴含知识的数据形态进行处理,比如行为数据、关系数据等。

魏忠钰老师表示,想要真正发挥大模型在学科交叉研究的影响,需要在强大的语言模型的基础上,考虑如何增强其多数据类型的处理能力,扩展它对于领域知识的理解和使用,只有这样才能达到对真实世界的深层次理解。

(三)以政治人物建模为例,在大模型时代下学科交叉研究的发展

政治人物建模是用数据构建政治人物的全面画像,关键数据来源于公开言论、关系数据及行为数据。魏忠钰老师介绍了在研究过程中的三个阶段:

  • 行为建模:基于政治人物的投票数据进行建模,可理解其政治倾向。
  • 社会关系建模:构建政治人物之间的互动与合作关系网络,可理解其在政治网络中的角色与地位。
  • 言论内容建模:分析政治人物的公开言论与文本数据,提取观点与立场,可理解其思想主张。

三种类型的数据,在政治人物画像的过程中各自有自己的局限性,行为建模的数据易受外界影响,难以清晰表达人的核心理念;社会网络分析仅依赖关系数据,难以深入理解人的思想与主张;言论数据受到开放平台的影响,难以全面反映目标的真实立场。基于图模型的建模方法可以将这三种类型的信息进行有效融合,完成对于目标人物的全面建模。

图模型虽然可以有机融合三种数据,但是在具体的使用过程中,它也有自己的局限性,比如框架难以快速对未见过的议员进行快速的表示学习,从而限制了模型的场景迁移能力。为了进一步完善政治人物建模,魏忠钰老师及相关研究人员利用语言作为政治人物的表示学习基础,构建出一体化的政治人物表征框架,特点如下:

  • 不直接学习政治人物节点的表征,而是学习政治人物言论到其表征的映射过程。
  • 通过检索政治人物的所有公开言论,构建两种粒度的言论表征:通用言论表征与政治领域言论表征。
  • 通过两种自监督任务实现场景知识的注入与优化:结构感知对比学习:利用人物与党派、其他人物的关系作为监督信号更新参数;行为驱动对比学习:利用人物与投票结果的关系作为监督信号更新参数。

在大模型基础之上,政治人物表征框架利用大规模语料构建语言模型,通过设计自监督任务,实现外界知识的注入与优化,打开了一条融合多学科与多模态知识的新路径,助推学科交叉领域的进一步发展。

二、引爆:ChatGPT与AIGC带来的思考与应用趋势

腾讯政策发展中心副主任 Darren 老师,带来了《引爆:ChatGPT 与 AIGC 带来的思考与应用趋势》的主题演讲,从变革趋势、产业应用及后续布局角度切入进行分享,探讨 AI 技术发展如何为用户创造更高价值。

(一)从超级个体看 AIGC 的发展

Darren 老师指出,ChatGPT 和 GPT-4 等先进语言模型的出现,标志着 AI 已经初步实现与人类的自然交互。这一突破预示着 AI 将对各行各业产生深远影响。然而,将 AI 视为产品或服务的卖点是片面的,应把 AI 深度融入产品或服务之中,成为核心竞争力。

另一大趋势为产品逐渐从适应大多数用户,转向满足每个用户的个性化需求,这意味着“产品适配用户”将取代“用户适配产品”,甚至会出现“一次性使用”的产品。Darren 老师表示,随着技术的进步,个性化定制的 AI 助理即将问世,但这项技术的前提,需要企业掌握海量的用户数据,深度理解用户需求并迅速响应,这意味着企业需有快速的产品设计与迭代能力。

(二)从应用角度看 AIGC 的影响

AI 技术的快速发展正在驱动产业变革,大模型与生成式人工智能的出现显现出强大的生产力。Darren 老师认为,随着大模型参数的增加和泛化能力的提高,AI 可以完成更复杂的任务,生成式人工智能可高效生产各种创意和素材。

在人工智能的加持下,电商领域形成了逆向种草现象,通过 AI 生成多样化案例,吸引用户主动提出定制化意见,从而实现快速生产与销售;AI 变声技术通过人工智能赋能音乐创作,实现更丰富多样的音乐体验;AI 生成包装设计可自动生成设计方案,提高效率的同时,满足品牌和用户的个性化定制需求。从 C 端渗透到 B 端,AI 技术为传统行业带来了深刻影响。

(三)大模型的未来布局

大模型创新面临着社会各界缺乏共识以及企业视角局限的挑战,该如何衡量创业赛道是否适合应用 AI 技术呢?Darren 老师指出,关键因素在于赛道对 AI 技术的浓度。所谓“浓度”是指 AI 技术在这一赛道上的实际应用程度与集成度,只有当 AI 技术能够高度融入并在业务流程或领域中发挥关键作用时,才有望将 AI 从辅助工具变成颠覆性武器,从简单的“点缀”变成“改变游戏规则”的力量。AI 的最高境界,就是 AI 与业务场景的深度融合。

选择研发通用大模型还是领域模型?Darren 老师表示,通用大模型与领域模型的优势不同,通用大模型具有海量数据,专属模型在特定领域中表现出色,例如 Bloomberg 的金融领域专业模型,需大量金融知识与数据投入,才能超越通用模型的表现。因此若是细分行业,可以尝试建立领域专属模型。预计下半年会有更多垂直领域的 AI 模型问世,这将成为未来企业创造价值的重要途径。

三、圆桌论坛:ChatGPT狂飙,如何应对AI的新一轮技术变革?

本场圆桌论坛以《ChatGPT 狂飙,如何应对 AI 的新一轮技术变革?》为主题,由新浪微博新技术研发负责人、腾讯云 TVP 张俊林老师担任主持,提出众多深度问题,图灵联合创始人、智源研究院前副院长、腾讯云 TVP 创始委员 刘江老师、复旦大学大数据学院副教授、数据智能与社会计算实验室负责人 魏忠钰老师、熵简科技联合创始人、腾讯云 TVP 李渔老师共同参加对话交流。

(一)ChatGPT 引发巨大反响的原因

李渔:这次给我们非常大的震撼,让我们意识到 AGI 的曙光真正来了。我之前一直从事 NLP 方面的研究,这次以 ChatGPT 为代表的技术,相对之前有两个方面的重要突破,第一,有强大的通用学习能力,用一个模型可以做各种各样专业的任务,我们在多个金融场景下测试,效果超出业务人员预期;第二,它有强大的常识与推理能力,具备较为完备的常识知识与理解力,在生成语言表达时可根据上下文做出精准回应。

魏忠钰:学术研究到产品化到商业落地,这个过程一直是非常漫长的,这个过程也给了整个社会接受新技术的时间。然而类似于 ChatGPT 这样的大规模语言模型,本来在技术层面上就是最前沿的,而得益于优秀的产品设计,直接从最前沿的学术理论,一跃成为商业产品,这带来的影响是震撼的。相当于社会对最新技术的理解消化过程急剧缩短了。

(二)通用大模型 VS 领域大模型的关系

魏忠钰:通用模型和领域模型区别在于,通用大模型提供最基本的语义理解与知识表达能力,领域模型针对特定领域数据与任务进行优化,具有更加专业的知识与理解力。虽然大模型具备了强大的泛化能力,但在特定任务的学习过程中仍然存在一定程度的“灾难遗忘”,使得它在具体任务中的表现并非出类拔萃。在一些特定场景下,我们对于模型的宽容度很低,因此,需要对模型进行任务或者场景导向下的定向调优,这给领域模型留出了空间。

张俊林:关于这两者的关系,现在市面上存在两种不同的观点。一种观点认为,未来通用模型将越来越强,领域模型只有建立在非常强大的通用模型上才能发挥最大优势;另一种观点则认为,直接利用领域数据在普通的通用模型上进行修正与优化,可以更快建立适用于该领域的强大模型。目前很多人更偏向于第二种观点。

李渔:我觉得通用模型和领域模型是互补的关系。GPT-4 代表当前通用大模型的天花板,它的背后对应着一个非常强大的认知能力,这种强大的认知和推理能力在小模型或是领域模型上是很难实现的。领域模型的好处在于更专业的场景上有更专业的知识和表达。在特定的任务场景下拥有独特优势。二者互相配合去完成现实世界中的各种复杂任务。

(三)国内大模型研发的现状、机遇与挑战

李渔:大模型整个生态是一个完整的链条,从基础的算力到大模型的研发,再到产品化落地,是一个很广的生态。做基座大模型对资源投入要求确实很高,目前阶段,对于小团队而言,做一些垂直领域的差异化的产品是更好的选择。另外,算力的提升也是影响国产大模型发展很重要的方面。国内研发出与 GPT-4 完全对标的大模型所需要的具体时间目前来看较难确定,这取决于很多因素,但如果某个模型的认知与学习能力不断在进化,它可以反过来调教另外的模型,实现螺旋上升的效果。

魏忠钰:对国内大模型的研发,我保持乐观态度,并且相信在基座大模型方面双方距离是会越来越接近的,在当前的开源环境下,很多的所谓的“护城河”并不坚固,甚至可以说,没有秘密可言。另外一个判断是,目前的大模型依旧难以突破“意识”的天花板,现在我们看到的或许已经是当前技术路径的最终形态了,难以通过迭代实现“阶跃式”的进步。如果是这样的话,那么,我们还有足够的时间去无限靠近当前的最终形态。

张俊林:类似 GPT 水准的模型,我相信国内一定是可以做出来的,只要持续投入计算资源、数据采集与人才团队等方面的成本就可以。我认为明年 6 月之前是可以做出对标 ChatGPT3.5 版本的,但是能达到具备 GPT-4 水准的模型,我的态度不太乐观。因为就目前来说国内整体环境还是相对浮躁,要达到 GPT-4 水准还需要研发攻坚和大量的创新投入。

(四)AI 重构产业形态,如何应对冲击与变革

李渔:我认为我们应持积极拥抱的态度。ChatGPT 作为工具,将为我们的工作效率带来乘数级别的提升。越聪明、越积极主动的人,这个工具给他带来的乘数效应将会越大,这对于个人而言是极其幸运的。对于企业来说,管理层也应当把数字员工计划作为企业的重要议题开始考虑,当然这需要一定的时间。

魏忠钰:我非常赞同超级个体这一概念。在这个时代后,对于个人创业者将会越来越友好。ChatGPT 出来后,可以预见到很多技术门槛将会越来越低,在大模型时代,我们应该发挥主观能动性,想方设法把这个东西用起来,真正去创造价值。

结语

随着大模型技术的日益成熟,未来通用人工智能将引发更多领域的变革与重塑,深层次的人工智能应用将创造更多跨业态、个性化、高效率的商业模式与服务模式。在通用人工智能时代,TVP 将继续秉持着“用科技影响世界”的初心,通过每一场深度分享,携手行业技术专家,共同助推人工智能的健康发展,让技术普惠于人。

现场花絮集锦

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/628309.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

自己开发或者修改的组件包如何发布到npm官方市场

1、注册账号 打开npm官方网站: www.npmjs.com; 进行注册 注册需要用户名,密码和邮箱, 当注册完成后需打开邮箱进行验证(邮箱不验证无法上传) 二、 在需要打包发布的文件夹package.json所在目录下执行命令:…

Nacos架构与原理 - 通信通道

文章目录 Nacos 长链接⼀、现状背景二、场景分析1. 配置SDK 和 Server 之间Server 之间通信 2. 服务SDK 和 Server 之间Server 之间通信 三、长链接核心诉求1. 功能性诉求客户端服务端 2. 性能要求3. 负载均衡客户端随机服务端柔性调 4. 连接⽣命周期5. 安全性6. 低成本多语⾔实…

基于jsp+mysql+Spring+mybatis的SpringBoot美容院预约管理系统

运行环境: 最好是java jdk 1.8,我在这个平台上运行的。其他版本理论上也可以。 IDE环境: Eclipse,Myeclipse,IDEA或者Spring Tool Suite都可以,如果编译器的版本太低,需要升级下编译器,不要弄太低的版本 tomcat服务器环…

数据分析 × 人文社科:高校交叉学科教学经验分享

随着新一轮科技革命与产业变革的加速演进,学科间的交叉融合不断升级,由数据驱动的系列交叉学科备受瞩目,然而,在实际教学与学科建设的过程中,对于数据科学引入至相关学科,高校教师还是普遍面临着比较多的问…

MYSQL中的14个查询技巧

1.group_concat 在我们平常的工作中,使用group by进行分组的场景,是非常多的。 比如想统计出用户表中,名称不同的用户的具体名称有哪些? 具体sql如下: select name from `user` group by name; 但如果想把name相同的code拼接在一起,放到另外一列中该怎么办呢? 答:…

LeetCode - 16 最接近的三数之和

目录 题目来源 题目描述 示例 提示 题目解析 算法源码 题目来源 16. 最接近的三数之和 - 力扣(LeetCode) 题目描述 给你一个长度为 n 的整数数组 nums 和 一个目标值 target。 请你从 nums 中选出三个整数,使它们的和与 target 最接…

HNU-操作系统OS-作业2(15-22章)

OS_homework_2 这份文件是OS_homework_2 by计科210X wolf 202108010XXX 文档设置了目录,可以通过目录快速跳转至答案部分。 第15章 运行程序OS-homework/vm-mechanism/relocation.py 15.1 用种子 1、2 和 3 运行,并计算进程生成的每个虚拟地址是处于界限内还是界限外? 如…

Python + HDF5 因子计算与 DolphinDB 一体化因子计算方案对比

在量化交易中,基于金融市场的 L1/L2 的报价和交易高频数据来进行高频因子计算,是非常常见的投研需求。目前国内全市场十年的 L2 历史数据约为 20 ~ 50T,每日新增的数据量约为 10 ~ 20G。传统的关系数据库如 MS SQL Server 或 MySQL 已经很难支…

2023届【校招】安全面试题和岗位总结(字节、百度、腾讯、美团等大厂)

写在前面 个人强烈感觉面试因人而异,对于简历上有具体项目经历的同学,个人感觉面试官会着重让你介绍自己的项目,包括但不限于介绍一次真实攻防/渗透/挖洞/CTF/代码审计的经历 > 因此对于自己的项目,面试前建议做一次复盘&#…

Zigbee学习(四)入网流程及抓包分析

Zigbee学习系列文章 Zigbee学习(一)架构及入网 Zigbee学习(二)认识Profile和Cluster Zigbee学习(三)Z-Stack代码框架解析 文章目录 Zigbee学习系列文章前言一、概述二、入网报文解析1.Management Permit J…

双向交错CCM图腾柱无桥单相PFC学习仿真与实现(1)系统问题分解

目录 前言 系统硬件架构 系统软件架构 仿真实现 仿真效果 总结 前言 目前正在做双向交错CCM图腾柱无桥单相PFC的项目,硬件拓扑兼容三相和单相的PFC,三相PFC功能目前已经完成,准备把单相的PFC学习和开发过程记录一下,以及后面…

基于CH32F103的DAC播放WAV功能

一、理论 1.1 DAC理论 数字信号转化为电压信号,实现扬声器不同频率的发声。 12位DAC,表达范围0-4095 1.2音频wav理论 1.2.1 wav文件格式解析 wav 文件一般由3个区块组成:RIFF chunk、Format chunk 和 Data chunk。 RIFF chunk&#xff…

Vivado 下 IP核之单端口 RAM 读写

目录 Vivado 下 IP 核之单端口 RAM 读写 1、RAM 简介 2、实验任务 3、程序设计 3.1、RAM IP 核配置 3.2、时序图讲解 1、写优先模式的时序图如下所示: 2、读优先模式的时序图如下所示: 3、不变模式的时序图如下所示: 3.3、顶层模块…

mysql 数据库 不同数据类型字段设置长度大小、取值范围 及 存储空间

学习目标: 学习的目标 了解不同数据类型字段设置长度大小,从而 在使用 mysql 数据时为使用的字段设置适当的长度 。 学习内容: 学习的内容 整数型字符串型TEXT时间型 总结: 提示:总结 1、整数型 1、整数型的数值…

STM32队列

目录 什么是队列? 队列特点 1. 数据入队出队方式 2. 数据传递方式 3. 多任务访问 4. 出队、入队阻塞 队列相关 API 函数 1. 创建队列 参数: 2. 写队列 参数: 返回值: 3. 读队列 参数: 返回值&#xf…

找工作第一弹——三件套基础巩固

目录 前言HTML篇表格结构a的两种打开方式自定义列表单选,多选音视频标签 CSS篇伪元素清楚浮动固定定位fixedemCSS三角 JS细节篇原型链字符串拼接的方法递归 JS内置对象sort的升序和降序字符串大写和小写Objects对象的方法date的用法数字取整数组的最大值与最小值 We…

ROS中使用VLP16激光雷达获取点云数据

ROS中使用VLP16激光雷达获取点云数据 个人博客地址 本文测试环境为:Ubuntu20.04 ROS Noetic 需要将激光雷达与PC连接,然后在设置>网络>有线中将IPv4改为手动,并且地址为192.168.1.100,子网掩码为255.255.255.0&#xff0c…

leetcode61. 旋转链表(java)

旋转链表 leetcode61. 旋转链表题目描述 解题思路代码演示链表专题 leetcode61. 旋转链表 Leetcode链接: https://leetcode.cn/problems/rotate-list/ 题目描述 给你一个链表的头节点 head ,旋转链表,将链表每个节点向右移动 k 个位置。 示例…

浅析 xml 数据格式文件

浅析 xml 数据格式文件 xml ( Extensible Markup Language ) 全称 -> 可拓展的标记语言; xml文件的主要用途:xml文件主要用于数据的 传输 和 存储,并不是展示; xml标签与html的区别:节点的标签使用方式和 html 十分…

【产品经理】企业的产品增长之路

英特尔前CEO安迪格鲁夫有本书叫做《Only the Paranoid Survive》,全文的中心思想是警示他人,要居安思危,唯有打破常规,不拘泥于现状才能生存。 一、为何企业都在关注增长? 1. 诺基亚的贱卖 13年市值曾位居全球上市公…