可信AI年度观察 | 生成式AI技术及产品快速迭代,生成内容质量及安全性仍需提升

news2025/1/18 17:01:29

自2021年起,生成式人工智能(以下简称“生成式AI”)连续两年入选Gartner《Hype Cycle for Artificial Intelligence》,被认为是未来重要的AI技术趋势。2022年以来,生成式AI产品不断涌现,生成内容模态多样,国内外头部科技企业竞相布局。生成式AI产品在快速发展过程中,在生成内容可控性、合规性等方面仍存在不足。中国信息通信研究院(以下简称“中国信通院”)联合中国人工智能产业发展联盟(以下简称“联盟”),基于生成式AI研究基础,总结了生成式AI技术及应用发展现状与趋势。

一、2022年生成式AI发展观察

1.扩散模型和ChatGPT能力出众,多种生成模态涌现

扩散模型Diffusion(以下简称“扩散模型”)和神经网络模型CLIP结合,文生图实现质变。扩散模型能够缩短训练时长、使图像生成更具多样性,具备保留数据语义结构的能力。神经网络模型CLIP可匹配图像和文本,与扩散模型结合可加快文本生成图片速度。近一年来,扩散模型成为研究热潮,在人工智能顶级会议ICLR 2023中,“Diffusion Model”在论文题目关键词频率排名从去年的第159名上升到14名[1]

图1:ICLR2023投稿论文关键词Top10排名,图片来自网络

大规模预训练语言模型ChatGPT(后文简称“ChatGPT”)发布,内容生成能力强大。ChatGPT由OpenAI于2022年12月发布,一经推出引起业界普遍关注。部分观点认为ChatGPT能够颠覆搜索行业,在智能客服、游戏、虚拟人等领域也将得到广泛应用。ChatGPT具备强大的对话能力和生成能力,由大规模预训练语言模型GPT-3.5微调得来,在理解能力、结果准确性、识别非法与偏见能力上均能取得更优效果。

生成模态不断更新,呈现多元化格局。按照生成模态划分,生成式AI产品分为文本生成、图片生成、代码生成和音频生成多个方向。随着技术的不断发展,生成模态种类不断扩展。2022年9月Meta发布自研视频生成大模型Make-A-Video;2022年11月,NVIDIA公司发布了3D模型生成工具Magic3D;同月WebAR软件平台解决方案商Geenee AR发布了AI WebAR内容创造套件RT3D AI SDK。

2.国内外产品各具特色,交互体验不断升级

国内生成式AI产品以语言生成类和视觉生成类为主,其他应用类型处于探索阶段。文本生成类产品如百度的“文心ERNIE3.0”和澜舟科技的“AIGC文本生成引擎”等,可实现小说诗歌创作、新闻内容生成、商业文案生成。图片生成类应用如百度的“文心一格”,其创作出的作品效果接近人类作品。代码生成产品如硅心科技的“aiXcoder”可实现代码自动补全、相似代码搜索、错误自动定位。音频生成产品如网易的“天音”可实现自动编曲。同时,国内部分企业也陆续推出新工具和平台,可生成数字内容、合成数据等。华为云推出数字内容生产线MetaStudio,该平台具备3D模型制作、云渲染等能力,可用于虚拟直播、虚拟视频内容制作。中国移动研究院、北京宽客进化公司实现了GAN生成NFV相关合成数据技术,并逐步探索结构化数据生成技术的落地路径。

国外生成式AI产品应用方向多样,现象级产品迅速获取大量用户。根据知名创业组织Antler的统计,截止2022年年底,海外生成式AI产品数量达到190余个[2],包括视频、音频、游戏、数据、搜索等多种类型应用。同时,2022年年底图片生成应用Midjourney官方Discord中的关注人数超过百万,ChatGPT上线后一周内用户数量已近百万。

生成式AI产品在交互设计中,更注重用户体验。目前生成式AI产品形态包含插件、API网页交互、客户端等。其中,API网页交互无需下载安装产品,在云端即可获得生成内容,如用户可在百度的“文心ERNIE 3.0”产品网页中输入提示词生成内容。同时,生成式AI技术与搜索产品融合后,匹配内容、意图理解表现更好。例如,用户使用论文阅读助手SciSpace时,无需指定关键词即可搜索和查找相关论文,可提升阅读论文效率。

3.应用场景逐渐扩展,痛点短板亟需解决

文本生成类应用在生成可控性、准确率等方面仍表现不足。文本生成类应用仍存在生成内容准确率低、可控性低等问题。例如,著名技术交流论坛Stack Overflow曾临时禁止ChatGPT回答编程问题。图片生成类应用则存在作品版权争议较大、生成内容细节不足等问题。AI创作时会大量借鉴绘画、漫画名作,其生成内容与原作风格相似度较高,版权界定尚不清晰。例如著名艺术家网站ArtStation已有艺术家呼吁删除站内所有AI绘画作品。同时,AI作品在细节表现上仍存在不足,例如某些图片生成的应用中,生成内容将动物和物品、真实和卡通混淆。

二、中国信通院生成式AI方向工作有序开展

1.组织ChatGPT生成能力评测,开发域创作表现较好,约束条件下仍有不足

2022年12月初,为便于产学研各方快速了解ChatGPT内容生成能力,中国信通院对ChatGPT展开评测,从技术能力和产品能力两个关键模块切入。技术能力选取创意写作、命题写作、摘要生成和代码生成四大任务类型,以数据集测试的方式评测ChatGPT的可接受率。产品评测关注用户体验,邀请评分人员对生成内容的可读性、主观性等方面打分。测评结果显示,ChatGPT在创意写作等开放域内容创作表现较好,而面对约束条件如摘要生成、代码纠错时生成能力仍有限。关于本次评测的更多详情,可访问文章:

可信AI评测观察:ChatGPT生成能力|开放域内容创作表现较好,但在约束条件下生成能力仍有不足

图2:ChatGPT生成能力评测成果

2.生成式AI标准编制工作稳步推进,预计今年3月发布

近年来,生成式AI行业发展迅速,覆盖数据模态不断扩展,生成内容愈发具有创造力、多元化。另一方面,部分生成式AI应用的产品能力仍存在不足,数据合规性、安全性也需进一步规范。中国信通院与联盟高度重视生成式AI技术及发展走向,于2022年11月启动生成式AI标准编制工作。希尔贝壳以及来自学术界、产业界的50余家单位积极参与标准编制

图3:生成式AI标准报名参编单位一览

生成式AI标准体系初步形成,标准编制工作正在进行。生成式AI标准分为技术能力和产品能力两部分,全面评测产品的技术能力和产品水准。技术能力部分按照生成模态划分,通过主观评价和客观评价两大维度全面评测生成式AI产品的技术水平。产品能力重点关注生成式AI产品的服务能力、可信能力和综合能力。其中服务能力关注产品功能、用户交互和付费模式等指标;可信能力中加入隐私保护、生成数据合规性、安全性等指标;综合能力关注多行业适配性、多样性等指标。

图4:生成式AI标准框架

参考文献:

1. ICLR 2023 OpenReview 投稿文章一览:

https://github.com/EdisonLeeeee/ICLR2023-OpenReviewData

2. Mapping the Generative AI landscape:

https://www.antler.co/blog/generative-ai

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/161777.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python机器学习:认识机器学习

🌕 机器学习是什么? ⭐️:机器学习是一门涉及数学、统计学、计算机科学等的学科。 ⭐️:机器学习是从一个大量的已知数据中,学习如何对未知的新数据进行预测,并且可以随着学习内容的增加,提高对…

让你彻彻底底理解“并发”以及“并行”

1. 前言 我们做后端的人,一般会遇到别人给你说高并发,那我们知道什么叫并发吗??? 什么叫并行吗??? 今天这篇文章的目的其实就是为了讲明白什么叫并发,并行。好了废话不多…

二维数组八个方向的判断--牛客刷题1023-病菌感染

铁子和顺溜上生物课的时候不小心将几滴超级病菌滴到了培养皿上,这可急坏了他们。 培养皿可以被看成一个n*n的方格,最初病菌滴在了这n*n的格子中的某些格子,病菌的传染方式是这样的,如果一个方格与两个或多个被感染的方格相邻(两个…

2023,数字政务潮水已至

城市是时代发展最鲜活的物理存在,政务是城市的“中枢系统”,将数字技术广泛应用于政府管理服务,既能提高政府公共服务的履约效能,亦顺应经济社会数字化转型的大趋势。 作者|子雨 出品|产业家 从集聚资源求增长,到…

Linux的文件系统和软硬链接

目录 文件系统 磁盘的物理结构: 磁盘的存储结构 磁盘的逻辑抽象结构 管理文件 那么文件如何与属于自己的内容关联起来? 创建一个文件,OS做了什么? 删除一个文件,OS做了什么? 软硬链接 硬链接 软连…

Python学习笔记——字典

字典是一种映射类型 ,它是一个无序的集合。内部元素是键值对形式出现,即一个关键字(key)与一个值(value)的组合(“键-值”对)。字典是一种可变容器模型,且可存…

视频在线点播功能如何实现?

1. 视频点播需求分析1.1 需求描述视频点播需求如下:1、学生可以在windows浏览器上在线观看视频。2、播放器具有快进、快退、暂停等基本功能。1.2 视频点播解决方案1.2.1 流媒体详细参考:https://baike.baidu.com/item/%E6%B5%81%E5%AA%92%E4%BD%93/98740…

2023年网络安全比赛--网络安全应急响应中职组(超详细)

一、竞赛时间 180分钟 共计3小时 二、竞赛阶段 竞赛阶段 任务阶段 竞赛任务 竞赛时间 分值 1.找出被黑客修改的系统别名,并将倒数第二个别名作为Flag值提交; 2.找出系统中被植入的后门用户删除掉,并将后门用户的账号作为Flag值提交(多个用户名之间以英文逗号分割,如:admi…

【项目】小帽教育(一)

小帽教育 第一章 项目开发环境搭建 一、项目背景 1.在线教育市场环境 在线教育行业是一个有着极强的广度和深度的行业,从校内到校外;从早幼教到职业培训;从教育工具到全信息化平台等等。 2020年的新冠疫情外生冲击,让在线教育…

Android 深入系统完全讲解(14)

2 如何定位编译问题 编译不出来,编译不生效,都是可以用比对的方式去处理。之前遇见只改资源单编译不生效,跟正常的一比较发现是系统编译机制是判断代码的时间戳,而不管资源目录,于是处理的方式就是单编配置强制&#…

过年了,我采集采集m3u8格式做做动态壁纸不过分吧

前言 嗨喽~大家好呀,这里是魔王呐 ❤ ~! 首先澄清一下,我用Python收集这些视频,绝不是想做别的什么, 真的只是用来做动态壁纸,大家不要误会!我不是那样的人~ 这样的不过份吧 😻 环境 Python…

二叉树的深度 | 分治 +回溯 + 迭代

二叉树的最大深度 leetcode https://leetcode.cn/problems/maximum-depth-of-binary-tree/ 回溯基本思路 二叉树的最大深度就是 : 从根节点到叶子节点的最大的深度 定义一个全局变量 int res 0 , 以及局部变量 depth 表示当前层的深度当我们访问到根节点的时候(前序位置), 就…

亿信华辰出席2022DAMA中国数据管理峰会,共话数据治理

2023年1月7日-8日,万众瞩目的2022DAMA中国数据管理峰会在上海成功举办,国内外知名行业领袖、业内优秀企业代表出席了会议。会上,围绕 “数据基础制度和数字化转型”主题,前沿观点高能碰撞、专家学者共话未来。亿信华辰首席运营官毛…

CTP开发(1)CTP开发的概述

CTP是上海期货交易所开发的一套程序化交易的API。这篇文章呢,是进行扫盲和引路的,让你在开发时可以少走弯路。1、如果你要进行CTP开发,那么先是在模拟环境下调试,这就需要去上期的仿真模拟网站simnow下载相应的API包。地址如下&am…

[数字信号处理]时域中的离散时间信号和系统

离散时间信号最基本的形式是定义在等间隔的时间离散值上,且在这些离散时间上的信号振幅值是连续的。离散时间系统则是输入为离散时间信号输出也是离散时间信号的系统。对于线性时不变(LTI)系统来说,我们可以发现LTI系统与该系统的…

【4】Kubesphere_多租户

目录 创建企业空间角色 邀请新成员 部门管理 准备工作 创建部门 分配用户至部门 从部门中移除用户 删除和编辑部门 进入访问控制 可以配置企业空间、用户和用户角色 企业空间角色页面列出了以下四个可用的内置角色。创建企业空间时,KubeSphere 会自动创建内…

对称加密面临的那些挑战

密码对于多数人,是既熟悉又陌生的存在,注册账户、登录账号、网购,网络上的开展大多数行为都需要基于输入密码这一前提,从这方面谈,我们熟悉且熟知密码。然而这些由简单的字母、数字、符号等构成的简单口令,…

Spring Data默认值的错误

Spring Data有很多配置的默认值,但不一定都适合你。如一个依赖Cassandra 的项目,有时写入数据后,并不能立马读到。这种错误并没有什么报错,一切都是正常的,就是读不到数据。 1 源码解析 直接使用 Spring Data Cassan…

化繁为简,数字化推动企业数据库升级焕新 | 爱分析报告

报告编委 黄勇 爱分析合伙人&首席分析师 洪逸群 爱分析高级分析师 张良筠 爱分析分析师 外部专家(按姓氏拼音排序) 李远志 柏睿数据 副总裁 谢寅 镜舟科技 资深解决方案架构师 许哲 中信建投证券 数据组VP 姚延栋 YMatrix 创始人&CEO 张晨…

实体店店铺管理软件应该怎么挑?有这几个功能的错不了!

现在开实体店的都是勇士,不仅要和同行竞争,还要和电商、直播竞争,没有点秘密武器根本不能生存。秘密武器之一,就是在做生意路上摸爬滚打多年的实体店老板们都在用的——实体店店铺管理软件!它会帮助你从手工记账迈入智…