OpenAI发布的《Addendum to GPT-4o System Card: Native image generation》文件的详尽笔记

news2025/4/3 3:19:08

Native_Image_Generation_System_Card

文件基本信息

  • 文件名称:《Addendum to GPT-4o System Card: Native image generation》
  • 发布机构:OpenAI
  • 发布日期:2025年3月25日
  • 主要内容:介绍GPT-4o模型中新增的原生图像生成功能,包括其能力、潜在风险、安全挑战以及OpenAI为应对这些挑战所采取的评估和缓解措施。

1. 引言

  • 4o图像生成功能简介:4o图像生成是OpenAI推出的一种新型图像生成技术,相较于之前的DALL·E系列模型,它具有更强的能力,能够生成逼真的图像,并且可以接受图像作为输入进行转换,还能按照详细指令操作,包括可靠地将文本融入图像。由于其深度嵌入在GPT-4o模型的架构中,能够以微妙且富有表现力的方式应用这些能力,生成既美观又有用的图像。
  • 安全基础设施与风险:4o图像生成受益于OpenAI现有的安全基础设施,并借鉴了部署DALL·E和Sora过程中积累的经验。然而,这种新能力也带来了一些新的风险,例如可能被用于创建或修改照片,从而对照片中的人物造成损害,或者生成制造武器的示意图等。因此,OpenAI在GPT-4o系统卡的补充说明中,详细描述了他们关注的边际风险以及为应对这些风险所做的工作。

2. 观察到的安全挑战、评估和缓解措施

2.1 安全挑战:原生图像生成带来的新风险
  • 与DALL·E的区别:DALL·E是一种扩散模型,而4o图像生成是嵌入在ChatGPT中的自回归模型,这种根本区别带来了以下新能力及相应风险:
    • 图像到图像的转换:能够以一个或多个图像作为输入,生成相关或修改后的图像。
    • 逼真度:4o图像生成的高级逼真能力意味着其输出在某些情况下可能看起来像照片。
    • 指令遵循:能够遵循详细指令并呈现文本和指令性图表,这既带来了不同于早期模型的实用性,也带来了风险。
  • 风险示例:如果没有安全控制,4o图像生成可能会以对被描绘人物有害的方式创建或修改照片,或者提供制造武器的示意图等。
  • 风险应对策略:OpenAI借鉴多模态模型以及Sora和DALL·E视觉生成工具的经验,针对4o图像生成特有的新风险进行了映射和应对。他们致力于在最大化用户帮助性和创造性自由的同时,最小化伤害,并且会根据实际使用情况不断评估和调整政策。
2.2 安全堆栈
  • 聊天模型拒绝:在ChatGPT和API中,主要聊天模型是防止生成违反政策内容的第一道防线。基于其训练后的安全措施,聊天模型可以根据用户的提示拒绝触发图像生成过程。
  • 提示阻止:在调用4o图像生成工具后,如果文本或图像分类器标记提示违反政策,则阻止该工具生成图像。通过预先识别和阻止提示,这一措施有助于在内容生成之前防止生成不允许的内容。
  • 输出阻止:在图像生成后应用这种方法,使用包括儿童性虐待材料(CSAM)分类器和以安全为重点的推理监控器在内的多种控制手段,阻止违反政策的图像输出。监控器是一个定制训练的多模态推理模型,用于推理内容政策。通过在生成后评估输出,这一策略旨在阻止任何违反政策的内容,为防止生成不允许的内容提供额外保障。
  • 未成年人的额外保障:使用上述所有缓解措施,为可能未满18岁的用户提供更安全的体验,并限制这些用户创建某些可能不适合其年龄的内容类别。目前,未满13岁的用户被禁止使用OpenAI的任何产品或服务。
2.3 评估
  • 评估方法:OpenAI通过以下三种来源的提示来观察4o图像生成安全堆栈的性能:
    • 外部手动红队测试
    • 自动化红队测试
    • 使用现实场景进行离线测试
  • 外部手动红队测试
    • OpenAI与经过审查的外部红队成员(来自红队网络和Scale AI)合作,对4o图像生成进行测试。这些测试是在内部测试4o图像生成的原始模型能力之后进行的,以评估模型的原始能力并确定测试的重点领域。
    • 红队成员被要求探索各种优先主题领域,并开发和使用各种越狱方法和策略,试图绕过模型的安全防护。
    • 测试完成后,将数千次手动对抗性对话合并并转换为自动化评估。重新运行安全堆栈,并跟踪以下两个主要指标:
      • not_unsafe:系统是否生成违反模型政策的输出?
      • not_overrefuse:系统是否拒绝符合模型政策的请求?
    • 表1显示了仅使用系统缓解措施(提示阻止和输出阻止)以及同时使用系统缓解措施和聊天模型拒绝时,4o图像生成在外部红队测试数据上的整体性能指标。
  • 自动化红队测试
    • 在自动化红队测试中,使用上述模型政策生成合成对话,以探测系统对模型政策每个部分的性能表现。这些合成对话使我们能够比单独使用手动红队测试更全面地测试系统对政策的实施情况。
    • 生成了数千次不同类别的合成对话,包括有无图像上传的情况,以补充手动红队测试人员的工作。
    • 表2显示了仅使用系统缓解措施(提示阻止和输出阻止)以及同时使用系统缓解措施和聊天模型拒绝时,4o图像生成在自动化红队测试数据上的整体性能指标。结果表明,其性能与人类红队测试数据相似,这进一步增强了我们对政策在各种对话中一致有效性的信心。
  • 使用现实场景进行离线测试
    • 还在反映现实场景的文本提示上评估了4o图像生成的安全堆栈,以评估模型在生产环境中的行为。这包括来自不同安全类别的示例,以使评估具有代表性,反映生产中实际遇到的分布情况。这有助于我们了解模型在实际条件下的表现,并突出可能需要额外安全措施的领域。
    • 表3显示了仅使用系统缓解措施(提示阻止和输出阻止)以及同时使用系统缓解措施和聊天模型拒绝时,4o图像生成在现实场景测试中的整体性能指标。
2.4 特定风险领域的讨论
2.4.1 儿童安全
  • OpenAI的承诺:OpenAI高度重视儿童安全风险,优先预防、检测和报告所有产品(包括4o图像生成)中的儿童性虐待材料(CSAM)内容。
  • 4o图像生成中的具体模型政策
    • 在发布时,不允许编辑上传的逼真儿童图像。未来将评估是否可以安全地允许编辑。
    • 加强了针对儿童性虐待材料(CSAM)的现有保护措施,无论是在图像编辑还是图像生成方面。
  • 检测机制
    • 对于所有图像上传,整合了Thorn开发的Safer,以检测与已知CSAM的匹配情况。确认匹配的图像将被拒绝并报告给NCMEC,相关用户账户将被封禁。此外,还利用Thorn的CSAM分类器识别图像上传和4o图像生成生成的图像中可能的新未哈希CSAM内容。
    • 利用多模态审核分类器检测并阻止任何涉及未成年人的性内容。
    • 对于4o图像生成,基于Sora中使用的现有18岁以下分类器,构建了一个逼真人分类器,用于分析所有上传图像,预测其中是否描绘了未成年人。在发布时,只有在不是对逼真未成年人图像进行编辑的情况下,才允许生成逼真的儿童图像。此外,逼真的儿童生成必须遵守我们所有政策的安全约束。
    • 逼真人分类器接收上传的图像,并预测以下三个标签之一:
      • 无逼真人
      • 逼真成人
      • 逼真儿童
    • 如果图像中同时包含逼真成人和逼真儿童,分类器被设计为返回“逼真儿童”作为预测结果。
    • 表4显示了该分类器在包含近4000张图像的数据集上的评估结果,这些图像分为[儿童|成人]和[逼真|非逼真]类别。
    • 目前,分类器的准确度很高,但可能会偶尔错误分类图像。例如,长相年轻的成年人可能会被错误标记为儿童。为了安全起见,分类器被调整为在分类边界或模糊情况下倾向于将图像标记为“儿童”。OpenAI致力于使用更好的模型和更好的评估集来提高分类器的性能。
2.4.2 艺术家风格
  • 问题与应对:当在提示中使用艺术家的名字时,模型可以生成看起来像某些艺术家作品风格的图像,这在创意社区引发了重要问题和担忧。因此,OpenAI在这一版本的4o

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2326263.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

蓝耘平台API深度剖析:如何高效实现AI应用联动

目录 一、蓝耘平台简介 1.1 蓝耘通义大模型 1.2 蓝耘云计算资源 1.3 蓝耘API与微服务 二、 蓝耘平台应用联动场景 2.1 数据采集与预处理联动 2.2 模型推理与后端服务联动 2.3 跨平台联动 三、蓝耘平台注册体验功能 3.1 注册 3.2 体验蓝耘MaaS平台如何使用海螺AI生成视频…

缓存 “三剑客”

缓存 “三剑客” 问题 如何保证 Redis 缓存和数据库的一致性? 1. 缓存穿透 缓存穿透是指请求一个不存在的数据,缓存层和数据库层都没有这个数据,这种请求会穿透缓存直接到数据库进行查询 解决方案: 1.1 缓存空值或特殊值 查一…

ComfyUi教程之阿里的万象2.1视频模型

ComfyUi教程之阿里的万象2.1视频模型 官网Wan 2.1 特点 一、本地安装1.1克隆仓库1.2 安装依赖(1.3)下载模型(1.4)CUDA和CUDNN 二、 使用体验(2.1)官方例子(2.2)执行过程(…

Leetcode 寻找两个正序数组的中位数

💯 完全正确!!你这段话可以直接当作这道题的**“思路总览”模板答案**了,结构清晰、逻辑严谨、几乎没有遗漏任何关键点👏 不过我可以帮你稍微精炼一下语言,使它在保留你原本意思的基础上更具表达力和条理性…

C#测试Excel开源组件ExcelDataReader

使用微软的com组件Microsoft.office.Interop.Excel读写Excel文件虽然可用,但是列多、行多的时候速度很慢,之前测试过Sylvan.Data.Excel包的用法,如果只是读取Excel文件内容的话,还可以使用ExcelDataReader包,后者是C#开…

手机零售行业的 AI 破局与创新降本实践 | OceanBase DB大咖说

OceanBase《DB 大咖说》第 20 期,我们邀请了九机与九讯云的技术总负责人,李远军,为我们分享手机零售企业如何借力分布式数据库OceanBase,赋能 AI 场景,并通过简化架构实现成本管控上的突破与创新。 李远军于2016年加入…

SpringBoot整合LogStash,LogStash采集服务器日志

LogStash 1. 下载 版本支持兼容表https://www.elastic.co/cn/support/matrix 版本: 7.16.x 的最后一个版本 https://www.elastic.co/downloads/past-releases/logstash-7-16-3 需要提前安装好jdk1.8和ES, 此处不在演示 2. 安装 tar -xvf logstash-7.16.3-linux-x86_64.tar.gz…

目前市场上,好用的校招系统是哪个?

在数字化浪潮的推动下,校园招聘已从传统的“海投简历线下宣讲”模式全面转向智能化、数据化。面对每年数百万应届生的激烈竞争,企业如何在短时间内精准筛选人才、优化招聘流程、降低人力成本?答案或许藏在AI驱动的校招管理系统中。而在这场技…

SharpBrowser:用C#打造超快的个性化开源浏览器!

推荐一个基于.Net 8 和 CefSharp开发的开源浏览器。 01 项目简介 SharpBrowser 是一个用 C# 和 CefSharp 开发的全功能网页浏览器。它声称是最快的开源 C# 网页浏览器,渲染网页的速度比谷歌浏览器还快,因为其使用轻量级的 CEF 渲染器。 经过比较所有可…

【新模型速递】PAI一键云上零门槛部署DeepSeek-V3-0324、Qwen2.5-VL-32B

DeepSeek近期推出了“DeepSeek-V3-0324”版本,据测试在数学推理和前端开发方面的表现已优于 Claude 3.5 和 Claude 3.7 Sonnet。 阿里也推出了多模态大模型Qwen2.5-VL的新版本--“Qwen2.5-VL-32B-Instruct”,32B参数量实现72B级性能,通杀图文…

【Elasticsearch基础】基本核心概念介绍

Elasticsearch作为当前最流行的分布式搜索和分析引擎,其强大的功能背后是一套精心设计的核心概念体系。本文将深入解析Elasticsearch的五大核心概念,帮助开发者构建坚实的技术基础,并为高效使用ES提供理论支撑。 1 索引(Index&…

Github 热点项目 awesome-mcp-servers MCP 服务器合集,3分钟实现AI模型自由操控万物!

【今日推荐】超强AI工具库"awesome-mcp-servers"星数破万! ① 百宝箱式服务模块:AI能直接操作浏览器、读文件、连数据库,比如让AI助手自动整理Excel表格,三分钟搞定全天报表; ② 跨领域实战利器:…

SpringMVC 拦截器(Interceptor)

一.拦截器 假设有这么一个场景,一个系统需要用户登录才能进入,在检验完用户的信息后对页面进行了跳转。但是如果我们直接输入跳转的url,可以绕过用户信息校验(用户登录),直接进入系统。 因此我们引入了使…

03-SpringBoot3入门-配置文件(自定义配置及读取)

1、自定义配置 # 自定义配置 zbj:user:username: rootpassword: 123456# 自定义集合gfs:- a- b- c2、读取 1)User类 package com.sgu.pojo;import lombok.Data; import org.springframework.boot.context.properties.ConfigurationProperties; import org.spring…

【蓝桥杯每日一题】3.28

🏝️专栏: 【蓝桥杯备篇】 🌅主页: f狐o狸x "今天熬的夜,会变成明天奖状的闪光点!" 目录 一、唯一的雪花 题目链接 题目描述 解题思路 解题代码 二、逛画展 题目链接 题目描述 解题思路 解题代…

万字长文详解Text-to-SQL

什么是Text-to-SQL 在各个企业数据量暴涨的现在,Text-to-SQL越来越重要了,所以今天就来聊聊Text-to-SQL。 Text-to-SQL是一种将自然语言查询转换为数据库查询的技术。它可以让用户通过自然语言来查询数据库,而不需要编写复杂的SQL语句。 T…

【Linux】动静态库的制作与使用

一.对软硬链接的补充 1、无法对目录进行硬链接 为什么呢? 首先,我们在访问文件时,每一个文件都会有自己的dentry结构,这些结构会在内存中维护一棵路径树,来快速进行路径查找。但是如果某个节点直接使用硬链接到了根节…

ubuntu22.04 如何安装 ch341 驱动

前言 本篇是介绍ubuntu22.04如何安装 ch341 驱动,并对其中遇到的问题进行整理。 一、流程 1.1 查看CH340驱动 首先是查看ubuntu22.04系统自带的驱动,用以下命令即可 ls /lib/modules/$(uname -r)/kernel/drivers/usb/serial 然后会跳出以下界面&…

个人博客网站从搭建到上线教程

步骤1:设计个人网站 设计个人博客网站的风格样式,可以在各个模板网站上多浏览浏览,以便有更多设计网站风格样式的经验。 设计个人博客网站的内容,你希望你的网站包含哪些内容如你的个人基本信息介绍、你想分享的项目、你想分享的技术文档等等。 步骤2:选择开发技术栈 因…

mac m4 Homebrew安装MySQL 8.0

1.使用Homebrew安装MySQL8 在终端中输入以下命令来安装MySQL8: brew install mysql8.0 安装完成后,您可以通过以下命令来验证MySQL是否已成功安装: 2.配置mysql环境变量 find / -name mysql 2>/dev/null #找到mysql的安装位置 cd /op…