目录
- GPT-4o 系统安全卡
- AMD 完成对 Silo AI 的收购,加速 AI 模型在硬件上的开发和部署
GPT-4o 系统安全卡
一、概述
- GPT-4o 是一个多模态模型,可以处理文本、音频、图像和视频输入,并生成文本、音频和图像输出。
- 本文概述了 GPT-4o 发布前的安全工作,包括外部红队测试、风险评估和缓解措施。
二、模型数据和训练
- 训练数据截止到 2023 年 10 月,包括公开数据、合作数据等。
- 数据集包含网页数据、代码和数学数据、多模态数据等。
- 采取了数据过滤、模型对齐、红队测试、产品级缓解措施等安全措施。
三、风险识别、评估和缓解
- 外部红队测试:超过 100 名来自 29 个国家、使用 45 种语言的红队成员参与测试。
- 评估方法:将文本评估任务转换为音频评估任务,利用 TTS 系统生成音频输入。
- 评估方法的局限性:TTS 模型的可靠性和代表性问题。
四、观察到的安全挑战、评估和缓解
- 未经授权的语音生成:限制使用预设语音,并使用输出分类器检测偏差。
- 说话人识别:训练模型拒绝根据语音识别说话人,但仍可识别名人名言。
- 生成受版权保护的内容:训练模型拒绝生成受版权保护的内容,并使用过滤器阻止包含音乐的输出。
- 无根据的推断/敏感特征归因:训练模型拒绝无根据的推断,并对敏感特征归因进行安全处理。
- 音频输出中的违规内容:使用现有审核模型对音频转录文本进行审核,并阻止包含有害语言的输出。
- 色情和暴力语音输出:使用现有审核模型对音频输入转录文本进行审核,并阻止包含相关请求的输出。
五、其他已知风险和局限性
- 音频鲁棒性:音频扰动可能降低安全鲁棒性。
- 错误信息和阴谋论:模型可能被诱导生成不准确的信息。
- 使用非母语音调说非英语:模型在说非英语时可能会使用非母语音调。
- 生成受版权保护的内容:模型可能重复训练数据中的受版权保护的内容。
六、防范框架评估
- 网络安全:低风险。
- 生物威胁:低风险。
- 说服力:中等风险。
- 模型自主性:低风险。
七、第三方评估
- METR:评估了 GPT-4o 在虚拟环境中执行多步骤任务的能力。
- Apollo Research:评估了 GPT-4o 的“计划”能力,包括自我意识和心理理论。
八、社会影响
- 拟人化和情感依赖:语音功能可能会加剧用户对模型的拟人化和情感依赖。
- 健康:模型可以改善健康信息的获取和临床工作流程。
- 科学能力:模型可以加速科学研究,但需要谨慎对待其潜在的双重用途。
- 资源不足的语言:模型在资源不足的语言方面表现有所改善,但仍有差距。
九、结论和下一步工作
- OpenAI 将继续监控和更新 GPT-4o 的安全措施。
- 鼓励对多模态模型的对抗鲁棒性、拟人化影响、科学研究应用、危险能力(如自我改进、模型自主性和计划)等方面进行研究。
GPT-4o 是一个强大的多模态模型,OpenAI 采取了多种安全措施来降低其风险。然而,该模型仍然存在一些局限性和潜在的社会影响,需要进一步研究和关注。
来源:
https://openai.com/index/gpt-4o-system-card/
AMD 完成对 Silo AI 的收购,加速 AI 模型在硬件上的开发和部署
AMD 于 2024 年 8 月 12 日宣布完成对欧洲最大私营人工智能实验室 Silo AI 的收购。 这项全现金交易价值约 6.65 亿美元,旨在通过与全球 AI 生态系统的密切合作,基于开放标准,提供端到端 AI 解决方案。
Silo AI 拥有一支世界级的人工智能科学家和工程师团队,经验丰富,曾为 Allianz、Philips、Rolls-Royce 和 Unilever 等大型企业客户开发尖端的人工智能模型、平台和解决方案。 他们的专业知识涵盖多个市场,并使用 AMD 平台创建了最先进的开源多语言大型语言模型 (LLM),包括 Poro 和 Viking。
AMD 认为,Silo AI 的专业知识和软件能力将直接改善客户体验,帮助他们在 AMD 平台上提供性能最佳的 AI 解决方案。
来源:
https://www.amd.com/en/newsroom/press-releases/2024-8-12-amd-completes-acquisition-of-silo-ai-to-accelerate.html
更多内容请查阅 : blog-240815
关注微信官方公众号 : oh my x
获取开源软件和 x-cmd 最新用法