AI大模型怎么备案?

news2024/11/25 2:24:34

随着人工智能技术的飞速发展,生成式AI正逐渐渗透到我们的日常生活和各行各业中。从文本创作到艺术设计,从虚拟助手到智能客服,AI的身影无处不在。然而,技术的创新与应用,离不开法律的规范与引导。为进一步保障和监管AI技术创新,我国出台了《生成式人工智能服务管理暂行办法》(以下简称《办法》),为AI技术的合规应用提供了明确的法律框架。此前,我国已经出台了针对深度合成算法的《互联网信息服务深度合成管理规定》(以下简称《深度合成规定》),明确了深度合成服务相关方的义务与主体责任。《办法》和《深度合成规定》构建了针对大模型的“双备案系统”,即“深度合成算法备案”和“大模型备案”。

今年4月,我国又颁布了一批已备案的生成式人工智能服务信息,这标志着对AI服务管理的进一步加强。本文将深入解析《办法》的核心要点,探讨大模型(生成式人工智能)备案的合规,帮助企业与开发者在享受AI技术红利的同时,确保每一步都符合法律规范,共同推动人工智能行业的稳健前行。

生成式AI大模型备案的要求

根据《生成式人工智能服务安全基本要求》需提供以下材料:语料安全、模型安全、安全措施,以及以上的安全自评估。各个板块的重点审查内容如下图所示。

1、语料安全

语料安全确保了大模型训练时使用的数据合规、安全。语料安全的板块涵盖以下内容:

  • 语料来源安全:对于特定语料来源,提供者在采集前后都应进行安全评估;含违法不良信息超过5%的语料不应采集或使用,且不应使用违反我国网络安全相关法律法规要求阻断的信息作为训练语料。

  • 语料来源多样性:应提高语料来源的多样性,确保每种语言和类型的语料都来自多个来源,并合理搭配境内外来源语料。

  • 语料来源可追溯性:使用开源语料时应具有相应的开源授权协议或文件,使用自采语料时应有采集记录,并且避免采集明确不可采集的语料。

  • 商业语料使用:使用商业语料时,应有法律效力的交易合同或合作协议,并应对交易方或合作方提供的语料、承诺、材料进行审核。

  • 语料知识产权保护:应设置知识产权负责人,建立管理策略,对语料中的知识产权侵权风险进行识别,不应使用有侵权问题的语料进行训练。

  • 语料的个人信息保护:使用包含个人信息的语料时,应获得个人信息主体的授权同意,或满足其他合法使用条件。

  • 安全评估:提供者对语料安全情况进行评估时,应采用人工抽检、关键词、分类模型等方法,确保抽样合格率达到规定标准。

  • 语料标注安全:应对标注人员进行安全培训、考核、划分,并指定标注的规则。同时应当对标注语料进行抽检。

2、模型安全

模型安全是为了确保生成式人工智能大模型产品在提供服务时所生成的内容的安全、准确、合法,同时保护知识产权和用户隐私。

  • 模型合规:如需基于第三方基础模型提供服务,应使用已经主管部门备案的基础型。

  • 内容安全性:训练时优先考虑生成内容的安全性,并引导模型产出积极内容。

  • 准确性和可靠性:提高生成内容中数据及表述与科学常识及主流认知的符合程度,减少其中的错误内容,并提高生成内容对使用者的帮助作用。

3.安全措施

建立全面的安全管理体系,包括合规性、风险控制、透明度、用户控制、未成年人保护、响应机制和系统安全性,以促进生成式人工智能服务的健康发展并保护用户权益。

  • 模型安全性:使用经备案的模型,并对关键场合,例如金融、医疗信心、基础设施的风险保护措施,和未成年人使用场景实施额外保护。

  • 服务透明度:公开服务信息、模型算法概要、个人信息用途;显著位置展示,易于用户访问

  • 用户输入信息:提供便捷方式让用户关闭信息训练功能;显著告知信息收集状态和关闭选项。

  • 内容标识:确保图片、视频等内容标识符合国家标准。

  • 计算系统安全:评估供应链安全,芯片支持硬件安全启动,保障系统安全运行。

  • 投诉举报机制:提供投诉举报途径,明确处理规则和时限。

  • 服务稳定性:隔离训练与推理环境,防范攻击;定期安全审计,建立备份和恢复策略。

注意,《生成式人工智能服务安全基本要求》还提出了一些其他条件,包括但不限于:

· 关键词库量不少于10000个,且具有代表性,每周最好至少按照网络需要更新一次词库。

· 建立完整的生成内容测试题库,总规模不少于20000题,且具有代表性。

· 建立完整的拒答测试题库,包含应拒答题库和非拒答题库各500题等等。

随着《生成式人工智能服务管理暂行办法》的实施,大模型备案所涉及到一系列相对复杂的流程与合规问题,对很多行业内的个体经营者提出了新领域的挑战。合规不仅是企业与开发者的责任,更是推动整个行业健康、有序发展的关键。在享受AI技术带来的便利和红利的同时,我们必须时刻保持警醒,确保每一步操作都在法律的框架之内。最后,如各位老友有任何AI领域的法律及合规问题,也随时欢迎来与飒姐共同探讨!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1873413.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《昇思25天学习打卡营第2天|快速入门》

文章目录 前言:今日所学:1. 数据集处理2. 网络的构建3. 模型训练4. 保存模型5. 加载模型 总体代码与运行结果:1. 总体代码2. 运行结果 前言: 今天是学习打卡的第2天,今天的内容是对MindSpore的一个快速入门&#xff0…

HarmonyOS ArkUi ArkWeb加载不出网页问题踩坑

使用 使用还是比较简单的,直接贴代码了 别忘了配置网络权限 Entry Component struct WebPage {State isAttachController: boolean falseState url: string State title: string Prop controller: web_webview.WebviewController new web_webview.WebviewCont…

锐捷网络闪耀CVPR 2024,外观异常检测方案斩获世界认可!

近日,锐捷网络在“视觉异常检测和创新性检测2024挑战赛”(Visual Anomaly and Novelty Detection 2024 Challenge,简称VAND)的少样本逻辑/结构异常检测赛道(VAND 2.0赛道2)中荣获第二名,并在计算机视觉顶级会议CVPR 2024上展示了这一成果&…

详细介绍LP-SCADA系统的核心数据采集单元

关键字:LP-SCADA系统, 传感器可视化, 设备可视化, 独立SPC系统, 智能仪表系统,SPC可视化,独立SPC系统 SCADA系统的数据采集功能是其核心组成部分,它允许系统从各种传感器、仪器和设备中收集实时数据。以下是SCADA系统数据采集功能的详细描述: 传感器和…

我的创作纪念日学期总结

🔥个人主页: Forcible Bug Maker 🔥专栏: 关于博主 目录 🌈前言🔥我的期末考试🔥我的学期总结🔥对未来的展望🌈结语 🌈前言 本篇博客主要内容:博…

SOLIDWORKS Electrical智能模型--实现机电一体化设计的关键

SOLIDWORKS Electrical 3D布线可以根据原理图自动生成线路,并且电气属性可以自动与导轨或机柜进行配合放置。但是这些电气模型该如何添加这些属性呢? 1.首先确保我们已经打开SOLIDWORKS Electrical 3D插件,接着打开一个模型,此处以…

【新版本来袭】ONLYOFFICE桌面编辑器8.1 —— 重塑办公效率与体验

文章目录 一、功能完善的PDF编辑器:重塑文档处理体验编辑文本插入和修改各种对象,如表格、形状、文本框、图像、艺术字、超链接、方程式等添加、旋转和删除页面添加文本注释和标注 二、幻灯片版式设计:创意展示的无限舞台三、改进从右至左显示…

使用SpringBoot整合Listener

常用的Web事件的监听接口如下: ServletContextListener:用于监听Web的启动及关闭 ServletContextAttributeListener:用于监听ServletContext范围内属性的改变 ServletRequestListener:用于监听用户请求 ServletRequestAttributeLi…

博睿数据受邀出席GOPS全球运维大会北京站,分享《一体化可观测数据模型和AIOps的融合实践》

2024年6月28日,第二十三届 GOPS 全球运维大会暨 XOps 技术创新峰会在北京顺利召开。大会为期2天,侧重 BizDevOps、XOps、DevOps、持续测试、SRE、可观测性、云原生等热门技术领域。并特别设置大模型运维、银行/证券数字化转型、平台工程、DevOps/AIOps 最…

游戏AI的创造思路-技术基础-机器学习(2)

本篇存在大量的公式,数学不好的孩子们要开始恶补数学了,尤其是统计学和回归方程类的内容。 小伙伴们量力而行~~~~~ 游戏呢,其实最早就是数学家、元祖程序员编写的数学游戏,一脉相承传承至今,囊括了更多的设计师、美术…

华为HCIP Datacom H12-821 卷18

1.问答题 (拖拽题)如图所示,请根据 DHCPv6 的四歩交互流程, 将报文按照顺序拖拽到相应的位置 参考答案: 1--solicit ,2--advertise , 3--equest, 4--reply 解析: DHCPv6的报文交互流程,类似于V4,先组播发现,服

二叉树的方法

目录 一、二叉树的定义 ​编辑 二、二叉树的创建 三、二叉树的遍历 1、前序遍历 2、中序遍历 3、后序遍历 4、层序遍历 四、二叉树遍历方法的使用 五、二叉树的操作 1、节点的个数 2、叶子节点的个数 3、第k层节点的个数 4、二叉树的高度 5、检查值为value的元素…

自动化巡检革命:旗晟双圆管轨道机器人的创新应用

在输煤皮带线和矿山带式输送机的巡检过程中,面临着高湿度、多粉尘、温湿度极端、噪音干扰;设备磨损频繁,难以及时发现问题;传统的人工巡检方式存在劳动强度大、效率低、检测质量不稳定、数据采集和分析滞后,无法实现实…

Promise 类的方法简介

文章目录 Promise.resolve() 和 Promise.reject()resolve()和reject()的参数 Promise.all()Promise.all()案例:多张图片上传Promse.allSettled()Promise.race()Promise.race()举例:图片加载超时Promise.race()举例:网络请求超时Promise.any()…

第4章 客户端-客户端管理

1. 客户端API 1.1client list client list命令能列出与Redis服务端相连的所有客户端连接信息。 127.0.0.1:6379> client list id254487 addr10.2.xx.234:60240 fd1311 name age8888581 idle8888581 flagsN db0 sub0 psub0 multi-1 qbuf0 qbuf-free0 obl0 oll0 omem0 events…

硬件实用技巧:摄像头常用的输出协议类型和输出接口类型

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/140042485 长沙红胖子Qt(长沙创微智科)博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV…

07-border布局的另一个用处

07-border布局的另一个用处 实现如下的布局: 分析: 1.USERNAME和PASSWORD使用form 2.PASSWORD的文本框使用NewMultiLineEntry 布局1 USERNAME和PASSWORD作为一个form整体,使用border布局,form设置为top,文本框设置为center参数。 packa…

Linux挂载Windows共享文件

一、Windows共享目录 二、Linux挂载 yum install cifs-utils mkdir /aaa/ mount.cifs -o usernamexxx,passwordxxx //172.16.8.121/aaa /aaa/

昇思25天学习打卡营第3天|数据集全攻略:加载、操作与自定义

导入数据集相关库和类 首先,导入了 NumPy 库,并将其简称为 np 。要知道,NumPy 乃是用于科学计算的关键库,作用非凡。接着,从 mindspore.dataset 当中导入了 vision 模块。此外,还从 mindspore.dataset 里引…

感染与疾病,感染的逐步进阶以及伴随的疾病发展

病原微生物和/或有害微生物成功入侵、繁殖并定居于宿主的体内或体内,从而导致健康障碍,称为感染。简单地说,它可以定义为由微生物引起的疾病。感染也被称为传染病或传染病或传染性疾病。 感染每年导致 1300多万 人死亡;2019 年死亡…