人工智能网络安全挑战赛(AIxCC):超亿元大奖等你来拿!

news2024/12/27 0:48:11

图片

2023年底,DARPA开启了一项前所未有的挑战——人工智能网络安全挑战赛(AIxCC),旨在通过技术竞赛探索AI时代下网络安全的新格局。该赛事希望孕育出一种创新的网络安全通用人工智能(AGI)系统,该系统能够智能挖掘、检测和修复关键基础设施的软件安全问题。

该赛事的总奖金池已超越1亿元人民币。这不仅极大地激励了参赛队伍,也体现了DARPA对网络安全领域的重大投入和期望。在这场挑战中,像Anthropic、Google、Microsoft 和 OpenAI 这样的AI领域巨头也将参与其中,提供最先进的技术支持。这不仅是对AI技术的一次全面检验,更是对未来网络安全防护能力的一次大胆探索。

比赛概述

参赛团队的任务是构建一个由人工智能驱动的全自动网络推理系统(CRS),用于识别和修补程序中的漏洞。在发现和修补挑战项目中的漏洞时,CRS 不能得到任何人工帮助。挑战项目是现实世界中关键软件的修改版本,如Linux内核和Jenkins自动化服务器。CRS 需要提交漏洞证明(PoV)和理解证明(PoU),并且对于它们发现的每个漏洞都可以提交一个补丁,这些都将作为本次挑战赛的重要评分依据。整体赛程分为如下四个阶段:

- 注册阶段(2024年1月至4月):比赛现已正式开放注册,同时,专门为小型企业设立的注册通道也同步开放。在提交概念白皮书后,最多有七家小型企业将有机会获得100万美元奖金,用于资助他们参加AIxCC比赛的后续阶段。

- 练习赛阶段(2024年3月至7月):在此阶段,参赛者将有机会通过实战来熟悉比赛,并对他们开发的网络安全人工智能系统进行实际测试。

- 半决赛阶段(2024年8月在DEF CON举行):在练习赛中,排名前七的团队将晋级至半决赛,并且每个团队将获得200万美元的奖金。

- 决赛阶段(2025年8月在DEF CON举行):在激动人心的总决赛中,表现最出色的三个团队将分别获得400万美元、300万美元和150万美元的奖金。

图片

                                                               AIxCC活动概览

挑战项目

在本次比赛中,所有挑战问题都是基于真实软件改编而来,显示出极高的多样性。这些目标软件可能使用多种编程语言编写,包括Java、Rust、Go、JavaScript、TypeScript、Python、Ruby和PHP。然而,至少一半的问题将涉及包含内存损坏漏洞的C/C++程序。其他类型的漏洞将从MITRE公布的前25个最危险软件漏洞中选择。每个挑战问题包括源代码、可修改的构建流程和环境、测试工具,以及公共功能测试套件。参与挑战的CRS需要应用多种AI/ML和传统程序分析技术,来发现、定位、触发和修复挑战问题中的漏洞。为了获得分数,CRS必须提交PoV(证明漏洞存在的输入)和PoU(说明触发漏洞条件的文件),并且可以提出修复方案。PoV是一种输入,用于利用提供的测试工具触发漏洞。PoU必须指明将由PoV触发的消毒剂(sanitizers)、测试工具,以及漏洞所在的代码行。

评分规则

在评分算法方面,各团队CRS的总分将基于漏洞发现、程序修复、准确性和多样性等多个维度来计算。

- 漏洞发现分数:每个通过AIxCC sanitizer 触发且附带有效PoU的PoV,都会为CRS带来积分。

- 程序修复分数:若附带的PoV/PoU的补丁能够有效阻止AIxCC sanitizer 触发,且不影响预期功能,CRS将获得积分。若补丁在代码检查器中没有发现错误,还可获得额外的奖励积分。

- 准确性分数:CRS执行任务的准确性也是评分的一个重要因素,意味着参赛队伍需尽量减少提交无效的PoV、PoU和补丁。

- 多样性分数:CRS处理挑战问题的多样性也是评分的一部分,即CRS的最终评分将与它们处理的CWE种类和编程语言的多样性直接相关。

未来展望

AIxCC竞赛代表了自动化漏洞挖掘、检测和修复技术在现实性和技术深度方面的显著进步,与先前的Cyber Grand Challenge相比,其创新性显而易见。首先,挑战问题的构成紧密贴合现实世界的需求,包括了实际软件及其漏洞。其次,这些问题不仅包含源代码,还被编译成现实世界中常用的二进制文件格式。这一点至关重要,因为它保证了问题的实用性和适用性。此外,该挑战赛涵盖了多种不同的源代码语言,并针对多样化的计算堆栈,极大地扩展了其应用范围和深度。 AIxCC对通用网络安全AGI系统的重点关注,为软件分析领域带来了独特的机遇。通过激励研究者和开发者探索新的方法,这些挑战可能解决传统方法无法应对的基本限制(例如停机问题)。这不仅推动了技术创新,还有望开拓全新的研究领域,从而提升整个行业在软件分析和安全性方面的表现。

                                                                                                                             翻译:Fancy

                                                                                                                             编辑:Fancy

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1424829.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3款日本云服务器推荐,最低一款只需15.8元

当今的互联网时代,云服务器已经成为企业和个人进行业务部署和数据存储的重要工具。而在全球范围内,日本云服务器市场也越来越受到关注。今天,我们将为大家推荐3款日本云服务器,最低的一款仅需15.8元/月。 1.恒创科技 一家非常受…

两种相同的垂直工具栏标志以及为什么

可能你很少碰到这样的开发需求,所以本文属于”课外阅读”级别。 有两种方式启用垂直工具栏,一种是指定通用的 CCS_VERT 标志,另外一种,比较罕见:指定工具栏所特有的扩展属性 TBSTYLE_EX_VERTICAL。 问题来了&#xf…

智能小车案例:基于Raspberry Pi的自动巡航与避障系统

项目背景 随着物联网技术的不断发展,智能小车成为了现代生活和工业自动化中的重要工具。为了实现智能小车的自动巡航与避障功能,我们采用了Raspberry Pi作为主控制器,结合传感器和执行器,构建了一个完整的系统。 所需材料 Raspber…

关于source批量处理sql命令建立数据库后发现中文乱码问题解决方案(Mysql)

今天在使用souce建表的时候发现自己表结构中的中文出现了乱码问题,那么具体的解决方案如下: 首先我们先使用命令行连接自己的数据库 mysql -u root -p 12345 然后使用show variables like "char%"; 如果说你的这个里面不是utf-8那么就是出现了…

Acrel-1200分布式光伏运维平台屋顶光伏工商业屋顶光伏应用

上海安科瑞电气股份有限公司 胡冠楠 咨询家:“Acrelhgn”,了解更多产品资讯 行业现状 “十四五”期间,随着“双碳”目标提出及逐步落实,本就呈现出较好发展势头的分布式光伏发展有望大幅提速。就“十四五”光伏发展规划&#xf…

大脑模型认知实验报告(脑与认知期末考核)

实验名称:大脑模型认知实验 实验目的: (1)对大脑的三部分、七层结构、区域划分有一个清晰的认识。 (2)对脑的各个区域的基本功能以及脑的工作方式有所了解。 实验环境:大脑模具、配有详细标…

vue3 + vite:打包部署后,动态组件渲染404问题解决

问题描述: 当需要渲染动态组件,动态的组件路径配置在数据库中时,如下图,本地运行能正常访问,用vite打包部署后,生产上改路径为404. 起初认为是,vite打包后的文件都是.js, 当页面加载后从数据库拿来的路径是.vue, 并且是src/xxx/xxx.vue 这种绝对路径形式的,所以就找不…

《Pandas 简易速速上手小册》第3章:Pandas 数据清洗基础(2024 最新版)

文章目录 3.1 处理缺失数据3.1.1 基础知识3.1.2 重点案例:客户数据分析3.1.3 拓展案例一:医疗问卷数据处理3.1.4 拓展案例二:零售店库存清单 3.2 数据类型转换3.2.1 基础知识3.2.2 重点案例:商品销售数据分析3.2.3 拓展案例一&…

热仿真中稳态与瞬态的区别

对于热仿真,根据是否随时间变化,可分为稳态(steady)仿真和瞬态(transient)仿真两类。 从数学计算的角度,所谓稳态是指物理量不随时间变化的定常过程,即计算域中所有物理量均满足关系…

华章杂志华章杂志社华章编辑部2023年第11期目录

专题论文 强化人才队伍发展 推动法治唐山建设问题研究 (0003) 李彬 文化论坛《华章》投稿:cn7kantougao163.com 乡村振兴背景下非物质文化遗产传承与发展探究 ——以黔西南州传统蓝染文化为例 (0006) 董天丽;何华杰;韦永吉;王芳琳 思政课视角下高职学生保护和继…

Git系列---远程操作

📙 作者简介 :RO-BERRY 📗 学习方向:致力于C、C、数据结构、TCP/IP、数据库等等一系列知识 📒 日后方向 : 偏向于CPP开发以及大数据方向,欢迎各位关注,谢谢各位的支持 引用 1.理解分布式版本控制…

第九篇【传奇开心果系列】Python的OpenCV技术点案例示例:目标跟踪

传奇开心果短博文系列 系列短博文目录Python的OpenCV技术点案例示例系列 短博文目录前言二、常用的目标跟踪功能、高级功能和增强跟踪技术介绍三、常用的目标跟踪功能示例代码四、OpenCV高级功能示例代码五、OpenCV跟踪目标增强技术示例代码六、归纳总结 系列短博文目录 Pytho…

绝地求生:地铁逃生模式从哪里进入游戏模式的讲解

地铁逃生模式是绝地求生(PUBG)中的一种游戏模式,玩家需要在地铁车厢中寻找武器并战胜其他玩家。如果你还不知道在哪里进入地铁逃生模式,本文闲游盒将为您进行详细的讲解。 进入地铁逃生模式的步骤: 打开绝地求生游戏客…

C++关键词auto详解

顾得泉:个人主页 个人专栏:《Linux操作系统》 《C从入门到精通》 《LeedCode刷题》 键盘敲烂,年薪百万! 一、小思考 随着我们对于C的不断学习,遇到的程序越来越复杂,程序中用到的类型也越来越复杂…

麒麟V10 mate-indicator进程占用内存过高问题

给客户新划的5台虚拟机,操作系统是麒麟V10,用户反映什么软件都没装系统内存占用就达到80%。 百度了一下是麒麟的bug,内存泄漏。官方分析报告。 解决方法:下载相应rpm包并安装即可解决。 1.确定麒麟版本 cat /etc/*release Ter…

npm淘宝镜像过期解决办法

npm淘宝镜像过期解决办法 因为npm 官方镜像(registry.npmjs.org)在国内访问很慢,我们基本上都会选择切换到国内的一些 npm 镜像(淘宝镜像、腾讯云镜像等)。由于淘宝原来的镜像(registry.npm.taobao.org&am…

肉食食材大数据平台(附源码)

目录 一.需求分析 1.项目背景 2.用户简介 3.术语定义 4.功能概述 二.概要设计 1.概要设计流程图 2.流程图详细说明 三.数据库设计 1.软件名称 2.概念结构设计 2.1电商模块 2.2猪肉今日价格模块 2.3大屏展示模块 2.3.1舆论舆情 2.3.2 省均价模块 2.3.3进出口模块…

Pyecharts绘制多种炫酷气泡图

Pyecharts绘制多种炫酷气泡图 引言 数据可视化是数据分析中不可或缺的一环,而Pyecharts作为一款基于Echarts的Python图表库,提供了丰富的图表类型,其中气泡图是一种常用于展示三维数据的炫酷图表。本文将介绍如何使用Pyecharts绘制多种炫酷…

【CSS】css获取子元素的父元素,即通过子元素选择父元素(使用CSS伪类 :has() :not() )

这里写目录标题 一、:has获取第一个div获取包含 a.active 的 li获取第二个div 二、:not除了类名为active 的 a,其他的a的字体都为18px <div><h1>标题</h1></div><div><ul><li><a href"#" class"active">测…

基于YOLOv8的水下生物检测,多种优化方法---自研注意力BSAM助力涨点(一)

&#x1f4a1;&#x1f4a1;&#x1f4a1;本文主要内容:详细介绍了水下生物检测整个过程&#xff0c;从数据集到训练模型到结果可视化分析&#xff0c;以及如何优化提升检测性能。 &#x1f4a1;&#x1f4a1;&#x1f4a1;加入自研注意力BSAM mAP0.5由原始的0.522提升至0.553…