[算法前沿]--003-AGI通用人工智能模型对安全的影响和开源的大模型

news2024/11/15 13:52:26

文章目录

  • 0.ChatGPT大模型带来的影响
    • 0.1 ChatGPT带来信息化革命性创新,目前尚不能处理专业知识但成长很快
    • 0.2 Chat GPT为网安行业带来新的创新方向,也将引领新一轮投融资热潮
      • 0.2.1 攻击方发起网络攻击的门槛降低
      • 0.2.2 防守方合理使用ChatGPT可大幅减少安全运营工作量
      • 0.2.3 针对AI网络安全应用的投融资将呈现井喷效应
    • 0.3 Chat GPT的广泛应用将推动数据安全需求升级
    • 0.4欧洲刑警组织:ChatGPT很有可能被滥用于网络犯罪
  • 1. 多GPU并行训练
    • 1.1 大模型训练-多GPU训练方法种类
      • 1.1.1 两种GPU训练方法:DataParallel 和 DistributedDataParallel:
    • 1.2 误差梯度如何在不同设备之间通信?
    • 1.3 BN如何在不同设备之间同步?
  • 2. 预训练模型发展历程
  • 3. 面向预训练语言模型的Prompt-Tuning技术发展历程

0.ChatGPT大模型带来的影响

0.1 ChatGPT带来信息化革命性创新,目前尚不能处理专业知识但成长很快

2023年虽然才开始不久,但毫无疑问ChatGPT是今年最重大的科技话题之一。Chat GPT是生成式人工智能的开山之作,出道即巅峰,是继PC互联网、移动互联网之后又一次革命性创新,其创新性在于突破之前决策式AI基于规则的算法模型框架,跳出之前“数据搬运工”的传统模式,即在海量数据中寻找符合规则策略的数据,经过比对计算,基于当前的环境、条件和状态,准确的找到符合条件的数据,一步一步的走向算法和程序的终点,得出一个确定的决策。
生成式AI为决策式AI赋予了灵魂和思想,决策式AI需要在海量数据中挑选并使用符合规则的数据,自身并不创造新的数据,生成式AI的革命性创新的根本在于将逻辑和伦理以算法的形式植入,并产生新的数据,相当于为算法植入了思想和灵魂,尽管其智能水平与高水平人类仍有较大差距,但生成式AI在可无限扩展的算力和数据加持下,其成长性和发展前景将无比光明。
从2022年底至今,Chat GPT已经从3.0快速迭代到3.5,从3.5迭代到4.0,配合市场营销的宣传,ChatGPT已经成功打造了几个标签:
l 高富帅:超级算力+海量数据+机器学习+资本追捧
l 自学成才:自我学习,自我提升,快速进阶
l 会推理:读懂复杂问题,具备逻辑能力

0.2 Chat GPT为网安行业带来新的创新方向,也将引领新一轮投融资热潮

ChatGPT带来的网络安全问题也将被无限放大,微软近期推出Microsoft Security Copilot将下一代AI技术,使用其技术内置到网络安全系统中,微软将网络安全防护产品作为首个与ChatGPT能力结合的产品发布,就可以看到网络安全在人工智能领域的重要性,或者网络安全本身就是ChatGPT的一个场景应用。

0.2.1 攻击方发起网络攻击的门槛降低

尽管ChatGPT有内容审计,不提供完整的直接可用的网络攻击工具,但只要攻击者有一定专业技能,通过合理的提问编排,如与搜索引擎配合,网络攻击者可借助ChatGPT快速提升攻击能力和烈度,另外从攻击者的视角,任何一个点被攻破,都可以成为跳板,取得成效;笔者问了ChatGPT网络攻防方面的一些常规问题,回答的有模有样。

0.2.2 防守方合理使用ChatGPT可大幅减少安全运营工作量

运营方对自身IT资产及业务足够熟悉时,可以使用ChatGPT识别漏洞、编写安全运营自动化脚本、制定安全策略等,可在很大程度提升安全运营效率。ChatGPT作为网络安全攻防双方都可使用的工具,用在防守端可得到直接有效答案更方便,在内容审核方面ChatGPT对防守属性的内容更友好易用。ChatGPT作为安全攻防工具本身具有两面性,并将在某一时间点达到攻守的整体平衡,决定攻防态势的最终是人,由人来规划、建设和运营网络安全能力,对工具的使用熟练程度能在很大程度上起到提高效率的作用。

0.2.3 针对AI网络安全应用的投融资将呈现井喷效应

到2025年,人工智能(AI)软件市场规模将从2021年的330亿美元增长到640亿美元。网络安全将是人工智能支出增长最快的细分市场,相关支出的复合年增长率(CAGR)高达22.3%,Forrester发布该报告时ChatGPT尚未出现,经过验证后的Chat GPT将极大推动后续以人工智能和机器学习为支撑技术的网络安全市场进一步繁荣,在大规模资产探测、漏洞管理、异常行为检测等细分方向推出更强能力网络安全产品,配合零信任的安全框架,实现可落地的弹性、动态、智能的网络安全防护体系。

0.3 Chat GPT的广泛应用将推动数据安全需求升级

ChatGPT基于问题交互式学习进化的方式出现,相当于将传统网络安全和数据安全建立的内外网的网格彻底刺破,相当于ChatGPT在以回答问题的形式收集和分析数据,企业和个人以正常业务的形式持续流出重要数据。针对以ChatGPT为代表是生成式人工智能工具,在合规定义方面至少要加强隐私保护(个人隐私、企业隐私、国家隐私)、合规审计(规划、建设、运营)、伦理监管(内容监管、舆情监管、公信监管)几方面的研究和设计,而且这些合规细则的推出已经到了的急迫程度。
从攻防的角度看,是通过防御和反制攻击来保护数据的安全性,其价值在于保护组织的敏感信息和知识产权,减少业务中断和损失,并维护组织的声誉。ChatGPT出现后,可以作为工具同时服务攻防两端,能够熟练使用ChatGPT的一方将对不掌握该技能的一方形成绝对优势,已知的使用Chat GPT进行数据安全类的攻击手段就有社会工程渗透、脱库撞库攻击、规模制造虚假信息(水军)、恶意收集凭证/密码等身份信息等,虽然这些手段在Chat GPT出现之前就已经存在,但是在使用Chat GPT后,攻击效率可大大提高。这些需求升级将导致数据安全的规划和建设在元数据的处置时就入局,如进行数据资产的盘点、数据的分级分类、数据脱敏、数据传输/存储加密等细分技术和方案的快速落地。
数据安全在业务支持方面主要是指为业务需求提供安全保障,以确保数据的保密性、完整性和可用性,价值在于支持业务的联结和增长,提高组织的效率和竞争力。主要应用于金融、电力、电子商务、医疗保健等对数据安全敏感的行业和场景。在Chat GPT的能力加持下数据安全在业务端的能力将更多的体现在在业务逻辑中对钓鱼检测、撞库检测、凭证伪造检测、弱密码检测、可疑身份检测等日常高发、高危类安全行为方面;
综上,合规、攻防和业务支持是数据安全的三个刚性需求,它们的价值和场景均以保护数据为核心,企业和组织需要在这三个方面进行整合,形成一个全面的数据安全策略。ChatGPT的可怕之处在于系统和平台会以“吸星大法”式的模式采集、分析和验证数据,在专业能力达到一定程度的问题处置上,先以“莫须有”的形式和逻辑给出自己一套答案,在一步一步的交互过程中验证AI的理解,而且整个过程中相关人员几乎不会有产生数据安全威胁的意识,这与传统的钓鱼网站、钓鱼邮件类的数据安全问题,对企业的数据安全破坏程度更高。因此,一方面需要数据安全合规、攻防和业务支撑方面做到位,另一方面还需结合专项的数据安全意识类培训,自上向下进行安全意识的培训,从数据安全管理的角度,多管齐下,提升效果。

0.4欧洲刑警组织:ChatGPT很有可能被滥用于网络犯罪

3月27日,欧洲刑警组织创新实验室与相关专家组织了一系列研讨会,探讨犯罪分子会如何滥用 ChatGPT 等大型语言模型,以及它如何协助调查人员的日常工作。会议报告名为“ChatGPT - the impact of Large Language Models on Law Enforcement(ChatGPT - 大型语言模型对执法的影响)”,该报告概述了 ChatGPT 的潜在滥用,并展望了未来可能发生的事情。

欧洲刑警组织的专家们指出,ChatGPT可能为以下三个犯罪领域提供了便利:
1、欺诈和社会工程:ChatGPT高度逼真的文本生成能力使其成为网络钓鱼的有力工具。LLMs语言模式再现能力可用于模仿特定个人或群体的说话风格。
2、假情报:AI擅长快速批量生成真假难辨的声音文本,用户能够借以生成及传播特定叙述的信息,这使其非常适合宣传虚假信息。
3、网络犯罪:只要提供明确的需求,ChatGPT 就能够使用多种不同的编程语言生成用户所需的代码。对于欠缺技术知识的潜在犯罪分子来说,它就是生成恶意代码的有力工具。

欧洲刑警组织的报告旨在提高人们对LLMs潜在滥用的认识,与人工智能公司开展对话,帮助他们建立更好的保障措施,并促进安全可靠的人工智能系统的发展。报告中特别强调了执法机构需要了解这些技术的积极和消极应用,以便应对未来的挑战。可以看到,尽管目前AI的发展未臻完美,但其能力与日俱进,任何人都十分有必要提高对其的认知。

1. 多GPU并行训练

  1. 有两种原因:第一种是模型在一块GPU上放不下,两块或多块GPU上就能运行完整的模型(如早期的AlexNet)。第二种是多块GPU并行计算可以达到加速训练的效果。想要成为“炼丹大师“,多GPU并行训练是不可或缺的技能。

1.1 大模型训练-多GPU训练方法种类

常见的多GPU训练方法:
1.模型并行方式:如果模型特别大,GPU显存不够,无法将一个显存放在GPU上,需要把网络的不同模块放在不同GPU上,这样可以训练比较大的网络。(下图左半部分)
2.数据并行方式:将整个模型放在一块GPU里,再复制到每一块GPU上,同时进行正向传播和反向误差传播。相当于加大了batch_size。

1.1.1 两种GPU训练方法:DataParallel 和 DistributedDataParallel:

  • DataParallel是单进程多线程的,仅仅能工作在单机中。而DistributedDataParallel是多进程的,可以工作在单机或多机器中。
  • DataParallel通常会慢于DistributedDataParallel。所以目前主流的方法是DistributedDataParallel。

1.2 误差梯度如何在不同设备之间通信?

在每个GPU训练step结束后,将每块GPU的损失梯度求平均,而不是每块GPU各计算各的。

1.3 BN如何在不同设备之间同步?

假设batch_size=2,每个GPU计算的均值和方差都针对这两个样本而言的。而BN的特性是:batch_size越大,均值和方差越接近与整个数据集的均值和方差,效果越好。使用多块GPU时,会计算每个BN层在所有设备上输入的均值和方差。如果GPU1和GPU2都分别得到两个特征层,那么两块GPU一共计算4个特征层的均值和方差,可以认为batch_size=4。注意:如果不用同步BN,而是每个设备计算自己的批次数据的均值方差,效果与单GPU一致,仅仅能提升训练速度;如果使用同步BN,效果会有一定提升,但是会损失一部分并行速度。

2. 预训练模型发展历程

  • Zsc1Y7
  • 第一阶段 :设计一系列的自监督训练目标(MLM、NSP等),设计新颖的模型架构(Transformer),遵循Pre-training和Fine-tuning范式。典型代表是BERT、GPT、XLNet等;
  • 第二阶段 :逐步扩大模型参数和训练语料规模,探索不同类型的架构。典型代表是BART、T5、GPT-3等;
  • 第三阶段 :走向AIGC(Artificial Intelligent Generated Content)时代,模型参数规模步入千万亿,模型架构为自回归架构,大模型走向对话式、生成式、多模态时代,更加注重与人类交互进行对齐,实现可靠、安全、无毒的模型。典型代表是InstructionGPT、ChatGPT、Bard、GPT-4等。

3. 面向预训练语言模型的Prompt-Tuning技术发展历程

  • F6n93T
  • Prompt-Tuning自从GPT-3被提出以来,从传统的离散、连续的Prompt的构建、走向面向超大规模模型的In-Context Learning、Instruction-tuning和Chain-of-Thought。
  • 自从GPT、EMLO、BERT的相继提出,以Pre-training + Fine-tuning 的模式在诸多自然语言处理(NLP)任务中被广泛使用,其先在Pre-training阶段通过一个模型在大规模无监督语料上预先训练一个 预训练语言模型(Pre-trained Language Model,PLM) ,然后在Fine-tuning阶段基于训练好的语言模型在具体的下游任务上再次进行 微调(Fine-tuning) ,以获得适应下游任务的模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/458873.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

组态王与PLC之间1主多从自组网无线通信

本方案是基于三菱专用协议下实现的1主多从自组网无线通信形式,主站为组态王,从站为三菱FX3U PLC和485BD扩展。采用日系PLC专用无线通讯终端DTD435MC-V96,作为实现无线通讯的硬件设备,来解决组态王与PLC之间的通讯问题。 一、方案…

百度AI模型“文心一言”新鲜体验

今天收到通知可以体验百度的AI模型“文心一言”,等了一个多月迫不及待的去体验了一把,以下是体验的相关记录。 1、简单介绍 通过文心一言官网链接https://yiyan.baidu.com/进入,看到如下界面: 在文心一言的自我介绍中&#xff0c…

seetaface6 GPU版本windows编译

目录 1. seetaface6概述2. 编译说明2.1 编译工具2.2 编译顺序 3. 编译OpenRoleZoo4. 编译SeetaAuthorize5. 编译TenniS6. 编译FaceTracker6 1. seetaface6概述 seetaface6源码以及模型文件github下载路径:https://github.com/SeetaFace6Open/index 由于项目性能需求…

华为为何要搞相对冷门的ERP?

大家都知道华为的研发实力很强,但几天前他们宣布研发出超大规模云原生的ERP时,还是有些吃惊。 20日,在东莞的一场“英雄强渡大渡河”表彰会上,华为抛出一个大多数公司都难以做到的成果:三年时间,数千人&am…

从零开始写ChatGLM大模型的微调代码

cursor 的下载及安装(免费版每月100次,升级pro 20刀/月) cursor是一款与openai合作的,使用gpt-4的一款编程工具,它可以让你通过gpt-4进行辅助编程,以此提高效率。 下载地址:https://www.curso…

CentOS系统安装Intel E810 25G网卡驱动

因特尔网卡驱动给的都是二进制包,需要编译环境。 首先去Intel下载最新的驱动 E810驱动下载:https://www.intel.com/content/www/us/en/download/19630/intel-network-adapter-driver-for-e810-series-devices-under-linux.html?wapkwe810 里面有三个驱…

量子计算新进展!瑞典和芬兰率先研发芯片

(图片来源:网络) 芬兰和瑞典在北欧率先推出了独立的量子计算机项目,并在未来量子技术方面取得了可喜的新进展。 在瑞典,查尔姆斯理工大学 (Chalmers UoT) 获得了追加的900万欧元(约合6774万元人民币&#x…

风力发电系统的随机调度研究(matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

【神经网络】tensorflow实验8--梯度下降法

1. 实验目的 ①掌握TensorFlow的可训练变量和自动求导机制 ②能够使用TensorFlow实现梯度下降法,求解一元和多元线性回归问题 2. 实验内容 下载波士顿房价数据集,使用线性回归模型实现对波士顿房价的预测,并以可视化的形式输出模型训练的过…

【Git】—— 版本控制(忽略文件、查看修改内容,撤销未提交的修改、查看历史提交记录)

目录 一、准备工作 二、忽略文件 三、查看修改内容 四、撤销未提交的修改 五、查看提交记录 前面学习了Git最基本的用法,包括安装Git、创建代码仓库以及提交本地代码。 下面将要学习版本控制。 一、准备工作 先选择一个项目,给它创建一个代码仓库&a…

Linux环境定时备份MySQL数据库

数据库备份常有,实现备份,大概需要3个步骤: 目录 1.创建数据库备份用户 2.创建数据库备份shell脚本 3.创建定时任务 1.创建数据库备份用户 为了数据安全,不建议使用root用户。举例:创建数据库备份用户 dump&#…

复现永恒之蓝[MS17_010]

目录 准备靶机 测试ping连通性 攻击漏洞 利用漏洞 准备靶机 1台kali,1台win7 win7系统可以在MSDN镜像网站里获取 注:将win7安装好,win7无法安装vmtools,若升级系统,可能会把永恒之蓝补丁打上,所以建议别升级系统 测试…

用Java创建可扩展的OpenAI GPT应用程序

ChatGPT 值得深入使用的方面之一是它的引擎,它不仅为基于Web的聊天机器人提供动力,还可以集成到Java应用程序中。 ▌Budget Journey App 想象一下,你想去一个城市旅行并且设置好了预算,你应该如何分配你的钱并让你的旅行难忘&am…

巧用千寻位置GNSS软件|逐点放样应用技巧

线路逐点放样是针对施工需要和设计要求,对线路 20、50、100间隔的整桩距或整桩号的特定桩位进行连续放样设定的程序。运用千寻位置GNSS软件如何快速实现线路逐点放样呢?让我们一探究竟吧! 点击【测量】->【线路逐点放样】,选择…

CMake : Linux 搭建开发 - g++、gdb

目录 1、环境搭建 1.1 编译器 GCC,调试器 GDB 1.2 CMake 2、G 编译 2.1 编译过程 编译预处理 *.i 编译 *.s 汇编 *.o 链接 bin 2.2 G 参数 -g -O[n] -l、-L -I -Wall、-w -o -D -fpic 3、GDB 调试器 3.1 调试命令参数 4、CMake 4.1 含义 4.2…

npm全局包及项目包的讲解与方法

看图可知 安装全局包和项目包 我们通过npm install 命令来安装包,简单说就是把包从npm的官网(或者是指定的镜像源)下载到我们自己的电脑中。那具体这个包下载到哪里了,还是有一点讲究的。 分成两类: 全局安装: 包被…

IntelliJ IDEA 新建安卓项目失败,网上的各种教程都不管用的看向这里!!!

目录 1、出现的问题: 2、解决办法: 1)新建项目 2)修改设置 3、注意 备注: 目的:最近开发机器人远程控制需要一个安卓app,之前是自己做了个H5app来用的,H5不是很稳定,所…

Kotlin基础

Kotlin基础 一.Kotlin介绍1.诞生2.Kotlin与JVM3.为什么学习kotlin?4.Kotlin跨平台特性 二.变量常量类型条件语句函数1.声明变量2.内置数据类型3.只读变量4.类型推断5.编译时常量6.条件语句:表达式7.String模板8.函数 三.匿名函数函数类型高阶函数&#x…

关于OKD(OpenShift)中组件资源介绍和命令行操作的一些笔记

写在前面 参加考试,会陆续分享一些 OpenShift 的笔记博文内容为 openshift 常见 API 资源对象介绍,包括所特有的 Route,IS,DC,BC 等。学习环境为 openshift v3 的版本,有些旧这里如果专门学习 openshift &a…

第一节 ogre源码编译与安装

一. 电脑环境要求 本机使用的编译环境为:系统为Windows 10, Microsoft Visual Studio Enterprise 2019,版本 16.11.26,cmake-3.18.6-win64-x64 这些为基本的操作环境自己可以从网上下载安装。 二. 依赖环境下载 DirectX SDK &a…