Coremail AI技术发展前生今世

news2024/11/21 0:18:05

2023年3月15日凌晨,OpenAI发布大型多模态模型GPT-4,正式宣告AI迈入新的“黄金时代”。作为邮件安全厂商,Coremail不禁思索,在当今科技高速发展的节点上,如何将此类大型多模态模型落地至具体的邮件安全防护?

3月23日,Coremail邮件安全人工智能实验室首席架构师潘庆峰(下文简称“大P”)在直播间为观众朋友们介绍了Coremail AI技术发展历程,并展示了CAC邮件安全大数据中心与应用产品的闭环架构,也欢迎志同道合的朋友们与我们共同讨论分享。

智能算法萌芽期(2000年前后)

作为2000年就加入Coremail进行邮件系统开发的元老级人物,Coremail内部常常亲切地称呼潘庆峰老师为大P。

据大P介绍,在1999年开发出第一套邮件系统后,Coremail在第二年就已经开始了关于反垃圾技术的相关研究。

2000-2010年是各互联网电商野蛮生长厮杀的阶段,某些电商APP在进行推广时,往往会选择使用广告类电子邮件,这类广告邮件正文夹带跳转商品页链接URL。

一旦用户点击该URL完成选购付款,那么广告邮件的发件人即可获得对应抽成佣金。

这类玩法也衍生至游戏、网站、APP拉新,只要终端用户通过广告邮件链接完成游戏氪金、用户注册、APP下载,则广告邮件发送方即可获得大量佣金。

面对这类垃圾广告邮件的骚扰,Coremail在此阶段主要依靠特定规则拦截垃圾邮件,例如关键词、IP地址、收发件地址等信息进行拦截。

随着技术的发展与垃圾邮件的增长,Coremail逐渐开始运用多种智能算法对邮件进行分析过滤,包括Bayes算法,  fingerprint算法,基于规则权重的邮件评分算法等。

智能算法发展期(2010前后)

时间快进到2010-2020年,垃圾广告发送方形成了完整的产业链,通过大量购买IP、邮件文本图片添加随机背景或在垃圾文本中添加大量正常文本干扰Bayes算法等企图绕过现有的邮件系统厂商检测

面对这类挑战,Coremail在这十年间逐步引入了大数据技术,建立了Coremail邮件安全大数据中心(CAC中心),建立了云端的CAC服务,通过实时检查和特征规则下发加强各个Coremail系统的反垃圾能力。

CAC中心应用特征工程结合传统的人工智能垃圾邮件识别算法,如SVM和浅层的神经网络算法等,比原来的基于邮件评分的简单算法过滤效果有了进一步的提升。

Coremail针对新出现的发送垃圾方法做了集中性检查处理,比如文本图片类型的垃圾邮件,根据当时的算力限制,专门研发了图片垃圾的非OCR算法并申请了相关专利。

2015年后深度学习算法开始快速发展,计算机视觉,自然语言处理等方面出现了大量的高水平模型,CAC也尝试在钓鱼邮件检测等方面应用深度学习的一些算法。

大规模应用期(2020年至今)

2020年新冠疫情以来,攻击者的攻击活动也日益活跃,Coremail发现市面上的钓鱼,诈骗,恐吓, 商业电子邮件犯罪(Business Email Compromise,简称BEC)等各类恶意邮件演变出更多更复杂的攻击组合,并还在不断进化中,这类恶意邮件导致的金钱损失危害远高于垃圾广告对用户的骚扰影响。

伴随深度学习算法继续爆炸性的发展,自然语言处理,异常检测,迁移学习和预训练大模型等AI技术也在快速产生。

幸运的是,攻防对抗中,Coremail基于邮件安全大数据中心持续积累的海量优质数据,实现了邮件样本智能收集,识别,入库,反馈,自学习训练并提升算法模型能力的闭环。

在垃圾邮件检测,异常登陆检测,语义分析等方向都做了各种尝试并取得了一定的效果,相关的一些深度学习算法已经直接应用在了我们的产品中,如CAC 2.0反钓鱼防盗号、CACTER邮件安全网关、安全管理中心SMC2等。

在未来,Coremail AI LAB将坚持长期主义,加大对云计算、人工智能、大数据的投入研究,将成果实践落地至Coremail系列产品,运用到实际的业务场景中,推动邮件安全整体产业性发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/428179.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PostgreSQL 系统表相关技术栈 实现原理(系统表初始化关系模型,SysCache RelCache)

文章目录前言基本介绍OIDpg_classpg_typepg_attribute系统表关系初始化编译阶段Initdb 阶段系统表的访问SysCache初始化 & 基本结构查找 & 插入 & 扩容RelCache初始化pg_filenode.mappg_internal.init初始化完整步骤dynahash 可扩展hash表extendible hashextendibl…

基于国产 FPGA + DSP+1553B总线 的大气数据测量装置的设计与实现

大气数据可供飞行器的控制管理系统使用,为飞行器提供飞行指导,因此实时精准 地获取大气数据在飞行器飞行过程中至关重要。本文设计并实现了一种基于 FPGA 和 DSP 的大气数据测量装置。测量装置包含五个压力传感器及两个温度传感器,可实时获取…

【springcloud 微服务】Spring Cloud Alibaba整合Sentinel详解

目录 一、前言 二、环境准备 2.1 部署sentinel管控台 2.1.1 官网下载sentinel的jar包 2.1.2 启动控制台 2.1.3 访问控制台 2.2 整合springcloud-alibaba 2.2.1 引入相关依赖 2.2.2 修改配置文件 2.2.3 增加一个测试接口 2.2.4 接口测试 三、sentinel 流控规则使用 …

基于HTML5/WebGL智慧楼宇三维可视化云平台

随着“双碳”目标政策的逐步推进,楼宇建筑作为连接人与空间的关键节点,节能潜力愈加凸显,行业热度与日俱增。如今,智慧楼宇已成群雄逐鹿的蓝海,在建筑信息化的浪潮之下,一场跨行业、跨品牌、跨领域的智慧建…

HTML5庆祝生日蛋糕烟花特效

HTML5庆祝生日蛋糕烟花特效 <!DOCTYPE html> <html> <head><meta charset"UTF-8"><title>HTML5 Birthday Cake Fireworks</title><style>canvas {position: absolute;top: 0;left: 0;z-index: -1;}</style> </h…

Kafka的概念|架构|搭建|查看命令

Kafka的概念|架构|搭建|查看命令一 Kafka 概述二 使用消息队列的好处三Kafka 定义3.1Kafka 简介3.2Kafka 的特性3.3 Kafka 系统架构3.4 Partation 数据路由规则四 kafka的架构五 搭建kafka5.1环境准备5.2安装kafka5.3 修改配置文件5.4 编辑其他二台虚拟机的配置文件5.5 编辑三台…

数据结构之第八章、二叉树

目录 一、树型结构&#xff08;了解&#xff09; 1.1概念 1.2专业术语&#xff08;重要&#xff09; 1.3树的表示形式&#xff08;了解&#xff09; ​编辑 1.4树的应用 二、二叉树&#xff08;重点&#xff09; 2.1概念 2.2两种特殊的二叉树 2.3二叉树的性质 2.4…

内、外连接查询-MySQL数据库 (头歌实践平台)

文章目的初衷是希望学习笔记分享给更多的伙伴&#xff0c;并无盈利目的&#xff0c;尊重版权&#xff0c;如有侵犯&#xff0c;请官方工作人员联系博主谢谢。 目录 第1关&#xff1a;内连接查询 任务描述 相关知识 内连接查询 编程要求 测试说明 第2关&#xff1a;外连接…

阿里云计算巢产品负责人何川:计算巢,通过数字化工具加速企业数字原生

让数字原生的中小企业用好云&#xff0c;基于云提高研发效率、构建敏捷组织、快速扩展业务&#xff0c;提高中小企业的发展韧性。在阿里云云峰会 2023 北京站的《数字原生企业创新论坛》中&#xff0c;阿里云智能计算巢产品负责人何川发表了《阿里云计算巢通过数字化工具加速企…

数据结构之第七章、队列(Queue)

目录 一、概念 二、队列 2.1队列的概念、 2.1单链表模拟实现队列 2.2双链表模拟实现队列 2.3队列的使用 2.4循环队列 2.4.1设计环形队列 三、双端队列 四、面试题 4.1用队列实现栈 4.2栈实现队列 一、概念 队列&#xff1a;只允许在一端进行插入数据操作&#xff0…

多功能财务项目管理

使用Zoho Projects的多功能财务项目管理软件改进流程并提供更好的结果。 一、使用Zoho Projects使财务项目管理更加清晰 了解为什么世界各地的财务团队都求助于Zoho Projects以获得强大且透明的财务项目管理软件。 1、跟踪每个数字 Zoho Projects的财务项目管理软件允许团队成…

LCMXO3LF-4300C-6BG324I FPGA lattice 深力科 FPGA的基本结构

LCMXO3LF-4300C-6BG324I FPGA lattice 深力科 FPGA的基本结构 lattice莱迪斯深力科电子 超低密度FPGA 是最新的立即启用、非挥发性、小型覆盖区 FPGA&#xff0c;采用先进的封装技术&#xff0c;能让每个元件达到最低成本。此系列采用最新的小型封装&#xff0c;不仅具有低功率…

2014蓝桥杯国赛排列序数 C语言/C++

[蓝桥杯 2014 国 A] 排列序数 题目描述 如果用 a b c d 这 444 个字母组成一个串&#xff0c;有 4!244!244!24 种&#xff0c;如果把它们排个序&#xff0c;每个串都对应一个序号&#xff1a; abcd 0abdc 1acbd 2acdb 3adbc 4adcb 5bacd 6badc 7bcad 8bcda 9bdac …

Java Stream常见用法汇总,开发效率大幅提升

本文已经收录到Github仓库&#xff0c;该仓库包含计算机基础、Java基础、多线程、JVM、数据库、Redis、Spring、Mybatis、SpringMVC、SpringBoot、分布式、微服务、设计模式、架构、校招社招分享等核心知识点&#xff0c;欢迎star~ Github地址 如果访问不了Github&#xff0c…

如何将PyTorch模型迁移到昇腾平台

PyTorch是业界流行的深度学习框架&#xff0c;用于开发深度学习训练脚本&#xff0c;默认运行在CPU/GPU上。为了使这些脚本能够利用昇腾AI处理器的强大算力执行训练&#xff0c;需要对PyTorch的训练脚本进行迁移。 首先&#xff0c;我们了解下模型迁移的全流程&#xff1a; 通…

Attribution

Maps that use Mapbox map designs, data or software usually must display the Mapbox logo and text attribution. This guide explains when, why, and how you are required to add these forms of attribution, and any exceptions. 使用 Mapbox 地图设计、数据或软件的…

Redis整条完整数据复制黏贴-客户端操作

1.先安装可视化工具&#xff1a; Another-Redis-Desktop-Manager.1.5.9 2.链接上redis服务器 3.打开Another-Redis-Desktop-Manager.1.5.9 4.选中你要复制那条记录&#xff0c;然后点击右上角的copy command 5.把复制下单数据&#xff0c;修改相关key&#xff0c;value等…

Redis:常见的面试题和答案

1、Redis 是什么&#xff1f;它的主要用途是什么&#xff1f; 答案: Redis 是一个开源的内存数据结构存储系统&#xff0c;可以用作数据库、缓存和消息代理。它支持多种数据结构&#xff0c;例如字符串、列表、哈希表、集合和有序集合。Redis 的主要用途包括缓存、会话存储、排…

【C++】第12章: 类和动态内存分配

文章目录第12章 类和动态内存分配12.1 动态内存和类12.1.1 复习示例和静态类成员12.1.2 特殊成员函数12.1.2.1 默认构造函数12.1.2.2 复制构造函数12.1.2.3 何时调用复制构造函数&#xff1f;12.1.2.4 默认的复制构造函数12.1.3 赋值运算符12.2 改进后的新String类12.2.1 修订后…

中创|香港Web3嘉年华精彩回顾:探索Web3的未来与机遇!

持续四天的Web3新纪元&#xff1a;香港Web3嘉年华重塑数字世界与现实世界的交融&#xff01; 4月12日&#xff0c;香港会议展览中心&#xff0c;2023香港Web3嘉年华盛大开幕&#xff0c;来自全球的Web3项目方、投资机构、基础设施建设提供商、港府重要议员云集于此&#xff0c…