2022 年度盘点 | 更成熟的 AI,更破圈的技术狂欢

news2025/3/10 14:45:33

By 超神经

内容一览:2022 年 AI 领域发展不断提速,新技术成果纷纷落地,模型迭代加速升级。本文总结了 2022 年 AI 领域各大公司的技术成就。

关键词:年终盘点   大厂   技术创新

2022 年在此起彼伏的咳嗽声中接近尾声,这一年,AIGC 成为人工智能领域最大黑马,ScienceAI 有了更多实际落地的应用,这一年我们经历了各大厂商缩减预算、裁撤员工,也体验了绝处逢生的技术狂欢……

今天,我们将通过这篇文章,与各位同行共同回顾 2022 年那些人工智能领域具有突破性意义的研发成果。

 data2vec 

语音、视觉及文本自监督学习的通用框架

发布机构:Meta AI

发布时间:2022 年 1 月

项目地址:

https://github.com/facebookresearch/fairseq/tree/main/examples/data2vec

data2vec 是一个大一统的多模态自监督学习模型,可以以较高的性能处理图像、文本、语音等任务。

12 月 16 日 data2vec 2.0 发布,与现有的计算机视觉自监督算法相比,相同精度下速度快了 16 倍。

9179ffc5a64d94bdccd7cf6b53d09788.png

data2vec 2.0 原理简介

 AlphaCode 

竞赛级别代码生成 AI

发布机构:DeepMind

发布时间:2022 年 2 月

项目地址:

https://github.com/deepmind/code_contests

AlphaCode 借助大型语言模型,依据问题的语言描述构建代码。在 Codeforces 挑战赛中,AlphaCode 击败了 46% 的参赛者。该研究不仅登上了 Science 封面,还被该杂志评入年度十大科学突破。

a5c888b25a16738f591ddb996834026d.jpeg

AlphaCode 概览

 Dall·E 2 

文本到图像的生成工具

发布机构:OpenAI

发布时间:2022 年 4 月

项目地址:https://openai.com/dall-e-2/

Dall·E 2 依据文本描述,可以创建更加具有现实主义色彩的艺术图像。与 OpenAI 2021 年发布的 Dall·E 相比,Dall·E 2 可以生成更真实、更准确的图像,且分辨率提高了 4 倍。

30f0c3d2047e79c9cc014fb0348bc8c5.png

输入文本提示

An astronaut riding a horse in a photorealistic style

Dall·E 2 生成的图像示例

 Gato 

全能型智能体

发布机构:DeepMind

发布时间:2022 年 5 月

项目地址:

https://www.deepmind.com/blog/a-generalist-agent

Gato 是一个全能型智能体,可以玩雅达利游戏、对图像进行描述、聊天以及根据上下文决定输出文本、关节扭力或其他 token。

这种通用模型解决所有任务类似人工智能,最终或超过特定于专门领域的模型。

255817ab082310715f71baead5d8955d.jpeg

 ESM Fold 

蛋白质结构预测模型

发布机构:Meta AI

发布时间:2022 年 7 月

项目地址:

https://github.com/facebookresearch/esm

ESM Fold 是一个预测蛋白质序列的模型,能够直接进行高准确度、端对端、原子层级结构预测。它仅使用单个输入序列,只需查看单个蛋白质序列,这极大加快了推理速度。

75712e8d616792288fa103bcf652a118.png

用 ESM Fold 进行单序列结构预测

 Make-A-Video 

依据文本生成视频的 AI 系统

发布机构:MetaAI

发布时间:2022 年 9 月

项目地址:https://makeavideo.studio/

Make-A-Video 是一个文本-视频生成模型,它通过带有文字描述的图像,来学习常用的描述方式,同时使用无标签视频,了解和学习移动方式。

Make-A-Video 生成的视频风格多样,对文本还原度高,是生成短视频方面的 SOTA 模型。

8b117f0cad1cc4e5b8275668069f7a39.gif

依据文本描述生成视频的部分示例

 AlphaTensor 

改进矩阵乘法,提升计算速度

发布机构:DeepMind

发布时间:2022 年 10 月

项目地址:

https://github.com/deepmind/alphatensor

AlphaTensor 改进了目前最优的 4*4 矩阵乘法,并且进一步提升了其他 70 余种不同大小矩阵乘法计算速度。该成果登上了 Nature 封面,被 Scinece 杂志评入年度十大科学突破。

0cf6d61223fbb51cb9eb6ded8974efee.png

AlphaTensor 架构一览

 Magic 3D 

text-to-3D content 创建工具

发布机构:NVIDIA

发布时间:2022 年 11 月

项目地址:

https://deepimagination.cc/Magic3D/

NVIDIA 入局 AIGC,凭文字描述就可生成 3D Mesh 模型。它结合 image conditioning 技术以及基于文本提示的编辑方法,提供了一个控制 3D 合成的新思路,使得创建高质量 3D Mesh 模型成为可能。

e1a17795152b911465ba0bbb3d4e8b29.jpeg

Magic 3D 通过两个阶段创建 text-to-3D content

 ChatGPT 

超级对话模型

发布机构:OpenAI

发布时间:2022 年 11 月

项目地址:

https://openai.com/blog/chatgpt/

ChatGPT 的训练使用了 RLHF (Reinforcement Learning from Human Feedback),与 InstructGPT 使用的方法相同,仅在数据收集设置上有细微差别。

ChatGPT 可以像人类一样聊天交流,完成撰写邮件、视频脚本、文案、翻译及代码等任务。自上线以来,引起了海内外无数开发者的争相试用和热烈讨论,堪称 2022 年开发人员参与度最高的技术项目。

72d9e26ecf0d122f2bd1842b00d556eb.png

ChatGPT 训练过程概览

 Point·E 

依据文本描述生成 3D 点云

发布机构:OpenAI

发布时间:2022 年 12 月

项目地址:

https://github.com/openai/point-e

用 Point·E 依据文本提示生成 3D 点云的过程分为三个步骤

1、依据文本提示,生成一个合成视图 (synthetic view)

2、依据合成视图,生成 coarse point cloud (1024 point)

3、基于低分辨率点云和合成视图,生成 fine point cloud (4096 Point)

利用 Point·E 单卡 1 分钟生成 3D 点云,text-to 3D 告别高算力消耗时代。

a3ad2784948e003fec3edbdf469d9e44.jpeg

 冬去春来,畅想 2023

2022 即将画上句点,2023 注定是充满未知的一年,AIGC 领域会有哪些新成果?ScienceAI 将如何应对基础科学与 AI 交叉带来的挑战?芯片研发、国产操作系统,又会产生哪些新突破?

你对 2023 年人工智能领域的技术和应用有哪些预判,欢迎留言交流讨论~

39f567e6329e14ffada9ba654af82ada.gif

 元旦福利,抽奖送书 

元旦将至,HyperAI超神经联合机械工业出版社,为读者朋友们送福利啦!

参与下方抽奖,即有机会获得最新上市的「基于鲲鹏的大数据挖掘算法实战」,2023 年第一波抽奖福利,看你会不会欧气满满、锦鲤附体!

更多本书简介,可访问:

—— 完 ——

7f7643bd81c25330a4ef3a55a6fb915c.jpeg

扫描二维码,加入讨论群

获得更多优质数据集

了解人工智能落地应用

关注顶会&论文

回复「读者」了解更多

更多精彩内容(点击图片阅读)

86c7b3db0ce7b7dec3360b559230a2e3.png

801bfbde441edde814cc0e09bfbc9753.png

234dc5afa4b82bf1972637cfa49c080c.png

8a0f41e7694d97ceba30a703ef979efc.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/116895.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

onCreate、onSaveInstanceState、onRestoreInstance一个参数和两个参数

Android Studio移动应用开发——onCreate、onSaveInstanceState、onRestoreInstance一个参数和两个参数_dear_jing的博客-程序员宅基地 - 程序员宅基地 在做Android生命周期实验过程中,把 Log.i(TAG, "(1) onCreate()") 写到了含有两个参数的函数 onSave…

HTML5 元素拖放

文章目录HTML5 元素拖放概述触发事件实现元素拖放功能dataTransfer元素拖动效果垃圾箱效果HTML5 元素拖放 概述 在HTML5中,我们只需要给元素添加一个draggable属性,然后设置该属性值为true,就能实现元素的拖放。 拖放,指的是“…

【Python】Numpy分布函数总结

文章目录总表均匀分布和三角分布幂分布与正态分布相关的分布与Gamma相关的分布极值分布总表 np.random中提供了一系列的分布函数,用以生成符合某种分布的随机数。下表中,如未作特殊说明,均有一个size参数,用以描述生成数组的尺寸…

【综合笔试题】难度 1.5/5,常规二叉树爆搜题

题目描述 这是 LeetCode 上的 95. 不同的二叉搜索树 II ,难度为 中等。 Tag : 「树」、「二叉搜索树」、「BST」、「DFS」、「递归」、「爆搜」 给你一个整数 n,请你生成并返回所有由 n 个节点组成且节点值从 1 到 n 互不相同的不同 二叉搜索树 。可以…

2022出圈的ML研究:爆火的Stable Diffusion、通才智能体Gato,LeCun转推

这些机器学习领域的研究你都读过吗? 2022 年即将步入尾声。在这一年里,机器学习领域涌现出了大量有价值的论文,对机器学习社区产生了深远的影响。 今日,ML & NLP 研究者、Meta AI 技术产品营销经理、DAIR.AI 创始人 Elvis S.…

CSRF漏洞渗透与攻防(一)

目录 前言 什么是CSRF漏洞 CSRF实现流程 CSRF漏洞危害 XSS漏洞危害 CSRF与XSS区别 CSRF分类 GET型: POST型: CSRF漏洞案列模拟 CSRF常用Payload: CSRF漏洞挖掘 检测工具 CSRF漏洞防御 防御思路 我们该如何去防御CSRF漏洞…

LeetCode动态规划—打家劫舍从平板板到转圈圈(198、213)

打家劫舍平板板打家劫舍转圈圈打家劫舍(进阶版)平板板打家劫舍 转化子问题: 按顺序偷n间房子,就是考虑偷前n-1间房子还是偷前n-2间房子再偷第n间房子。 列出公式: res[n] max{ res[n-1] , 数组中最后一个数据res[n-…

企业信息化之源代码防泄密场景分析

场景描述 随着企业信息化发展迅速,越来越多的无形资产面临着被泄露,被盗取的,或员工无意导致的数据泄密风险。尤其是有源码开发的企业,源代码的安全更是重中之重,一旦泄密,有可能给企业带来不可估量的损失…

全程数字化的企业电子招标采购管理系统源码

全程数字化的采购管理 智能化平台化电子化内外协同 明理满足采购业务全程数字化, 实现供应商管理、采购需求、全网寻源、全网比价、电子招 投标、合同订单执行的全过程管理。 传统采购模式面临的挑战 如何以最合适的价格,找到最优的供应商,购买到最好的产品和服务?…

程序员必备网站,建议收藏!

俗话说的好,一个程序员,20%靠知识储备,80%靠网络搜索。 打开代码,打开Google,开始工作。 那么常用的写码软件,你知道几个呢? 下面我们来一起看一下常用的写码软件吧~ 建议收藏本文&#xff…

【算法】面试题 - 链表

链表相关面试题141. 环形链表问题:快慢指针为什么一定会相遇142. 环形链表 II问题:如何确认入口160. 相交链表237. 删除链表中的节点19. 删除链表的倒数第 N 个结点21. 合并两个有序链表23. 合并K个升序链表(两种解法)扩展&#x…

国产手机扬眉吐气,终于打击了苹果的嚣张气焰

苹果在9月份、10月份都取得了快速增长,而国产手机品牌持续下滑,但是11月份终于让国产手机捡回了主动权,11月份的数据显示有国产手机品牌的出货量大幅增长,而苹果的出货量却大幅下滑,国产手机成功反击了苹果。分析机构给…

Vue + SpreadJS 实现高性能数据展示与分析

Vue SpreadJS 实现高性能数据展示与分析 在前端开发领域,表格一直都是一个高频使用的组件,尤其是在中后台和数据分析场景下。但当一屏展示数据超过1000条数据记录时,会出现浏览器卡顿等问题,严重影响客户体验。为解决这些性能问…

Seay代码审计系统审计实战

今天继续给大家介绍渗透测试相关知识,本文主要内容是Seay代码审计系统审计实战。 免责声明: 本文所介绍的内容仅做学习交流使用,严禁利用文中技术进行非法行为,否则造成一切严重后果自负! 再次强调:严禁对未…

【算法题解】5. 删除有序数组中的重复项 + 移动零

文章目录删除有序数组中的重复项题目解题思路代码实现复杂度分析移动零题目解题思路代码实现复杂度分析删除有序数组中的重复项 题目 给你一个 升序排列 的数组 nums ,请你原地删除重复出现的元素,使每个元素只出现一次 ,返回删除后数组的新…

Python 并发编程实战,用多线程、多进程、多协程加速程序运行

Python 并发编程实战,用多线程、多进程、多协程加速程序运行 文章目录Python 并发编程实战,用多线程、多进程、多协程加速程序运行1、什么是CPU密集型计算、IO密集型计算?2、多线程、多进程、多协程的对比3、怎么根据任务选择对应技术&#x…

达梦数据成功过会!信创浪潮中如何成就一家国产龙头?

‍‍数据智能产业创新服务媒体——聚焦数智 改变商业2022年12月22日,上海证券交易所科创板上市委员会发布《2022年第110次审议会议结果公告》,武汉达梦数据股份有限公司(首发)符合发行条件、上市条件和信息披露要求。该公告标志着…

5.4 迭代语句

文章目录while语句使用while循环传统for语句传统for循环的执行过程for语句头中的多重定义省略for语句头的某些部分范围for语句do while语句迭代语句通常称为循环,它重复执行操作直到满足某个条件才停下来。while和for语句在执行循环体之前检查条件,do while 语句先执…

MATLAB算法实战应用案例精讲-【连接分析】PageRank(补充篇)(附Python代码实现)

前言 PageRank算法在1998年4月举行的第七届国际万维网大会上由Sergey Brin和Larry Page提出。PageRank是通过计算页面链接的数量和质量来确定网站重要性的粗略估计。算法创立之初的目的是应用在Google的搜索引擎中,对网站进行排名。 随着国内外学者的深入研究,PageRank算法…

burpsuite靶场——SSRF

文章目录针对本地服务器的基本 SSRF针对另一个后端系统的基本 SSRFSSRF 与基于黑名单的输入过滤器基于白名单的输入过滤器的 SSRFSSRF 通过开放重定向漏洞绕过过滤器带外检测的盲 SSRF利用 Shellshock 的盲 SSRF针对本地服务器的基本 SSRF 在商品下查看货物库存情况时抓包 有st…