中国AI大模型论文数量全球第一,清华力压麻省理工、斯坦福

news2024/9/27 7:17:49

论文是研究新技术、开发新产品获取“图纸”的重要途径之一,OpenAI的研究人员正是借鉴了Transformer的论文(被引用超过9万次),才开发出了对全球各行业影响巨大的产品ChatGPT。

而论文的数量、通过率和被引用次数是衡量一个国家科技人才素质,以及技术创新能力的重要标准之一。

根据美国最古老大学之一乔治城大学的数据分析平台ETO,在今年5月发布的最新调查报告显示:2017—2022年期间,全球一共发布了125.5万篇与AI相关的论文。

图片

其中,中国发布了24.3万篇AI论文,占到了总数的25%,成为发布论文最多的国家

美国发布了17.1万篇论文,占总数的18%,排名第二;剩下的论文由欧洲、亚太地区国家贡献。

需要注意的是,ETO只统计了英文技术论文,如果算上中文论文,那么中国发布的论文数量将会更多。

图片

在AI论文研究领域方面,中国对计算机视觉模型、机器人技术成为发布、研究最多的领域总计14万篇左右;在自然语言处理为1.9万篇左右、AI安全方面为2557篇。

图片

从每年被引用次数最多的10%论文来看,美国达到34036篇,中国是29229篇。

图片

如果细分到学术、研究机构,中国AI论文的被引用次数是领先美国的,中国科学院排名第一、谷歌排名第二,清华大学排名第三超过了麻省理工、斯坦福、卡内基梅隆等著名大学

北京大学、中国科学院大学、上海交通大学和浙江大学在AI论文的发表和被引用方面也很出色。

图片

从企业角度来看的话,谷歌排名第一,发布了6529篇论文,平均每篇被引用次数达到183.8;微软排名第二发布了5558篇,平均引用82.8;腾讯排名第三,发布了2760篇,平均引用54.2;

阿里巴巴排名第四,发布了2518篇,平均被引用42.3;Meta排名第五,发布了2280篇,平均引用181;亚马逊排名第六,发布了2026篇,平均引用43.5;IBM排名第七,发布了1574,平均引用52.5;

三星排名第八,发布了1530篇,平均引用29.3;华为排名第九,发布了1485,平均引用36;百度排名第十,发布了1355篇,平均引用61。

图片

本次报告的其他主要发现:

从2017—2022年,全球AI研究增长了一倍多,这在很大程度上得益于自然语言处理和计算机视觉模型研究的快速增长。机器人研究进展缓慢,但仍然比较明显。

AI安全研究进展很快,但基础比较薄弱。ETO估计,AI安全研究仅占整个AI研究的2%。

中国在AI研究产出方面处于领先地位;但如果仅计算高频率被引用论文数量,美国略高排名第一。

中国科学院的AI研究总量以及高频率引用研究论文,均位居世界榜首。

图片

此外,在2017—2022年期间,大约有40万篇论文是关于AI视觉模型的,整体增长了121%,成为AI增长最快的子领域。典型代表产品有Midjourney、Stable Difusion、DALL·E 3、Sora、Gen-3等。

在2017—2022年期间,大约有13.5万篇论文是关于自然语言处理的,整体增长了104%。典型产品有ChatGPT、文心一言、Kimi、讯飞星火、通义千问等。

图片

其实关于论文数量这个问题,「AIGC开放社区」是深有体会。如果你经常看arxiv、SSRN、《自然》、acm、IEEE等顶级论文平台,以及Huggingface、Github的开源项目就能发现,国内出现频率相当高,而且多数项目创新性都不错,评价也很高。

即便是国外科技巨头谷歌、微软、OpenAI、Meta、苹果等AI论文、项目,华人的贡献也占据了重要地位。

例如,OpenAI的最初ChatGPT研发团队华人有9位,有5位本科是在中国念完的,其中3位毕业于清华大学、1位毕业北京大学、1位毕业华中科技大学。

图片

此外,在上周United Nations在官网发布的最新调查显示,中国在生成式AI(AIGC)申请的专利数量为38210个,美国只有6276个,是其6倍。就算别的国家全都加在一起连中国的一半都不到。

这也充分证明了,中国对生成式AI、大模型的重视程度、技术环境以及拥有庞大的AI人才库。

本文素材来源ETO调查报告,如有侵权请联系删除

END

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1909706.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

电脑文件夹怎么设置密码?让你的文件更安全!

在日常使用电脑的过程中,我们常常会有一些需要保护的个人文件或资料。为了防止这些文件被他人未经授权访问,对重要文件夹设置密码是一种有效的保护措施,可是电脑文件夹怎么设置密码呢?本文将介绍2种简单有效的方法帮助您为电脑文件…

红酒与运动后的恢复:健康的双重助力

在繁忙的都市生活中,运动已成为许多人追求健康与活力的方式。当汗水洒落,肌肉得到锻炼,一场酣畅淋漓的运动后,身心仿佛得到了洗礼。而在这份宁静与满足之余,你是否想过,一杯优雅的红酒也能为你的运动后恢复…

以SGET协会OSM标准首创有662引脚的OSM模组——凌华智能引领嵌入式运算市场

在可焊接的45 x 45mm尺寸上提升功率 开启嵌入式运算发展的新时代 摘要: 1.开放式标准模块(OSM™),最大尺寸仅45 x 45mm,采用零开销的模块化系统简化生产,并提供662个引脚以增强小型化和物联网应用。 2.凌华智能提供基于NXP i.M…

二叉树中的最大路径和(Java版)

二叉树中的 路径 被定义为一条节点序列,序列中每对相邻节点之间都存在一条边。同一个节点在一条路径序列中 至多出现一次 。该路径 至少包含一个 节点,且不一定经过根节点。 路径和 是路径中各节点值的总和。 给你一个二叉树的根节点 root &#xff0c…

AI自动生成PPT哪个软件好?高效制作PPT就用这4个

学生时期做各种小组作业需要做PPT,毕业后开始上班每周大大小小的各种会议和汇报,也少不了PPT的折磨。 倘若你也刚好有这种烦恼,那么不妨试试下面我给大家安利的这4款AI自动生成PPT免费软件~保准你用上以后可不再为PPT制作而发愁!…

面向过程编程详解

目录 前言1. 面向过程编程的定义2. 面向过程编程的特点2.1 过程和函数2.2 顺序执行2.3 全局变量2.4 控制结构 3. 面向过程编程的应用场景3.1 系统级编程3.2 科学计算3.3 小型项目 4. 面向过程编程的优缺点4.1 优点4.2 缺点 5. 代表性的编程语言5.1 C语言5.2 Pascal5.3 Fortran …

【LLM大模型】开发基于云的RAG应用,使用开源 LLM

检索增强生成 (RAG)通常用于开发定制的 AI 应用程序,包括 聊天机器人、推荐系统和其他个性化工具。该系统利用向量数据库和 大型语言模型 (LLM)的优势来提供高质量的结果。 为任何 RAG 模型选择合适的 LLM 非常重要,需要考虑成本、隐私问题和可扩展性等…

仿写SpringMVC

1.创建简单的注解 1.1 Controller package com.heaboy.annotation;import java.lang.annotation.*;Documented Retention(RetentionPolicy.RUNTIME) Target(ElementType.TYPE) public interface Controller { } 1.2 RequestMapping package com.heaboy.annotation;import …

喜讯|华院钢铁行业大模型入选“2024全国企业新质生产力赋能典型案例”

7月2日,由中国科学院主管、科学出版社主办的商业周刊《互联网周刊》(CIW)联合德本咨询(DBC)、中国社会科学院信息化研究中心(CIS)发布了“2024全国企业新质生产力赋能典型案例”。华院计算技术&…

基于FPGA的千兆以太网设计(1)----大白话解释什么是以太网

1、什么是以太网? 还记得初学以太网的时候,我就被一大堆专业名词给整懵了:什么以太网,互联网,MAC,IP,局域网,万维网,网络分层模型等等等等。慢着!我学的不是以太网吗?怎么出来这么一大堆东西? 啊!以太网究竟是什么?别急,我接下来就尽量用通俗的大白话来给你解释…

香港优才计划多少分获批成功率高?一文看懂各分数段获批情况!

有留意香港优才计划的朋友,应该都了解过,申请优才计划采用打分制,得分多少与最终获批有密不可分的关系。但有一点要提前清楚,申请优才不是得分越高就一定能获批,也不是得分低就一定没希望。 香港优才计划能否获批成功…

将直流电转换为交流电:逆变器的基本原理

什么是逆变器? 大多数电源设计都包括一个称为整流器的部分,该整流器将输入的交流波转换为不稳定的直流电压。但是,我们不能总是依赖来自建筑物主电源的交流输入到我们的系统中。 逆变器是一种将直流电 (DC) 转换为交…

前端javascript中的排序算法之冒泡排序

冒泡排序(Bubble Sort)基本思想: 经过多次迭代,通过相邻元素之间的比较与交换,使值较小的元素逐步从后面移到前面,值较大的元素从前面移到后面。 大数据往上冒泡,小数据往下沉,也就是…

Docker-安装MongoDB、RabbitMQ、ActiveMQ、Portainer(保姆篇图示详解)

文章目录 MongoDB 安装RabbitMQ 安装ActiveMQ 安装Portainer 安装 更多相关内容可查看 MongoDB 安装 1.拉取镜像(默认为最新版本,也可指定版本) docker pull mongo:版本号2.根据镜像 运行容器实例 (暴露端口 数据挂载 用户密码设…

【NLP】利用 RAG 模分块技术提升文档处理效能

将大型文档划分为较小的部分是一项至关重要但又复杂的任务,它对检索增强生成 (RAG) 系统的性能有重大影响。这些系统旨在通过结合基于检索和基于生成的方法,提高输出的质量和相关性。有效的分块,即将文档拆分为可管理的片段的过程&#xff0c…

百度Feed业务数仓建模实践

作者 | XY 导读 Feed,即个性化推荐信息流,是百度 App 上承载各种类型内容(如文章、视频、图集等)的重要 topic。本文概要讲述了随着业务发展,移动生态数据研发部在 Feed 数据宽表建模上的演进过程以及一些实践&#xf…

LeetCode67(二进制求和[位运算,大数运算])

二进制求和 题目要求: 给你两个二进制字符串 a 和 b ,以二进制字符串的形式返回它们的和。 这道题其实有几种解法.我们先来介绍简单的方法. 我们可以将两个字符串的二进制转成十进制,获取对应值相加之后,我们可以不断对2取余,获取尾数拼接即可.也就是像我们平常求一…

记一次线上流量突增问题排查

一.问题 接流量告警出现获取 xx 信息接口调用次数同比往年大促活动猛涨.扩大至 10 倍之多.心里顿时咯噔一下.最近各种严打,顶风作案.某不是摸到电门了.一下子要把自己带走.从此走向求职之路.一时间脑子哇哇的思绪万千. 202x.5.20 大促开门红的调用.这个是往年活动的时候的调用…

01-引论-操作系统的目标和作用

操作系统的目标 1.方便性 2.有效性 3.可扩充性 4.开放性 操作系统的目标与应用环境有关 在不同的应用环境下,操作系统的重点和功能可能会有所不同。例如,对于桌面操作系统,用户界面的友好性和多媒体功能可能是重点;对于服务…

Qt/C++项目积累: 2.主机监控器 - 2.1 项目介绍

修改记录 序号日期说明对应软件版本号120240709对预期功能和已完成功能进行新增无 一:项目主体编写背景 在观察程序的运行状态时,其对系统的CPU,内存,硬盘占用无疑是几项重要参考指标,而现有的监控软件,搜…