加码中文 AIGC,IDEA 推出“盖亚计划”

news2025/2/23 18:56:33

作者 | 伍杏玲

出品 | CSDN

近年来,AIGC 话题火爆 AI 技术人的朋友圈。由于深度学习模型不断完善、开源模式推动,AIGC 的迭代速度呈爆发式发展。据 Gartner 发布的 2022 年需要探索的重要战略技术趋势显示,生成式 AI 是其中引人注目的人工智能技术之一。Gartner 预计到 2025 年,生成式人工智能将占所有生成数据的 10%,而目前这一比例还不到 1%。当前科技巨头们纷纷入局: 

2021年,OpenAI 团队推出人工智能绘画产品 DALL·E,用户输入简单文本或图像生成新的定制化图像,引发热议,今年进而升级到DALL·E 2。随后谷歌和 Meta 也相继发布相关产品,并发展出文字转视频功能。今年 8 月,Stable Diffusion 正式开源,为人们展现 AI 数字生产力在图像生成乃至艺术创作上的强大力量。

在国内,今年 7 月,IDEA 研究院认知计算与自然语言研究中心(IDEA CCNL)开源了第一个中文 CLIP 模型,目前已发布 4 个版本。11 月 1 日,开源了第一个中文版本的 stable diffusion 模型“太乙 Stable Diffusion”,标志着中文 AIGC 时代的到来。

在刚结束的 IDEA 大会,IDEA 研究院创院理事长沈向洋公布了一项重要的 AIGC 项目——“盖亚计划”,该计划旨在更好地助力中国 AIGC 文化产业数字化转型的创新发展。

01 从一图胜千言到一言胜千图,“盖亚计划”重磅发布

伴随算力和数据的数量级增长、大模型的持续迭代,AIGC 发展速度惊人,去年尚处于初级生疏阶段,如今已达到以假乱真的级别。在今年 9 月的科罗拉多州博览会美术比赛中,人工智能绘画《空间歌剧院》获得头奖。

沈向洋表示,“人工智能大模型发展的规模和速度,都到了今天我们不可忽视的地步。最新的技术可以通过一句话,创造出数不清的图像,每张都有自己的特点。可谓从一图胜千言,到了一言胜千图。”

他以高产的达芬奇为例,一些艺术史研究者猜测达芬奇可能不是一个人画这么多画,而是带领徒弟们画的。如今有了 DALL·E 等人工智能技术,每个人都有可能成为“达芬奇”,能低成本地让机器画出自己想要的画,AIGC 能提高数字生产力。

洞悉这些技术趋势变化,2021 年 5 月,IDEA 研究院认知计算与自然语言研究中心发起盖亚计划,致力于在预训练大模型时代,建设认知智能的基础设施,创造具备认知能力的AI数字生产力,推动 AI 学术和产业发展。

02 “盖亚”计划背后的黑科技

盖亚项目分为三层,底层技术基础是中文最大的开源预训练模型体系“封神榜”:GitHub - IDEA-CCNL/Fengshenbang-LM: Fengshenbang-LM(封神榜大模型) 是IDEA研究院认知计算与自然语言研究中心主导的大模型开源体系,成为中文AIGC和认知智能的基础设施。Fengshenbang-LM(封神榜大模型)是IDEA研究院认知计算与自然语言研究中心主导的大模型开源体系,成为中文AIGC和认知智能的基础设施。 - GitHub - IDEA-CCNL/Fengshenbang-LM: Fengshenbang-LM(封神榜大模型)是IDEA研究院认知计算与自然语言研究中心主导的大模型开源体系,成为中文AIGC和认知智能的基础设施。https://github.com/IDEA-CCNL/Fengshenbang-LM“封神榜”作为以中文驱动的基础生态系统,涵盖预训练大模型、特定任务的微调应用、基准和数据集等,已拥有超过 88 个开源预训练模型,占全球中文开源预训练模型的10%(全球中文开源模型大概在800个)。

第一个中文版“太乙 Stable Diffusion”模型,在 Hugging face 上的一百多个 Stable Diffusion 里排名第三,几周前的下载量已突破 10 万。二郎神 UniMC 模型拥有2亿参数,多次获得FewCLUE/ZeroCLUE等榜单冠军。

“封神榜”开源模型目前参数超 10 亿,将数据和算力沉淀成具有认知能力的预训练模型,目标是成为海量下游任务和各种算法创新研究的坚实基础。

中间为赋能层 GTS 模型自动生产引擎,致力用“AI 生产 AI”,为特定场景以解决具体场景下定制化模型生产面临的人力贵和数据少的困境,快速产出 SOTA 模型,有效为 AI 企业降本增效。据悉,其独创的 GTS 训练体系,已拿到 FewCLUE 榜单冠军,证明机器首次超过人类顶级算法专家水平。

有了 GTS,每个用户可以低成本地生产属于自己的个性化 AIGC 模型。

最上面为应用创新层“方物 AI 创意图库”,用 AIGC 技术打造中文最大图像集合,用机器来帮助扩展人类的想象力。采用最先进的模型和引擎,提供最有价值的用户体验,探索 AIGC 标杆落地应用。

有了这些硬核黑科技的支撑,盖亚计划有效降低推理成本,从降低 AI 成本和服务门槛,如盖亚计划生成单张的图像为 0.2 分人民币,而 Stability 生成单张图像为 0.5 分人民币,OpenAI 生成单张图像 5 分人民币。

目前,“盖亚计划”团队有 40 人,全为毕业于全球顶尖高校的 90 后成员,仅成立的一年多时间里,已发表 14 篇论文,并多次取得 FewClue 和 ZeroClue 冠军。在硬核人才储备和扎实技术支持下,“盖亚计划”生态建设蓬勃发展,目前已达成与华为昇腾和阿里达摩院 Modelscope 共建中国开源模型生态的一致目标。并于清华、港中文、中科大、上交大等高校以及追一科技、小冰等达成模型共建的共识并开展合作,为中国 AIGC 产业高速发展加码助力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/45501.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

uniapp开发小程序-工作笔记

开发背景 公司开始安排本人开发微信小程序,于是乎研究了一点关于uniapp的api和注意的点。仅仅是个人笔记…可能有错误,希望各位指出。 uniapp开发小程序 应用生命周期 onLaunch 初始化完成时 只触发一次 onShow 后台进入前台 显示页面的时候 onHide 前台…

全志V853 NPU 转换部署 YOLO V5 模型

NPU 转换部署 YOLO V5 模型 本文以 YOLO v5s 模型为例,详述 ONNX 模型在 V853 平台的转换与部署的流程。 模型的准备 YOLO v5 目前开源于 Github,链接【GitHub - ultralytics/yolov5: YOLOv5 🚀 in PyTorch > ONNX > CoreML > TF…

【Android App】实战项目之虚拟现实(VR)的全景相册(附源码和演示视频 可用于学习和大作业)

需要源码请点赞关注收藏后评论区留言私信~~~ 不管是绘画还是摄影,都是把三维的物体投影到平面上,其实仍旧呈现二维的模拟画面。 随着科技的发展,传统的成像手段越来越凸显出局限性,缘由在于人们需要一种更逼真更接近现实的技术&am…

基于有偏距离权值(Weighted cubic O-MOMS with warping)三次O-MOMS插值理论的图像超分辨重构研究-附Matlab程序

⭕⭕ 目 录 ⭕⭕✳️ 一、图像超分辨率重构原理✳️ 二、三次O-MOMS插值重构理论与实验分析✳️ 2.1 三次O-MOMS(Cubic O-MOMS)插值理论与实验验证✳️ 2.2 有偏距离三次O-MOMS插值重构理论与实验验证✳️ 2.3 权重三次O-MOMS插值理论与实验验证✳️ 2.4 有偏距离权值三次O-MOM…

[附源码]Python计算机毕业设计Django茶叶销售微信小程序

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

Hive 查看和修改 tez 容器的资源

1. 查看当前的配置 1.1 进入 AppMaster 或 History 进入运行中,或者运行完作业对应的 “Tracking URL”。以下示例是已经运行完的 job。 1.2 进入 tez-ui 进入 tez-ui 之后,点击 Configurations 1.3 查看配置 输入要查询的配置项,点击…

随smart登陆欧洲,亿咖通科技踏上出海新征程

随着全新smart精灵#1正式登陆欧洲,全球移动出行科技公司亿咖通科技同步向欧洲车主揭晓其搭载于新车上的下一代智能座舱系统,并正式将其出海战略向前推进关键一步,成为中国智能化出海的一座崭新里程碑。 全新smart精灵#1预计将于2022年底开始&…

π220N31兼容代替TI ISO1540DR 低功耗 3.0kVrms 双向I2C 隔离器

π220N31兼容代替TI ISO1540DR 低功耗 3.0kVrms 双向I2C 隔离器,I2C隔离器输入和输出采用二氧化硅(SiO2)介质隔离,可阻断高电压并防止噪声电流进入控制侧,避免电路干扰和损坏敏感器件。与光电耦合器相比,在功能、性能、尺寸和功耗…

2022年全国最新消防设施操作员模拟真题题库及答案

百分百题库提供消防设施操作员考试试题、消防设施操作员考试预测题、消防设施操作员考试真题、消防设施操作员证考试题库等,提供在线做题刷题,在线模拟考试,助你考试轻松过关。 124、消防电梯设置应符合下列哪些( )要求 A.消防电梯载重量不应小于800kg …

麦芽糖-阿奇霉素 maltose-Azithromycin

麦芽糖-阿奇霉素 maltose-Azithromycin 中文名称:麦芽糖-阿奇霉素 英文名称:maltose-Azithromycin 别称:阿奇霉素修饰麦芽糖,阿奇霉素-麦芽糖 PEG接枝修饰麦芽糖 麦芽糖-聚乙二醇-阿奇霉素 Azithromycin-PEG-maltose 阿…

@企业主们看过来,用华为云CDN给你的网页加个速

企业主们看过来,用华为云CDN给你的网页加个速 前段时间参加秋招的时候,被问到了一个问题,CND是干啥的,什么是CND,面试官问我这个问题的时候,我暗窃喜这不是我的强项吗!!!…

【C++面向对象程序设计】CH5 继承与派生(续)——虚基类

目录 前言 一、虚基类的作用 二、虚基类的初始化 三、例【5.9】在【例5.8】中在teacher类和student类之上增加一个共同的基类person,人员的一些基本数据放在person中 四、多层多重继承用虚基类 五、虚基类的构造函数 六、多重继承如何工作 七、虚拟继承 八…

【深入浅出Java并发编程指南】「难点 - 核心 - 遗漏」线程状态流转及生命周期的技术指南(知识点串烧)

前提介绍 本章主要介绍相关线程声明周期的转换机制以及声明周期的流转关系以及相关AQS的实现和相关的基本原理,配合这相关官方文档的中英文互译的介绍。 线程状态流转及生命周期 当线程被创建并启动以后,它既不是一启动就进入了执行状态,也不…

17. 电话号码的字母组合

17. 电话号码的字母组合 给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。答案可以按 任意顺序 返回。 给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。 示例 1: 输入:digits …

R语言分布滞后非线性模型(DLNM)研究发病率,死亡率和空气污染示例

全文下载链接:http://tecdat.cn/?p21317本文提供了运行分布滞后非线性模型的示例,同时描述了预测变量和结果之间的非线性和滞后效应,这种相互关系被定义为暴露-滞后-反应关联(点击文末“阅读原文”获取完整代码数据)。…

C语言文件操作

目录序言文件程序文件&数据文件程序文件数据文件文本文件&二进制文件文件名操作初阶打开&关闭文件fopen读写文件fputc & fgetc文件缓冲区文件指针操作进阶打开方式"w"(只写)"r"(只读)"a"(追加)文件的顺序读写fgets & fputsf…

Mac安装rabbitmq延迟队列插件

Mac安装rabbitmq延迟队列插件我是通过brew安装的rabbitmq,没有安装Homebrew的需要安装一下查看我们rabbitmq版本,我这里的版本是3.11.3,我们下载的插件大版本必须是3.11 brew info rabbitmq下载rabbitmq_delayed_message_exchange插件&#…

虹科分享 | 终端安全防护 | 网络安全术语列表(终篇)

如果你的工作或者生活与网络安全有关,你就知道它使用了自己独特的、不断发展的语言。术语和缩略语受到网络安全专家的喜爱。因此,我们创建了一个全面的网络安全词汇表,解释了常用的网络安全术语、短语和技术。我们设计此列表是为了揭开安全专…

春夏秋冬-第12届蓝桥杯Scratch选拔赛真题精选

[导读]:超平老师计划推出Scratch蓝桥杯真题解析100讲,这是超平老师解读Scratch蓝桥真题系列的第89讲。 蓝桥杯选拔赛每一届都要举行4~5次,和省赛、国赛相比,题目要简单不少,再加上篇幅有限,因此我精挑细选…

[附源码]计算机毕业设计springboot车险销售管理系统论文

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…