AI绘画火爆,到现在还只是冰山一角?AIGC掀起当代新艺术浪潮

news2024/10/1 5:33:03

前言: hello,大家好我是Dream。近日,各大社交平台掀起了一股“AI绘图”风潮,很多同学朋友纷纷在社交平台上晒出了属于自己的AI照片,一时间AI相关话题热度高涨。那对于AI绘画以及开启AI内容创作新时代的昆仑万维你究竟了解多少呢?那么今天我就带大家走进AIGC的新时代,去探寻昆仑万维的发展领军之路!

在这里插入图片描述

一、AIGC是什么

说到AI绘画大家一点也不陌生,但可能提到AIGC很多同学就不清楚了,其实AI绘画是属于AIGC应用分支之一的,也属于元宇宙的范畴。那什么是AIGC?AIGC全称为Artificial Inteligence Generated Content,即人工智能生产的内容。 随着人工智能的发展,AIGC赛道火热,各大科技公司正纷纷入局,并且在这个数据积累、算力提升和算法迭代过程中,人工智能在逐步渗透在写作、编曲、绘画和视频制作等创意领域。
在这里插入图片描述

二、为什么说昆仑万维开启AI内容创作新时代

作为中国领先的互联网平台出海企业,昆仑万维近年来在不断夯实出海业务的同时,也在持续加强人工智能等技术的研发投入,加码元宇宙、AIGC、VR,促使多元业务协同发展,让昆仑万维在AIGC赛道取得了突破性进展。目前,昆仑万维海外信息分发元宇宙平台Opera海外社交娱乐平台StarX全球移动游戏平台Ark Games是海外市场的核心业务,在规模上覆盖了一百多个国家,形成全球月活用户数近4亿的庞大业务矩阵。
在这里插入图片描述
AI绘画的技术门槛其实很高。但我们也可以看到现在在各大平台都出现了类似的AI绘画功能,这是因为Stability AI公布了一个开源模型,只要有一定的技术能力都可以跑起来。但想达到一些细节性的生成效果,光靠开源能力还不够。真的做到商用级别,还得团队自己有算法级别的优化创新。除了AI绘画,AIGC技术还能应用于文字、图像、视频、语音、代码、机器人动作等多种内容形式的生成。 作为行业先行者----昆仑万维在AIGC领域具有绝对意义的发言权! 昆仑万维在AIGC领域已经投入了近两年的时间,成立MusicX Lab音乐实验室,目前已经正式销售AI作曲,并且其已经准备长期都会在AIGC领域继续进行大幅投入。
“昆仑天工”是由昆仑万维集团与合作伙伴奇点智源推出的全系列AIGC模型与算法,AI生成能力覆盖图像、音乐、编程、文本等全模态领域。那么接下来我就对昆仑天工的使用体验为大家做一点简单的介绍!

三、昆仑天工使用体验

1、四大世界顶尖开源模型

绘图:全国第一款多语言Stable Diffusion分支模型

昆仑天工在绘画领域使用了第一个中文 Stable Diffusion 的模型和中英双语 Stable Diffusion 模型。
在这里插入图片描述

Stable Diffusion是一个文本到图像的潜在扩散模型,它使用来自LAION-5B数据库子集的512x512图像进行训练,使用这个模型,可以生成包括人脸在内的任何图像。
该模型利用已经开源的太乙 CLIP 模型替换了英文 stable-diffusion-v1-4 中的语言编码器。同时其采取了两阶段的训练。第一阶段也是冻住 stable-diffusion的生成模型部分,在亿级别的高质量数据上微调语言编码器,调整学习率等超参数,训练语言模型中文部分的表征。第二阶段 放开 stable-diffusion的生成模型部分,增强中文引导图片生成的能力。
这是我自己用其生成的一些AI绘图,我用的关键词是雾气弥漫的森林瀑布溪流阳光城市印象,可以说画的也是非常漂亮,很好的展现出了我的内心世界:

在这里插入图片描述

可以看出该产品当前在同行业处于较为领先的地位,出图速度十分迅速,在10s以内,这可以算是在同行中最快的一个啦!并且图片风格与用户指令契合度高。支持双语,英文系统做的较好,昆仑天工也将继续去完善提升整个模型,将会有更多语言的提示词输入支持,更强大的语言生成,模型指导图像生成风格更加多样,增加更多艺术风格的支持支持用户对生成的图像进行二次提示词编辑图像等功能。

文本:全国生成效果最好的开源GPT中文预训练大模型

GPT-整体架构:
在这里插入图片描述
GPT使用了transformer的decoder部分,每层Trms构成了一个自左向右单层的transformer,总共堆叠了12层Trms。GPT去掉了原先decoder中使用encoder进行attention的部分,每层Trms只有一个 Masked Multi Self-Attention,即:768 维向量+12个Attention Head
GPT模型能较好的处理NLP各个应用领域的任务,比如文本分类,推理,对话,问答,完形填空,阅读理解,摘要,生成等等。百亿/千亿参数量级的GPT大模型作用在这些应用领域。
昆仑天工针对中文领域构建了千亿级别的高质星数据集,通过高性能集群,训练(200张显卡,训练了4周,后续优化合计2周)得到百亿参数星的GPT-3生成模型基于预模型,对于更具挑战性的任务持续深耕,迭代优化,专业性表现中进一步提升。在未来其将会开发更大的参数量、更多的专业领域级多模态。

编程:国内最好的一款多语言开源编程大模型

Sky-code 是 SingularityAI 研发的一款AI代码生成工具,支持各种主流编程语言,助力开发人员更快更好的编码。Sky-code 可以直接集成到编辑器中,无缝衔接在开发环境,在键入代码的同时,智能高效补全代码,提升工作效率,节省开发时间。 Sky-code 目前已经集成在了 Visual Studio Code 中,未来会支持更多平台和工具,如 Neovim、JetBrains IDE、Visual Studio 等。致力于为开发者解决琐碎的、重复性的代码工作,从而专注于更高价值的研发工作。
在这里插入图片描述

简单易用
SkyCode作为编辑器扩展提供服务,可以无缝融入到您的开发环境。
提升工作效率
天工SkyCode可以直接集成到您的编辑器中,无缝衔接在您的开发环境,在您键入代码的同时,智能高效补全代码,提升工作效率,节省开发时间。目前我们已经集成在了 Visual Studio Code 中,后续会支持更多平台和工具,如 Neovim、JetBrains IDE、Visual Studio 等
在这里插入图片描述
人工智能驱动
SkyCode由SingularityAI自研的大模型提供支持,在GPT-3 13B基础上进行微调后重新训练,是国内最优秀的代码补全模型。预训练模型GPT-3参数量高达1750亿,代码质量严格把关,优中选优模型吞吐海量代码,每秒输出百字代码以上。

音乐:国内第一款商用级开源作曲AI模型

昆仑万维的StarXMusicXLab音乐实验室完成首批五首完全由AI作曲的歌曲发布,目前这五首歌曲已在Spotify、SoundClould、QQ音乐和网易云音乐等海内外180余个音乐平台上线。
在这里插入图片描述

StarXMusicXLab是昆仑万维在 “AI赋能” 业务发展战略方向上的又一重大成果,对相关业务及整个行业之后发展均具有重要意义,能够丰富平台内容,同时为个人用户和企业用户,提供音乐相关解决方案,包括批量供给如背景音乐、伴奏配乐等泛化内容,以及为艺人及虚拟偶像定制化创作符合其人设调性的音乐作品等服务。经过StarX科研人员四、五年的努力,昆仑万维能够实现将人声从歌曲中分离出来,从而建立起庞大的高质量伴奏曲库。昆仑万维的人声消除技术应该是目前世界上最好的,凭借这项技术建立起了覆盖300万首曲子的伴奏曲库,这也是世界上最大的流行音乐伴奏曲。

2.数据集优质数量大,模型能力强

数据越多,训练的质量也就越好,模型质量也就越高。昆仑万维通过AI去学习曲库中的300万首乐曲,就能够生成高质量的,由人工智能创作的音乐。

文本模型对比在这里插入图片描述
通过模型文本对比我们可以看出来其在各种评分中是相当优秀的,在blue评分中更是高达17.27,这非常有利的说明了其:

  • 计算速度快,易于理解。
  • 它与人类评估相同文本的方式相对应。
  • 重要的是,它与语言无关,因此可以直接应用于您的 NLP 模型。
  • 当您有多个基本事实句子时,可以使用它。
  • 它的使用非常广泛,这使得将您的结果与其他工作进行比较变得更加容易

代码模型对比:

在这里插入图片描述
在代码模型中,其百次的通过率更是达到了惊人的80%以上,这是一个相当优秀的数据,模型的生成通过率相当可观。
模型的一次生成通过率是代码语言生成模型最重要的能力衡量指标。昆仑天工采用了OpenAI发布的HumanEval以及奇点内部纂写的的40Simples两个函数级代码生成任务的数据集作为评测目标。
这是HumanEval中一个非常简单的例子:
在这里插入图片描述
昆仑天工生成的代码需要通过单元测试(Unit Tests)才被认为生成正确。
值得一提的是,26亿参数的SKY-CODE模型(PASS@100=84.77%)超越了GPT-J(PASS@100=80%)接近60亿参数的模型结果。在两种数据集上, 26亿参数的模型超越了接近70亿参数的模型效果。在训练的充分程度上,SKY-CODE是所有模型中所用数据量以及计算量最小的模型,这一结果充分说明了SKY-CODE数据集构建策略和分阶段训练设计的合理性,并展示了采用这种方式能够在函数级代码生成这一最重要场景上达到业界最优。

3.未来发展前景巨大

随着人工智能技术的发展与完善,AIGC将成为这个时代内容创造的主流。StarX MusicX Lab推出AIGC歌曲,释放AI的落地场景,带来了巨大的内容创作想象空间。作为昆仑万维 “AI赋能” 业务发展战略方向上的重大成果,StarX MusicX Lab将继续依托成熟专业的全链路音乐制作和发行能力,向全球输出高质量的AI创作内容,增强昆仑万维业务矩阵的协同效应,助力各领域实现降本增效。
AI作为连接虚拟世界与真实世界的纽带,是构建元宇宙的关键基础技术之一。而AIGC的成熟有利于降低成本,带来数字人、虚拟场景、数字内容及图文视听相关产品的改变和丰富。昆仑万维助力多元化业务协作发展多向赋能,在AIGC赛道上躬身前行持续发力,丰富AIGC多场景应用,引领行业发展。
🌲🌲 好啦,这就是今天要分享给大家的全部内容啦,希望你看完之后也可以有些许的启发和感悟,我们都在路上,一起加油吧!
❤️❤️❤️如果你喜欢的话,就不要吝惜你的一键三连了~
在这里插入图片描述
在这里插入图片描述
最后,有任何问题,欢迎关注下面的公众号,获取第一时间消息、作者联系方式及每周抽奖等多重好礼! ↓↓↓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/95892.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

东北大学2023分布式操作系统考试题目及答案

Note:答案仅供参考,自己所写,不是标准答案,若发现错误,请指正,谢谢! 文章目录考试题目参考答案考试题目 1、简述分布式系统的设计目标中开放性的特点有哪些? 、 、 、 、 、 、 、…

​燕东微科创板上市:市值276亿 亦庄国投与京东方是股东

雷递网 雷建平 12月16日北京燕东微电子股份有限公司(简称:“燕东微”,股票代码为:“688172”)今日在科创板上市,燕东微本次发行17986.5617万股,发行价21.98元,募资总额39.56亿元。燕…

关于hcaptcha (vm wasm ob)三合一

该文章主要提供交流学习使用,请勿利用其进行不当行为! 如本篇文章侵犯了贵公司的隐私,请联系我立刻删除! 如因滥用解密技术而产生的风险与本人无关! 1 Hcaptcha hCaptcha 旨在解决机器学习中最劳动密集型的问题&am…

毕业设计 - 基于 java web的网上花店销售系统设计与实现【源码+论文】

文章目录前言一、项目设计1. 模块设计数据流图功能模块2. 实现效果二、部分源码项目源码前言 今天学长向大家分享一个 毕业设计项目: 网上花店销售系统的设计与实现 一、项目设计 1. 模块设计 数据流图 功能模块 1、首页(主界面) 提供简洁美观的主界…

Jenkins+Kubernetes企业级DevOps容器云平台

一、Kubernetes在DevOps中的作用 1、DevOps DevOps假导所有新的功能特性可以像流动的水一样,迭代到用户的终端,而水是不能讲流的,为了保证水流的质量,我们就必须在水流动的途中治理,直到最终交付到用户的手中。 DevOps是一套方法论、一系列的原则和实践,其主要目标为帮…

【Robot Framework】发送GET和POST请求

做接口自动化时,经常要使用GET与POST请求,那么如何使用RF发送对应的请求呢? 一、安装RequestsLibrary pip install robotframework-requests安装以后,导入到对应的测试套件或测试用例中. 本次主要介绍通过RequestsLibrary来实现…

JavaEE - JVM八股文(JVM内存区域划分,典型面试题,JVM类加载机制)

文章目录1. JVM运行时数据区(内存区域划分)2. JVM类加载机制常见面试题1. JVM运行时数据区(内存区域划分) JVM运行时数据区域也叫内存布局,但需要注意的时它和Java内存模型(JMM)不同&#xff0…

使用PyTorch进行知识蒸馏的代码示例

随着机器学习模型的复杂性和能力不断增加。提高大型复杂模型在小数据集性能的一种有效技术是知识蒸馏,它包括训练一个更小、更有效的模型来模仿一个更大的“教师”模型的行为。 在本文中,我们将探索知识蒸馏的概念,以及如何在PyTorch中实现它…

计算机毕设Python+Vue校园舆情监控系统(程序+LW+部署)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

C#修改富文本框(RichTextBox)指定内容颜色

1.前言 最近给客户做了一个协议解包与组包的工具,以便于他们给终端客户或者集成商使用,让客户能够快速集成产品协议,降低客户集成工作量,产品协议是基于JT/T808,但是有增加了自己的一些特殊修改。 客户使用的是C#开发…

数据库原理及MySQL应用 | 并发控制

无论何时,只要有多个查询需要在同一时刻修改数据,都会产生并发控制问题,MySQL通过多版本并发控制和加锁实现并发控制。 多用户并发执行事务访问同一个数据库时,可能引发脏写、脏读、不可重复读、幻读等一致性问题。并发事务访问相同记录的情况&#xff0…

Golang 【basic_leaming】数组

阅读目录Array(数组)数组定义数组的初始化方法一方法二方法三数组的遍历数组是值类型多维数组二维数组的定义二维数组的遍历数组练习题1、请求出一个数组的和以及平均值 for-range2、请求出一个数组的最大值,并得到对应的下标3、从数组 [1, 3, 5, 7, 8] 中找出和为 …

探花交友_第10章_搭建后台系统(新版)

探花交友_第10章_搭建后台系统(新版) 文章目录探花交友_第10章_搭建后台系统(新版)1.1 概述1.2 API网关1.2.1 搭建网关依赖引导类跨域问题配置类配置文件测试1.2.2 配置鉴权管理器1.3 Nacos配置中心1.3.1 添加依赖1.3.2 添加boots…

33.数据统计

数据统计 后台系统首页中,显示各种统计数据,比如:累计用户数、新增用户数、登录次数等内容。 解决方案 数据库表分析 一、数据采集 需求: 1、探花系统将用户操作日志写入RabbitMQ 2、管理后台获取最新消息,构造日…

SpringBoot+微信小程序实现的云音乐小程序系统 附带详细运行指导视频

文章目录一、项目演示二、项目介绍三、项目运行截图四、主要代码一、项目演示 项目演示地址: 视频地址 二、项目介绍 项目描述:这是一个基于SpringBoot微信小程序框架开发的云音乐微信小程序系统。首先,这是一个前后端分离的项目&#xff…

C语言百日刷题第十五天

前言 今天是刷题第15天,放弃不难,但坚持一定很酷~ 再刷一套模拟题 C语言百日刷题第十五天前言一、选择题二、判断题三、多选题四、填空题五、分析程序题一、选择题 1.下列选项中,不属于开发一个C语言应用程序的具体实现步骤的是&#xf…

为什么网络应用程序是今年的主要攻击媒介之一

网络犯罪分子在绕过最新的网络应用程序防火墙方面的独创性正在将互联网应用程序变成今年增长最快的攻击媒介。面向公众的 Web 应用程序现在是渗透组织边界的最广泛使用的攻击媒介。 根据卡巴斯基全球应急响应团队最近的一份报告,始于 Web 应用程序的攻击从 2020 年…

ocker高级篇1-dockeran安装mysql主从复制

大家好,咱们前面通过十篇的文章介绍了docker的基础篇,从本篇开始,咱们的《docker学习系列》将要进入到高级篇阶段(基础篇大家可以查看之前发布的文章)。 咱们先来介绍:docker复杂方式安装软件。通过按照mysql\redis两个案例来讲解…

XC6SLX100-3FGG484C规格、XC7A15T-2CPG236I产品概述及应用

Spartan-6系列提供领先的系统集成能力,为大批量应用提供最低的总成本。这个由13个成员组成的家族扩展了逻辑单元的密度,从3840个扩展到147443个,功耗仅为之前斯巴达家族的一半,并且具有更快、更全面的连接。 Spartan-6系列基于成熟…

拯救动画卡顿之FLIP

前置知识 什么是FPS FPS是浏览器的每秒的渲染帧数,也就是浏览器切换画面的次数,大多数设备的刷新率都是60FPS,一般来说FPS越低页面就会越卡顿。 什么是像素管道? 像素管道是浏览器单个帧的渲染流水线,如果其中有某…