AIGC领域优秀的资源汇总(应用、论文、开源项目)

news2024/11/24 6:16:07

AIGC领域介绍,及一些比较优秀的应用,和论文,开源项目汇总。

AIGC大纲

一、AIGC概念

​ AIGC,全名“AI generated content”,又称生成式AI,意为人工智能生成内容。例如AI文本续写,文字转图像的AI图、AI主持人等,都属于AIGC的应用。

​ AIGC也被认为是继PGC(Professionally Generated Content,专业生产内容)和UGC(User Generated Content,用户生产内容)之后的新型内容生产方式,AI绘画、AI写作等都属于AIGC的具体形式。

二、AIGC发展过程

​ AIGC的发展历程可以分为三个阶段:早期萌芽阶段(上世纪50年代至90年代中期),沉淀累积阶段(上世纪90年代至本世纪10年代中期),快速发展阶段(本世纪10年代中期至今)。

在早期萌芽阶段(1950s~1990s)

​ 由于技术限制,AIGC仅限于小范围实验与应用,例如1957年出现首支电脑创作的音乐作品《依利亚克组曲(Illiac Suite)》,80年代末至90年代中由于高成本及难以商业化,因此资本投入有限导致AIGC无较多较大成绩。

在沉淀累积阶段(1990s~2010s)

​ AIGC从实验性转向实用性,2006年深度学习算法取得进展,同时GPU,CPU等算力设备日益精进,互联网快速发展,为各类人工智能算法提供海量数据进行训练。2007年首部人工智能装置完成的小说《I The Road》(《在路上》)问世,2012年微软展示全自动同声传译系统,主要基于“深度神经网络”(Deep Neural Network,DNN)自动将英文讲话内容通过语音识别等技术生成中文。

在快速发展阶段(2010s~至今)

​ 2014年深度学习算法“生成式对抗网络”(Generative Adversarial Network, GAN)推出并迭代更新,助力AIGC新发展。2017年微软人工智能少年“小冰”推出世界首部由人工智能写作的诗集《阳光失了玻璃窗》,2018年NVIDIA (英伟达)发布StyleGAN模型可自动生成图片,2019年DeepMind发布DVD-GAN模型可生成连续视频。2021年Open AI推出DALL-E并更新迭代版本DALL-E-2,主要用于文本、图像的交互生成内容。

2023年

​ 而2023年更像是AIGC入世元年,AIGC相关的话题爆炸式的出现在了朋友圈、微博、抖音等社交媒体,正式被大众所关注。其中令人印象深刻的是微软全系融入AI创作和OpenAI GPT-4的发布:

​ 2023年1月,微软必应搜索(Microsoft Bing Search)推出了一项创新的功能,即聊天模式(Chat Mode)。这项功能允许用户通过聊天框与必应搜索进行交互,获取信息、娱乐、创意等各种内容。必应搜索利用了先进的自然语言处理(NLP)和生成技术,能够理解和回答用户的各种问题和请求,同时提供相关的网页搜索结果、建议、广告等。必应搜索还能够根据用户的选择,切换不同的模式,如平衡模式(Balanced Mode)、创意模式(Creative Mode)和精确模式(Precise Mode),以满足用户的不同需求和偏好。必应搜索的聊天模式是AIGC领域的一个突破,展示了人工智能与人类交流的可能性和潜力。

​ OpenAI在2023年3月发布了GPT-4模型:基于GPT-3改进的新一代预训练语言模型,参数达到2000亿,能够生成高质量的文本内容,支持多种语言和任务。GPT-4模型通过OpenAI Playground和OpenAI Codex等平台向公众开放,也通过受控API向企业提供服务。

三、AIGC应用

​ (这一代AIGC的应用)

​ AIGC通过让机器模仿人类的思维和创造力,使用自然语言处理、深度学习、图像处理等技术生成具有一定逻辑性和创意性的内容。相比于人工创作,AIGC具有自动化、高效、大规模生产、可定制等优势,可以应用于新闻报道、广告、文案撰写、音乐创作、影视制作等领域。在新闻报道领域,AIGC可以自动生成新闻摘要、事件报道、体育赛事等内容。在广告营销领域,AIGC可以根据用户画像和需求,自动生成广告文案、海报、短视频等广告素材。在音乐创作领域,AIGC可以自动生成音乐曲谱、和声、旋律等,也可以将不同的音乐元素组合起来生成新的音乐作品。在文学创作领域,AIGC可以自动生成诗歌、小说、散文等文学作品,甚至可以生成对话、情节、人物等元素。在视觉艺术领域,AIGC可以自动生成图像、视频、动画等作品。

举例一些应用功能:

​ 应用技术的成熟度:

​ 我们使用技术准备水平(TRL)来评估每种技术的成熟度。它的定义接近NASA的TRL概念。从1到9,其中9是最成熟的技术。

  1. 报告的基本原则
  2. 制定技术概念和/或应用
  3. 关键功能概念证明
  4. 可用的研究工作
  5. 研究原型验证
  6. 样机由专业用户操作
  7. 由最终用户操作的原型
  8. 由最终用户完成并验证的实际产品
  9. 经过大量终端用户日常验证的实际产品

这个列表中的大多数技术应该属于4或以上

文本生成(nlp)

在这里插入图片描述

文本-文本

NameTRLMore Links
Brad5-6
ChatGPT8-9[API] [Paper]
Claude5-6[Paper]
Copilot (Code only)8-9
GPT-47-8[API] [Paper]
LLaMA6-7[Paper] [Code]
New Bing7-8
StableLM5-6[Code]

文本-图片

NameTRLMore Links
DALL·E 27-8[API] [Paper]
MidJourney8-9
Stable Diffusion7-8[Paper] [Code]
TEXTure (Texture only)4-5[Paper] [Code] [Demo]

文本-视频

NameTRLMore Links
Fliki8-9[API]
Make-A-Video4-5[Paper]
Phenaki4-5[Paper]

文本-网格(3D)

NameTRLMore Links
DreamFusion4-5[Paper] [3rd Party Code]
DreamFields4-5[Paper] [Code]
Magic3D4-5[Paper]
Text2Mesh4-5[Paper] [Code]

文本-语音

NameTRLMore Links
Murf7-8[API]

文本-音乐

NameTRLMore Links
Mubert8-9[API]

图片生成

图片-文本

NameTRLMore Links
BLIP-24-5[Paper] [Code]

图片-图片

NameTRLMore Links
img2img6-7[Paper] [Code]

图片-网格(3D)

NameTRLMore Links
GET3D4-5[Paper] [Code]
nvdiffrec5-6[Paper] [Code]
pix2pix3D5-6[Paper] [Code]

图片-视频

NameTRLMore Links
Make-A-Video4-5[Paper]

表格来源:

git-hub: awesone-aigc
感兴趣的可以点击查看

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/588393.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

NRF52系列多个 base uuid 的问题,以client为例。

基础uuid知识 nordic的nrf sdk希望我们设置uuid的方式跟蓝牙技术联盟SIG的方式一样,也就是服务和特性的uuid是基于同一个base uuid修改产生的,比如base uuid是0x0000xxxx-0000-1000-8000-00805F9B34FB,那么服务和特性的128bit uuid就要基于此…

java8内部调用无法引用值的问题

问题:Variable used in lambda expression should be final or effectively final 具体原因: 这段代码试图将 20 赋给一个局部变量,它无法通过编译,但绝非编写错误。 这实际上是语言的设计者有意为之,用以鼓励用户使用…

优化版本 穿越火线(CF) FPS AI 自瞄 代码 权重 数据集(下面有链接)

更新初衷 本人在制作过程中,有一些爱钻研的朋友来问以及提出增加一些新的功能点回会更好,本着学习研究态度,在第一个版本上进行优化,增加一些内容 不喜欢看过程的小伙伴直接看最下面 界面 解决问题: 1、进入慢 2、无…

PyTorch-完整的模型训练套路

目录 1. 准备 1.1 使用Cifar10 1.2 item的用法 1.3 model的搭建 1.4 数据集、参数设置以及训练开始 1.5 测试集 1.6 使用tensorboard 1.7 保存每一轮的训练结果 2. 计算整体的正确率 3. 其他 3.1 train与eval 3.2 使用GPU训练 1. 准备 1.1 使用Cifar10 1.2 item的…

微信小程序授权登录

微信小程序—授权登录 一、小程序登录 登录流程时序 说明: 1.小程序端调用 wx.login() 获取临时登录凭证code ,并回传到开发者服务器。 2.服务器调用 code2Session 接口,换取 用户唯一标识 OpenID 和 会话密钥 session_key。 之后开发者服务器可以根…

2021年长三角高校数学建模竞赛A题Go!Fun游长三角解题全过程文档及程序

2021年长三角高校数学建模竞赛 A题 Go!Fun游长三角 原题再现: 又到一年毕业季,来自浙江杭州的一位大学生小李同学,家境良好,平时学习刻苦,在即将毕业之际,准备给自己安排一个毕业旅行,同时帮助…

Java 高级应用-多线程-实现 Runnable 接口与继承 Thread 类

1.1 程序、进程与线程 • 程序(program):为完成特定任务,用某种语言编写的一组指令的集合。即指一段 静态的代码,静态对象。 • 进程(process):程序的一次执行过程,或是正…

转变范式:如何使用 5 种新模式重塑 2023 年的实体店体验

在电商盛行的当下,线上购物已成为新零售的重要组成部分,实体零售业正处于两难境地。一方面,实体零售是绝对有必要的:美国约 85% 的销售额来自实体商店。 另一方面,尽管增长放缓,但电商收入占销售总额的比例…

chatgpt赋能python:Python中图形怎么整体下移?

Python中图形怎么整体下移? 在Python中,我们常常需要处理各种各样的图形,但是有时候我们需要将图形进行整体调整,比如将所有图形下移一定距离。那么在Python中,我们该如何实现这个操作呢? 介绍 在Python…

【Linux】3、iptables

文章目录 一、设置其他机器均无法访问 a、b、c 机器的 5432 端口二、设置 d、e 可访问 a、b、c 的 5432 端口三、检查业务是否受到影响 iptables 可在 tcp 协议栈层面限制访问,常用于解决现场的各漏洞。 场景:现场有 a、b、c 三个机器组成的 postgres 集…

经纬恒润AUTOSAR成功适配智芯科技国产车规级芯片

近日,经纬恒润AUTOSAR基础软件产品INTEWORK-EAS-CP成功适配智芯半导体的Z20K14x产品家族。同时,经纬恒润完成了对智芯半导体Z20K14X 产品MCAL软件适配和工程集成,为智芯半导体提供了全套AUTOSAR解决方案。 左图:经纬恒润AUTOSAR E…

iOS 创建组件库

索引库 repo 索引文件(.podspec文件) 1.搭建私有库之前必须要先创建索引库 1)首先检查当前电脑的索引库 pod repo 2)在gitlab上创建一个新的库,这个库用来保存私有库的podspec文件,所以我们一般起名字最好是 xxxSpec用以区分…

回归预测 | MATLAB实现SSA-CNN-BiLSTM麻雀算法优化卷积双向长短期记忆神经网络多输入单输出回归预测

回归预测 | MATLAB实现SSA-CNN-BiLSTM麻雀算法优化卷积双向长短期记忆神经网络多输入单输出回归预测 目录 回归预测 | MATLAB实现SSA-CNN-BiLSTM麻雀算法优化卷积双向长短期记忆神经网络多输入单输出回归预测预测效果基本介绍模型描述程序设计学习总结参考资料 预测效果 基本介…

在虚拟机上部署hadoop集群(全流程)

一、单节点部署前置准备 这里一直下一步就好了 接下来需要为该节点固定ip并配置相关网关还有dns解析 这里配置了一个本机dns解析,也配置了一个公网dns解析(主要目的还是为了固定ip

知识变现:知识付费产品,怎么定价?

知识变现:知识付费产品,怎么定价? 定价,是知识博主或者培训机构、用户、竞争对手间博弈平衡后的结果。 200元以下: 只有产品,没有服务。 产品的特征是标准化、大批量。这样的知识产品,要卖给几千、几万…

CSS 实现一个动态水形波浪蒙版层

需求的最终实现效果&#xff0c;如下图&#xff0c;在盒子表面&#xff0c;绘制一个波浪形状的蒙版层&#xff08;动态的&#xff09;。 先定义一个&#xff0c;主体盒子块&#xff0c;等会儿的蒙版图层会覆盖到它的上面。 <div></div>图层采用&#xff0c;SVG进…

Spring Boot 如何自定义异常处理器

Spring Boot自定义异常处理器 在Spring Boot应用程序中&#xff0c;异常处理是一个非常重要的方面。如果您不处理异常&#xff0c;应用程序可能会崩溃或出现不可预料的行为。默认情况下&#xff0c;Spring Boot将未捕获的异常返回给客户端。这通常不是期望的行为&#xff0c;因…

【Java基础】注解与反射

一、学习笔记 &#xff08;本文内容基本源自参考链接1视频教程&#xff09; 1、注解的含义 1&#xff09;注解&#xff08;annotation)是从jdk5.0开始引入的新技术&#xff0c;其作用&#xff1a;不是程序本身&#xff0c;可对程序作解释&#xff08;该作用与注释comment相同…

iOS 性能优化方案-弱网优化

一、iPhone手机弱网环境配置 选择现有网络状态 或自定义网络状态 设置参数: 每个参数的含义大致如下: in bandwidth &#xff1a;下行带宽 in packet loss &#xff1a;下行丢包率 in delay &#xff1a;下行延迟(ms) out bandwidth &#xff1a;上行带宽 out packet los…

【解决】升级g++到8版本

升级g到8版本 g不提高到最新版本在一些操作会头文件报错&#xff0c;因此下面我们配置g编译器 要升级g编译器到版本8&#xff0c;您可以尝试以下步骤&#xff1a; 添加Developer Toolset存储库&#xff1a;在CentOS上&#xff0c;可以使用Red Hat Developer Toolset存储库来获…