从文本、图像到音视频,AIGC技术将如何重构我们的数字世界?

news2024/12/24 9:28:48

引言

1950 年,艾伦·图灵提出著名的「图灵测试」,给出判定机器是否具有智能的试验方法。16 年后,世界上第一款可人机对话的机器人“Eliza”问世,这是 AI 技术最早期的萌芽阶段。但由于当时的科技水平限制,AIGC 仅限于小范围实验。

AIGC的技术发展

Eliza 的出现代表了人们对人工智能和自然语言处理的探索和兴趣,同时也反映了人们对计算机能否模拟人类思维和语言能力的好奇和探索能力。

如今人工智能技术经历了几十年的起伏和发展,现代人工智能应用也变得越来越智能化和逼真。递归神经网络(RNN)和生成对抗网络(GAN)等深度学习技术的出现,也让 AI 能够更好地理解人类语言,并生成更加自然和流畅的文本、图像、音频等内容。

到了 2022 年,这是生成式 AI 的突破之年,最具代表性的就是 ChatGPT,其一经发布便引起了广泛的关注和讨论,被认为是自然语言处理领域的一次重大突破。3 月 15 日,OpenAI 继续发布了其多模态的训练大模型——GPT-4,在 ChatGPT 的基础上增加了强大的识图能力,模态更丰富,且研发速度之快,令人惊叹。

除对话聊天工具外,AI 在其他领域也取得了不小的突破,3 月 16 日,Midijournry V5 发布,可创造高质量、高分辨率、高逼真的图像。Runaway 于 3 月 20 日发布GEN-2 视频生成模型的试用申请,新增根据文本和图片生成视频的功能。3 月 22 日,代码托管平台 GitHub 再次发布重磅“炸弹”:GitHub Copilot X,用户只需“动动嘴”,它就能帮你把代码写了。

回顾技术的发展,我们可以发现,每一轮技术变革,都带来了产业级的投资机会。先行觉悟的人,会在其中获取巨大的利益,而后知后觉的人大几率是被社会推动着走。

例如互联网诞生起就催生了在线教育、数字娱乐和社交网络等新兴行业,进一步推动了人类交流和信息传输的领域发展。

智能手机的出现让用户不再受限于键盘和鼠标,带来了移动支付、共享经济、应用开发等一众产业机会,进一步改变了人们的消费和生活方式。

5G 技术的普及,也使得人们将能够更智能地与物联网、无人机、自动驾驶汽车等连接,这不仅催生了智能交通、智能物流、智能制造等新的产业链,而且也让传统行业趋向数字化、自动化方向转型。

以生产工具为标志的生产力的发展是社会存在的根本柱石,也是历史的第一推动力。这是马克思主义关于生产力理论的经典观点。历史的进步和社会变革都源于生产力和生产关系的发展和变革。生产工具越是先进,其生产力就越是强大。而如今 AIGC 技术似乎就是革命性的生产工具。

AIGC 技术正在经历新一轮的变革浪潮,其交互方式也从生成文本、代码、图片正朝着更多元、更自然的形式上发展。历史总在循环往复,互联网的交互形式最初也是从文本、到图像、到音视频再逐步发展到如今的互动音视频(直播)。现在 AIGC 也正朝着更加逼真的方向发展,随着技术的不断升级和深入,AIGC 将可预见地颠覆音视频领域。

大咖经验分享

AIGC 已经开始重塑音视频哪些细分领域了?距离 AIGC 全面赋能音视频行业还有多远?未来会不会出现更加智能化、高效化的音视频应用与创作形式?会不会有更加自然、智能的语音交互出现?

4 月 26 日(周三)晚 20:00,「TVP 技术夜未眠」第七期来啦,本期我们特别邀请了腾讯云直播、媒体处理专家工程师 赵军老师与上海交通大学电子工程系教授、图像所副所长、腾讯云TVP 宋利老师,与我们一起探讨 AIGC 在音视频领域的应用与发展。

讲师介绍:

赵军:腾讯云直播、媒体处理专家工程师

腾讯专家工程师, 开源爱好者,FFmpeg maintainer,目前在腾讯云音视频负责视频云的媒体处理框架以及优化等工作,同时也以开放的心态,持续在开源社区提交相关 Patch。

宋利:上海交通大学电子工程系教授、图像所副所长、腾讯云 TVP

上海交通大学电院、人工智能研究院、未来媒体网络协同创新中心教授、博士生导师,IEEE 高级会员,多媒体信息领域技术专家,图像通信与网络工程研究所副所长。主持国家 863 课题、自然科学基金等科研项目数二十余项,发表学术论文 200 余篇,授权发明专利 35 项,软件著作权 5 项。

添加云小助微信:tvp1215,回复「音视频」即可加入本次直播交流群,可以提前交流互动,并参与群内互动抽奖!

TVP技术夜未眠

TVP 技术夜未眠 —— 技术畅言,夜深不眠。聚焦最新、最热、最受关注的技术话题,邀请各领域资深专家对话 TVP 大咖,深度剖析技术原理,洞察互联网技术走向,碰撞出思维火花,照亮技术之夜。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/695162.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【MySql】C语言连接mysql|图形化工具

文章目录 Connector/C 使用mysql接口介绍Navicat远程连接数据库 Connector/C 使用 说完了mysql的基础,后面我们只关心使用,要使用C语言连接mysql,需要使用mysql官网提供的库,前往官网下载即可。 但是实际上我们并不需要这样去做,…

Feign、Ribbon、Hystrix(铁三角)以及三者超时时间配置

在微服务架构中很多功能都需要调用多个服务才能完成某一项功能,一个成熟的微服务集群,内部调用必然依赖一个好的 RPC 框架,比如:基于 Http 协议的 Feign,基于私有 tcp 协议的 Dubbo 1. Feign 是什么 Feign 是Spring …

Consul 理解

Consul是google开源的一个使用go语言开发的服务发现、配置管理中心服务。内置了服务注册与发现框 架、分布一致性协议实现、健康检查、Key/Value存储、多数据中心方案,不再需要依赖其他工具(比如ZooKeeper等)。服务部署简单,只有一…

SpringBoot实现自定义配置属性提示

前言 我们在使用SpringBoot开发项目时,常常需要编写一些属性配置类,用来完成自定义或特定的属性配置。在配置文件application.yml中,IDEA会自动提示官方默认的相关配置且可以点击属性自动跳转到属性对应的配置类中,实现快速查看属…

力扣387:字符串中的第一个唯一字符

题目描述:给定一个字符串s,找到它的第一个不重复字符,并返回索引,如果不存在,则返回-1. 提示:s 不为空且 s 只包含小写字母 思路: 将字符串中的每个字符遍历一次,将其中每个字符以…

基于Java斗车交易系统设计实现(源码+lw+部署文档+讲解等)

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

centos下的Nginx, tar安装不能使用systemctl启动问题

1.systemctl start nginx启动报错 2.报错原因 解压方式nginx,系统服务内没有nginx的服务,所以报错 3.配置nginx系统服务 1)/etc/init.d/目录下创建nginx 2)nginx文件内容 #!/bin/sh # nginx - this script starts and stops the nginx daemin # # c…

【漏洞案例】云上攻防之云主机中web应用自身漏洞

0x00 前言 最近在做项目的时候,测到了一个部署在云上的存在 Laravel UEditor SSRF 漏洞的站点,并且发现这个 SSRF 漏洞可以读取到临时凭证,这不巧了,正好最近写了一个云环境利用的工具。 开始之前这里先简单介绍一下这个工具&am…

(三)R-studio调度

1、准备测试脚本 from datetime import datetime print(111) print(datetime.now()) 2、设置定时调度 如果crontab没有安装,需要在root用户下安装,并启动,可参考:Ubuntu下crontab的安装和使用 (base) rstudio5abc0fae5cff:~/p…

JVM的OOM问题定位解决

1、生成dump文件(错误日志文件),MAT可以进行解读 (1)参数 -XX:HeapDumpOnOutOfMemoryErrorOOM时导出堆到文件。 -Xms1m -Xmx8m -XX:HeapDumpOnOutOfMemoryError(2)设置参数 -Xms1m -Xmx8m -…

【Python】 Windows上通过git bash执行python卡住的解决方法

解决方法 编辑 C:\Program Files\Git\etc\profile.d\aliases.sh,将python2.7改成python 编辑完成后,重启git bash, 输入python即可 参考 https://blog.csdn.net/ofreelander/article/details/112058975

Linux网络环境配置

第一种方式(自动获取): 说明:登陆后,通过界面的来设置自动获取IP 特点:Linux启动后会自动获取IP 缺点:是每次自动获取的IP地址可能不一样 第二种方法(指定IP): 1、说明…

kettle文件资源库之Show hidden folders

版本7.1 在创建文件资源库时&#xff0c;有一个选项“show hidden folders”。从字面上理解&#xff0c;是“显示隐藏文件夹”的意思&#xff0c;其实不然。 通过repositories.xml文件我们可以看到&#xff0c;其实这个选项在配置文件中对应的标签是&#xff1a;<hides_hi…

计算机视觉:3*3卷积核的优势

本文重点 如果你了解卷积神经网络,那么你一定会注意到大多数卷积神经网络模型经常使用3*3的卷积核,甚至是1*1的,而5*5的都少用,这是为什么呢?本文对3*3的卷积神经网络的好处进行总结。 参数量少 在卷积神经网络中,卷积核的大小决定了模型的参数量。3*3的卷积核比5*5…

leetcode 102. 二叉树的层序遍历

2023.6.28 二叉树的层序遍历&#xff0c;需要用到的数据结构是队列。有几个核心点&#xff1a; 初始化变量 size&#xff0c;用于记录每层节点的数量。不能直接用que.size()&#xff0c;因为队列的大小是会随时变化的。在内层while循环中&#xff0c;每次先将队头节点的值保存…

HDLbits--Bugs mux4

用二选一多路选择器创建4选一多路选择器 说先修改编译问题&#xff1a;mux0&#xff0c;mux1变量重复使用&#xff0c;并且位宽只有一位&#xff0c;修改后编译 结果&#xff1a; 可知&#xff1a;00-a&#xff0c;01-b,10-c,11-d 可知sel[0]区分a和b&#xff0c;c和d &…

vue2项目Vant组件Dialog 弹出框异步关闭的坑

vue2项目使用vant&#xff0c;我这边是全局引入的&#xff0c;引入插件官方文档中有&#xff0c;这边就不介绍了。 安装&#xff1a;Vant 2 - Mobile UI Components built on Vue 话不多说直接说坑&#xff0c;当时写这个的时候真的给我气到了~~~ 先看一下官方文档&#xff1…

VS2019 Python连接Sql server2008

安好后&#xff1a; 测试代码&#xff1a; import pymssqltry:conn pymssql.connect(host127.0.0.1,usersa,password123456,databasehotel,charsetutf8)# 连接并执行Sql语句cursor conn.cursor()sql select * from odercursor.execute(sql)# 获取数据集rs cursor.fetchal…

【UCOS-III】自我学习笔记→第37讲→内存管理实验

文章目录 前言实验步骤1.复制消息队列工程&#xff0c;并创建OS内存区句柄和内存地址&#xff0c;并删除task2\task3及其相关内容2.修改task1任务函数3.查看串口现象 测试代码工程文件总结 前言 无&#xff0c;仅作记录&#xff0c;不具有参考价值&#xff0c;所用开发板为STM…

记一次docker-compose的坎坷安装经历

最近公司在做一个kafka项目&#xff0c;所以想用docker来安装kafka集群&#xff0c;所以安装完docker后就准备安装docker-compose&#xff0c;但在安装过程中确碰到了各种问题&#xff0c;搞了两个半天再通过翻墙工具才终于搞定。 首先看了篇文章显示安装前要对应docker版本。 …