【清华大学】AIGC发展研究(3.0版)

news2025/4/21 10:12:37

目录

  • AIGC发展研究报告核心内容
    • 一、团队简介
    • 二、AI哲学
    • 三、国内外大模型
    • 四、生成式内容
      • (一)文本生成
      • (二)图像生成
      • (三)音乐生成
      • (四)视频生成
    • 五、各行业应用
    • 六、未来展望

AIGC发展研究报告核心内容

一、团队简介

报告由清华大学新闻学院、人工智能学院的沈阳团队发布,团队在新闻传播学、计算机科学等多个领域从事教学科研,已有众多大模型产业化和AIGC实施案例。

二、AI哲学

探讨AI在多个哲学领域引发的变化,如怀疑论、主体间性、他者经验等,分析AI对传统哲学观念的挑战与革新。

三、国内外大模型

  1. 基座升级:介绍AI从文本生成到视频生成等领域的快速演进,如OpenAI的GPT-4o、Sora等模型的突破。
  2. 生成机制:以“我喜欢吃苹果”为例,讲解AI模型的语料预训练、参数学习、模型推理等生成机制。
  3. AI缺陷:指出AI幻觉、可解释性、计算成本等潜在缺点与局限。

四、生成式内容

(一)文本生成

  1. 技术原理:基于Transformer架构的语言模型,通过学习大量文本数据,能够生成与人类语言相似的文本内容。
  2. 应用场景:包括但不限于新闻报道、文学创作、内容营销、教育培训、智能客服等领域。
  3. 实际案例
    • AI写作:如OpenAI的GPT系列模型,能够生成高质量的文章、故事、诗歌等。
    • AI论文写作:清华大学新闻与传播学院沈阳教授团队使用AI生成了一篇8264字的小论文。
    • AI小说创作:华东师范大学传播学院院长王峰教授及其团队通过“大语言模型+提示词工程+人工后期润色”的方式完成了国内首篇百万字AI小说。
  4. 未来趋势:随着模型的不断优化和训练数据的增加,文本生成将更加自然、准确和多样化。

(二)图像生成

  1. 技术原理:利用生成对抗网络(GAN)或扩散模型等技术,通过学习大量图像数据,能够生成新的图像内容。
  2. 应用场景:涵盖艺术创作、广告设计、影视制作、游戏开发、教育辅助等多个领域。
  3. 实际案例
    • AI绘画:Midjourney、DALL-E等模型能够生成各种风格的绘画作品。
    • AI转绘展:国内外已举办多次AI转绘展览,如伦敦书展的AI转绘演示、中国《一个人的北京城》AI转绘展。
    • AI修复:新华社利用AI技术修复烈士形象,制作感人“照片”。
  4. 未来趋势:图像生成将更加逼真、细腻,能够满足更多专业领域的需求。

(三)音乐生成

  1. 技术原理:基于深度学习的音乐生成模型,通过学习音乐数据中的旋律、和声、节奏等特征,能够生成新的音乐作品。
  2. 应用场景:音乐创作、影视配乐、广告音乐、游戏音乐、音乐教育等。
  3. 实际案例
    • AI音乐创作平台:如Suno AI的Suno,能够一次性完成歌词、演唱、编曲、配乐等音乐创作的全流程。
    • AI音乐模型:MiniMax的Abab-music-1、腾讯的琴乐大模型等在音乐生成方面表现出色。
  4. 未来趋势:音乐生成将更加多样化、个性化,能够融合不同风格和文化元素。

(四)视频生成

  1. 技术原理:结合计算机视觉、自然语言处理和生成模型等技术,能够将文本、图像等输入转化为动态视频内容。
  2. 应用场景:影视制作、广告宣传、教育培训、文化旅游、新闻报道等。
  3. 实际案例
    • AI微短剧:总台视听新媒体中心与总台人工智能工作室联合清华大学新闻学院元宇宙文化实验室制作的《中国神话》。
    • AI视频修复:新华社“说真相”系列节目利用AIGC直接生成动态视频。
    • AI生成视频:如Midjourney+Runway生成的视频内容。
  4. 未来趋势:视频生成将更加流畅、自然,能够实现更多复杂的场景和特效。

五、各行业应用

  1. 服装行业:AI设计服装并对接生产,推动中国服装史的发展。
  2. 医疗行业:AI辅助医疗诊断、治疗方案制定等,提升医疗服务水平。
  3. 教育行业:AI个性化教育模式,帮助学习者提升能力。
  4. 出版行业:AI在出版流程中的应用,提高出版效率和质量。
  5. 文旅行业:AI虚拟人等技术为游客提供个性化服务和创新体验。
  6. 传媒行业:AIGC在新闻报道、社交媒体等领域的应用,革新传媒模式。
  7. 移动互联网:AIGC与移动互联网应用结合,提升用户体验和智能化服务。
  8. 虚拟人与元宇宙:AI赋能虚拟人和元宇宙,拓展应用场景和服务模式。

六、未来展望

  1. 职业替代与协作:分析不同职业在AI时代的替代性和协作潜力。
  2. 社会形态变化:探讨AI社会的核心特征和主要职业,以及社会分工的变化。
  3. 经济变化:阐述AI对市场、产业发展、资源分配等方面的影响。
  4. 政治冲击:分析AI在政治领域的效率提升和潜在风险。
  5. 文化重塑与伦理挑战:讨论AI对文化创作、社会变革、伦理思考等方面的影响。
  6. 生活方式变化:描述AI在衣、食、住、行、玩等方面带来的智能化、个性化、便捷高效的生活方式。
  7. 情感变迁:分析情感从真实人际到虚拟陪伴的转变,以及情感识别与管理的增强。
  8. 认知变化:探讨人类在AI时代的信息依赖、意识内卷等问题,以及面临的工具理性和价值理性冲突。
  9. 法律重塑:研究AIGC内容的权益归属、创作主体确定等法律问题。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2320542.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JavaSE1.0(基础语法之运算符)

算术运算符 基础运算之加 减 乘 除 取余( - * / %) 运算符之相加( ) public static void main(String[] args) {System.out.println("Hello world!");int a 10;int b 20;int c a b;System.out.println(c);//…

蓝桥与力扣刷题(蓝桥 数的分解)

题目:把 2019分解成 3个各不相同的正整数之和,并且要求每个正整数都不包含数字 2 和 4,一共有多少种不同的分解方法? 注意交换 3 个整数的顺序被视为同一种方法,例如 1000100118和 1001100018 被视为同一种。 解题思…

Java IO 流:从字节到字符再到Java 装饰者模式(Decorator Pattern),解析与应用掌握数据流动的艺术

在 Java 编程中,IO(输入输出)流是处理数据输入输出的核心工具。无论是读取文件、网络通信,还是处理用户输入,IO 流都扮演着重要角色。本文将深入探讨 Java IO 流的核心概念、分类、经典代码实例及其应用场景&#xff0…

爬虫案例-爬取某站视频

文章目录 1、下载FFmpeg2、爬取代码3、效果图 1、下载FFmpeg FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。 点击下载: ffmpeg 安装并配置 FFmpeg 步骤: 1.下载 FFmpeg: 2.访问 FFmpeg 官网。 3.选择 Wi…

nacos-未经授权创建用户漏洞

1、修改配置文件 vim application.properties# 修改配置项 nacos.core.auth.enabledtrue nacos.core.auth.enable.userAgentAuthWhitefalse2、重启nacos systemctl restart nacos3、验证 打开nacos部署服务器输入命令 curl -XPOST -d “usernametest123&passwordtest!123…

C++:IO库

一、C IO库的架构 C标准库中的IO系统基于流(Stream)​的概念,分为三层结构: ​流对象​(如cin, cout, fstream)​流缓冲区​(streambuf,负责底层数据处理)​数据源/目的…

企业级前端架构设计与实战

一、架构设计核心原则 1.1 模块化分层架构 典型目录结构: src/├── assets/ # 静态资源├── components/ # 通用组件├── pages/ # 页面模块├── services/ # API服务层├── store/ # 全局状态管理├── uti…

从入门到精通【MySQL】 CRUD

文章目录 📕1. Create 新增✏️1.1 单行数据全列插入✏️1.2 单行数据指定列插入✏️1.3 多行数据指定列插入 📕2. Retrieve 检索✏️2.1 全列查询✏️2.2 指定列查询✏️2.3 查询字段为表达式✏️2.4 为查询结果指定别名✏️2.5 结果去重查询 &#x1f…

08_双向循环神经网络

双向网络 概念 双向循环神经网络(Bidirectional Recurrent Neural Network, BiRNN)通过同时捕捉序列的正向和反向依赖关系,增强模型对上下文的理解能力。与传统的单向网络不同,BIRNN 能够同时从过去和未来的上下文信息中学习,从而提升模型的…

2025年Postman的五大替代工具

虽然Postman是一个广泛使用的API测试工具,但许多用户在使用过程中会遇到各种限制和不便。因此,可能需要探索替代解决方案。本文介绍了10款强大的替代工具,它们能够有效替代Postman,成为你API测试工具箱的一部分。 什么是Postman&…

(四)---四元数的基础知识-(定义)-(乘法)-(逆)-(退化到二维复平面)-(四元数乘法的导数)

使用四元数的原因 最重要的原因是因为传感器的角速度计得到的是三个轴的角速度, 这三个轴的角速度合成一个角速度矢量, 结果就是在微小时间内绕着这个角速度矢量方向为轴旋转一定角度. 截图来源网址四元数 | Crazepony开源四轴飞行器

汇能感知高品质的多光谱相机VSC02UA

VSC02UA概要 VSC02UA是一款高品质的200万像素的光谱相机,适用于工业检测、农业、医疗等领域。VSC02UA 包含 1600 行1200 列有源像素阵列、片上 10 位 ADC 和图像信号处理器。它带有 USB2.0 接口,配合专门的电脑上位机软件使用,可进行图像采集…

Blazor+PWA技术打造全平台音乐播放器-从音频缓存到离线播放的实践之路

开局三张图… 0.起源 主要是自己现在用的是苹果手机,虽然手机很高级,但是想听自己喜欢的歌曲确是不容易,在线app都要付费,免费的本地播放器都不太好用(收费的也不太行),基础功能都不满足。此外…

使用LangChain开发智能问答系统

代码地址见文末 1. 项目配置 1.1 Neo4j 数据库配置 1. 安装与环境变量 解压路径:将neo4j-community-5.x.x.zip解压至D:\neo4j-community-5.x.x环境变量: NEO4J_HOME: D:\neo4j-community-5.x.xJAVA_HOME: D:\neo4j-community-5.x.x\jdk(注意:需指向 JDK 目录)Path 变量…

Centos操作系统安装及优化

Centos操作系统安装及优化 零、环境概述 主机名 centos版本 cpu 内存 Vmware版本 ip地址 test CentOS Linux release 7.6.1810 (Core) 2C 2G 15.5.1 10.0.0.10 一、介质下载 1、7.6版本下载 CentOS7.6标准版下载链接: https://archive.kernel.org/centos-vault/7.6.1810/i…

游戏引擎学习第177天

仓库:https://gitee.com/mrxiao_com/2d_game_4 今日计划 调试代码有时可能会非常困难,尤其是在面对那些难以发现的 bug 时。显然,调试工具是其中一个非常重要的工具,但在游戏开发中,另一个非常常见的工具就是自定义的调试工具&a…

数据结构知识点1

目录 一、时间复杂度和空间复杂度 1.1时间复杂度: 1.2空间复杂度: 二、装箱和拆箱 三、泛型 3.1泛型类的使用: 3.2泛型的上界: 3.3泛型方法: 一、时间复杂度和空间复杂度 1.1时间复杂度: 时间复杂…

自由学习记录(45)

顶点片元着色器(important) 1.需要在Pass渲染通道中编写着色器逻辑 2.可以使用cG或HLSL两种shader语言去编写Shader逻辑 3.代码量较多,灵活性较强,性能消耗更可控,可以实现更多渲染细节 4.适用于光照处理较少&#xf…

数据源支持远程Excel/CSV,数据集支持分组字段功能,DataEase开源BI工具v2.10.6 LTS版本发布

2025年3月17日,人人可用的开源BI工具DataEase正式发布v2.10.6 LTS版本。 这一版本的功能变动包括:数据源方面,新增支持远程Excel/CSV数据源,支持以HTTP、HTTPS、FTP协议获取远程服务器上的Excel和CSV数据文件,并且可以…

SpringBoot3使用CompletableFuture时java.util.ConcurrentModificationException异常解决方案

问题描述 在Spring Boot 3项目中,使用CompletableFuture进行异步编程时,偶发{"code":500,"msg":"java.util.ConcurrentModificationException"}异常,但代码中并未直接操作List或CopyOnWriteArrayList等集合类…