【人工智能】AI虚拟主播制作初体验:生成数字人到视频创作全流程

news2025/1/18 11:42:15

文章目录

  • 💯AI虚拟主播
  • 💯使用AI绘画工具生成数字人
    • 借助GPT生成数字人所需的提示词
    • 方案一:使用Midjourney生成数字人
    • 方案二:使用TensAI生成数字人
    • 补充方案三:在D-ID内直接生成数字人
  • 💯使用D-ID生成数字人视频
    • D-ID注册与消耗积分说明
    • D-ID 让数字人“活”起来
  • 💯小结


在这里插入图片描述


AI虚拟主播


💯AI虚拟主播

随着人工智能技术的不断进步,AI虚拟主播正逐渐成为内容创作领域的一大热点。通过AI技术生成的虚拟形象不仅能够高度还原真人的外观,还能够与观众进行互动,提供更加个性化的内容体验。无论是在广告宣传、教育培训,还是在直播与社交平台上,AI虚拟主播都展现出了巨大的潜力。本文将带你进行一次初步探索,感受AI虚拟主播的魅力。通过使用AI绘画工具生成逼真的数字人形象,并借助D-ID等平台让这些静态的形象“活”起来。
在这里插入图片描述


💯使用AI绘画工具生成数字人

首先,我们要使用AI绘画工具为我们生成一个虚拟的数字人形象,这种数字人会非常接近真人的形象。这里使用的AI绘画工具比较推荐Midjourney,如果没有Midjourney也没关系,还会推荐一款在线网页版的文生图的国内AI网站也可生成数字人,供我们使用。
补充:D-ID内也可直接生成数字人形象。
在这里插入图片描述


借助GPT生成数字人所需的提示词

首先我们要去构思如何编写创建数字人形象的提示词,我们通常会设定一些条件,比如他所从事的行业、年龄范围以及五官的具体特征等。这些设定有助于生成一个更符合我们需求的虚拟形象。
以下是一些参数可以参考:

  • 基础:国家、身份(学生/上班族/明星/网红/女装模特)、年龄
  • 容貌:面部(眼睛/鼻子/嘴巴/脸型)、肤色、身材、追加附魔词
  • 服装:休闲/职业/时尚/运动/纯色基本款/民族服饰
  • 场景:地点、时间、天气、光线
  • 摄影:现实、人像摄影、构图 (占比)
  • 动作:默认也可以设定
  • 比例:9:16或3:4宽高比

这里提供一个现成模板用于测试

中国、网红
女明星,五官立体,身材好,
白色连衣裙
街拍,购物街道,
索尼,85mm
走路,
9:16

让AI为我们生成提示词

现在你是一名基于输入描述的提示词生成器,你会将我输入的自然语言想象为完整的画面生成提示词。请注意,你生成后的内容服务于一个绘画AI,它只能理解具象的提示词而非抽象的概念。我将提供简短的中文描述,生成器需要为我提供准确的提示词,必要时优化和重组以提供更准确的内容,也只输出翻译后的英文内容。
请模仿示例的结构生成完美的提示词。
示例输入:“一个坐在路边的办公室女职员”
示例输出:1 girl, office lady, solo, 16yo,beautiful detailed eyes, light blush, black hair, long hair, mole under eye, nose blush , looking at viewer, suits, white shirt, striped miniskirt, lace black pantyhose, black heels, LV bags, 
thighhighs,sitting, street, shop border, akihabara , tokyo, tree, rain, cloudy, beautifully detailed background, depth of field, loli, realistic, ambient light, cinematic composition, neon lights, HDR, Accent Lighting, pantyshot, fish eye lens.
请仔细阅读我的要求,并严格按照规则生成提示词,如果你明白了,请回复"我准备好了",当我输入中文内容后,请生成我需要的英文内容。注意,英文连着写,不要标序号。

使用KIMI、文心一言等AI工具也同样可以帮助我们生成提示词,这里以GPT为例:
在这里插入图片描述
在这里插入图片描述
以下是生成好的提示词,已加上分辨率9:16

Chinese celebrity, internet star, female, detailed facial features, attractive body, white dress, street photography, shopping street, Sony 85mm lens, walking, realistic, urban background, fashion, vibrant colors, natural lighting, candid moment. --ar 9:16

方案一:使用Midjourney生成数字人

  1. 向Midjourney输入上一步GPT给我们生成的提示词
    在这里插入图片描述
  2. 放大我们需要的那张图,保存到本地。
    在这里插入图片描述

方案二:使用TensAI生成数字人

如果没有Midjourney,可先使用这个国内的AI工具,使用在线文生图功能:
TensAI:https://tensai.tenclass.com/?invite_code=4fdhLK

  1. 选择文生图功能,工具勾选M-J-P生成人像效果更佳。
    在这里插入图片描述

  2. 接着跟Midjourney一样输入提示词
    在这里插入图片描述

  3. 生成后找一张适合的进行放大
    在这里插入图片描述

  4. 保存到本地。
    在这里插入图片描述


  • 注意:以上是列举了两个相对容易上手的AI绘画工具,分别是Midjourney和TensAI,用于生成数字人图像。当然,除了这两个工具外,其他AI绘画工具也同样适用,例如Stable Diffusion等。选择哪种工具取决于你的具体需求和使用习惯,每种工具都有其独特的功能和优势,灵活选择能够帮助你更好地实现创作目标。

补充方案三:在D-ID内直接生成数字人

  • 写到一半才发现D-ID原来也可以在线生成数字人。
    在这里插入图片描述
  • 效果不错,生成速度也挺快的,这样子方便很多。
    在这里插入图片描述

💯使用D-ID生成数字人视频

在生成了逼真的数字人图像后,下一步就是让这些静态的图片形象“活”起来。这时,我们可以借助D-ID来实现这一目标。D-ID 是一款先进的AI技术平台,它能够将静态的图像转化为生动的面部动画和视频。通过D-ID,你可以为你的数字人赋予逼真的表情和语音,让他们看起来更具生命力。
D-ID:https://www.d-id.com/
在这里插入图片描述


D-ID注册与消耗积分说明

  • 这里我们需要注册一下才能使用图片转视频功能
    在这里插入图片描述
  • 注册过程就不详细介绍了。
    在这里插入图片描述

  • 这个网站都是英文,所以开启了Google翻译。

  • 注意:D-ID每个账号注册后有20个免费积分,每个代理会话消耗1个积分,每分钟视频价值4个积分。理论上来说,如果你拥有多个邮箱,可以不断注册新账号,这样就能够持续获得免费积分,从而使点数几乎用不完。
    在这里插入图片描述


D-ID 让数字人“活”起来

  1. 点击创建视频
    在这里插入图片描述

  1. 点击上传我们的AI数字人图像
    在这里插入图片描述

  1. 可选择视频中数字人呈现的表情和所在位置
    在这里插入图片描述

  1. 可以为数字人选择不同地区的语言,甚至是方言,并根据需要调整音色。此外,平台还支持根据你提供的音频样本进行声音模仿。
    在这里插入图片描述

  1. 在脚本处可以输入数字人视频中说的话,还可以调整说话风格、语速
    在这里插入图片描述
    在这里插入图片描述
  • 可以提供本地音频供AI模仿
    在这里插入图片描述

  1. 还可以选择自定义视频中数字人所处的背景,但好像是类似PS的图层,应该是需要先将数字人抠图才能完美融合背景。
    在这里插入图片描述

  1. 可在视频中自定义位置加上文字说明
    在这里插入图片描述
  • 可自定义文字信息。
    在这里插入图片描述

  1. 可对生成视频自定义命名
    在这里插入图片描述

  1. 生成成功后可以保存在本地
    在这里插入图片描述

💯小结

  • 数字人这个概念其实早在前几年就已经引起了广泛关注。然而,当时生成数字人的技术还没有如今这样成熟和易于操作,更多的是一些高端玩家能够玩转,对于我们普通人来说几乎是遥不可及的。而现在,随着AI技术的发展,我们可以借助AI绘画工具生成数字人图像,并通过D-ID让其“活起来”,大致了解AI虚拟主播的生成,时代的发展让普通人也能感受到科技带来的便利。
  • 本文只是对虚拟主播的一个简单制作体验教程,并不全面,还有许多功能没有深入探索。作为一个对于AI虚拟主播的初步探索,这篇文章也是为了让读者在尝试中体验到AI发展带来的乐趣,感谢阅读~

public class Main {  
    public static void main(String[] args) {  
        System.out.println(“愿你所到之处皆为热土,愿你所遇之人皆为挚友;愿你余生不负忧,自在如风常欢笑。”);  
    }  
}

在这里插入图片描述


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2070237.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CS1.5快捷键

《黑神话悟空》玩不起,玩起了23年前的cs1.5 B11:USP(警察自带手枪) B12:Glock18(匪徒自带手枪) B13:Desert Eagle(沙漠之鹰) B14:P-228 B15:Dual Berettas(匪…

git命令大全(git checkout ,git merge,git branch,git cherry-pick)

git stash 和git commit区别git文件状态命令手册git init git clone提交和修改git log远程仓库操作 git pull git push创建分支(增删改查)git checkout ,git branch ,git mergegit loggit taggit add, git stash ,git rebase,git cherry-pick git stash …

AI绘画SD三分钟入门教程!秋叶大佬8月最新的Stable Diffusion整合包V4.9来了,完整安装部署教程奉上,附各种模型插件一次性用爽!

大家好,我是画画的小强 前几天8月15日,国内AI绘画工具开源大佬更新了StableDiffusion整合包最新版本4.9,相关信息从图中能看到,本次更新后SD WebUI已经能够支持最新的AI绘画大模型SD3.0,以及更新了SD最强的控制插件Co…

nvm 安装老的node,npm版本

1、今天想安装一个老的node与npm版本,但出现问题,安装不了 2、后来修改settings.txt文件增加如下: node_mirror: https://npmmirror.com/mirrors/node/ npm_mirror: https://npmmirror.com/mirrors/npm/ 否则因为现在访问https://nodejs.or…

Jmeter 性能测试实战教程

一、性能测试流程 进行性能测试前,我们首先需要了解一下性能测试大致分为哪些流程,这样才能保证测试过程有序开展: 1、性能需求分析 了解哪些业务需要(一般都是用户量大的核心业务,比如登录,查询等功能&…

HTML5休闲小游戏《切割大师》源码,引流、刷广告利器

HTML5休闲小游戏《切割大师》源码,直接把源码上传到服务器就能使用了! 下载链接:https://www.huzhan.com/code/goods467910.html

webpack--webpack的启用

1、创建项目目录结构 2、安装依赖 2.1 初始化项目 npm init -y 2.2 安装webpack和webpack-cli npm i webpack webpack-cli -D 2.3 打包 npx webpack ./src/main.js --modedevelopment “./src/main.js”是指定需要打包的文件 --mode是指定打包的环境--mode有两个值,…

【vue3|第27期】Vue Router 中的 Meta 属性:灵活控制与增强你的应用

日期:2024年8月23日 作者:Commas 签名:(ง •_•)ง 积跬步以致千里,积小流以成江海…… 注释:如果您觉在这里插入代码片得有所帮助,帮忙点个赞,也可以关注我,我们一起成长;如果有不…

Python优化算法11——螳螂优化算法(GOA)

科研里面优化算法都用的多,尤其是各种动物园里面的智能仿生优化算法,但是目前都是MATLAB的代码多,python几乎没有什么包,这次把优化算法系列的代码都从底层手写开始。 需要看以前的优化算法文章可以参考:Python优化算…

销售易CRM怎么样?如何自动同步?

销售易CRM是什么? 销售易CRM是一款企业级CRM软件,它利用先进的移动互联、社交网络和云计算技术,提供从营销、销售到服务的一体化解决方案。销售易CRM不仅是一个软件工具,更是一种企业经营管理理念,通过智能技术的应用…

【Hot100】LeetCode—105. 从前序与中序遍历序列构造二叉树

目录 1- 思路递归 2- 实现⭐105. 从前序与中序遍历序列构造二叉树——题解思路 3- ACM 实现 原题连接:105. 从前序与中序遍历序列构造二叉树 1- 思路 递归 前序:中左右中序:左中右 让前序的第一个元素作为中序的分割点 分割思路 1- 递归…

推荐一个java低代码开发平台-橙单

文章目录 前言一、项目介绍二、技术选型三、项目特点四、基础功能介绍五、源码下载六、官方文档总结 前言 大家好,今天为大家推荐一个开箱即用,快速开发的低代码平台。项目采用 Boot3 Flowable7 Sa-Token Vue3技术栈。 一、项目介绍 橙单中台化低代…

如何使用ssm实现基于SSM框架云趣科技客户管理系统

TOC ssm079基于SSM框架云趣科技客户管理系统jsp 绪论 1.1 研究背景 当前社会各行业领域竞争压力非常大,随着当前时代的信息化,科学化发展,让社会各行业领域都争相使用新的信息技术,对行业内的各种相关数据进行科学化&#xff…

Android compose OutlinedTextField 点击事件

点击 OutlinedTextField 响应点击事件 再OutlinedTextField外层包裹ExposedDropdownMenuBox,重要的是让点击事件关联 readOnly true,Modifier.menuAnchor()

[CLIP-VIT-L + Qwen] 多模态大模型源码阅读 - MultiModal篇

[CLIP-VIT-L Qwen] 多模态大模型源码阅读 - MultiModal篇 前情提要源码阅读导包逐行讲解 dataclass部分整体含义逐行解读 模型微调整体含义逐行解读 MultiModal类整体含义逐行解读 参考repo:WatchTower-Liu/VLM-learning; url: VLLM-BASE 前情提要 有关多模态大模型架构中的…

机器学习预处理

一、数据读取 数据的读取方式有多种,最终我们可以转化为numpy和pandas形式储存,方便后续的模型建立。 1.1 读取库的安装 需要用到的三个库 pip install pandas pip install numpy pip install openpyxl 1.2 库的使用 import pandas as pd ​ #### 1…

面向对象编程:深入PHP的封装、继承和多态性!

文章目录 面向对象OOP的核心概念定义类、创建对象构造函数和析构函数访问修饰符继承方法重写接口和抽象类静态方法和属性魔术方法 错误处理错误处理概述错误级别异常处理自定义异常设置错误处理忽略错误错误日志断言 总结 面向对象编程(OOP)是一种编程范…

设计资讯 | 这款受数学方程启发的平板桌:配集成黑胶唱片机和无线充电器

早在 1903 年,英国数学家亨利欧内斯特杜德尼就想出了将正方形变形为等边三角形的方法。这个技巧是将正方形分割成可重新排列的四个不同形状。这种方法经过一个多世纪的各种应用,仍然具有价值。 1986 年,建筑师 David Ben-Grunberg 和他的艺术…

加速打开gtihub的工具dev-sidecar

加速github,git clone, pip install 直接上工具链接 dev-sidecar code: https://github.com/docmirror/dev-sidecar dev-sidecar releases: https://github.com/docmirror/dev-sidecar/releases 不想看code的,直接点击 dev-sidecar releases…

Leetcode 1108. IP地址无效化

Leetcode 1108. IP 地址无效化 问题:给你一个有效的 IPv4 地址address,返回这个 IP 地址的无效化版本。 所谓无效化 IP 地址,其实就是用 "[.]" 代替了每个 "."。 方法1:对字符串挨个进行判断,如…