AI数字人克隆采集规范分享!

news2024/9/27 7:25:24

数字人直播的时代已经来临,使用青否数字人SaaS系统数字人源码:zhibo175)去生成数字人,那如何能得到自己想要的效果呢?需要注意一下几点:

一.摄影棚灯光方案

中型(15m²左右)摄影棚​

适用于美妆/珠宝等直播,近距离细节展示,高色彩还原度​

大型(20m²左右)站播适用​

适用于服装鞋帽/家居等,主播站立演示穿搭/使用效果的场景​

二.数字人克隆 - 视频采集规范

训练素材录制要求

1、视频时长:训练素材要求5-10分钟;

2、拍摄要求:推荐直接用剪映录制,如果用相机更好;分辨率要求 >= 1080*1920(推荐分辨率为4K),fps不能低于25帧;拍摄主要影响因素是噪音,其次是灯光。

3、噪音:录制时要求环境安静不能有噪音,爆音,回音,最好选择安静的环境拍摄,有降噪麦克风。

4、灯光:灯光要求保证人物脸部,嘴巴,牙齿等五官细节清晰可见,光线均匀,无阴影。

5、视频画面:人物头像不能超过屏幕1/3,人脸尺寸大于300*300px;录制时推荐绿幕背景,后期可以更换各种背景;绿幕平整无褶皱,人距离绿幕2米远。

6、口播内容:内容不限,推荐选模特熟悉的内容,准备6000字文稿;讲的过程说错也没关系,继续讲就可以;千万不要一直说重复的内容。

7、服饰妆造注意事项:避免反光材质衣物;避免半透丝纱材质衣物;避免蕾丝材质的衣物;避免与绿幕相近的衣物以及绿色元素;

首饰:避免佩戴宽松易滑动晃动的首饰,比如项链、容易晃动的耳环(耳钉是可以的)、带链子的眼镜;

妆发:妆容自然得体,头发整理好避免出现散发碎发以及发缝;

8、人物动作:动作自然,与应用场景匹配;动作尽量通用,避免指向性动作;手不挡脸,抬手不过肩;表情动作自然,避免大角度侧脸;避免身体晃动,避免大幅度和迅速的动作;口播时,嘴巴注意张开,口齿清晰,发音标准,说话速度不能太快;避免舔嘴,吞咽,撅嘴,皱眉,摸头,摸脸等小动作。

9、其他注意事项:人物面部不能有遮挡,灯光要求脸部轮廓,牙齿嘴唇清晰可见;人物不能过分瘦脸,美白,可能造成轮廓不清晰。

推理素材录制要求:

  1. 拍摄要求同训练视频一致;
  2. 素材要求20-30s;
  3. 录制过程中全程静默,不说话,前5s不动,中间做通用手势,肢体动作,表情动作自然,后5s不动。

三.声音克隆 - 音频采集规范

1、音频时长:有效音频时长20分钟,如果带口音,音频建议不少于30分钟;

2、录音准备

根据不同使用需求,准备5000字左右的文本内容,内容和应用场景(朗读、直播、日常讲话等)语境相符;

3、录音环境:录音环境安静,环境底噪小于40dB,可使用“分贝仪”APP测试录音环境底噪;

录制时保持无回音、无混响、无噪声等;

4、录音设备及录音参数:录音设备推荐降噪麦克风/小蜜蜂,条件允许建议使用防风棉衣或防喷罩;推荐使用48kHz采样率录制音频;推荐无损音质格式保存音频,如: wav、 fiv、m4a,不能使用压缩格式保存音频,如:mp3;

5、录音人:录音人不宜离麦太近,防止喷麦和录入呼吸声连贯说完一句话;发音清晰、吐字清楚,句与句之间断句清楚;

句与句之间停顿1~2秒;保持语境风格一致,避免多种情绪混杂。

按照以上要求去拍摄和录制,上传到青否数字人SaaS系统后台,生成数字人即可。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1310228.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Rust语言抓取在线考试平台的专业试题数据

不管你是学车也好,还是考各类证书,都离不开刷题,有些题库都是需要收费的,而且市面平台那么多,想要刷更多的题只能下载很多不同APP,因此,我写了一个Rust爬取试题的爬虫,将更多的分散的…

从 enable_if 了解模板元编程

前言 在阅读学习 ZLToolKit 源码时&#xff0c;从如下一段代码中了解到 enable_if 和 SFINAE 的概念&#xff0c;从而引入了对模板元编程的了解。 template<class R, class... ArgTypes> class TaskCancelableImp<R(ArgTypes...)> : public TaskCancelable { pub…

PHP基础 - 循环与条件语句

循环语句 1)for循环: 重复执行一个代码块指定的次数。 for ($i = 0; $i < 5; $i++) { // 初始化 $i 为 0,每次循环后将 $i 值增加 1,当 $i 小于 5 时执行循环echo "The number is: $i \n"; // 输出当前 $i 的值并换行 }// 循环输出结果为: // The number …

【一秒梵高】基于OpenCV4实现图像九种风格迁移

风格迁移 图像风格迁移、色彩填充与色彩变换等&#xff0c;严格意义上来说都属于计算机视觉任务中图像处理的分支。它们输入的是图像&#xff0c;输出的也是图像&#xff0c;过程实现图像到图像的内容与风格的转换&#xff0c;深度学习在这类图像处理任务上也取得了良好的效果…

改进了编排控制并增强了推理的可视性,Agents for Amazon Bedrock 现已上市

七月份的时候&#xff0c;我们推出了 Agents for Amazon Bedrock 预览版。如今&#xff0c;Agents for Amazon Bedrock 全面上市。 Agents for Amazon Bedrock 通过编排多步任务&#xff0c;有助于您加速生成人工智能 &#xff08;AI&#xff09; 应用程序的开发。代理使用基础…

【ARM Coresight 系列 2 文章 -- Trace32 对 APBIC 地址的配置 介绍】

请阅读【ARM Coresight SoC-400/SoC-600 专栏导读】 文章目录 APBIC RomtableTrace32 RESBREAKTrace32 ENRESETAPBIC Romtable 图 1 APBIC 网络图 如上图所示,如果想通过Trace32/DS-5 去访问 AP, 这个时候需要怎么做呢?可以看到 APBIC 中ROMTABLE 中 APB-AP 的偏移是0x002000…

2023 re:Invent|Amazon Q与Amazon CodeWhisperer面向企业开发者提效利器

本篇文章授权活动官方亚马逊云科技文章转发、改写权&#xff0c;包括不限于在 亚马逊云科技开发者社区, 知乎&#xff0c;自媒体平台&#xff0c;第三方开发者媒体等亚马逊云科技官方渠道 2023年&#xff0c;以GPT为代表的生成式AI引爆了新一轮技术热潮&#xff0c;短短一年的时…

Jenkins离线安装部署教程简记

前言 在上一篇文章基于Gitee实现Jenkins自动化部署SpringBoot项目中&#xff0c;我们了解了如何完成基于Jenkins实现自动化部署。 对于某些公司服务器来说&#xff0c;是不可以连接外网的&#xff0c;所以笔者专门整理了一篇文章总结一下&#xff0c;如何基于内网直接部署Jen…

【数据结构】栈和队列超详解!(Stack Queue)

文章目录 前言一、栈1、栈的基本概念2、栈的实现&#xff08;数组实现&#xff09;3、栈的基本操作3.1 栈的结构设计3.2 栈常见的基本函数接口 4、栈的实现4.1 初始化栈4.2 栈的销毁4.3 入栈4.4 出栈4.5 判空4.6 长度4.7 获取栈顶元素 完整代码Stack.hStack.cTest.c 二、队列1、…

排序-归并排序与计数排序

文章目录 一、归并排序1、概念2、过程3、代码实现4、复杂度5、稳定性 二、 计数排序1、思路2、代码实现3、复杂度&#xff1a;4、稳定性 一、归并排序 1、概念 是建立在归并操作上的一种有效,稳定的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已…

车载导航系统UI界面,可视化大屏设计(PS源文件)

大屏组件可以让UI设计师的工作更加便捷&#xff0c;使其更高效快速的完成设计任务。现分享车载导航系统科技风蓝黑简约UI界面、车载系统UI主界面、车载系统科技风UI界面、首页车载系统科技感界面界面的大屏Photoshop源文件&#xff0c;开箱即用&#xff01; 若需 更多行业 相关…

数据库动态视图和存储过程报表数据管理功能设计

需求&#xff1a;需要将ERP的报表数据挪到OA中&#xff0c;但是OA表单设计不支持存储过程动态传参&#xff0c;所以需要设计一个系统&#xff0c;可以手动配置&#xff0c;动态显示原本ERP的报表数据&#xff0c;ERP报表是存在数据库的视图和存储过程中 思路&#xff1a;因为E…

算法复习——6种排序方法的简单回顾

算法复习——6种排序方法的简单回顾 常见排序方法&#xff1a;冒泡排序、选择排序、插入排序、堆排序、归并排序、快速排序的简单回顾 冒泡排序 重复“从序列右边开始比较相邻两个数字的大小,再根据结果交换两个数字的位置” 在冒泡排序中&#xff0c;第 1 轮需要比较 n - 1…

整理b站黑马程序员C++课程中对于计算机视觉学习有所帮助的知识点。(重点用*标出)

文章目录 1、注释2、变量3、常量4、标识符5、整型 浮点型 字符型 字符串 布尔6、输入 输出7、逻辑运算法8、 程序流程结构9、三目运算符10、switch语句11、循环语句12、跳转语句13、*数组13.1一维数组名 14、二维数组15、**函数15.1、函数的调用15.2、函数的声明15.3、函数份文…

Android camera的metadata

一、实现 先看一下metadata内部是什么样子&#xff1a; 可以看出&#xff0c;metadata 内部是一块连续的内存空间。 其内存分布大致可概括为&#xff1a; 区域一 &#xff1a;存 camera_metadata_t 结构体定义&#xff0c;占用内存 96 Byte 区域二 &#xff1a;保留区&#x…

HarmonyOS--基础组件TextInput

TextInput 官方文档 TextInput组件https://developer.harmonyos.com/cn/docs/documentation/doc-references-V3/ts-basic-components-textinput-0000001427584864-V3#ZH-CN_TOPIC_0000001523968610__%E5%AD%90%E7%BB%84%E4%BB%B6 文本输入框组件 接口 TextInput(value?:…

【Python】用Python发邮件

准备工作 以新浪邮箱为例&#xff0c;进入账号管理&#xff0c;打开授权码并保存下来 用到的包 import smtplib from email.header import Header from email.mime.text import MIMEText 账号授权码准备 这里用的是前面记录的授权码&#xff0c;不是登录密码哦 email_hostsm…

40G AOC线缆全系列产品知识详解

40G AOC&#xff08;Active Optical Cable&#xff09;线缆作为高速数据传输的重要组成部分&#xff0c;在现代通信和数据中心应用中扮演着重要角色。本期文章我们将从其基本原理、应用领域、优势特点等方面对ETU-LINK 40G AOC全系列产品进行解析。 一、40G AOC全系列产品解析…

Facebook广告投放常见错误

在进行Facebook广告投放时&#xff0c;很容易犯一些常见的错误。这些错误可能导致广告投资的浪费&#xff0c;影响广告效果并降低回报。本文小编讲一些常见的Facebook广告投放错误&#xff0c;以及如何避免它们。 1、不明确目标受众 广告的成功与否很大程度上取决于你选择的目…

基于Java+Swing+mysql学生选课成绩信息管理系统

基于JavaSwingmysql学生选课成绩信息管理系统 一、系统介绍二、功能展示三、项目相关3.1 乱码问题3.2 如何将GBK编码系统修改为UTF-8编码的系统&#xff1f; 四、其它1.其他系统实现 五、源码下载 一、系统介绍 学生教师信息管理、年级班级信息管理、课程信息管理、选课、成绩…