AI复活亲人市场分析:技术、成本与伦理挑战

news2024/7/2 3:29:29

“起死回生”这种事,过去只存在于科幻电影里,但今年,被“复活”的案例却越来越多。

2月底,知名音乐人包晓柏利用AI“复活”了她的女儿,让她在妈妈生日时唱了一首生日歌;3月初,商汤科技的年会上,刚刚去世不久的创始人汤晓鸥以数字人的形式被“复活”,并进行了风格独特的演讲;近日,有网友用AI技术“复活”了李玟、乔任梁等已逝明星,掀起了巨大的争议。

与逝去的亲人“再见面”这门原本隐秘小众的生意,开始频繁出现在公众视野中。但由于所用技术不同,价格和效果也各不相同。

花10元,可以让去世亲人的照片“眨眼”,背后是简单的图像处理技术;花费千元,可以通过AI换脸变声技术与未能告别的亲人视频通话;花费万元,能够与屏幕中亲人的克隆数字人进行聊天,这种数字人能够说话、行动和表现表情,真实感更强。

“AI复活”是一门有强烈需求的生意,潜藏着数亿级市场,然而涉足这一领域的商家鱼龙混杂。有的下载软件就能制作“会说话的照片”进行售卖;有的数字人服务商在向企业售卖直播、会展、主持人等数字人服务之外,开发了面向个人的数字人定制APP;还有一些商家,通过自研+接入第三方技术接口的方式,为用户提供定制化服务。

未来,“AI复活”或许会像拍照一样普遍,但其中也存在数据隐私和法律伦理等问题。有业内人士警告称,AI换脸变声技术的成熟可能被一些人利用,以用户对亲人的思念和信任实施诈骗,因此他提醒大家“回忆虽好,谨防被‘割’”。

 “复活”亲人,需要多少钱?

目前市面上的“AI复活”产品,根据成本和技术难度分为三个等级,对应着用户在“复活”亲人后与之“再见”的三种方式。

最低档次是照片驱动,即俗称的talking photo(会动的照片)。前几年就有类似的APP火了一阵子。利用深度学习和图像处理等技术,可以让照片中的人物嘴巴和眼睛动起来;若要让照片中的人开口说话或唱歌,则需用到唇语匹配和语音生成技术。这些技术已经成熟且开源,量产后单次成本可以压缩到10元以内。据有10年AI创业经验的极链科技创始人&总裁董慧智介绍。

第二档次是表情捕捉驱动的伪直播,通过将真人模特替换成逝者的形象和声音,实现语音电话或视频通话互动,或者生成祝福短视频等。这里涉及语音克隆、AI换脸、动捕(表情捕捉)、深度伪造(deepfake)等技术。这种方式特别讨巧,技术并不新鲜,部分AI诈骗也采用类似技术。动捕设备及人力成本较高,需要数千元。这类“AI复活”的视频片段在短视频平台播放量很高,通常是小辈为家中老人下订单,使用逝者的脸和声音与老人通话,称逝者在外工作,延续“善意的谎言”。老人往往看不出破绽,只是频频抹泪。

第三档次是近期火热的用数字人技术“复活”亲人。由于产品不同,成本也有所不同。通常通过收集人物生前的照片、声音等数据来克隆数字人的形象和声音,然后底层搭载大语言模型模拟逝者的思想,能与之进行实时的文字或语音交流。51数字人公司提供这项业务,创始人陈鸿介绍,一般产品交付的是一个带有数字人的屏幕,大屏如电视,小屏如iPad。用户登录账号后,可以看到逝去亲人的数字人形象,能够通过语音或文字与之互动,产品还提供语音电话叫醒服务。“定制类的‘复活亲人’业务,一般要5万元以上。”陈鸿称,客户大多是长期付费,后续不断在细节上调优,也有家族凑钱一起做的,要求更高。

“AI复活”对数据质量要求极高,被克隆者生前的照片、视频或语音样本越多、越清晰,数字人的相似度就越高。再输入一些个人特征数据,如兴趣爱好,才能模拟其性格。“素材不全,成本会增加。”陈鸿表示。因此,精度越高、数据越定制化,效果也越接近真人,价格也更昂贵。所谓的精度,主要体现在人物口型准确度、分辨率清晰度、动作复杂程度、服饰发型和表情丰富度、语音(音色、语气)相似度、是否有电音、是否有抑扬顿挫(多情感)、是否带交互、交互是否更贴合本人性格等。

在数字人领域,要完美克隆某个人的技术难度“上不封顶”。商汤科技“复活”创始人汤晓鸥就是一个例子。商汤科技数字空间事业群数字文娱事业部总经理栾青告诉「定焦」,为了还原汤老师的音容笑貌,采用了不同技术。整个制作过程中,商汤运用了自研的TTS语音生成大模型,截取了汤老师四、五段不同说话风格的声音作为prompt(提示),总声音素材不过十几秒,还原了汤老师的东北口音、音色、常用的语气词和语调以及冷幽默的风格。此外,商汤如影数字人技术团队使用汤老师之前清晰有效的视频,通过商汤自研的视频生成技术进行动作生成和场景过渡,还原走动、喝水等动作,以及微笑的表情。

受限于素材不多,以及算力和成本的考虑,目前很多数字人的视频和产品看起来仍然很“假”。“这些都不算是完整的‘复活’数字人,技术和服务的最高交付上限,无法满足人们的最低需求下限。”陈鸿称。形象不够像,只能用情绪价值来补充,在数字人的设计上加入一些交互细节。他举例说,比如一个客户的爷爷最喜欢老四,聊天时爷爷会突然提到下个月是老四的生日,家人要多聚、兄弟要和睦,客户就会被打动。

总的来说,前两档使用相对简单的图像处理、换脸和声音克隆技术,可以看到人脸、模仿声音,但由于成本低,效果粗糙。市面上见到的还原度较高且能动、能对话的,属于第三档数字人,越像越贵。

 谁在靠克隆人赚钱?

从过往的“复活亲人”案例来看,大部分不像真人且让人出戏甚至尴尬。而随着生成式AI技术的发展,栾青观察到,“AI复活”在技术上的可行性和真实度上都大幅提高,能让人投入、感动,从而激发更多需求。

由此,一条产业链应运而生。这条产业链上,有跟风商家、数字人服务商、AI从业者,还有专门做定制AI复活(复活或克隆亲人、明星、企业家等)的玩家。电商平台上,不少店铺提供“AI复活”服务,标价多为10元、50元。短视频平台上,也有不少人以“AI造梦”“AI疗愈”为名提供类似服务。“收费便宜、效果粗糙,但这是一个长期存在的长尾市场。”董慧智称。

淘宝上售卖的“让照片说话”服务图

这类生意也存在灰色空间。有短视频博主发布“复活”李玟、张国荣、乔任梁等已逝名人的视频,让他们开口唱歌和说话,虽然声称“旨在致敬和纪念,无商业目的”,但此类视频流量颇高,还有部分借此引流做“亲人复活”生意。同时,一些提供“AI复活”服务的店铺也注明“只做怀念,人脸识别请绕道”。

目前,技术成熟的数字人服务商和AI从业者,更多是将商业模式放在B端,如AI客服、数字人直播、AI老师、AI主持人、AI医疗等,有部分推出了面向C端的类似工具,但并未大规模宣传。网友曾用大模型初创公司MiniMax

推出的FacePlay产品,让数字人“复活”费玉清;公司推出了一款可多人实时互动的AI视频通话产品“心心”,曾吸引不少普通人用其来“复活”亲人,但公司尚未开展相关业务。MiniMax联合创始人杨斌称,“此类技术没有问题,关键在于应用是否妥当。”

多家数字人服务商告诉「定焦」,他们在收到B端客户需求时,不少是用于“克隆”特定人物,尤其是短视频平台上的虚拟主播,很多是参考现有红人进行数字人定制。此外,也有一些“复活”逝者的需求,但公司较为谨慎,通常用行业案例视频来回应需求。

由于“复活亲人”涉及数据隐私、法律伦理等问题,技术服务商在与客户对接时也较为小心。栾青称,商汤目前没有向C端推出“复活亲人”服务,“我们要尊重原始数据保护的法律和伦理边界。”目前,商汤的数字人应用主要还是基于角色扮演(IP)、主播、老师等场景,这些数字人没有特定的人格,只提供情绪、内容和情感。

更多公司选择与第三方公司合作提供服务。大模型和生成式AI公司出门问问联合创始人李志飞称,他们曾与殡葬企业永安堂合作推出“定制AI助手”,用AI与传统殡葬行业结合的模式,“复活”亲人。此外,51数字人也在与相关企业合作探索更多可能性。

也有一些创业公司直接涉足C端业务,研发相关技术并提供“复活亲人”的定制化服务。陈鸿介绍,51数字人曾有一些客户,是找亲朋好友凑钱一起下单,将逝者的形象和声音传到大屏上,然后装在家中某个位置,配合逝者的服装、发型、妆容等,提升家族仪式感,也给后辈一种情感寄托。“但这类服务依然小众。”

在更多从业者看来,数字人虽能做到越来越像,但仍无法取代真人。MiniMax的杨斌称,“即使科技再发达,人类依然是特殊的存在。” 在他看来,数字人只是一种工具,不能也不该有太高期待。

争议与风险:情感操纵?

越来越多的逝者被数字人技术“复活”,带来的不仅是情感的释放,也有技术滥用的风险。资深AI行业观察者陆嘉瑞告诉「定焦」,从实际使用效果看,用户对“复活亲人”的需求多是想要释放情感,但AI生成的音视频并不代表本人行为,“这是一种情感欺骗。”他称,当一个人面对“复活亲人”时的反应,并不是真实互动,这与“换头”短视频所带来的情感冲击不同,更可能引发不良影响。

同样,商汤科技的栾青也持保留意见。在她看来,虚拟人技术带来的是情感投射和共鸣,而数字人的使用应该有伦理边界,不能随意用技术操控情感。

另一个隐患是数据隐私和安全。去年,某明星就因私人照片被不法分子利用AI换脸技术制作不雅视频,产生恶劣影响。陆嘉瑞称,尽管AI生成的音视频并非真人,但其细节、情感表达等可能被利用,尤其是AI换脸变声技术成熟后,可能被一些人利用,以用户对亲人的思念和信任实施诈骗。

51数字人的陈鸿也警告称,用户在输入数据时应小心,尤其是语音数据,防止被不法分子获取并利用。他建议,“不要轻易分享个人数据,使用AI服务时要认准正规平台,避免数据泄露。”

此外,法律和伦理问题也是“AI复活”领域的难题。目前,国内尚无专门针对AI换脸和复活技术的法律法规。陆嘉瑞建议,相关部门应尽快制定法律法规,规范数字人技术的使用,避免技术滥用带来不良后果。

2015年,俄罗斯亿万富翁德米特里·伊茨科夫发出倡议,宣称到2045年将为所有人打造一副机器人身体来实现永生,这项计划面临一定争议。2022年,伊隆·马斯克在推特上提到已经将自己的大脑上传到云端,并与自己的虚拟版本交谈过,但有人认为这是马斯克在宣传自己的脑机接口公司Neuralink。

随着“AI复活”褪去神秘感,行业或许也会开始进入价格内卷的时代,如果不想出现“劣币驱逐良币”的情况,行业还需保持敬畏之心。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1877606.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ComfyUI汉化插件安装

步骤一:点击Manager 步骤二:选择安装插件 步骤三:搜索Translation,选择第一个点击右边得安装 步骤四:点击下放得RESTART进行重启 步骤五:等待重启完成后,点击设置 步骤六:选择中文语…

day02-Spark集群及参数

一、Spark运行环境变量问题(了解) 1-pycharm远程开发运行时,执行的是服务器的代码 2-通过本地传递指令到远程服务器运行代码时,会加载对应环境变量数据,加载环境变量文件是用户目录下的.bashrc文件 在/etc/bashrc 1-1 在代码中添加 使用os模块…

[方法] Unity 3D模型与骨骼动画

1. 在软件中导出3D模型 1.1 3dsmax 2014 1.1.1 TGA转PNG 3dsmax的贴图格式为tga,我们需要在在线格式转换中将其转换为Unity可识别的png格式。 1.1.2 模型导出 导出文件格式为fbx。在导出设置中,要勾选三角算法,取消勾选摄像机和灯光&#…

海康车牌识别 报警回调后程序崩溃

我用的32位 6.1.9版本SDK 回调会导致程序崩溃 咨询了下海康官方技术 答复如下:(此答复我没尝试 自行尝试 我的解决方法是更换了老版本 5.3版本 没什么问题 个人资源中有 自行下载

grpc学习golang版( 四、多服务示例 )

系列文章目录 第一章 grpc基本概念与安装 第二章 grpc入门示例 第三章 proto文件数据类型 第四章 多服务示例 第五章 多proto文件示例 第六章 服务器流式传输 第七章 客户端流式传输 第八章 双向流示例 文章目录 一、前言二、定义proto文件三、编写server服务端四、编写Client客…

【漏洞复现】安美数字酒店宽带运营系统——命令执行漏洞(CNVD-2021-37784)

声明:本文档或演示材料仅供教育和教学目的使用,任何个人或组织使用本文档中的信息进行非法活动,均与本文档的作者无关。 文章目录 漏洞描述漏洞复现测试工具 漏洞描述 安美数字酒店宽带运营系统 server_ping.php 存在远程命令执行漏洞&#…

3.3V到5V的负电源产生电路(电荷泵电压反相器)SGM3204输出电流0.2A封装SOT23-6

前言 SGM3204 非稳压 200mA 电荷泵负电源产生电路,LCEDA原理图请访问资源 SGM3204电荷泵负电源产生电路 SGM3204电荷泵负电源产生电路 一般描述 SGM3204从 1.4V 至 5.5V 的输入电压范围产生非稳压负输出电压。 该器件通常由 5V 或 3.3V 的预稳压电源轨供电。由于…

OpenGL3.3_C++_Windows(19)

Demo演示 1 几何着色器 几何Geometry glsl 发生在什么阶段? 图形渲染管线: 顶点数据——顶点着色器阶段——图元装配;(Geometry glsl )——光栅化阶段——裁切——片段着色器——测试和混合可选的Geometry几何着色器(…

龙芯久久派到手开机测试

今天刚拿到龙芯久久派,没看到文档,只有视频,我来写个博客,做个记录,免得以后忘记 1.连接usb转ttl串口与龙芯久久派,如图所示。 2.将usb转串口接到电脑USB口 也就是这个接电脑上 3.打开串口调试助手或Secu…

前端路由管理

前端路由管理简介: 当谈到前端路由管理时,通常指的是在单页面应用程序(SPA)中管理页面间导航和URL的过程。路由管理器是一个工具,可以帮助前端开发者定义应用程序的不同视图之间的关系,同时能够响应URL的改…

广东省钟表行业协会第十二届会员大会暨2024年钟表行业发展交流会

6月25日广东省钟表行业协会第十二届会员大会暨2024年钟表行业发展交流会在广州万富希尔顿酒店隆重召开。大会选举沙胜昔为广东省钟表行业协会第十二届理事会会长。 领导发言 新任会长 沙胜昔 首席荣誉会长 吴伟阳 新老会长交接仪式 本次大会,全国钟表大伽齐参与…

美业门店管理系统中收款门店对应的加盟商如何查看?美业系统源码、演示视频分享私

专业的美业系统更加贴合美业门店的经营需求,提供了更全面、便捷、高效的管理功能,有助于提升门店的服务质量和经营效益。博弈美业系统包括PC、iPad、手机、小程序四大端口,满足不同人群的各种需求。 ▶ 收款门店对应的加盟商如何查看&#xf…

找不到d3dcompiler_43.dll无法继续执行的修复指南

在电脑使用过程中,我们可能会遇到一些错误提示,其中之一就是“缺失d3dcompiler43.dll”。那么,这个错误提示到底是怎么回事呢?小编将从常见原因、对电脑的影响以及解决方法等方面进行详细解析。 一,了解d3dcompiler_43…

【高性能服务器】单进程服务器

🔥博客主页: 我要成为C领域大神🎥系列专栏:【C核心编程】 【计算机网络】 【Linux编程】 【操作系统】 ❤️感谢大家点赞👍收藏⭐评论✍️ 本博客致力于知识分享,与更多的人进行学习交流 ​ 单进程服务器 …

OLMo:真正完全开源的大模型

最近,又有一家机构AI2(Allen Institute for AI)开源了一个LLM:OLMo,它的英文全称就叫Open Language Model。相比之前开源的大模型,OLMo的独特之处是完全开源,除了训练的模型,OLMo还开…

2-requests模块(6节课学会爬虫)

2-requests模块(6节课学会爬虫) 1,安装requests2,发送get,post请求,获取响应3,response的方法方法一(Response.text)方法二(response.content.decode()&#…

综合评价 | 基于组合博弈赋权的物流系统综合评价(Matlab)

目录 效果一览基本介绍程序设计参考资料 效果一览 基本介绍 综合评价 | 基于组合博弈赋权的物流系统综合评价(Matlab) 组合博弈赋权(Weighted Sum)是一种常见的多目标决策方法,用于将多个目标指标进行综合评估和权衡…

【子串】3. 无重复的最长子串

3. 无重复的最长子串 难度:中等难度 力扣地址:https://leetcode.cn/problems/longest-substring-without-repeating-characters/description/ 题目看起来简单,刷起来有好几个坑,特此记录一下,解法比官网的更加简单&…

Json与Java类

简介 JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,易于人阅读和编写,同时也易于机器解析和生成。JSON数据由键值对构成,并以易于阅读的文本形式展现,支持数组、对象、字符串、数字、布尔值…

全国31省细分产品出口数据集(2002-2022年)

数据简介:整理全国31个省直辖市自治区按hs码分的22类细分产品的出口数据,只包含22类的细分,不包含更细的类目。可用来计算出口产品质量,出口产品技术复杂度等指标,数据区间为2002-2022年。 数据名称:31省细…