最近有好多人询问数字人的情况,昨天遇到一个客户,我把数字人作品发给他看,他说“不像”,我把国际上别人做得最好的数字人发给他看,他还是说“不像”,我就知道这个客户没得谈了。后来我把网易公司做的数字人、字节跳动公司做的数字人给他看,还有当前做得最好的3D动漫人物给他看,他才终于承认做这些都是很要成本的。他给我发了一个用AI一键生成数字人动画的视频给我看,里面一群人骑着车,人头变成猪头,车子变成飞机... 差点把我气死,原来他需要的效果是这样的。
还有现在很流行的做直播的数字人,这类数字人本质上他是用真实人物的视频分解再重新排列组合生成新的视频,技术含量低效果还不错,一年几千块钱也不贵,其实大多数人用这类数字人够用了,但是你用着用着就会发现局限性,他身上的反光不会随着周围环境光的变化而变化,这类数字人像纸片一样...
做一个3D数字人要经历拍摄人物面部照片,采集声音,3D人物建模,设计毛发、设计服装、设计场景、设计动作、生成嘴型和表情、设计灯光、摄像机转场动画,还需要准备一套话术文案,如果要求数字人实时对话还要接入AI大模型,不仅对计算机的性能要求高还对操作人员的技术要求也很高...
就拿拍摄人物面部照片来说,要求是正面照,垂直90度,如果是80度或者70度拍摄的照片需要对照片做处理纠正角度,要求照片色泽均匀,不能太亮或者太暗,不能有表情,龇牙咧嘴的那些照片都不行,这还只是中间一个环节。采集声音要求声音干净,环境噪音小。其实最难的部分是人物说话时口型的生成,若不是借助AI的帮助,单凭手工那是不可能完成的任务,总之做数字人是非常繁琐的,并不是大家认为的一键生成。
that girl
有做数字人需求的朋友欢迎和我联系,一起交流进步,另外做数字人的收益很大一部将支援墨家思想的推广和建设。