heygen的前世今生

news2024/10/6 22:32:43

heygen

  • 关于徐卓&梁望
  • 国内创业&诗云科技
  • 成立heygen
  • 为什么原班人马在国内做和国外做产品,造成的结果如此迥异?
  • 技术原理

关于徐卓&梁望

徐卓本科毕业于同济大学,硕士毕业于卡内基梅隆大学计算机专业,之后在 Snap 工作了 6 年,是该司前100号员工,广告事业部 No.2 工程师,核心技术 Leader;曾在6 年间从 0 到 1 搭建 Snapchat 广告平台、推荐算法系统以及机器学习平台 Barista(百亿级数据), 并负责 AI Camera 的技术及产品研发。

期间在商业化,推荐算法,机器学习平台,以及公司产品中担任核心角色。尽管技术上的实力不俗,但徐卓认为市场需求才是第一位。由于在 Snap 工作期间就意识到跨境电商企业对广告中“替换人脸”需求,徐卓创立公司就把广告和电商行业作为首个落地场景。

另一位联创兼CPO为梁望,本科也来自同济大学,硕士毕业于CMU人机交互专业,曾任字节跳动北美设计Lead。带领企业级产品设计及创新产品项目探索;曾任 Smule 设计总监,负责千万级月活产品、跨国团队管理、开创内部方法论以及带领开拓视频、直播等业务,累计提升 UGC 总量超过 10 倍。

国内创业&诗云科技

刘慈欣的《三体》,为我们大胆描绘了宏伟壮阔的外星文明;他的另一部小说 《诗云》,却凸显着人类创造的力量:在诗仙李白的千古绝句前,外星文明的强大力量也难以匹敌,最终放弃侵略地球。

儿时,徐卓脑子里总是有各种奇思妙想,“但每次画出来后,(作品)跟电视上看到那些完全不一样。”由于技巧和材料的限制,大多数人的奇思妙想没有来得及付诸实现,就渐渐被淡忘。

现在,“诗云马良”作为诗云科技内容生成引擎的一部分,让梦想得以实现 :用户只需输入创意和内容,AI就像神笔马良的神奇画笔一样帮你呈现。

2020年底,诗云科技在深圳成立,愿景是用AI生成内容,即通过构建一套完整的内容生产系统,来革新内容创作过程,代替摄像头,让用户以更低成本完成内容创作。其核心技术是深度学习、生成对抗网络(GAN)、强化学习和3D建模。

第2年,诗云科技宣布获得数百万美元天使轮融资,投资方是红杉中国种子基金和真格基金。本轮融资主要用于技术研发、产品迭代和市场拓展。同年8月份,又拿到了数百美元的Pre-A轮融资
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

创业后,徐卓发现市场对3D内容如虚拟人、交互场景的需求和关注在迅速增长,许多客户都提出了对3D内容的需要。

2022年,由于国内市场不温不火,经营不善,徐卓团体打算放弃国内市场,转而国外市场,诗云科技服务器停止。

成立heygen

2022年底,徐卓团队沿用原班人马,远赴大洋对岸,在LA成立heygen公司。整个团队也只有约30人,分布在3个大陆、4个国家和6个城市,以远程办公进行。

在这里插入图片描述

Heygen 从 2022 年 7 月推出后用了 178 天就达到 100 万美元的 ARR,217 天达到“拉面盈利”状态。虽然官方没有披露最新数据,但从网站访问情况看,Heygen 在 9 月份的访问量同比暴增 92%,位居国内出海 AI 产品榜首位,相信营收数据应该也会大幅增加。

在这里插入图片描述

为什么原班人马在国内做和国外做产品,造成的结果如此迥异?

原因是多方面的,首先,人工智能的高地在美国,全球最顶尖的人才在美国,最先进的 AI 芯片也在美国。智涌时代在《AI 人才抢夺战:年初疯狂,年末彷徨》一文中就说得很明白,国内人工智能人才捉襟见肘,即便开出千万年薪也很难从美国挖来人才。为什么?很现实的问题,一个人好不容易在美国读书,留下工作,娶妻生子拿到美国绿卡,再回国内发展面临的诸多问题如何解决?在美国搞 AI 研究,芯片管够。在国内,四五百张 GPU 往往是一个项目组能够申请到的算力上限。

此外,方向不对,努力白费。国内做 SaaS 产品是个天坑。今年 7 月,一篇《中国市场不需要 SaaS》的文章刷屏。确实,当一个行业做了 8 年,全行业绝大部分玩家依然不赚钱,可能就是错付了。而且,国内用户白嫖成性,喜欢免费薅羊毛,对 SaaS 产品付费意识弱。梁望在接受媒体采访时也认为,“欧美地区对于 SaaS 的接受度、付费意愿和市场体量相比国内高很多。”

用为王道。创造一款产品,要有人用才有价值。Heygen 在推出前在 Fiverr 市场上测试了用户的反映,结果真的有人愿意付费使用,这证明产品方向没问题。一款产品实现从小部分人用到大规模采用,也需要一些小窍门。比如邀请新人获得积分,用户生成的视频里面打水印,增加品牌曝光度等。保持产品快速迭代也很重要,大多数互联网公司通常是每两周发布一次,Heygen 是每周发布一次。Bug 是不可避免的,但不是每个 Bug 都值得优化,团队要将精力用在紧急而重要的事情上。

在这里插入图片描述

技术原理

https://www.cifnews.com/article/151250

HeyGen背后的技术原理并不复杂。HeyGen中的文本翻译部分采用了GPT模型,语音转文字采用了whisper模型,声音克隆和新音频生成采用了so-vits-svc模型,最后的口型匹配采用了GeneFace++模型。通过整合优化这些开源模型,HeyGen才实现了当前流畅的一键中英文语音转换效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1841959.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ITSS案例分享 — 强化网络安全保障水平

某科技有限公司成立于2001年,是中国网络安全产业领跑者,于2000年发力安全业务,在云安全、身份安全、终端安全、态势感知、高级威胁治理,以及威胁情报领域等拥有多项全球领先技术,在核心技术领域持续领跑;同…

【每日刷题】Day70

【每日刷题】Day70 🥕个人主页:开敲🍉 🔥所属专栏:每日刷题🍍 🌼文章目录🌼 1. 922. 按奇偶排序数组 II - 力扣(LeetCode) 2. 905. 按奇偶排序数组 - 力扣&…

【会议征稿,CPS出版】第四届管理科学和软件工程国际学术会议(ICMSSE 2024,7月19-21)

第四届管理科学和软件工程国际学术会议(ICMSSE 2024)由ACM珠海分会,广州番禺职业技术学院主办;全国区块链行业产教融合共同体,AEIC学术交流中心承办,将于2024年7月19-21日于广州召开。 会议旨在为从事管理与软件工程领域的专家学…

瑞尼克RNK聚四氟乙烯注射器刻度清晰纯净

四氟注射器用于抽取或者注入气体或者液体,四氟注射器由前端带有小孔的针筒以及与之匹配的活塞芯杆组成,用来将少量的液体或其注入到其它方法无法接近的区域或者从那些地方抽出,在芯杆拔出的时候液体或者气体从针筒前端小孔吸入,在…

程控漏电流测试电阻箱的应用

程控漏电流测试电阻箱是用于测量和控制电流的设备,广泛应用于电力系统、电子设备、自动化设备等领域。它的主要功能是通过改变电阻值来控制电流的大小,从而实现对设备的保护和控制。 程控漏电流测试电阻箱在电力系统中有着重要的应用,电力系统…

数据分析第十讲:pandas 应用入门(五)

pandas 应用入门(五) 我们再来补充一些使用DataFrame做数据分析时会使用到的操作,这些操作不仅常见而且也非常重要。 计算同比环比 我们之前讲过一个统计月度销售额的例子,我们可以通过groupby方法做分组聚合,也可以…

火爆全网 LLM大模型教程:从零开始构建大语言模型,git突破18K标星

什么!一本书的Github仓库居然有18.5k的星标!(这含金量不必多说) 对GPT大模型感兴趣的有福了!这本书的名字叫 《Build a Large Language Model (From Scratch)》 也就是 从零开始构建大语言模型! 虽然这是一…

软件构造 | Equality in ADT and OOP

软件构造 | Equality in ADT and OOP 🧇1 Three ways to regard equality 1.1 Using AF to define the equality ADT是对数据的抽象, 体现为一组对数据的操作 抽象函数AF:内部表示→抽象表示 基于抽象函数AF定义ADT的等价操作&#xff0…

MySQL----事务的隔离级别(附带每一级别实例截图)

先来回顾一下事务并发可能存在的三大问题: 脏读(Dirty Read)–不能接受 一个事务读取了另一个事务未提交的数据。例如当事务A和事务B并发执行时,当事务A更新后,事务B查询读取到A尚未提交的数据,此时事务A…

探索客户端-服务器架构:网络应用和分布式系统的基石

目录 前言1 客户端-服务器架构概述1.1 客户端的角色1.2 服务器的角色 2 客户端-服务器架构的工作原理3 客户端-服务器架构的应用4 客户端-服务器架构的优缺点4.1 优点方面4.2 缺点方面 5 客户端-服务器架构的未来发展结语 前言 在当今信息技术飞速发展的时代,客户端…

【数据结构】第十八弹---C语言实现堆排序

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】 目录 1、堆排序 1.1、基本思想 1.2、初步代码实现 1.3、代码优化 1.4、代码测试 总结 1、堆排序 在博主数据结构第十二弹---堆的应用有详细讲解堆…

【SpringMVC】第1-7章

第1章 初始SpringMVC 1.1 学习本套教程前的知识储备 JavaSEHTMLCSSJavaScriptVueAJAX axiosThymeleafServletMavenSpring 1.2 什么是MVC MVC架构模式相关课程,在老杜的JavaWeb课程中已经详细的讲解了,如果没有学过的,可以看这个视频&…

kafka学习笔记07

Kafka高可用集群搭建节点需求规划 开放端口。 Kafka高可用集群之zookeeper集群搭建环境准备 删除之前的kafka和zookeeper。 重新进行环境部署: 我们解压我们的zookeeper: 编辑第一个zookeeper的配置文件: 我们重复类似的操作,创建三个zookeeper节点: 记…

最新暑假带刷规划:50天吃透660+880!

现在只刷一本题集根本不够 去做做24年的考研真题卷就什么都明白了,24年的卷子就是典型的知识点多,杂,计算量大。 而现在市面上的任何一本题集,都无法做到包含所有的知识点,毕竟版面有限! 所以&#xff0…

Python+Pytest+Yaml+Allure接口自动化测试框架详解

PythonPytestYamlAllure整体框架目录(源代码请等下篇) 框架详解 common:公共方法包 –get_path.py:获取文件路径方法 –logger_util.py:输出日志方法 –parameters_until.py:传参方式方法封装 –requests_util.py:请求方式方法封…

《人工智能导论》书面作业

第 1 章:绪论 1、分别解释人工智能的三个主要学派的代表人物和主要思想,并给出每个学派的一个实际应用实例。 符号主义(Symbolists 或 逻辑主义): 代表人物:马文闵斯基(Marvin Minsky&#xf…

SEO工具,SEO优化人员必备工具

工欲善其事必先利其器,现在是一个讲究效率的时代,学会使用工具,往往能事半功倍!使用SEO工具可以帮助你更有效地进行关键词研究,创建高质量的内容,以及建立高质量的外部链接。通过这些工具,你可以…

全面赋能,永久免费!讯飞星火API能力正式免费开放

2023年5月,讯飞星火正式发布,迅速成为千万用户获取知识、学习知识的“超级助手”,成为解放生产力、释放想象力的“超级杠杆”。 2024年5月,讯飞星火API能力正式免费开放,携手生态开发者加快大模型赋能刚需场景。 领…

嵌入式开发十九:SysTick—系统定时器

在前面实验中我们使用到的延时都是通过SysTick进行延时的。 我们知道,延时有两种方式:软件延时,即CPU 循环等待产生的,这个延时是不精确的。第二种就是滴答定时器延时,本篇博客就来介绍 STM32F4 内部 SysTick 系统定时…

如何手撸一个自有知识库的RAG系统

RAG通常指的是"Retrieval-Augmented Generation",即“检索增强的生成”。这是一种结合了检索(Retrieval)和生成(Generation)的机器学习模型,通常用于自然语言处理任务,如文本生成、问…