从短视频到AIGC,快手字节重开一局

news2024/9/19 9:27:11

作者 | 辰纹

来源 | 洞见新研社

从短视频到剪辑工具,从电商到外卖,再到如今的AIGC大模型,快手和字节的竞争从来就没有停止过。

通用大模型方面,快手有快意,字节有豆包;AI图片创作快手有可图,字节有星绘;视频生成大模型,快手有可灵,字节用即梦相对,此外在AI音乐、剪辑工具、社交产品、特效制作等多个领域,快手和字节都有相应的AIGC产品形成竞对。

图片

制表:洞见新研社

短视频的主航道上,快手和字节打了个半斤八两,如今转向到AIGC的未来之争,两方的一举一动同样颇具关注。

01 针锋对麦芒

公开资料显示,为了跟上席卷全球的大模型行业潮流,字节跳动去年抽调了内部的高层管理和业务骨干组建了新的AI部门Flow。

前TikTok产品技术负责人朱文佳任Flow的业务负责人、字节跳动产品和战略副总裁朱骏任产品负责人,字节跳动技术副总裁洪定坤担任技术负责人,三方协同合作推进AI进程。

基础大模型方面,字节跳动去年8月上线了首个大语言模型“豆包”及多模态大模型BuboGPT。此外,字节跳动基础模型在语言和图像两种模态上均进行了布局,两个团队均向TikTok技术负责人朱文佳汇报。

AI应用层方面,Flow目前已推出三款AI产品,豆包、扣子和Cici。

其中,豆包为一款类GPT应用,可以完成问答、文本生成、语言翻译等多种任务,还可以根据用户需求和上下文进行自适应问答,提供个性化服务。

扣子是一站式AI Bot开发平台,无论用户是否有编程基础,都可以在扣子平台上快速搭建基于AI模型的各类问答Bot,可完成解决简单的问答,并处理复杂逻辑的对话。

为了加强AI战略,字节的其他部门也没闲着,包括剪映、巨量引擎、抖音主端、抖音电商、飞书等部门,都在加码各自的AI业务,成果陆续落地。

快手同样是在去年年初启动了新AI战略。

2023年Q3财报会议上,快手CEO程一笑介绍,快手的语言大模型-快意130亿和660亿大模型已达到行业内同等规模领先水平,同时也已经开始超千亿规模语言大模型以及多模态大模型的研发。

有媒体报道称,快手AI主要由快手AI技术团队(此前的快手Y-tech部门)负责。

具体的业务布局则是建立了以快意大模型为基础的AI服务平台,面向市场提供AI技术服务,产品服务涵盖计算机视觉、计算机图形学、自然语言处理、音频技术、视频技术、知识图谱、机器学习、AR/VR/MR、多模态等核心技术领域。

今年2月,继ChatGPT之后,OpenAI公布的Sora AI视频生成模型再度引爆全网。

然而从5月份开始,国内达到类Sora级别的AI视频模型技术陆续公布,快手也在6月6日推出AI视频生成模型可灵,并进行邀测,由于可灵的生成效果直逼Sora,引发行业关注。

猎豹移动董事长傅盛在体验过快手可灵后给与了高度评价,“甚至我觉得也吊打了Sora,我认为这个产品今天,在我能使用的范畴内就是全世界第一的”。

02 心智争夺战

无论在AIGC中的投入有多少,产品的宣传有多炫目,其最终的目的还是要让这项产品用起来,特别要让普通人用起来,因而从这一视角来看,大模型竞争的本质,是终端心智的争夺。

在这方面,字节的豆包显示出非常强的竞争力。

根据QuestMobile的统计数据,截至今年3月,豆包月活用户已达到2328.2万,排在豆包身后的文心一言、天工、讯飞星火、Kimi智能助手的月活用户数分别为1466.1万、966.1万、620.4万、589.7万。

而豆包官方数据显示,其移动和桌面双端月活跃用户已经超过 2600 万。同时,这些用户还共同创造了800多万个智能体。

基于豆包大模型,字节跳动还打造了AI应用开发平台“扣子”,互动娱乐应用“猫箱”,AI分身创作应用“星绘”等一系列产品。

在字节跳动内部,抖音、番茄小说、飞书、巨量引擎等50多个业务接入到豆包大模型,用来提升效率和优化产品体验。

由内及外,OPPO小布助手、荣耀MagicBook的YOYO助理、华硕笔记本电脑豆叮AI助手、极氪汽车的座舱大模型等均已接入字节的大模型服务。

可以注意到,从C端的APP用户,到B端的千行百业,豆包不仅使用量大,应用场景也非常丰富。据悉,目前豆包日均处理文本1200亿Tokens,生成 3000 万张图片。

不难看出,字节凭借着原本业务的用户基础,采用了打造平台型产品,围绕平台型产品建立其他关联产品生态的策略,这一幕与字节早期“APP工厂“时代极为相似。

快手的快意大模型具备与豆包相似的能力,只是快意目前更多应用在快手内部,主要为短视频、直播、广告、电商等业务服务。

快手官方公布的数据称,半年来,有近2万商家在快手平台借助大模型能力实现智能化经营,获得不菲回报。相比今年1月,今年6月的AIGC月活跃客户数增长了8倍,月GMV规模提升了64倍,平台AIGC广告收入规模提升了12倍。

快意之外,可灵是快手的另外一个心智争夺杀手锏。

其实不光是傅盛,很多科技博主、AI创作者们对可灵的表现也是大为赞赏。

AI创作者娜娜在体验过可灵后认为,人物一致性是可灵的一大亮点,并且可灵更加擅长真实画风,表现比较好的是美女、动物、吃东西等画面的生成。

与另外两个国外视频生成软件Runway和Luma进行对比,可灵在文生视频之外,比Runway多了一个图生视频的功能,比Luma的生成结果更加稳定。

也正是因为表现出色,引来了众多用户参与到可灵内测的申请之中,根据快手官方公布的数据显示,早在7月份时就已经有超过50万的用户申请可灵的内测资格,视频生成数量达700万。

不难看出,可灵的产品在技术上有突破,快手在视频生成赛道的布局也是极具策略的,用猎豹傅盛的话来说,“可灵的成功,更加证明了,Sora并不是一项技术性突破,而是产品型图片”。

03 决胜点在商业化

大模型的业务布局,快手和字节各有侧重,然而大模型的竞争最终的落脚点还是在商业化上,不光要用户爱用,还要用户愿意花钱来用。

在这方面,快手和字节也呈现出不同的思考方向。

我们先来看字节对豆包的定位,从产品形态来看,豆包是一个综合性的AI智能体平台,这也就意味着字节对豆包有着更大的野心,即不光光是为原有业务赋能,更希望豆包能够成为一个新的营收增长点。

因而在应用设计上,字节着重解决了豆包的“拟人化”“离用户更近”和“个性化”的问题,为了让更多的人体验到豆包,除了基础的免费服务之外,字节还着手大幅降低豆包的收费标准。

根据字节官方公布的数据,豆包主力模型 Pro-32k 版本模型推理输入价格为0.0008元/千Tokens,0.8厘就能处理 1500 多个汉字,比行业同等模型便宜99.3%;128k型号价格为0.005元/千Tokens,比行业价格低95.8%。

豆包的价格之所以定的这么低,字节认为有两点,一是需要做到这么低,另一个是自己能够做到这么低。

前者很好理解,只有足够低的价格,才会降低企业用户的试错成本,增强企业用户的信心,尝试大模型。

后者则是出于对行业趋势和自身能力的一种判断。

零一万物CEO李开复曾表示,大模型推理成本每年降低十倍,这在过去两年已经发生,优化得好更是可以降低二三十倍。

字节则通过模型结构优化、分布式推理、混合调度等举措,极大压低了大模型的推理成本,模型的调用量越大,成本的优化空间也就越大。

价格是豆包的留给行业最醒目的标签,更重要的是,通过一系列操作,字节打了一个样,为行业创作了一个大模型商业运营的范式。

相比之下,快手AIGC业务的商业化进程就要慢一些,如上文所述,快意更多为快手的自身业务赋能,可灵的想象空间虽大,但快手目前对可灵无明确的商业计划,也不对外提供API。

快手视觉生成与互动中心负责人万鹏飞在一次演讲中,谈到可灵的未来时曾提到,“视频创作的门槛和效果的ROI大幅度提升,视频创作者和消费者界限逐渐模糊。越来越多消费者变成创作者,对于视频创作生态的繁荣是非常有价值的。”

由此可见,不断强化自己的短视频生态,将长板持续做长也未尝不是一个较好的商业化路径,通过内部验证之后的技术产品输出,其能量往往更大。

04 结语

创新工场联合创始人汪华曾做过一个统计,虽然最近大家看到很多产品在大量推广,用户量也在迅速增长,但是把所有应用加在一起,日活也不过就是1000万,中国有12亿网民;而美国3亿人口就有大几千万的日活,相比之下还有很大的差距。

李彦宏也呼吁行业不要卷模型,要去卷应用,没有应用,光有一个基础模型,不管是开源还是闭源都一文不值。    

这也是说,虽然AI未来已来,但是大模型的产品化还远远没有到来,用AI赚钱的时代才刚刚开始。

投身于时代潮流之中,快手有机会,字节有机会,你和我也有机会。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2080294.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

docker续3:

一、使用Dockerfile创建应用镜像 在Docker file中定义所需要执⾏的指令,使⽤ docker build创建镜像,过程中会按照dockerfile所定义的内容进⾏打开临时性容器,把docker file中命令全部执⾏完成,就得到了⼀个容器应⽤镜像&#xff…

星河社区升级命令行工具,一站式完成大模型实训

飞桨PFCC社区成员卢畅贡献。卢畅,飞桨 PFCC 成员,飞桨开源之星,飞桨开发者专家(PPDE),长期参加飞桨黑客松、护航计划等开源活动,参与过飞桨执行器预分析性能优化、静态图自动并行架构升级等任务…

SpringBoot项目整合智谱AI + SSE推送流式数据到前端展示 + RxJava得浅显理解

项目背景: 项目背景是一个这个AI答题应用平台,我引入AI得作用就是让AI根据我指定得这个题目的标题和描述来生成一些列的题目。(主要功能是这个,但是还用了AI给我评分,不过这个功能比较简单,在本文就简单介…

python可视化-条形图

1、加载数据 import pandas as pd import seaborn as sns import matplotlib.pyplot as plt# 导入数据 df pd.read_csv(E:/workspace/dataset/seaborn-data-master/tips.csv) df.head()2、基于seaborn的条形图 # 利用barplot函数快速绘制 sns.barplot(x"total_bill&quo…

Python从0到100(五十三):机器学习-决策树及决策树分类器

前言: 零基础学Python:Python从0到100最新最全教程。 想做这件事情很久了,这次我更新了自己所写过的所有博客,汇集成了Python从0到100,共一百节课,帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、 计算机视觉、机器学习、神经网络以及人工智能…

中微8S6990 EEPROM踩坑记录

中微8S6990 EEPROM内容丢失解决记录 问题描述: 问题程序如下: void temp_remember(uint16_t temperature,uint16_t address_H,uint16_t address_L) {uint8_t temp,temp1 0;temp temperature>>8;temp1 temperature;FLASH_UnLock();FLASH_Erase_DataArea(address_H);…

虹科方案 | 领航智能交通革新:虹科PEAK智行定位车控系统Demo版亮相

导读: 在智能汽车技术发展浪潮中,车辆控制系统的智能化、网络化已成为行业发展的必然趋势。虹科PEAK智行定位车控系统,集成了尖端科技,能够实现车辆全方位监控与控制的先进系统。从实时GPS定位到CAN/CANFD信号处理,虹科…

漏洞挖掘 | 记一次Spring横向渗透

0x1 前言 这篇文章给师傅们分享下,前段时间的一个渗透测试的一个项目,开始也是先通过各种的手段和手法利用一些工具啊包括空间引擎等站点对该目标公司进行一个渗透测试。前面找的突破口很少,不太好搞,但是后面找到了spring全家桶…

2024.8.27

130124202408271012 DATE #:20240827 ITEM #:DOC WEEK #:TUESDAY DAIL #:捌月廿肆 TAGS < BGM "Dragonflame--Kirara Magic" > < theme oi-contest > < theme oi-data structure Segment > < [空] > < [空] > 渊沉鳞潜&#xff0c…

搜维尔科技:Manus VR高精度手部动作捕捉数据手套为人形机器人、人工智能和人机交互赋能

Manus Quantum数据手套能够提供实时端到端的手部动作数据流与高精度数据集&#xff0c;助力人形机器人实现快速发展。 Quantum量子数据手套采用毫米级精度的磁性指尖跟踪传感器&#xff0c;融入尖端的EMF磁性定位追踪技术&#xff0c;无漂移&#xff0c;能提供高度准确且可靠的…

波导阵列天线学习笔记5 工作在K/Ka频带上的紧凑的共口径双频双圆极化波导天线阵列

摘要: 在本文中&#xff0c;一种紧凑的共口径双频双圆极化天线阵列被提出在K/Ka频段的全双工卫星通信中来实现高增益和宽带宽。所设计的天线阵列可以同时在20GHz频带实现右旋圆极化辐射同时在30GHz频带实现左旋圆极化辐射。此阵列包括圆极化波导天线单元和全公司馈网。脊频谱极…

CTFHub-SSRF过关攻略

第一题&#xff0c;内网访问 一&#xff0c;打开web/ssrf/内网访问 二&#xff0c;进入页面什么都没有查看一下上一步给的参数 三&#xff0c;输入http://127.0.0.1/flag.php回车显示flag 四&#xff0c;然后复制提交&#xff08;恭喜通关&#xff09; 第二题&#xff0c;伪协…

Glide生命周期监听原理以及简单应用利用空Fragment代理Activity

Glide关于生命周期监听的原理解析以及简单应用 文章目录 Glide关于生命周期监听的原理解析以及简单应用1.Glide生命周期监听原理1.1 从Glide初始化开始分析1.2 原理总结 2.简单应用2.1 应用场景1-主题切换之昼夜模式变化监听2.2 应用场景2--SDK打开特定应用或Activity 3.总结 相…

docker的部署及基本用法

目录​​​​​​​ 1 docker 介绍 1.1 什么是docker&#xff1f; 1.2 docker在企业中的应用场景 1.3 docker与虚拟化的对比 1.4 docker的优势 1.5 容器工作方式 2 部署docker 2.1 配置软件仓库 2.2 docker 安装 2.3 配置docker 镜像加速器 2.4 启动服务 2.5 激活内核网络选项…

ctfhub-web-SSRF通关攻略

一、内网访问 1.打开ctfhub给的环境地址 2.观察题目 发现让我们访问127.0.0.1下的flag.php 在地址栏后面有一个url参数 ?urlhttp://127.0.0.1/flag.php 提交即可 二、伪协议读取文件 1.打开ctfhub给的环境 2.观察题目 发现让我们读取flag.php文件 读取文件用到的协议是…

2024最值得购买的耳机?开放式耳机测评

在2024年&#xff0c;多款开放式耳机在市场上备受关注&#xff0c;它们各具特色&#xff0c;满足了不同消费者的需求。今天甜心根据当前市场情况和用户反馈&#xff0c;为大家推荐几款最值得购买的开放式耳机&#xff1a; 虹觅HOLME Fit2 虹觅HOLME Fit2是一款集颜值、舒适度、…

WireShark网络分析~环境搭建

一、虚拟网络设备搭建 &#xff08;一&#xff09;eNSP介绍 网络由网络设备和计算机构成&#xff0c;eNSP是模拟网络拓扑关系的软件。 &#xff08;二&#xff09;eNSP下载 华为官网&#xff1a;https://forum.huawei.com/enterprise/zh/thread/blog/580934378039689216 &am…

2k1000LA 调试4G

问题&#xff1a; 其实算不上 调试&#xff0c; 之前本来4G是好的&#xff0c;但是 我调试了触摸之后&#xff0c;发现4G用不了了。 其实主要是 pppd 这个命令找不到。 首先来看 为什么 找不到 pppd 这个命令。 再跟目录使用 find 命令&#xff0c;能够找到这个命令&#…

python可视化-密度图

1、加载数据 import pandas as pd import numpy as np from sklearn.datasets import load_iris import warnings# 禁用所有警告信息 warnings.filterwarnings(ignore)# 加载数据 iris load_iris() iris iris.keys() df pd.DataFrame(iris.data, columnsiris.feature_names)…

【JS】localeCompare实现中文排序

如何对两个中文进行字典顺序排序&#xff0c;如’本’拼音首字母’b’&#xff0c;‘初’拼音首字母’c’&#xff0c;所以’本’<‘初’。 JS默认根据编码顺序排序 使用localeCompare即可&#xff0c;如 ‘本’ < ‘初’ 则返回负数 使用方法 referenceStr.localeComp…