“混战”大模型,知乎、小红书、快手各有所长

news2024/11/17 13:21:24

配图来自Canva可画

一直以来,追逐风口都是互联网企业的天性。因此,继元宇宙风口之后,横空出世并火遍全国的AIGC和ChatGPT,便又成为了各行业企业追逐的焦点。在此背景下,无论是国内互联网大厂,还是科技公司,亦或是内容平台,但凡有些实力的玩家都纷纷下场,围绕AI大模型展开了一场激烈角逐,“千模大战”也就此拉开了帷幕。

一场基于大模型的创业浪潮开始席卷开来,国内陆续布局大模型的企业也如雨后春笋般争相涌现。只不过,与百度、阿里、华为这类打造通用大模型的“高端”玩家不同,知乎、小红书、快手等则选择了另辟蹊径。而作为内容问答、短图文、短视频等主流内容形式的代表,知乎、小红书、快手这些小巨头们对大模型的探索,自然也就成为了外界关注的重点。

竞逐大模型

大模型无疑是今年最热的风口,国内企业早就陆续宣布对大模型展开探索,而不管是投资还是自建,已经开始进场分羹的不在少数,知乎、小红书、快手自然也不会错过这班“列车”。众所周知,互联网大厂对大模型展开研发及相关布局,是高度符合其产业互联网战略的,而相比之下,知乎、小红书、快手这三个平台的进场,虽是意料之外,却也依旧在情理之中。

一方面,AI技术逐渐普及,玩家们充分受益于人工智能技术浪潮,自然不想错过这个时代的变革。AI技术的发展将会带来产业的进步和新机遇的诞生,而伴随着人工智能技术不断取得突破,AI大模型也呈现蓬勃发展态势。AI大模型浪潮席卷全球,只有先上牌桌,才能抓住规则这张“王牌”,因此,知乎、小红书、快手等玩家进军大模型就变得刻不容缓了。

另外,对于这些玩家来说,一旦别家的大模型落地,或会对其构成一定的威胁,而为了防范风险,入局就变得顺理成章了。进入AIGC时代,基于深度学习的大模型将极大提升内容生产的速度和数量。在此背景下,拥有了“技术优势”的竞争对手很可能会迅速突破知乎、小红书、快手的护城河,因此,布局大模型就变成了这些小巨头们保持竞争力的一种方式。

另一方面,在移动互联网红利消退的背景下,选择拥抱大模型,可以让这些玩家的内容变得更加多元化,有望带来新的增长点。由决策式AI到生成式AI的演变正在将大模型应用推向更加多元化的场景,知乎、小红书、快手等平台推出大模型产品,则可以提高内容生产的速度和质量,以拓展更多新内容;还可以更好地满足用户的需求,从而吸引更多用户留存。

另外,这些玩家都或多或少地面临着商业化困境,而利用大模型,有望助其更好地实现商业化。一直以来,小红书都困于“站内种草,站外拔草”,商业化闭环难构建;知乎和快手也分别因为难抵广告收入下滑和营业成本高昂,以及深陷直播电商竞争,而常年处于亏损之中。而其对AI大模型的训练,能给内容社区带来一波红利,从而反哺业务增长以及商业化加速。

从以上角度来看,布局大模型,似乎已经成为了知乎、小红书、快手等小众玩家不得不打的一场仗。只不过,由于每家的商业逻辑和入场角度不同,每家在大模型上的优势和表现也是不尽相同。而凭借着自身在AI技术和内容上的积累,这些平台们也开始在大模型领域各显神通。

知乎快人一步

作为国内领先的问答社区及原创内容平台,知乎早就将大模型能力应用到了平台中。据悉,4月,知乎发布了大语言模型“知海图AI”,并内测首个站内大模型应用功能“热榜摘要”;随后,又发布了一款大模型智能应用功能“搜索聚合”。得益于此,知乎已经成为国内首批具备大语言模型能力的公司,而知乎之所以能加入生成式AI的战局,自然是具备了一些特色和优势。

一是,知乎大规模、高质量的中文数据池是训练大模型的良好素材,将大幅度提升训练效率。知乎PUGC的运营模式为其积累了海量、优质的数据。据悉,截至2022年第四季度,知乎社区上累计内容达6.5亿条,其中包括5.1亿条问答,就连微软NewBing都将其视作中文数据源之一。可见,知乎对于训练大模型类的AI来说,无疑是一个非常优秀的数据库资源。更何况,这些数据从形式上就十分契合大模型输入、输出的训练方式,能有效提升训练效率。

二是,知乎基于问答的讨论场是大模型天然的应用场景,能够快速精准地为用户提供大模型服务。众所周知,知乎是国内最有名的知识问答社区,这些年知乎积累了海量的问答资源,而提供这一资源的用户来自各行各业,拥有不同的知识背景和经验,他们的答案通常会更为专业、详细和科学,可以有效确保内容的准确性和深度。而这也就意味着,知乎大模型可以从多个角度学习和理解问题,并对用户进行更精准的推荐和问答。

三是,知乎与面壁智能的合作,能助其在训练人工智能模型时,获得更专业、更先进的技术支持。由于没有大厂的雄厚实力,知乎这类中厂便开始通过联合研发与战略投资的方式,与国内大模型团队共同开发中文大模型。知乎的合作伙伴——面壁智能是一家专注于大模型研发的企业,其在自然语言处理和机器学习领域拥有深厚的技术积累。与面壁智能的合作,可以为知乎AI大模型的研发提供更加专业和及时的技术支持。

小红书稳步推进

事实上,除知乎之外,小红书已秘密筹备了“大模型”团队,抢先参与到大模型技术的研发布局中。有消息报道称,小红书在4月悄然上线了一款名为“Trik”的AI创作应用,主打AI绘画。

显然,与大厂相比,小红书的资金储备和技术实力都不够雄厚,而鉴于大模型研发需要高昂的算力、数据以及人力成本,小红书参与大模型研发的概率并不高,更多地可能会聚焦大模型应用环节,围绕平台内用户运营,以及创作者工具提供等方向展开。尽管如此,小红书布局大模型,依旧有着自己的底气。

一来,小红书多类型数据的内容社区,是大模型极佳的实践场景。经过多年积累,小红书的社区内容生态中的内容量丰富且多样,据悉,小红书已经成长为一个月活超2亿的UGC内容社区,涵盖了视频、图片、文字、笔记、用户评论等多个类型的数据。而这些数据也将会为自然语言处理、AI辅助内容的生成提供多模态的数据基础和应用场景。

二来,小红书结构化的笔记内容,更方便大模型进行套路的学习和输出。根据小红书在“WILL商业大会2023”上公布数据显示,通过将笔记、用户行为数据结构化,小红书识别了26万的属性词、600万+的昵称词、700万+的情感描述词。而小红书可拆解、规律化的平台属性,更有利于大模型应用的模仿,从而也能够为平台带来生产效率的提升。

三来,小红书千人千面的推荐系统,有望成为大模型训练的样本。基于大规模的用户行为的产生,小红书团队根据用户的特点去做了更加个性化的搜索。小红书中的瀑布流或者内容流,就是系统根据用户行为中的规律,找出了用户感兴趣的内容并推荐给了用户。而针对小红书平台产生的海量数据参数,将有可能会被实时送到模型中去做预估,而且随着样本的不断变化,模型参数也将会不断更新。

快手跃跃欲试

知乎和小红书一直在积极筹备,快手自然也不能落后。据程一笑介绍,快手目前已组建了大模型研发团队,并依托过去在AIGC算法和大规模语言模型方面的技术积累,按计划推进大模型开发和训练,只是当前模型还处于训练阶段。快手虽然暂时没有对外发布大模型产品,但能看出其对大模型是持积极拥抱态度的。而在快手积极布局背后,自然也有着涉足大模型的驱动力。

一方面,快手的视频生成是生成式AI相对缺乏的细分领域,有助于形成差异化优势。入局大模型赛道的玩家有很多,但相比较而言,作为国民级短视频应用的快手的探索方向就显得十分与众不同。据了解,快手目前在大模型方面的尝试包括大规模语言模型、多模态预训练大模型、智能创作工具等。除了文本之外,快手还在语音、图像、视频、3D图形等各个模态的内容生成方面均有所尝试。

另一方面,快手短视频平台具有娱乐化属性,能给予大模型一定的试错空间。据目前透露的消息来看,快手大模型目前主要由两部分功能组成,一种是类似于Midjourney的文生图功能,一种是类似于ChatGPT的对话式AI工具。而尽管快手称“语言描述的精准度不及Midjourney”,但相较于极度追求专业化的Midjourney,以UGC为主的快手本身对大模型的要求不会有太高。

作为各行业的代表企业,知乎、小红书、快手争相拥抱大模型,固然有其必要性和优势条件,但AI大模型所伴随的深重危机感也不容忽视。上面所提到各个内容平台的表现,都只是其增加了一些有关大模型的“新功能”,其AI大模型产品距离成熟还有很远,实现商业化落地,更是难上加难。

目前来看,国内大中小厂扎堆大模型的现象已经是屡见不鲜,对于参赛的玩家而言,大模型的能力虽是比拼的重点,但具体的场景和落地应用同样关键。而最终谁能在这场“大模型混战”中存活下来,并拔得头筹,也还需要时间来检验。不过,可以肯定的是,知乎、小红书、快手想要从中突围,还有很长的路要走。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/636883.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

力扣笔记(每日随机一题)—— 打强整数

问题(中等) 给定三个整数x 、 y 和 bound ,返回 值小于或等于 bound 的所有 强整数 组成的列表 。 如果某一整数可以表示为 x i y j x^i y^j xiyj ,其中整数 i > 0 且 j > 0 i > 0 且 j > 0 i>0且j>0&a…

jmeter009:用户自定义变量

添加路径:线程组>配置元件>用户自定义变量 (用户自定义变量)元件的使用:

vue 打开重复页签

先上图 这两个红色框线实际都是产品详情页面,用产品名称替代了页面的title 1、首先在router/index.js配置路由 {path: /productDetail,component: Layout,hidden: true,children: [{path: productDetail/:productId(\\d), //必须该种方法传递参数component: () &…

超高频工业rfid读头对比高频读头有哪些优势?

超高频的工作频段主要在860MHz~960MHz之间,对比高频RFID来说,超高频技术的传输速度更快,读取距离也更远,批量群读的性能也更好,因此在工业、物流与供应链等领域都有非常广泛的应用。 超高频工业rfid读头对比高频读头有…

Java通过jni调用C语言函数,IntelliJ IDEA,CLion,动态链接库dll,本地方法,native

Java通过jni调用C语言函数 使用的工具 IntelliJ IDEACLion 开始之前的注意事项 确保安装了mingw并配置了环境变量(下载地址:https://udomain.dl.sourceforge.net/project/mingw-w64/Toolchains%20targetting%20Win64/Personal%20Builds/mingw-builds…

【2023】华为OD机试真题Java CC++ Python JS Go-题目0245-信号发射和接收

题目0245-信号发射和接收 题目描述 有一个二维的天线矩阵,每根天线可以向其他天线发射信号,也能接收其他天线的信号,为了简化起见,我们约定每根天线只能向东和向南发射信号,换言之,每根天线只能接收东向或南向的信号。 每根天线有自己的高度anth,每根天线的高度存储在…

软件之禅(五)Input 出场

黄国强 2023/06/12 这篇文章我们引入新的概念,即输入(Input)。类似 Output ,Input 也有多种输入形式。同样我们也需要做个设计,封装后续的变化。继续上代码。 / // 输入类class Input; using InputPtr std::shared_p…

8. 原子操作类

Atomic 翻译成中文是原子的意思。在化学上,我们知道原子是构成一般物质的最小单位,在化学反应中是不可分割的。在我们这里 Atomic 是指一个操作是不可中断的。即使是在多个线程一起执行的时候,一个操作一旦开始,就不会被其他线程干…

SIMD加速矩阵运算

一、SIMD指令简介 SIMD的全称叫做,单指令集多数据(Single Instruction Multiple Data)。最直观的理解就是,向量计算。比如一个加法指令周期只能算一组数(一维向量相加),使用SIMD的话&#xff0…

应届生求职个人简历模板(合集)

应届生求职个人简历模板1 基本信息 姓 名: 性别: 婚姻状况: 民族: 户 籍: 年龄: 现所在地: 身高: 联系电话: 电子邮箱:__ 求职意向 希望岗位:Web前…

【建议】强烈推荐ES6函数自由传参的写法,针对方法体的可扩展性很有帮助

let fun({a,b,c}{a:1,b:2,c:3})>{console.log(a);console.log(b);console.log(c); } 接下来我们即可自由传参,需要什么就传递什么 以上写法非常适用于需求变更的情况下自由传递参数,而且形参的数量、传参先后顺序可以根据业务自由搭配,非常…

Feign接口windows启动调用正常,Linux环境调用404

1、Linux环境启动之后报错 如下: windows 是调用正常得 反复测试好几轮 还是这样 ,nacos都是注册进去得 helper-service 调用 xTIMS-Web 解决:FeignClient注解 不配置URL会出现那样问题, 配置URL之后 解决 ,不报错了…

延迟队列--DelayQueue(JDK)

JDK自身支持延迟队列的数据结构,其实类:java.util.concurrent.DelayQueue。 我们通过阅读源码的方式理解该延迟队列类的实现过程。 1.定义 DelayQueue:是一种支持延时获取元素的无界阻塞队列。 特性: 线程安全; 内部元素有“…

人工智能算力需求稳增,中国将持续夯实算力底座

中国始终强调科技兴国的重要性。数字经济时代,技术的力量更为凸显。近年来,中国政府相关部门相继发布一系列政策,更加明确了人工智能对于提升中国核心竞争力的重要支撑作用,加上新基建、数字经济等持续利好政策的推动,…

0202性能分析-索引-MySQL

1 索引语法 创建索引 CREATE [UNIQUE|FULLTEXT] INDEX index_name ON table_name(index_column_name,...);Index_name:规范为idx_表名_字段名... 查看索引 SHOW INDEX FROM table_name;删除索引 DROP INDEX index_name ON table_name;按照下列要求,创建…

仿交易猫链接 跳转APP功能

最新仿交易猫假链接,带有跳转APP功能 下载程序:https://pan.baidu.com/s/16lN3gvRIZm7pqhvVMYYecQ?pwd6zw3

C语言数据结构——循环链表

如果人生会有很长,愿有你的荣耀永不散场。——《全职高手》 一 . 循环单链表 循环单链表是单链表的另一种形式,其结构特点是,链表中最后一个结点的指针域不再是结束标记,而是指向整个链表的第一个结点,从而使链表形成一个环。 和单…

PLC现场安装和维护的注意事项

虽然PLC是专门在现场使用的控制装置,在设计制造时已采取了很多措施,使它对工业环境比较适应,但是为了确保整个系统稳定可靠,还是应当尽量使PLC有良好的工作环境条件, 并采取必要的抗干扰措施。因此,PLC在安…

python中,unicode对象怎么转换成dict?

python中,unicode对象怎么转换成dict? 使用loads两次

「展会前线」易天光通信盛装亮相2023越南通讯展会

2023年6月7日,在历经了忙碌有序的前期准备工作后,易天光通信销售团队带着满满的信心踏上了越南通讯展会之旅! “千呼万唤始出来,犹抱琵琶半遮面”。2023年6月8日,各方期待已久的2023越南通讯展会在越南胡志明市正式开…