一、信息流产品的场景
我们分别从用户、内容生产者和平台的角度,描述他们在信息流产品里的消费场景,便于理解阐述的指标体系。
1、用户在信息流产品里的消费的场景
- 小明同学,每天打开 5 次 App,刷新内容 20 次,浏览了 100 条内容,7 条广告。
- 100 条内容包括:10 条文字类的鸡汤小文,30条图文类的新闻报道,60条视频为主的娱乐新闻。
- 在这浏览的 100 条内容中,小明点赞了 10 条内容,评论了 5 条内容,转发了 2 条内容。
以上场景,对应了用户在信息流产品中的使用深度和对于平台推荐内容的互动情况。
2、内容生产者在产品里的消费场景
- 小雨同学,早上在平台里生产(上传)了一个音乐视频作品、两个美食图片作品。
- 晚上他涨了500个粉丝;视频作品有 1000 个人点赞、200 条评论;图片类作品只有30 个点赞、无人评论。
以上 2 个场景,分别对应了内容生产者在产品中生产量和平台为生产者提供的价值(涨粉变现,或者互动社交)。
3、平台的内容推荐和流量分配机制
- 平台为用户推荐的内容,用户是否喜欢?
- 内容生产者的作品(内容)是否在平台上获得了与其作品质量相匹配的流量?
- 平台卖出了多少广告流量,获取了多少收入?
以上 3 个场景对应平台侧考虑的推荐内容的精准性、流量分配的合理性,及实现平台自身的盈利等问题。
二、信息流产品的数据指标体系
注意!下面我为你来讲解本课重点:信息流数据指标体系。上一部分我们讲了信息流产品里三个角色对应的不同场景,信息流数据指标体系也由三个部分构成。
用户侧的指标
对用户侧,我们关心的是用户在信息流产品中的使用深度和对于平台推荐内容的互动情况。
1. 使用深度
- 用户刷新页面的次数: 用来衡量用户黏性和依赖度。好的信息流产品会为用户匹配用户感兴趣的内容,让用户刷的停不下来,比如抖音。
- 下发总信息量: 用户刷新页面时,服务端会下发固定数量的内容,比如 20 条内容(不同App 下发数量不同)。下发信息量,代表信息已经加载到手机待阅读的信息列表里了,不代表用户真正的都看完了这些信息。比如刷新一次微博推荐页,手机端会一次性加载5 天的内容量,但是用户可能只看了其中 2 条就会关掉 App。
- 真实曝光信息量: 用户刷新后,下移手机屏幕。下发的信息流,便逐个曝光到用户眼前。漏出屏幕的信息的数量即为真实曝光信息量,比如上面提到的“用户看了 2 条信息后关掉 App”,那么这次的曝光信息量就是 2。
- 人均阅读信息量: 用户通过点击信息流标题进入正文的数量,用来衡量用户阅读的深度。还是以微博为例来讲,用户在推荐页看的信息,是曝光,如果点击某条微博信息,就算作一次阅读。
- 人均阅读时长:用来衡量用户在 App 上花费的时间。它能直接量化用户对 App 的依赖度。互联网 C 端产品竞争日益激烈,用户“玩”手机的时间一定的情况下,谁占用用户总时长越多,商业价值自然越高。
2. 用户对推荐内容的互动情况
用户互动行为可能会有很多种,常见的互动指标包含了产品内所有用户与内容(或者)作者互动的行为次数。互动行为包括但不限于:关注作者、写评论、点赞、转发分享、举报、删除、不感兴趣、私信等。
生产侧的指标
我们刚说到了用户消费侧的数据指标,现在我们将以下内容生产者(作者)的数据指标。对于内容生产者而言,平台关心的数据指标为作者在产品中生产的内容数量和平台为生产者提供的价值(涨粉变现,或者互动社交)。
1)作者在产品中生产的内容数量
生产者的数据指标, 核心有两个,它们分别是每日生产内容的作者数和每日生产的内容数量(作品数)。针对这两个指标维度,(我们)还会关注一些不同维度拆分的指标。
针对作者数维度:
- 分新老作者关注,将指标分为当天新增的作者数、非当天新增的作者数;
- 分作者的重要性关注,将指标分为 KOL、普通作者数;
- 分作者生产内容的类型关注,将指标分为美食作者数、音乐作者数、财经作者数等。
针对作品数维度:
- 分作品类型关注,将指标分为图片作品数、视频作品数、文字作品数等;
- 分作品的内容类型关注,将指标分为美食作品数、音乐作品数、财经作品数等;
- 分作品质量关注,将指标分为高质量作品数、普通质量作品数、低质量作品数。
2)平台为生产者提供的价值
生产者为平台提供内容,平台也需要为生产者提供相应的价值,才能让生产者持续地为平台提供优质内容。所以,我们也需要关注平台为生产者提供的价值。生产者提供内容的主要目的有两种,一种是通过内容变现,这部分作者对涨粉速度比较敏感(通过粉丝变现);另一种是社交,这部分作者对内容变现没有太大欲望,他们更希望自己生产的内容被人看到,有用户跟他们互动。
2.1)针对想变现的作者,我们关注:
- 每天有涨粉的作者数;
- 每天单个作者平均涨粉数;
- 每天新增 KOL 数(一般以粉丝数来衡量一个作者是否是 KOL)。
2.2)针对想社交的作者,我们关注:
- 每天收到留言/评论/私信的作者数;
- 每天作者作品被观看的次数。
除了这些,我们还需要关注每日流失的 KOL 数量。
以上,内容生产侧的核心指标, 可以帮助平台及时了解内容侧的整体情况。
平台侧的指标(偏推荐侧)
平台侧主要考虑的有:推荐内容的精准性、流量分配的合理性,及实现平台自身的盈利。
1. 推荐内容的准确性
准确性,简单说就是平台为用户推荐的内容,是用户喜欢的(个性化推荐)。要准确地进行个性化推荐,平台侧要解决的问题有:
第一, 将信息打上丰富维度的标签,比如信息类型(文本、图像、视频)、内容类型(美食、财经、娱乐等)……
第二, 用户浏览信息的行为,描述用户各种属性特征,比如性别、年龄、城市等级、内容类型偏好等。并不断根据用户行为的变化迭代,更新用户的属性特征。
第三, 根据信息标签和用户行为标签,建立推荐算法模型和数据策略,为用户推送匹配的信息。
衡量准确性的数据指标有:
- 推荐兴趣信息的准确率 = 推荐列表里用户阅读数量 / 推荐列表的总信息数。
- 推荐信息的召回率 = 推荐列表里用户阅读数量 / 平台内的总信息量(含推荐列表的内容和非推荐列表的所有内容)。
- 推荐信息的整体信息覆盖率 = 推荐的信息数 / 平台总体信息数。
准确率, 目的是衡量平台推荐算法的准确性。如果,推荐过去的信息, 用户都阅读了,那么说明推荐准备率为 100%。
召回率, 是为了检验平台推送的多样性、丰富度。假如平台内有 100 万条存量内容,推荐算法推荐给用户的内容只有 1000 条,召回率是 0.1%。这说明平台里所有用户看到的信息比较相近。
实际上, 准确率和召回率是一对相互制衡的指标,往往准确率高的情况,召回率会比较低,反之亦然。举个例子:为了提高准确率, 系统总是将用户最喜欢的信息推荐到用户眼前,比如,小明喜欢游戏、汽车、美女,但最痴迷游戏。系统为了提高准确性,给小明推荐的全部是游戏。
这样准确率到时提升了,但是召回率变低了,因为推荐内容仅覆盖到游戏。同样,假设为了提高召回率,系统给小明推荐了游戏、汽车、美女、教育、科技、财经等信息, 覆盖了小明喜欢的全部信息, 但是小明只选择前三项阅读,对于教育、科技、财经小明完全不感兴趣,没有阅读。那么,这样虽然召回率 100%,但是准确率却仅为 50%。
其实,对应准确率这部分,还有很多具体的指标。
- 真实曝光的阅读转化率:真实曝光的阅读转化率=用户实际阅读量 / 真实曝光信息量,用来衡量信息曝光到阅读的转化率,反应推荐信息与用户兴趣的匹配度;
- 人均互动次数:从曝光到互动,有些信息用户不一定会进入正文页或者本身不需要进入正文页,可以直接从标题进行转评赞的互动,比如微信、微博;
- 点赞率:点赞率= 点赞数 / 真实曝光数, 用来衡量信息的欢迎程度;
- 评论率:评论率 = 评论数 / 真实曝光数,有些信息更吸引用户去评论;
- 转发率:转发率 = 转发数 / 真实曝光数, 衡量信息传播效应;
- 有效播放:有效播放 = 用户主动播放且超过 3 秒或者自动播放超过10秒,用来过滤无效播放;
- 完播率:完播率 = 视频播放结束次数 / 视频播放次数 ,作为有效播放升级的指标;
- 关注率:关注率 = 关注数 / 真实曝光数,这个用来衡量涨粉能力;
- 导流率:导流率 = 短链点击数 / 真实曝光数,这个用来衡量文章的带货能力;
- 负反馈率:负反馈率 = 用户单击不关注数 / 真实曝光数,这个收集用户负反馈信息,标注低质量信息,优化用户推荐精准度、提高体验。
2. 流量分配的合理性
前面我们讲到,只有平台也能为生产者提供相应的价值,生产者才会持续的平台提供内容,达成一种双赢。所以,平台在流量分发时,不能单纯地只考虑短期效果(如只为优质内容提供热门流量)也要兼顾广大长尾作者。所以,平台需要监控:
- KOL 的流量占比=KOL 作品的真实曝光量/平台信息真实曝光总量;
- 非 KOL 的生产者的流量占比=非 KOL 作品的真实曝光量/平台信息真实曝光总量。
3. 平台盈利
主要就是平台收入和利润,包括商业广告的变现或者流量到订单的转化。
总结
信息流现在是当前互联网平台信息分发最高效的方式,本课程主要分享了信息流数据指标体系, 分信息消费者、生产者、平台方来介绍主要数据指标。希望能让你对信息流的基础数据指标有一定认识。欢迎在留言区提问,也欢迎大家关注我的微信公众号(数据民工来取经儿)进行学习。