基于机器学习的内容推荐算法及其心理学、社会学影响闲谈

news2024/11/9 9:38:06

基于机器学习的内容推荐算法目前在各类内容类APP中使用的非常普遍。在购物、时尚、新闻咨询、学习等领域,根据用户的喜好,进行较为精准的用户画像与内容推荐。此类算法不但可以较为准确的分析用户的特征,如年龄、性别等,还能通过长期的跟踪维护,大致确定用户的偏好。但过于精确的推荐,对用户的潜在心理学影响越来越受到科学界的重视。本文首先介绍推荐算法的基本原理,再介绍其对用户的心理学、社会学影响。

文章目录

  • 1. 推荐算法简介
    • 1.1 内容模型
    • 1.2 没有用户画像的直接预测
    • 1.3 基于用户模型的推荐
  • 2.精确推荐的负面影响
    • 2.1 信息茧房
    • 2.2 群体割裂
  • 3. 应对建议

1. 推荐算法简介

一个用户的浏览或者购买行为,以一定的颗粒度为单位,可以在历史时间轴上构成一串链条。但细分推荐场景,又大致可以分为两类。一是简单互动类,二是复杂互动类。

类别A,简单互动类:典型的是新闻、短视频。用户在一个内容上驻留的时间期望以分钟、秒计,以浏览为主,加以简单的弹幕、点赞等回复。用户在1天内可产生上百个颗粒的浏览行为。

类别B,复杂互动类:典型的是购物、学习。用户较为专注于一类内容,且在某几个单一内容的驻留时间很长,发生较为复杂的事务,如退货、结算、评价等。用户在1天内只会产生少量的颗粒。

尽管这两种类别的推荐算法在数据模型、训练方法上的侧重相当的不同,但依旧有一些共同点。

1.1 内容模型

要描述一个内容的属性,使得机器学习或者简单的模式分类算法可以对其进行处理,就要把内容转化为含有各类属性的向量。

如音乐,可能包含许多属性。既有流派、作曲、演唱、唱片集等枚举类型的标量,也有对波形进行处理后得到的变换域向量,往往体现了整个音轨的起伏、能量区间和频率组合关系。

在这里插入图片描述

典型的作品数据含有长度为16的标量区,长度为128的向量区,构成一个144的特征向量。在内容模型中,这个向量就代表确定的一首歌。

M ⃗ = [ M c ⃗ M v ⃗ ] \vec{M}=\begin{bmatrix} \vec{M_c} & \vec{M_v} \end{bmatrix} M =[Mc Mv ]

一个用户的浏览习惯,就是以向量 M ⃗ \vec{M} M 为单位的向量列表,代表了这个用户的n次历史浏览。
{ M ⃗ 0 , M ⃗ 1 , M ⃗ 2 , . . . , M ⃗ n − 1 } \{\vec{M}_0,\vec{M}_1,\vec{M}_2,...,\vec{M}_{n-1}\} {M 0,M 1,M 2,...,M n1}

1.2 没有用户画像的直接预测

对于类别A,由于存在海量的浏览链条,可以采取一种简单朴素的预测算法。这种算法通过输入K次浏览数据,试图对下一颗粒的标量进行预测。

{ M ⃗ t − K , M ⃗ t − K + 1 , . . . , M ⃗ t − 1 } = = > M c , t ⃗ \{\vec{M}_{t-K},\vec{M}_{t-K+1},...,\vec{M}_{t-1}\}==> \vec{M_{c,t}} {M tK,M tK+1,...,M t1}==>Mc,t

一旦获取了预测标量,则可以推荐标量中涉及的唱片集、歌手、风格给用户。

1.3 基于用户模型的推荐

用户模型是对内容受众的数学化描述。比如用户的性别、年龄等等,以及数字化的喜好数据。这类算法目前门类很多,也有不少开源的模型。比较有意思的是,基于用户模型的推荐,并不强调必须要准确获知可被自然人理解的用户特征,比如年龄、性别。比如某一类推荐算法,看起来更像是一种信息压缩与解压的生成式算法。

这种算法,分为用户的特征提取(学习)、基于特征的推荐两步骤。思路是随机从用户习惯中抽取K组特征串{M}输入模型,经过A区的NN网络,输出用户画像 P,并经过B区生成内容模型{M’}。训练的目的,是控制P的规模,并期待输出的内容集合与用户的历史数据集合最为吻合。

画像与推荐

这种情况下,P虽然代表用户特征,但其中向量的具体意义已经不再重要了。在具备大量用户的网站,无需对用户全集进行完整的训练,只需要收集到小规模向量P的类别,即可根据新用户的类别直接查表获得推荐内容。

2.精确推荐的负面影响

过于精确的内容推荐,会产生意想不到的心理学、社会学影响,典型的是信息茧房与群体割裂。

2.1 信息茧房

一种典型的影响是信息茧房。当一个用户在初次浏览某个内容网站时,获取的咨询的属性非常宽泛与随机,其首页展现的内容的概率分布是平缓的、均匀的。这段时间是算法收集用户习惯的阶段。

随着浏览次数的增加,推荐算法对用户喜好的掌握越来越精确,使得用户获得的内容集中于感兴趣的若干点上,算法收敛。

推荐喜好
对推荐算法不了解的用户尤其会受到影响,他们不会认为早晨起来每天都看到这些内容,是自己被“投其所好”造成的现象。用户获取的信息被算法束缚在一个狭窄的集合内,无法了解到潜在重要的信息。

这种情况对于学习、科学网站,是没有问题的。但对综合类的内容网站,则存在弊端。假设用户在某段时间心理压力大,搜索了负面的内容,则推荐算法可能会推波助澜。尤其是对有抑郁倾向的用户,可能加重病情。

2.2 群体割裂

算法依靠用户习惯为用户画像,并精确推送内容。而用户被画像后推送的内容影响,会产生群体聚集效应。从种群角度来说,各种符号形成的群落会在算法编织的信息茧房里聚集,吸引具备同样特征的个体,而加剧群体的割裂。
在这里插入图片描述
这使得整个群体被不断分割、强化,形成很多稳定而不包容的类。这些类无法站在对方的角度思考问题,因为各个类别都生活在算法编制的茧房里,一些统计学上显而易见的小概率事件在各自茧房中放大,一些需要注意的公共问题也无法在不同的群体中传播与取得共识。久而久之种群整体就会被分化,失去稳定性。

3. 应对建议

从算法角度,应该在涉及心理学、社会学的领域引入新的输入。比如在检获有抑郁倾向后,推送治愈系的内容,以及提高推荐算法的丰富程度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/605960.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

QT项目实战(视频播放器)

文章目录 前言一、QMediaPlayer二、QVideoWidget三、QAudioOutput四、播放器代码实现五、最终效果总结 前言 本篇文章将使用QT6.4来实现一个简单视频播放器,在QT中使用一个视频播放器还是非常简单的。那么下面就让我们一起来实现这个视频播放器吧。 一、QMediaPla…

深度学习应用篇-计算机视觉-图像增广[1]:数据增广、图像混叠、图像剪裁类变化类等详解

【深度学习入门到进阶】必看系列,含激活函数、优化策略、损失函数、模型调优、归一化算法、卷积模型、序列模型、预训练模型、对抗神经网络等 专栏详细介绍:【深度学习入门到进阶】必看系列,含激活函数、优化策略、损失函数、模型调优、归一化…

基于VGG16实现宝石图像分类任务(acc 84%)--paddle paddle

作业:补充网络定义部分,使用卷积神经网络实现宝石分类 要求:1.补充完成CNN的网络结构定义方法实现宝石识别 2.可尝试不同网络结构、参数等力求达到更好的效果 卷积神经网络 卷积神经网络是提取图像特征的经典网络,其结构一般包…

【hello C++】类和对象(下)

目录 1. 再谈构造函数 1.1 构造函数体赋值 1.2 初始化列表 1.3 explicit关键字 2. static成员 2.1 概念 2.2 特性 3. 友元 3.1 友元函数 3.2 友元类 4. 内部类 5.匿名对象 6.拷贝对象时的一些编译器优化 7. 再次理解类和对象 1. 再谈构造函数 1.1 构造函数体赋值 在创建对象…

Spring Boot项目使用 jasypt 加密组件进行加密(例如:数据库、服务的Key、等等进行加密)

🍓 简介:java系列技术分享(👉持续更新中…🔥) 🍓 初衷:一起学习、一起进步、坚持不懈 🍓 如果文章内容有误与您的想法不一致,欢迎大家在评论区指正🙏 🍓 希望这篇文章对你有所帮助,欢…

【018】C++的指针数组和数组指针

C 指针数组和数组指针 引言一、指针数组1.1、数值的指针数组1.2、字符的指针数组1.3、二维字符数组 二、指针的指针三、数组指针3.1、数组首元素地址和数组首地址3.2、数组指针的使用示例3.3、二维数组和数组指针的关系 四、多维数组的物理存储总结 引言 💡 作者简介…

从0实现基于Alpha zero的中国象棋AI(会分为多个博客,此处讲解蒙特卡洛树搜索)

从0实现基于Alpha zero的中国象棋AI 0.0、前言 ​ 题主对于阿尔法狗的实现原理好奇,加上毕业在即,因此选择中国象棋版的阿尔法zero,阿尔法zero是阿尔法狗的升级版。在完成代码编写的历程中,深刻感受到深度学习环境的恶劣&#x…

零门槛快速创业:GPT和AI工具的秘密武器

在不到一周的时间里,David创建了一个按需印刷的Etsy商店,该商店具有引人注目的标识和大量独特的文字和艺术。 我最近花了大约一周的时间来建立Etsy店面。在本文中,我将向你展示我如何(可能更有趣的是,在哪里&#xff…

YOLOv5:TensorRT加速YOLOv5模型推理

YOLOv5:TensorRT加速YOLOv5模型推理 前言前提条件相关介绍TensorRT加速YOLOv5模型推理YOLOv5项目官方源地址将训练好的YOLOv5模型权重转换成TensorRT引擎YOLOv5 best.pt推理测试TensorRT Engine推理测试小结 参考 前言 由于本人水平有限,难免出现错漏&am…

笔试强训8

作者:爱塔居 专栏:笔试强训 作者简介:大三学生,希望和大家一起进步 day13 一. 单选 1.下列关于视图的说法错误的是: A 视图是从一个或多个基本表导出的表,它是虚表B 视图一经定义就可以和基本表一样被查询…

Python遍历网格中每个点

遍历网格中每个点 1. 问题描述2. Python实现2.1 网格参数初始化2.2 遍历赋值2.3 矩阵赋值1. 问题描述 最近需要实现一个对矩阵赋值并对矩阵表示的网格参数进行测试的任务,写了一段代码提供参考。 假设网格的长宽均为 2. Python实现 2.1 网格参数初始化 首先定义好需要划分…

【小呆的力学笔记】非线性有限元的初步认识【三】

文章目录 1.2.2 基于最小势能原理的线性有限元一般格式1.2.2.1 离散化1.2.2.2 位移插值1.2.2.3 单元应变1.2.2.4 单元应力1.2.2.5 单元刚度矩阵1.2.2.6 整体刚度矩阵1.2.2.7 处理约束1.2.2.8 求解节点载荷列阵1.2.2.9 求解位移列阵1.2.2.10 计算应力矩阵等 1.2.2 基于最小势能原…

基于深度学习的高精度推土机检测识别系统(PyTorch+Pyside6+YOLOv5模型)

摘要:基于深度学习的高精度推土机检测识别系统可用于日常生活中检测与定位推土机目标,利用深度学习算法可实现图片、视频、摄像头等方式的推土机目标检测识别,另外支持结果可视化与图片或视频检测结果的导出。本系统采用YOLOv5目标检测模型训…

通过location实现几秒后页面跳转

location对象属性 location对象属性 返回值location.href获取或者设置整个URLlocation.host返回主机(域名)www.baidu.comlocation.port 返回端口号,如果未写返回空字符串location.pathname返回路径location.search返回参数location.hash返回…

【SCADA】关于KingSCADA仿真驱动的应用

大家好,我是雷工! 在有些时候我们需要用到虚拟仿真的数据,例如在效果演示时为了有良好的动态效果。在KingSCADA软件中可以通过Simulate驱动作为虚拟设备实现这一功能需求。 下面为大家演示该功能的应用: 一、KingIOServer工程设计…

Go实现跨域Cors中间件

概述 本版本主要实现cors中间件 github 地址:Sgin 欢迎star,将会逐步实现一个go web框架 内容 通过建造者模式创建我们的跨域中间件Cors \ 我们了解到,当使用XMLHttpRequest发送请求时,如果浏览器发现违反了同源策略就会自动加…

StableDiffusion入门教程

目录 介绍模型的后缀ckpt模型&#xff1a;safetensors模型文件夹VAE 模型在哪下载Hugging face:<https://huggingface.co/models>下载SD官方模型文生图模型标签介绍 C站&#xff1a;<https://civitai.com/>筛选模型的类型CheckPoint Type &#xff08;模型的类型&a…

Python学习笔记 - 探索元组Tuple的使用

欢迎各位&#xff0c;我是Mr数据杨&#xff0c;你们的Python导游。今天&#xff0c;我要为大家讲解一段特殊的旅程&#xff0c;它与《三国演义》有关&#xff0c;而我们的主角是元组&#xff08;tuple&#xff09;。 让我们想象这样一个场景&#xff0c;三国演义中的诸葛亮&am…

pandas数据预处理

pandas数据预处理 pandas及其数据结构pandas简介Series数据结构及其创建DataFrame数据结构及其创建 利用pandas导入导出数据导入外部数据导入数据文件 导出外部数据导出数据文件 数据概览及预处理数据概览分析利用DataFrame的常用属性利用DataFrame的常用方法 数据清洗缺失值处…

Cesium教程 (3) 矢量切片mvt-imagery-provider加载

Cesium教程 (3) 矢量切片mvt-imagery-provider加载 目录 0. 矢量切片 1. 开源项目 2. 环境 3. 代码 4. TODO 0. 矢量切片 WMTS&#xff1a;加载最快&#xff0c;图片格式&#xff0c;样式固定&#xff1b; WMS&#xff1a;加载数量大则慢&#xff0c;但可以点击查询等&am…