Py之scikit-surprise：scikit-surprise的简介、安装、使用方法之详细攻略

Py之scikit-surprise：scikit-surprise的简介、安装、使用方法之详细攻略

news2026/2/14 20:53:01

Py之scikit-surprise：scikit-surprise的简介、安装、使用方法之详细攻略

目录

scikit-surprise的简介

1、基准测试

Movielens 100k

Movielens 1M

scikit-surprise的安装

scikit-surprise的使用方法

1、基础用法

(1)、简单的示例，展示如何（下）载数据集，将其拆分为5折交叉验证，并计算SVD算法的MAE和RMSE

scikit-surprise的简介

Surprise，Simple Python RecommendatIon System Engine，是一个用于构建和分析处理显式评分数据的Python scikit推荐系统工具。Surprise的设计目的包括：

>> 为用户提供对实验的完全控制。为此，我们强调文档，试图通过指出算法的每个细节使其尽可能清晰和精确。

>> 缓解数据集处理的痛苦。用户可以使用内置数据集（Movielens、Jester）和自定义数据集。

>> 提供各种可用的预测算法，如基线算法、邻域方法、基于矩阵分解的算法（SVD、PMF、SVD++、NMF）等。此外，还内置了各种相似度度量（余弦、MSD、皮尔逊等）。

>> 使新算法思路的实现变得简单。

>> 提供评估、分析和比较算法性能的工具。可以使用强大的CV迭代器（受scikit-learn优秀工具启发）轻松运行交叉验证过程，以及对一组参数进行详尽搜索。

请注意，Surprise不支持隐式评分或基于内容的信息。

1、基准测试

以下是各种算法（使用默认参数）在5折交叉验证过程中的平均RMSE、MAE和总执行时间。数据集包括Movielens 100k和1M数据集，所有算法使用相同的折叠。所有实验在一台搭载Intel i5第11代2.60GHz处理器的笔记本电脑上运行。生成这些表格的代码可以在基准测试示例中找到。

Movielens 100k

Movielens 100k	RMSE	MAE	Time
SVD	0.934	0.737	0:00:06
SVD++ (cache_ratings=False)	0.919	0.721	0:01:39
SVD++ (cache_ratings=True)	0.919	0.721	0:01:22
NMF	0.963	0.758	0:00:06
Slope One	0.946	0.743	0:00:09
k-NN	0.98	0.774	0:00:08
Centered k-NN	0.951	0.749	0:00:09
k-NN Baseline	0.931	0.733	0:00:13
Co-Clustering	0.963	0.753	0:00:06
Baseline	0.944	0.748	0:00:02
Random	1.518	1.219	0:00:01

Movielens 1M

Movielens 1M	RMSE	MAE	Time
SVD	0.873	0.686	0:01:07
SVD++ (cache_ratings=False)	0.862	0.672	0:41:06
SVD++ (cache_ratings=True)	0.862	0.672	0:34:55
NMF	0.916	0.723	0:01:39
Slope One	0.907	0.715	0:02:31
k-NN	0.923	0.727	0:05:27
Centered k-NN	0.929	0.738	0:05:43
k-NN Baseline	0.895	0.706	0:05:55
Co-Clustering	0.915	0.717	0:00:31
Baseline	0.909	0.719	0:00:19
Random	1.504	1.206	0:00:19

scikit-surprise的安装

pip install numpy
pip install scikit-surprise
pip install -i https://mirrors.aliyun.com/pypi/simple scikit-surprise



或者利用conda
conda install -c conda-forge scikit-surprise



或者从最新的源代码构建
pip install numpy cython
git clone https://github.com/NicolasHug/surprise.git
cd surprise
python setup.py install

scikit-surprise的使用方法

1、基础用法

(1)、简单的示例，展示如何（下）载数据集，将其拆分为5折交叉验证，并计算SVD算法的MAE和RMSE


from surprise import SVD
from surprise import Dataset
from surprise.model_selection import cross_validate

# Load the movielens-100k dataset (download it if needed).
data = Dataset.load_builtin('ml-100k')

# Use the famous SVD algorithm.
algo = SVD()

# Run 5-fold cross-validation and print results.
cross_validate(algo, data, measures=['RMSE', 'MAE'], cv=5, verbose=True)


Evaluating RMSE, MAE of algorithm SVD on 5 split(s).

                  Fold 1  Fold 2  Fold 3  Fold 4  Fold 5  Mean    Std     
RMSE (testset)    0.9367  0.9355  0.9378  0.9377  0.9300  0.9355  0.0029  
MAE (testset)     0.7387  0.7371  0.7393  0.7397  0.7325  0.7375  0.0026  
Fit time          0.62    0.63    0.63    0.65    0.63    0.63    0.01    
Test time         0.11    0.11    0.14    0.14    0.14    0.13    0.02

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1308356.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

分类预测 | Matlab实现HPO-GRU【23年新算法】基于猎食者优化算法优化门控循环单元的数据分类预测

分类预测 | Matlab实现HPO-GRU【23年新算法】基于猎食者优化算法优化门控循环单元的数据分类预测

分类预测 | Matlab实现DBO-SVM蜣螂算法优化支持向量机的数据分类预测【23年新算法】目录分类预测 | Matlab实现DBO-SVM蜣螂算法优化支持向量机的数据分类预测【23年新算法】分类效果基本描述程序设计参考资料分类效果基本描述 1.HPO-GRU【23年新算法】基于猎食者优化算法优…

阅读更多...

生物燃料市场分析：预计2029年将达到1968亿美元

生物燃料市场分析：预计2029年将达到1968亿美元

生物燃料(biofuel)泛指由生物质组成或萃取的固体、液体或气体燃料，可以替代由石油制取的汽油和柴油，是可再生能源开发利用的重要方向。所谓的生物质是指利用大气、水、土地等通过光合作用而产生的各种有机体，即一切有生命的可以生长的有机物质…

阅读更多...

配置文件中的$和@

配置文件中的$和@

配置文件中的$和 0、前言借鉴文章： https://blog.csdn.net/Saintmm/article/details/124603343 https://blog.csdn.net/ster_ben/article/details/119295815在yml配置文件中，可以使用${}和{}来引用其他配置项的值作为配置项的值。 spring:applicati…

阅读更多...

19、WEB攻防——.NET项目DLL反编译未授权访问配置调试报错

19、WEB攻防——.NET项目DLL反编译未授权访问配置调试报错

文章目录一、.NET项目——DLL文件反编译指向—代码特性二、.NET项目——Web.config错误调试—信息泄露三、.NET项目——身份验证未授权访问—安全漏洞 web搭配： windowsiisaspaccesswindowsiisaspxsqlserver 一、.NET项目——DLL文件反编译指向—代码特性 bin目…

阅读更多...

基于物联网的智能仓管理系统方案

基于物联网的智能仓管理系统方案

基于物联网的智能仓管理系统方案一、项目背景随着企业业务的快速发展，传统的人工仓库管理方式已经无法满足现代企业的需求。仓库运营效率低下、货物出入库错误、库存不准确等问题不断涌现。因此，我们提出一个基于物联网技术的智能仓管理系统方案&…

阅读更多...

被围绕的区域[中等]

被围绕的区域[中等]

一、题目给你一个m x n的矩阵board，由若干字符X和O，找到所有被X围绕的区域，并将这些区域里所有的O用X填充。示例 1： 输入：board [["X","X","X","X"],["X",&qu…

阅读更多...

输入一组数据，以-1结束输入[c]

输入一组数据，以-1结束输入[c]

我们新手写题时总能看到题目中类似这样的输入没有给固定多少个数据，我们没有办法直接设置数组的元素个数，很纠结，下面我来提供一下本人的方法（新手，看到有错误或者不好的地方欢迎大佬指出，纠正&#xff0…

阅读更多...

NOIP2017提高组day2 - T2：宝藏

NOIP2017提高组day2 - T2：宝藏

题目链接 [NOIP2017 提高组] 宝藏题目描述参与考古挖掘的小明得到了一份藏宝图，藏宝图上标出了 n n n 个深埋在地下的宝藏屋， 也给出了这 n n n 个宝藏屋之间可供开发的 m m m 条道路和它们的长度。小明决心亲自前往挖掘所有宝藏屋中的宝藏。但…

阅读更多...

Linux 安装图形界面 “startx”

Linux 安装图形界面 “startx”

———————————————— 报错，如下： bash :startx command not found ———————————————— 解决方法： 1.先安装 — X Windows System，输入以下命令： yum groupinstall “X Window System”…

阅读更多...

IPQ6010 vs IPQ8072 What’s the difference?|802.11AX WiFi6 Solution DR6018 DR8072

IPQ6010 vs IPQ8072 What’s the difference?|802.11AX WiFi6 Solution DR6018 DR8072

IPQ6010 vs IPQ8072 What’s the difference?|802.11AX WiFi6 Solution DR6018 DR8072 IPQ6010 vs IPQ8072: In-Depth Comparison and Selection Guide The rapid evolution of networking technologies has driven continuous innovation in routers and network devices. Am…

阅读更多...

鸿蒙（HarmonyOS）北向开发项目编译问题汇总

鸿蒙（HarmonyOS）北向开发项目编译问题汇总

运行Hello World Hello World 工程可以运行在模拟器中，或者运行在真机设备中。本示例先以选择将 Hello World 工程运行在模拟器中进行说明，如果选择运行在真机设备中，需要先对工程进行签名，然后才能运行在真机设备中。 DevEco S…

阅读更多...

Proxmox创建CentOS虚拟机

Proxmox创建CentOS虚拟机

文章目录下载ISO安装文件上传创建虚拟机启动虚拟机设置DNS CentOS配置国内安装源备份原有安装源下载更新国内源清理yum缓存制作新配置文件缓存下载ISO安装文件下载地址：https://www.xitongzhijia.net/ 也可去官网进行下载上传下面介绍直接通过页面上传&…

阅读更多...

三、Java运算符

三、Java运算符

1.运算符和表达式运算符： 就是对常量或者变量进行操作的符号。比如： - * / 表达式： 用运算符把常量或者变量连接起来的，符合Java语法的式子就是表达式。比如：a b 这个整体就是表达式。而其…

阅读更多...

11.仿简道云公式函数实战-逻辑函数-TRUE

11.仿简道云公式函数实战-逻辑函数-TRUE

1. TRUE函数 TRUE 函数可直接返回逻辑值 true。 2. 函数用法 TRUE() 3. 函数示例 TRUE 函数一般不会作为函数单独使用，可与其他函数一起使用，或作为判断逻辑的结果。如，判断字段值是否为空时，设置公式为IF(ISEMPTY(方案选择)…

阅读更多...

2023-12-12 AIGC-AI工具的基本工作原理

2023-12-12 AIGC-AI工具的基本工作原理

摘要: 2023-12-12 AIGC-AI工具的基本工作原理 AI工具的基本工作原理 AI工具的基本工作原理涉及到一系列复杂的技术和算法。这些原理可以根据不同类型的AI工具进行概括，包括机器学习、自然语言处理、图像识别等。以下是一些关键的AI工具及其工作原理的概述&#xff…

阅读更多...

基础算法(1):排序(1):选择排序

基础算法(1):排序(1):选择排序

今天对算法产生了兴趣，开始学习基础算法，比如排序，模拟，贪心，递推等内容，算法是很重要的，它是解决某个问题的特定方法，程序数据结构算法，所以对算法的学习是至关重要的&a…

阅读更多...

【知网稳定检索】第三届人文，智慧教育与服务管理国际学术会议（HWESM 2024）

【知网稳定检索】第三届人文，智慧教育与服务管理国际学术会议（HWESM 2024）

第三届人文，智慧教育与服务管理国际学术会议（HWESM 2024） 2024 3rd International Conference on Humanities, Wisdom Education and Service Management 第三届人文，智慧教育与服务管理国际学术会议（HWESM 2024&…

阅读更多...

LangChain学习二：提示-实战（上半部分）

LangChain学习二：提示-实战（上半部分）

文章目录上一节内容：LangChain学习一：模型-实战学习目标：提示词及提示词模板的运用学习内容一：什么是提示词？学习内容二：提示词模板2.1 入门2.2 模板格式2.3 验证模板2.4 序列化提示模板2.5 将少量示例传递…

阅读更多...

Linux 高级管理，MySQL服务器的构建与维护

Linux 高级管理，MySQL服务器的构建与维护

实验环境某公司因业务范围日益扩大，最近订购了一套基于B/S架构的电子商务系统，在正式部署之前，要求对现有的httpd服务器进行改造，首先需要增加MySQL数据库服务。需求描述 1. 编译安装MySQL服务器，并添加为mysqld系…

阅读更多...

Centos7防火墙及端口开启

Centos7防火墙及端口开启

1、防火墙 1.1、查看防火墙是否开启 systemctl status firewalld 1.2、开启防火墙 firewall-cmd --list-ports 1.3、重启防火墙 firewall-cmd --reload 2、端口 2.1、查看所有已开启的端口号 firewall-cmd --list-ports 2.2、手动开启端口启动防火墙后，默认没有开…

阅读更多...

推荐文章

最新文章