基于深度学习的在线选修课程推荐系统

news2024/11/26 10:34:59

基于深度学习的在线选修课程推荐系统

1、效果图

点我查看Demo
在这里插入图片描述

2、功能

可联系我--(1257309054)
登录注册、点赞收藏、评分评论,课程推荐,热门课程,个人中心,可视化,后台管理,课程选修

3、核心推荐代码

使用Keras框架实现一个简单的深度学习推荐算法。Keras是建立在Python之上的高级神经网络API。Keras提供了一种简单、快速的方式来构建和训练深度学习模型。

​ 根据用户对书籍的评分表,使用Emmbeding深度学习训练得到一个模型,预测用户可能评分高的书籍,并把前5本推荐给用户。

Emmbeding是从离散对象(如书籍 ID)到连续值向量的映射。
这可用于查找离散对象之间的相似性。
Emmbeding向量是低维的,并在训练网络时得到更新。
设计一个模型,将用户id作为用户向量,物品id作为物品向量。
分别Emmbeding两个向量,再Concat连接起来,最后加上3个全连接层构成模型,进行训练。
使用adam优化器,用均方差mse来衡量预测评分与真实评分之间的误差

在这里插入图片描述

4、算法流程

1、从数据库中读取评分表信息并转成二维数组
2、数据预处理,把用户id,物品id映射成顺序字典
3、统计用户数量、物品数量
4、划分训练集与测试集
5、构建Embedding模型并进行数据训练得到模型
6、调用模型预测评分高的物品并推荐给用户

5、主体核心代码

 -*- coding: utf-8 -*-

"""
@contact: 微信 1257309054
@file: recommend_keras.py
@time: 2024/6/8 16:21
@author: LDC
使用Keras框架实现一个深度学习推荐算法
"""

import os
import django
from django.conf import settings

os.environ["DJANGO_SETTINGS_MODULE"] = "course_manager.settings"
django.setup()

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import pymysql
from sklearn.model_selection import train_test_split
import warnings

warnings.filterwarnings('ignore')

from course.models import UserSelectTypes, CourseInfo, RateCourse
from keras.layers import Input, Embedding, Flatten, Dot, Dense, Concatenate, Dropout
from keras.models import Model

from keras.models import load_model


def get_select_tag_course(user_id, course_id=None):
    # 获取用户注册时选择的课程类别各返回10门课程
    category_ids = []
    us = UserSelectTypes.objects.get(user_id=user_id)
    for category in us.category.all():
        category_ids.append(category.id)
    unrec = []
    if course_id:
        unrec.append(course_id)
    course_list = CourseInfo.objects.filter(tags__in=category_ids).exclude(id__in=unrec).distinct().order_by(
        "-collect_num")[:10]
    return course_list


def get_data():
    '''
    从数据库获取数据
    '''
    conn = pymysql.connect(host=settings.DATABASE_HOST,
                           user=settings.DATABASE_USER,
                           password=settings.DATABASE_PASS,
                           database=settings.DATABASE_NAME,
                           charset='utf8mb4',
                           use_unicode=True)
    # 选择评分大于等于3的课程
    sql_cmd = 'SELECT course_id, user_id,mark FROM rate_course where mark >=3'
    dataset = pd.read_sql(sql=sql_cmd, con=conn)
    conn.close()
    return dataset


def preprocessing(dataset):
    '''
    数据预处理
    '''
    course_val_counts = dataset.course_id.value_counts()
    course_map_dict = {}  # 课程字典
    for i in range(len(course_val_counts)):
        course_map_dict[course_val_counts.index[i]] = i

    # print(map_dict)
    dataset["course_id"] = dataset["course_id"].map(course_map_dict)

    user_id_val_counts = dataset.user_id.value_counts()
    # 映射字典
    user_id_map_dict = {}  # 用户字典
    for i in range(len(user_id_val_counts)):
        user_id_map_dict[user_id_val_counts.index[i]] = i
    # 将User_ID映射到一串字典
    dataset["user_id"] = dataset["user_id"].map(user_id_map_dict)

    return dataset, course_map_dict, user_id_map_dict


def train_model():
    '''
    训练模型
    '''
    dataset = get_data()  # 获取数据
    dataset, course_map_dict, user_id_map_dict = preprocessing(dataset)  # 数据预处理
    n_users = len(dataset.user_id.unique())  # 统计用户数量
    print('n_users', n_users)

    n_courses = len(dataset.course_id.unique())  # 统计课程数量
    print('n_courses', n_courses)

    # 划分训练集与测试集
    train, test = train_test_split(dataset, test_size=0.2, random_state=42)
    # 开始训练
    # creating course embedding path
    course_input = Input(shape=[1], name="course-Input")
    course_embedding = Embedding(n_courses + 1, 5, name="course-Embedding")(course_input)
    Dropout(0.2)
    course_vec = Flatten(name="Flatten-courses")(course_embedding)

    # creating user embedding path
    user_input = Input(shape=[1], name="User-Input")
    user_embedding = Embedding(n_users + 1, 5, name="User-Embedding")(user_input)
    Dropout(0.2)
    user_vec = Flatten(name="Flatten-Users")(user_embedding)

    # concatenate features
    conc = Concatenate()([course_vec, user_vec])

    # add fully-connected-layers
    fc1 = Dense(128, activation='relu')(conc)
    Dropout(0.2)
    fc2 = Dense(32, activation='relu')(fc1)
    out = Dense(1)(fc2)

    # Create model and compile it
    model2 = Model([user_input, course_input], out)
    model2.compile('adam', 'mean_squared_error')

    history = model2.fit([train.user_id, train.course_id], train.mark, epochs=10, verbose=1)
    model2.save('regression_model2.h5')
    loss = history.history['loss']  # 训练集损失

    # 显示损失图像
    # plt.plot(loss, 'r')
    # plt.title('Training loss')
    # plt.xlabel("Epochs")
    # plt.ylabel("Loss")
    # plt.show()
    print('训练完成')


def predict(user_id, dataset):
    '''
    将预测评分高的课程推荐给该用户user_id
    '''

    model2 = load_model('regression_model2.h5')

    '''
    先拿到所有的课程,并去重成为course_data。
    再添加一个和course_data长度相等的用户列表user,不过这里的user列表中的元素全是1,
    因为:预测第1个用户对所有课程的评分,再将预测评分高的课程推荐给该用户。
    '''
    course_data = np.array(list(set(dataset.course_id)))
    user = np.array([user_id for i in range(len(course_data))])
    predictions = model2.predict([user, course_data])
    # 更换列->行
    predictions = np.array([a[0] for a in predictions])
    # 根据原array,取其中数值从大到小的索引,再只取前top10
    recommended_course_ids = (-predictions).argsort()[:8]
    return recommended_course_ids


def embedding_main(user_id, course_id=None, is_rec_list=False):
    '''
    1、获取用户评分大于等于3的课程数据
    2、数据预处理:把数据映射成用户向量Embedding,课程向量Embedding
    3、划分训练集与测试集:使用二八法则随机划分,80%的数据用来训练,20%的数据用来测试
    4、训练模型:分别Emmbeding两个向量,再Concat连接起来,最后加上3个全连接层构成模型,进行训练
    5、模型评估:通过查看训练集损失函数来查看模型优劣
    6、预测推荐:对用户评分过的课程进行模型预测,把预测评分高的课程推荐给用户
    user_id: 用户id
    course_id: 用户已经评分过的课程id,需要在推荐列表中去除
    is_rec_list: 值为True:返回推荐[用户-评分]列表,值为False:返回推荐的课程列表
    '''
    dataset = get_data()  # 获取数据
    # print(dataset.head())
    if user_id not in dataset.user_id.unique():
        # 用户未进行评分则推荐注册时选择的课程类型
        print('用户未进行评分则推荐注册时选择的课程类型')
        if is_rec_list:
            return []
        # 推荐列表为空,按用户注册时选择的课程类别各返回10门
        return get_select_tag_course(user_id, course_id)
    dataset, course_map_dict, user_id_map_dict = preprocessing(dataset)
    # user_id需要转换为映射后的user_id传到predict函数中
    predict_course_ids = predict(user_id_map_dict[user_id], dataset)  # 预测的课程Id
    recommend_list = []  # 最后推荐的课程id
    # 把映射的值转为真正的课程id
    for course_id in predict_course_ids:
        for k, v in course_map_dict.items():
            if course_id == v:
                recommend_list.append(k)
    print('keras_recommended_course_ids深度学习推荐列表', recommend_list)

    if not recommend_list:
        # 推荐列表为空,且is_rec_list: 值为True:返回推荐[用户-评分]列表
        if is_rec_list:
            return []
        # 推荐列表为空,按用户注册时选择的课程类别
        return get_select_tag_course(user_id, course_id)
    if is_rec_list:
        # 推荐列表不为空,且且is_rec_list: 值为True:返回推荐[用户-评分]列表
        return recommend_list

    unres = []
    if course_id:
        unres.append(course_id)
    # 过滤掉用户已评分的数据
    already_mark_ids = [d['course_id'] for d in RateCourse.objects.filter(user_id=user_id).values('course_id')]
    unrecommend = list(set(unres + already_mark_ids))
    if course_id and course_id not in unrecommend:
        unrecommend.append(course_id)
    course_list = CourseInfo.objects.filter(id__in=recommend_list).exclude(id__in=unrecommend).distinct().order_by(
        "-collect_num")
    return course_list


if __name__ == '__main__':
    train_model()  # 训练模型
    embedding_main(2)  # 调用模型

6、输出效果

Epoch 1/10
1/1 [==============================] - 2s 2s/step - loss: 25.0221
Epoch 2/10
1/1 [==============================] - 0s 8ms/step - loss: 24.9007
Epoch 3/10
1/1 [==============================] - 0s 7ms/step - loss: 24.8011
Epoch 4/10
1/1 [==============================] - 0s 6ms/step - loss: 24.7061
Epoch 5/10
1/1 [==============================] - 0s 3ms/step - loss: 24.6062
Epoch 6/10
1/1 [==============================] - 0s 4ms/step - loss: 24.5012
Epoch 7/10
1/1 [==============================] - 0s 5ms/step - loss: 24.3921
Epoch 8/10
1/1 [==============================] - 0s 5ms/step - loss: 24.2739
Epoch 9/10
1/1 [==============================] - 0s 3ms/step - loss: 24.1532
Epoch 10/10
1/1 [==============================] - 0s 5ms/step - loss: 24.0253
训练完成
1/1 [==============================] - 0s 200ms/step
keras_recommended_course_ids深度学习推荐列表 [61, 98, 71, 81, 97]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1803367.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

htb_office

端口扫描 namp -sSVC 10.10.11.1380,445 80端口 robots.txt 只有/administrator可以访问 Joomla joomscan扫描 joomscan --url http://10.10.11.3/ 版本为4.2.7,存在cve CVE-2023-23752 Joomla未授权访问Rest API漏洞 访问路径 /api/index.php/…

linux经典例题编程

编写Shell脚本,计算1~100的和 首先vi 1.sh,创建一个名为1.sh的脚本,然后赋予这个脚本权限,使用命令chmod 755 1.sh,然后就可以在脚本中写程序,然后运行。 shell脚本内容 运行结果: 编写Shell脚本&#xf…

【JavaScript】内置对象 - 字符串对象 ⑤ ( 判断对象中是否有某个属性 | 统计字符串中每个字符出现的次数 )

文章目录 一、判断对象中是否有某个属性1、获取对象属性2、判定对象是否有某个属性 二、统计字符串中每个字符出现的次数1、算法分析2、代码示例 String 字符串对象参考文档 : https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/String 一、判…

OpenCV学习(4.8) 图像金字塔

1.目的 在这一章当中, 我们将了解图像金字塔。我们将使用图像金字塔创建一个新的水果,“Orapple”我们将看到这些功能: cv.pyrUp() , cv.pyrDown() 在通常情况下我们使用大小恒定…

Rust 标记一个属性或函数为废弃

如题,演示Rust 标记一个属性或函数为废弃的基本使用方法: 示例: use serde::{Deserialize, Serialize};#[derive(Clone, Debug, Serialize, Deserialize, Default)] pub struct GrpcOptions {pub addr: String,pub max_recv_message_size: u…

MathType7.8学术必备神器 科研利器 教学好帮手

【MathType 7.8】数学公式编辑器,让学术和专业文档制作更高效、更准确!🧮✨ 作为一名软件技术专家,我一直在寻找一款能够轻松创建复杂数学公式的工具。幸运的是,我终于找到了MathType 7.8,这款强大的数学公…

数学+思维,CF1056B - Divide Candies

一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 Problem - 1056B - Codeforces 二、解题报告 1、思路分析 考虑i^2 j^2 | m 而m的余数有限,且m很小 我们枚举两重循环,都枚举m的余数,分别记为x,y 如果x ^ …

vue2组件封装实战系列之tag组件

作为本系列的第一篇文章,不会过于的繁杂,并且前期的组件都会是比较简单的基础组件!但是不要忽视这些基础组件,因为纵观elementui、elementplus还是其他的流行组件库,组件库的封装都是套娃式的,很多复杂组件…

【2024】Kafka Streams详细介绍与具体使用(1)

目录 介绍关键特性应用场景核心概念部署方式kafka streams的处理模式 具体使用1、准备工作2、添加依赖3、代码实现3、测试 介绍 Kafka Streams是构建在Apache Kafka之上的客户端库,用于构建高效、实时的流处理应用。它允许你以高吞吐量和低延迟的方式处理记录流&am…

人工智能在交通与物流领域的普及及应用

文章目录 🐋引言 🐋自动驾驶 🦈自动驾驶汽车 🐡应用现状 🐡技术实现 🐡实现过程及代码 🐋智能交通管理 🦈应用现状 🦈技术实现 🦈实现过程及代码 &…

【讲解下ECMAScript和JavaScript之间有何区别?】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共…

React Hooks 封装可粘贴图片的输入框组件(wangeditor)

需求是需要一个文本框 但是可以支持右键或者ctrlv粘贴图片,原生js很麻烦,那不如用插件来实现吧~我这里用的wangeditor插件,初次写初次用,可能不太好,但目前是可以达到实现需求的一个效果啦!后面再改进吧~ …

【国产NI替代】SMU 源测量仪:源测量单元平台主要用于半导体、传感器、模组等 IVR 测试测量

• 集 5 台仪器 (数字万用表、电压源、电流源、电子负载和脉冲发生器) 功能于⼀体 • 典型输出源及测量精度 02%,支持直流/脉冲输出模式 • 脉冲输出模式,最⼩脉冲宽度 100 us ,上升时间 10 us • 具有 pA 级分辨率高精度源,且…

Linux编译器-gcc或g++的使用

一.安装gcc/g 在linux中是不会自带gcc/g的,我们需要编译程序就自己需要安装gcc/g。 很简单我们使用简单的命令安装gcc:sudo yum install -y gcc。 g安装:sudo yum install -y gcc-c。 我们知道Windows上区分文件,都是使用文件…

linux系统——ping命令

ping命令可以用来判断对远端ip的连通性,可以加域名也可以加公共ip地址 这里发送出56字节,返回64字节

【C++修行之道】类和对象(四)运算符重载

目录 一、 运算符重载 函数重载和运算符重载有什么关系? 二、.*运算符的作用 三、运算符重载的正常使用 四、重载成成员函数 五、赋值运算符重载 1.赋值运算符重载格式 传值返回和引用返回 有没有办法不生成拷贝? 2. 赋值运算符只能重载成类的…

命令提示符方式获取笔记本电脑的电池使用情况和状态

1、键盘输入WinR,输入cmd,然后在命令提示符界面输入 powercfg/batteryreport2、将显示的路径复制到浏览器中查看

造假高手——faker

在测试写好的代码时通常需要用到一些测试数据,大量的真实数据有时候很难获取,如果手动制造测试数据又过于繁重无聊,显得不够优雅,今天我们介绍的faker这个轮子可以完美的解决这个问题。faker是一个用于生成各种类型假数据的库&…

多模态模型是什么意思(国内外的AI多模态有哪些)

在人工智能和机器学习的领域,我们经常会遇到一些专业术语,这些术语可能会让初学者感到困惑。其中,"多模态模型"就是这样一个概念。 什么是AI多模态。它是什么意思呢? 那么,多模态模型是什么意思呢&#xff1…

前端开发之中svg图标的使用和实例

svg图标的使用和实例 前言效果图1、安装插件2、vue3中使用2.1、 在components文件夹中,创建公共类SvgIcon/index.vue2.2、创建icons文件,存放svg图标和将所有的svg图标进行引用并注册成全局组件2.3、在man.js 中注册2.4、在vue.config.js中配置svg2.5、在vue中的调用svg图标3…