基于网络爬虫的购物平台价格监测系统的设计与实现

news2024/9/28 17:34:18

通过对网络爬虫的购物平台价格监测系统的业务流程进行梳理可知,网络爬虫的购物平台价格监测系统主要由前台买家模块、后台卖家模块以及管理员模块构成。前台功能包含登录功能、注册功能、系统首页功能、唯品会商品详情浏览、唯品会商品收藏、唯品会商品点赞、唯品会商品价格监测、唯品会商品消息提醒、我的个人中心等等、爬虫功能。系统整体功能模块逻辑图如图2-1所示。

图2-1 系统模块图

2.2.1 功能需求

用户和商家操作流程分为以下五个步骤:

1.用户可以浏览唯品会商品的分类、分类下的唯品会商品。首页有轮播图播放,用户可以通过点击进入唯品会商品链接浏览单个(或单类)唯品会商品的具体信息。用户可以根据关键字搜索唯品会商品,然后选购唯品会商品。

2.用户可在线选购自己喜欢的商品进行浏览加购,在唯品会商品详情界面可以点赞、收藏或者取消收藏,加入价格监测等等。

3.用户通过加购到价格监测里的商品,对商品进行在线支付购买。

4.商品价格监测到指定价格,消息提醒到用户。

5.用户买家对自己购买的唯品会商品订单进行收货处理,然后进行评论,可上传图片。

用户成功登录之后,左边会展示唯品会商品分类,点击左边的唯品会商品分类,展示该分类下面的所有唯品会商品,可以根据唯品会商品的名称模糊搜索唯品会商品,对唯品会商品进行模糊匹配搜索操作。通过GoodsController[16]后台控制器,根据GoodsService的QueryGoodsLike方法查询唯品会商品,SQL语句中用到Like模糊匹配查询得到结果,浏览唯品会商品的界面如图4-3所示。

图4-3 浏览唯品会商品界面

4.1.4 唯品会商品搜索

用户登录电商用户唯品会商品购物平台系统之后,可以输入关键字模糊匹配,从而快速匹配关键字相关的唯品会商品,主要原理是通过数据库的“Like”关键字去模糊查询数据库里面的数据[17]。通过GoodsController后台控制器,根据GoodsService的QueryGoodsLike方法查询唯品会商品,SQL语句中用到Like模糊匹配查询得到结果,唯品会商品搜索界面如图4-4所示。

图4-4 唯品会商品搜索界面

4.1.5 查询唯品会商品详情

电商用户唯品会商品详情界面的界面设计是左边展示唯品会商品图片,右边展示唯品会商品名称、具体规格,详情界面具体的功能有加入价格监测,收藏或者取消收藏,超赞功能。

1.价格监测功能:对心仪的唯品会商品可以加入价格监测,进行快速结算;

2.收藏功能:对喜欢的唯品会商品可以加入收藏或者取消收藏;

3.超赞功能:这是本系统设计的特色之处,可以对喜欢的唯品会商品进行超赞,可以点击赞美,增加其次数,次数多的会推荐给用户。

通过CartController控制评论的后台流转,通过CartService对add接口进行操作;通过GuessController控制评论的后台流转,通过GuessService对add或者delete取消收藏接口进行操作。电商用户唯品会商品详情界面如图4-5所示。

图4-5 查询唯品会商品详情界面

4.1.6 加入价格监测

用户选购自己所需唯品会商品,选择数量,加入价格监测,用户可对价格监测进行管理。通过CartController控制评论的后台流转,通过CartService对add接口进行操作,通过add方法操作数据库,价格监测界面如图4-6所示。

图4-6 加入价格监测界面

4.1.7 我的商品监测

用户点击“价格监测”按钮之后,会添加到价格监测列表[18],通过定时任务去定时监测价格,通过MonitorController控制评论的后台流转,,价格监测界面如图4-7所示。

图4-7 订单结算界面

4.1.8 下单成功

用户对唯品会商品订单提交之后,生成订单号,会显示当前订单信息,则下单成功。下单时通过MonitorController控制评论的后台流转,通过MonitorService对commit接口进行操作,通过commit方法操作数据库,下单成功界面如图4-8所示。

图4-8 提交订单界面

4.1.9 支付成功

用户购买支付成功,完成交易。通过MonitorController控制评论的后台流转,通过MonitorService对pay接口进行操作,通过pay方法操作数据库,完成交易界面如图4-9所示。

图4-9 支付成功界面

4.2 爬虫部分的实现

后台管理是包含用户信息管理、唯品会商品分类管理、唯品会商品信息管理、唯品会商品订单管理、评论管理、账户管理等等功能,本章节将会对后台管理功能进行详细的介绍。

4.2.1 爬虫功能

管理员登录是需要进行管理员验证,第一步、打开唯品会网站  https://www.vip.com。然后随意搜索一种商品,比如"键盘",搜索之后下拉发现页面URL没有发生改变,但是商品信息在不断加载,那么这就是动态Ajax技术,遇到这种情况,第一反应就是找接口。

第二步、打开开发者工具,鼠标右键,点击检查,切换到Network选项卡,然后刷新唯品会页面,进行抓包,然后查看每个包的pirview,发现商品信息在‘ v2?callback=getMerchandise’中,我们来看一下URL,不看不要紧,一看吓一跳-_-,这URL也太长了,研究一下参数,发现主要是每件商品都有自己的pid,那么接下来,只要我们找到商品的pid就可以抓取数据了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1506730.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

9. 内核、文件系统加载工具

内核、文件系统加载工具 内核、文件系统加载工具是嵌入式开发必备的工具 1. 烧写BootLoader 1.1 通过超级终端方式 烧写 Bootloader 可以使用超级终端的“传送” |“发送文件”命令进入发送文件对话框,使用 Xmodem 协议和 Kermit 协议发送 Bootloader 的各个文件…

DenseNet笔记

📒from ©实现pytorch实现DenseNet(CNN经典网络模型详解) - 知乎 (zhihu.com) 是什么之 DenseBlock 读图: x0是inputH1的输入是x0 (input)H2的输入是x0和x1 (x1是H1的输出) Summary: 传统卷积网,网…

角蜥优化算法 (Horned Lizard Optimization Algorithm ,HLOA)求解无人机路径优化

一、无人机路径规划模型介绍 无人机三维路径规划是指在三维空间中为无人机规划一条合理的飞行路径,使其能够安全、高效地完成任务。路径规划是无人机自主飞行的关键技术之一,它可以通过算法和模型来确定无人机的航迹,以避开障碍物、优化飞行时间和节省能量消耗。 二、算法介…

python学习笔记------集合(set)

集合定义格式 基本语法: #定义集合字面量 {元素,元素,元素......,元素} #定义集合变量 变量名称{元素,元素,元素......,元素} #定义空集合 变量名称set() #定义集合字面量 {元素&#…

海纳斯Hinas安装Tailscale

海纳斯Hinas安装Tailscale 海纳斯安装Tailscale第一步,注册Tailscale账号,并在手机/电脑安装Tailscale第二步,进入海纳斯后台卸载重装Tailscale 海纳斯安装Tailscale 海纳斯自己安装了Tailscale,但是无法使用,需要卸载…

GPU,一统天下

三十年前,CPU 和其他专用处理器几乎处理所有计算任务。那个时代的显卡有助于加快 Windows 和应用程序中 2D 形状的绘制速度,但没有其他用途。 快进到今天,GPU 已经成为业界最具主导地位的芯片之一。 但具有讽刺意味的是,图形芯片…

系统分析与设计(一)

我们有这么多各式各样的工具,互联网给我们带来了这么多用户和数据,这是好事也有副作用。 世界上能访问用户数据,并根据数据做分析和改进的公司,大概Google是其中翘楚,这种 data-centric 的做法做过了头,也有悲剧发生: Douglas Bowman 曾经是Google 的视觉设计主管,2009年的一天…

2013-2021年全国31省电子商务销售额数据(无缺失)

2013-2021年全国31省电子商务销售额数据(无缺失) 1、时间:2013-2021年 2、指标:电子商务销售额数据 3、来源:国家TJ局、各省NJ 4、范围:31省 5、缺失情况:无缺失 6、指标解释:…

JavaScript高级Ⅱ(全面版)

接上文 JavaScript高级Ⅰ JavaScript高级Ⅰ(自认为很全面版)-CSDN博客 目录 第2章 DOM编程 2.1 DOM编程概述 2.1.4 案例演示(商品全选) 2.1.5 dom操作内容 代码演示: 运行效果: 2.1.6 dom操作属性 代码演示: 运行效果: 2…

程序设计基础--C语言【一】

课堂笔记 1.整数数制 整数数制包括二进制数、八进制数、十进制数、十六进制数 1.1.十进制数 基数为10,由0到9这十个数构成。例如,4261可以看作是: (4*1000)(2*100)(6*10&#x…

最简单的电子书制作方法

制作电子书的方法有很多种,但最简单的一种可能就是使用在线工具了。现在有很多免费的在线工具可以让您轻松地创建电子书,而无需任何编程或设计技能。以下是最简单的电子书制作方法: 1. 准备好制作工具:FLBOOK在线制作电子杂志平台…

内存管理 --- 页面置换算法

最优置换:(参照未来OPT) 可以将将来很长一段时间不会访问的逻辑页面,进行置换 举例说明: 首先物理空间只有4个,然后遍历了ABCD 页,其中,要访问5 e 了但是没有,即发生缺页…

登录凭证------

为什么需要登录凭证? web开发中,我们使用的协议http是无状态协议,http每次请求都是一个单独的请求,和之前的请求没有关系,服务器就不知道上一步你做了什么操作,我们需要一个办法证明我没登录过 制作登录凭…

【LLM】Advanced rag techniques: an illustrated overview

note 文章目录 noteAdvanced rag techniques: an illustrated overview基础RAG高级RAG分块和向量化(Chunking & Vectorisation)搜索索引(Search Index)1. 向量存储索引(Vector Store Index)2. 多层索引(Hierarchical Indices)3. 假设问题和HyDE(Hypo…

【笔记】全国大学生GIS应用技能大赛练习总结

该总结笔记为小组成员在练习完毕了历届题目后自我总结的结果,如有不足之处可以在评论区提出,排版较乱往谅解 绘制带空洞的面要素: 法一: 1、矢量化整个区域。2、矢量化空洞区域。3、将矢量化空洞区域进行合并(编辑器…

Linux之selinux详解

华子目录 概念作用selinux与传统的权限区别selinux工作原理名词解释主体(subject)目标(object)策略(policy)(多个规则的集合)安全上下文(security context) 文…

【数理统计实验(四)】方差分析

🍉CSDN小墨&晓末:https://blog.csdn.net/jd1813346972 个人介绍: 研一|统计学|干货分享          擅长Python、Matlab、R等主流编程软件          累计十余项国家级比赛奖项,参与研究经费10w、40w级横向 文…

美洲狮优化算法(Puma Optimizar Algorithm ,POA)求解机器人栅格地图最短路径规划(提供MATLAB代码)

一、美洲狮优化算法 美洲狮优化算法(Puma Optimizar Algorithm ,POA)由Benyamin Abdollahzadeh等人于2024年提出,其灵感来自美洲狮的智慧和生活。在该算法中,在探索和开发的每个阶段都提出了独特而强大的机制&#xf…

java继承,接口,抽象类

目录 目录 1 继承的含义 2 继承的好处 3使类与类之间产生了关系。 看这里继承-------我的理解 代码部分 接口 代码 抽象类 代码 各位友友们大家好呀😊! 今天让我们继续回顾java,看看java中的抽象类以及接口继承是什么&#x1f914…

【动态规划】代码随想录算法训练营第三十九天 |62.不同路径,63.不同路径II(待补充)

62.不同路径 1、题目链接:. - 力扣(LeetCode) 2、文章讲解:代码随想录 3、题目: 一个机器人位于一个 m x n 网格的左上角 (起始点在下图中标记为 “Start” )。 机器人每次只能向下或者向右…