肉食食材大数据平台(附源码)

news2024/11/24 10:34:45

目录

一.需求分析

1.项目背景

2.用户简介

3.术语定义

4.功能概述

二.概要设计

1.概要设计流程图

2.流程图详细说明

三.数据库设计

1.软件名称

2.概念结构设计

2.1电商模块

2.2猪肉今日价格模块

2.3大屏展示模块

2.3.1舆论舆情

2.3.2 省均价模块

2.3.3进出口模块

2.3.4喜好程度分析模块

四.详细设计

1.电商展示模块

1.1数据爬取

1.2数据计算

1.3 web展示

2.今日猪价模块

2.1数据爬取

2.2web展示

3.大屏展示模块

3.1舆论舆情

3.1.1数据爬取

3.1.2 web展示

3.2今日省均价

3.2.1数据计采集计算

3.2.2 web展示

3.3喜好程度分析模块

3.3.1评论预处理

3.3.1.1评论去重

3.3.1.2数据清洗

3.3.2评论分词

3.3.2.1分词、词性标注、去除停用词

3.3.2.2提取含名词的评论

3.3.2.3绘制词云查看分词效果

3.3.3评论数据情感倾向分析

3.3.3.1匹配情感词

3.3.3.2修正情感倾向

3.3.3.3查看情感分析效果

五.软件使用

1.首页

2.模块​编辑

2.1大数据展示平台

2.1.1舆论舆情

2.1.2地图展示

2.2各省市每日肉价模块

2.3电商展示模块

六.安装部署

1.安装规划

1.1两台Linux操作系统服务器

1.2两台服务器说明

1.2.1一台服务器:

1.2.2另一台服务器:

2.系统概述

2.1硬件

2.2软件

七.项目背景

八.项目内容

1.数据大屏展示

2.猪肉每日肉价可视化

3.肉质智能识别

4.电商肉食数据展示

九.核心技术

1.大数据分析计算

2.喜好程度分析

3.图像智能识别

十.平台优势

十一.源码和相关文档


一.需求分析

1.项目背景

        因猪周期和猪瘟缘故,自2018年10月份以来,生猪基础产能大幅下降,共需不足,价格暴涨。中华人民共和国农业农村部制定方案《加快生猪生产恢复发展三年行动方案》,加大各项补贴政策,猪肉行业前景大好。受“居家隔离”影响,虚拟猪肉经济占比明显提高。猪肉进口关税提高,进口量减小,国产比重变大。

2.用户简介

        该项目的用户为个体自营养殖屠宰户和电商用户,旨在为创业者提供服务。年龄为20-50的人群,其具有一定的学习能力和网页操作能力。

3.术语定义

土杂猪:是由良种猪与本地猪杂交而来的。

内三元:以中国地方品种猪为母本,以进口猪为父本的一代杂交猪,再以进口猪为终端父本杂交而成,第一代的母本是家猪品种。

外三元:以大白猪作为母本,长白作为第一父本,杜洛克作为第二父本。其中、长白和杜洛克的猪都是进口品种,具有三种进口猪的基因。

4.功能概述

(1)电商展示模块,如名称、价格、原产地、进出口情况、毛重、净重等,可进行模糊查询。

(2)各省市今日肉价模块,可精确到地级市,展示土杂猪,内三元猪,外三元猪今日猪肉价格

(3)大屏数据展示:今日较昨日涨跌情况展示,今日新闻舆论展示,舆情词云图,电商评论喜好程度分析展示,今日各省平均肉价地图展示。

二.概要设计

1.概要设计流程图

2.流程图详细说明

1.利用python爬虫定时对京东生鲜电商肉类食材数据、猪肉价格数据、舆论舆情数据进行爬取。

2.利用flume,kafka对数据进行实时采集。

3.使用flink、spark分别进行实时计算和离线计算,利用python对商品评论进行喜好程度分析。

4.将分析计算后的数据导入mysql数据库。

5.采用前后端分离开发方式使用springboot、Vue+echarts对数据进行可视化展示。

三.数据库设计

1.软件名称

数据库软件:Mysql 8.0.26

管理员工具:navicat 15

数据库名称:pork

2.概念结构设计

2.1电商模块

2.2猪肉今日价格模块

2.3大屏展示模块

2.3.1舆论舆情

2.3.2 省均价模块

2.3.3进出口模块

2.3.4喜好程度分析模块

四.详细设计

1.电商展示模块

1.1数据爬取

使用python+selenium库对京东生鲜进行数据爬取。

1.2数据计算

将爬取的数据转化成结构化数据。利用spark框架对于编号重复的商品进行去重,只保留该商品第一次出现的记录。对于缺失值的处理,对于缺失多个属性的记录将其直接删除;对于没有价格的数据,采用网上搜索该商品价格和填充为同种类商品价格的均值两种方法进行处理;对于商品产地的缺失处理,采用继承上一条同种类商品的产地和默认填充为中国大陆两种方法结合;对于同种类商品净重的处理,网上查阅信息,填充为0~500g、500g~1000g、1000g~1500g三个类别;对于属性国产\进口的缺失值处理和上述方法类似。

利用函数式编程的scala语言和spark框架相结合,分析处理出每类商品的均值,每类商品本土生产、进口的比重等工作,为后续数据分析工作提供帮助。

1.3 web展示

使用springboot后端框架+mybatis puls对mysql数据进行模糊查询以及抽取。

前端使用vue2+vuex3+axios+elementUI等技术,接受后端传回来的数据,进行分页展示,具有输入框、选择地区、国产进口等功能。

2.今日猪价模块

2.1数据爬取

使用python+selenim库爬取猪肉价格数据存入mysql,将py文件部署于linux远程服务器上编辑脚本文件使用crontab服务工具定时调度脚本以执行爬虫任务。

2.2web展示

使用springboot后端框架+mybatis puls对mysql数据抽取。

前端使用vue2+vuex3+elementUI+Echarts等技术,使用阿里云的地图json文件,地图下钻获取各个省份的各个市的三种猪肉的当日价格。

3.大屏展示模块

3.1舆论舆情

3.1.1数据爬取

使用python+selenim库爬取舆论舆情数据数据存入mysql,利用jie ba + word cloud对舆情数据进行分词以及词语图的绘制。将py文件部署于linux远程服务器上编辑脚本文件使用crontab服务工具定时调度脚本以执行爬虫任务更新数据和词云图。

3.1.2 web展示

使用springboot后端框架+mybatis puls对mysql数据抽取以及读取词云图转为字节数组返回给前端

前端使用vue2+axios处理后端传回来的字节数组,以图片的形式展现出来。

3.2今日省均价

3.2.1数据计采集计算

使用flume监控目录文件夹,对爬虫的数据进行采集,输出到kafka消息队列,flink从Kafka中读取数据进行均价计算存入mysql。

3.2.2 web展示

使用springboot后端框架+mybatis puls对mysql数据抽取返回给前端。

前端使用vue2+vuex3+elementUI+Echarts等技术,使用阿里云的地图json文件,通过中国地图展示出各省的三种猪肉当日均价。

3.3喜好程度分析模块

3.3.1评论预处理
3.3.1.1评论去重

获取的数据有些评论相似度极高,可是在某些词语的运用上存在差异。为了存留更多的有用数据,删除完全重复部分,以确保保留有用的文本评论信息。

3.3.1.2数据清洗

评论数据中包含许多数字与字母,这类数据本身并没有实质性帮助。另外,由于该评论文本数据围绕京东生鲜中的肉类进行评价的,其中“京东”“快递”“京东生鲜”等词出现的频数很大,但对分析并没有什么作用,因此可以在分词之前将这些词去除,对数据进行清洗。

3.3.2评论分词
3.3.2.1分词、词性标注、去除停用词

使用Python中的jieba库将词语转化为数据框形式(一列是词,一列是词语所在的句子id,最后一列是词语在该句子中的位置)并删除标点符号和停用词。

3.3.2.2提取含名词的评论

由于分析目标是肉类产品的优缺点,评论中只有出现明确的名词,才有意义,因此需要对分词后的词语进行词性标注,之后再根据词性将含有名词类的评论提取出来。

3.3.2.3绘制词云查看分词效果

对预处理后的数据绘制词云查看分词效果,首先进行词频统计,将词频按照降序排序,然后选择前100个词,使用wordcloud模块中的WordCloud绘制词云,查看分词效果。

3.3.3评论数据情感倾向分析
3.3.3.1匹配情感词

情感倾向也称为情感极性。在某商品评论中,可以理解为用户对该商品表达自身观点所持的态度是支持、反对还是中立,即通常所指的正面情感、负面情感、中性情感。由于本案例主要是对肉类产品的优缺点进行分析,因此只要确定用户评论信息中的情感倾向方向分析即可,不需要分析每一评论的情感程度。对评论情感倾向进行分析首先要对情感词进行匹配,主要采用词典匹配的方法,本案例使用的情感词表是2007年10月22日知网发布的“情感分析用词语集 ( beta版)”,主要使用“中文正面评价”词表、“中文负面评价”“中文正面情感”“中文负面情感"词表等。将“中文正面评价”“中文正面情感”两个词表合并,并给每个词语赋予初始权重1,作为本案例的正面评论情感词表。将“中文负面评价”“中文负面情感”两个词表合并,并给每个词语赋予初始权重-1,作为本案例的负面评论情感词表。

一般基于词表的情感分析方法,分析的效果往往与情感词表内的词语有较强的相关性,如果情感词表内的词语足够全面,并且词语符合该案例场景下所表达的情感,那么情感分析的效果会更好。针对本评论分析,需要在知网提供的词表基础上进行优化.例如“好评”“超值”“差评”“五分”等词只有在网络购物评论上出现,就可以根据词语的情感倾向添加至对应的情感词表内。将“满意”“好评”“很快”“还好”“还行”“超值”“给力”“支持”“超好”“感谢”“太棒了”“厉害”“挺舒服”“辛苦”“完美”“喜欢”“值得”“省心”等词添加进正面情感词表。将“差评”“贵”“高”等词加入负面情感词表。

3.3.3.2修正情感倾向

情感倾向修正主要根据情感词前面两个位置的词语是否存在否定词而去判断情感值的正确与否,由于汉语中存在多重否定现象,即当否定词出现奇数次时,表示否定意思;当否定词出现偶数次时,表示肯定意思。按照汉语习惯,搜索每个情感词前两个词语,若出现奇数否定词,则调整为相反的情感极性。本分析使用的否定词表共有19个否定词,分别为:不、没、无、非、莫、弗、毋、未、否、别、六、休、不是、不能、不可、没有、不用、不要、从没、不太。读入否定词表,对情感值的方向进行修正。计算每条评论的情感得分,将评论分为正面评论和负面评论。

3.3.3.3查看情感分析效果

提出正面评论和负面评论,然后分别绘制词云,来查看情感分析效果,并计算各肉类评论的平均分。

五.软件使用

1.首页

软件地址: http://120.76.248.89/#/

2.模块

点击可进入相应模块

2.1大数据展示平台

2.1.1舆论舆情

自动滚动,点击可跳转相应新闻页

2.1.2地图展示

鼠标浮于地图之上可滚动放大缩小

可点击猪的不同种类查看相应价格

2.2各省市每日肉价模块

点击所要查看的省可以查看省内各市的猪肉价格


点击左边省地图空白区可返回中国地图

2.3电商展示模块

可以点击各省市,以及进出口进行筛选

六.安装部署

1.安装规划

1.1两台Linux操作系统服务器

一台部署flunk,Kafka,flume集群和python定时爬虫任务。

一台部署web项目jdk、和mysql数据库。

1.2两台服务器说明

1.2.1一台服务器:

作用:安装flink、flume、kafka、spark

防火墙:开放flinkwebUI端口号:8081、kafka端口号:9092

1.2.2另一台服务器:

作用:安装jdk、安装mysql数据库,设置允许远程链接配置。

防火墙:开放SpringBoot项目端口号:8070、开放mysql端口号:3306

2.系统概述

2.1硬件

双核

内存4G

系统盘80G

2.2软件

CentOS 8.2

Mysql 8.0.26

jdk1.8

flink1.3

Kafka2.12

Flume1.7

Python3.6

spark

七.项目背景

八.项目内容

1.数据大屏展示

2.猪肉每日肉价可视化

3.肉质智能识别

4.电商肉食数据展示

九.核心技术

1.大数据分析计算

2.喜好程度分析

3.图像智能识别

十.平台优势

十一.源码和相关文档

肉食食材大数据平台

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1424811.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Pyecharts绘制多种炫酷气泡图

Pyecharts绘制多种炫酷气泡图 引言 数据可视化是数据分析中不可或缺的一环,而Pyecharts作为一款基于Echarts的Python图表库,提供了丰富的图表类型,其中气泡图是一种常用于展示三维数据的炫酷图表。本文将介绍如何使用Pyecharts绘制多种炫酷…

【CSS】css获取子元素的父元素,即通过子元素选择父元素(使用CSS伪类 :has() :not() )

这里写目录标题 一、:has获取第一个div获取包含 a.active 的 li获取第二个div 二、:not除了类名为active 的 a,其他的a的字体都为18px <div><h1>标题</h1></div><div><ul><li><a href"#" class"active">测…

基于YOLOv8的水下生物检测,多种优化方法---自研注意力BSAM助力涨点(一)

&#x1f4a1;&#x1f4a1;&#x1f4a1;本文主要内容:详细介绍了水下生物检测整个过程&#xff0c;从数据集到训练模型到结果可视化分析&#xff0c;以及如何优化提升检测性能。 &#x1f4a1;&#x1f4a1;&#x1f4a1;加入自研注意力BSAM mAP0.5由原始的0.522提升至0.553…

【AG32VF407】国产MCU+FPGA,更新官方固件解决8Mhz内部晶振不准,Verilog实测7.9Mhz!

视频讲解 [AG32VF407]国产MCUFPGA&#xff0c;更新官方固件解决8Mhz内部晶振不准&#xff0c;Verilog实测7.9Mhz&#xff01; 实验过程 之前出现的双路pll不同频率的测试中&#xff0c;提出了内部晶振输出不准的问题&#xff0c;和官方沟通后得到极大改善&#xff0c;方法如下…

Excel技能——使用条件格式保护数据

1.选中需要保护数据的单元格 2.选择“条件格式”——“新建规则” 3.选择“使用公式确定要设置格式的单元格”——在条件单元格设置格式的位置&#xff0c;写“”——光标选中输入密码的单元格&#xff0c;此处是点击“123”处的单元格——输入“<>”&#xff08;意思是不…

Unity学习之Unity核心(一)2D相关

文章目录 1. 前言2 图片导入概述3 图片设置的六大部分3.1 纹理类型3.1.1 Default3.1.2 Normal Map 法线贴图格式3.1.3 Editor GUI and Legacy GUI3.1.4 Sprite3.1.5 Cursor 自定义光标3.1.6 Cookie 光源剪影格式3.1.7 LightMap光照贴图格式3.1.8 Single Channel 纹理只需要单通…

【Python 元类探秘】之四:深入检查类定义✨

【Python 元类探秘】之四&#xff1a;深入检查类定义 &#x1f50d; 前言 &#x1f389; 在 Python 的编程艺术中&#xff0c;元类&#xff08;Metaclass&#xff09;犹如幕后的导演&#x1f3ac;&#xff0c;悄然塑造着类的本质和行为。这个概念&#xff0c;虽然对于初学者来…

存内计算技术—解决冯·诺依曼瓶颈的AI算力引擎

文章目录 存内计算技术背景CSDN首个存内计算开发者社区硅基光电子技术存内计算提升AI算力知存科技存算一体芯片技术基于存内计算的语音芯片的实现挑战 参考文献 存内计算技术背景 存内计算技术是一种革新性的计算架构&#xff0c;旨在克服传统冯诺依曼架构的瓶颈&#xff0c;并…

家居设计软件的开发框架

家居设计软件的开发框架可以涵盖多个方面&#xff0c;包括图形渲染、用户界面、数据库管理等。以下是一些常用的开发框架和技术&#xff0c;可以用于家居设计软件的开发&#xff0c;希望对大家有所帮助。北京木奇移动技术有限公司&#xff0c;专业的软件外包开发公司&#xff0…

linux解决访问/下载github连接超时或下载慢的问题

问题 我这里是树莓派从github下载资源出现无法连接&#xff0c;连接超时的问题&#xff0c;如下所示解决方式 修改/etc/hosts文件 例&#xff1a; sudo nano /etc/hosts #添加如下 192.30.255.112 github.com git 185.31.16.184 github.global.ssl.fastly.net这里以树莓派为…

element中calendar组件自定义显示(例如:日期上面显示工作负责人)vue+element自定义日历

目录 1. 属性了解&#xff08;[更多](https://element.eleme.cn/#/zh-CN/component/calendar)&#xff09;2. 代码实现3. 效果图 1. 属性了解&#xff08;更多&#xff09; 2. 代码实现 <template><div class"CalendarPage"><!-- 按年月筛选&#xf…

全链路压测的关键点是什么?

全链路压测是一种重要的性能测试方法&#xff0c;用于评估应用程序或系统在真实生产环境下的性能表现。通过模拟真实用户行为和流量&#xff0c;全链路压测能够全面评估系统在不同负载下的稳定性和性能表现。本文将介绍全链路压测的关键点&#xff0c;以帮助企业更好地理解和应…

QSqlRelationalTableModel 关系表格模型

一、 1.1 QSqlRelationalTableModel继承自QSqlTableModel&#xff0c;并且对其进行了扩展&#xff0c;提供了对外键的支持。一个外键就是一个表中的一个字段 和 其他表中的主键字段之间的一对一的映射。例如&#xff0c;“studInfo”表中的departID字段对应的是“departments…

linux环境安装git、maven、jenkins等

重启 jenkins的命令&#xff1a; systemctl start jenkins 如果没有vim 命令 可以使用 yum install vim 安装 vim git 下载包地址 https://www.kernel.org/pub/software/scm/git/git-2.28.0.tar.gz 1.安装依赖环境&#xff1a; yum install -y curl-devel expat-devel ge…

RK3588平台开发系列讲解(视频篇)RKMedia的VDEC模块

文章目录 一、 VDEC模块支持的编码标准介绍二、VDEC API的调用三、VDEC解码流程沉淀、分享、成长,让自己和他人都能有所收获!😄 📢RKMedia是RK提供的一种多媒体处理方案,可实现音视频捕获、音视频输出、音视频编解码等功能。 一、 VDEC模块支持的编码标准介绍 RK3688 V…

【C/C++ 04】归并排序

归并排序&#xff08;MERGE-SORT&#xff09;是建立在归并操作上的一种有效的排序算法&#xff0c;该算法是采用分治法&#xff08;Divide and Conquer&#xff09;的一个非常典型的应用&#xff0c;也是用空间换时间思维的体现。 将已有序的子序列合并&#xff0c;得到完全有…

洁净室环境监测轮转系统lighthouse多路切换采样系统 中邦兴业

顺序多路切换采样系统在监测颗粒趋势方面发挥着至关重要的作用&#xff0c;特别是在注重产品产量的应用。虽然GMP法规没有强制要求使用这样的系统&#xff0c;但这样的系统在半导体和磁盘驱动器等行业中得到了广泛应用。半导体行业依靠顺序多路切换采样系统来确保颗粒物水平保持…

QT5.14+VS2017安装踩过的一些坑

1.在QT中使用MSVC只能用VS2017&#xff0c;相应的调试器的版本只能用15.9&#xff0c;高于15.9的亲测都不行。完整的安装除了需要QT5.15和VS2017&#xff0c;还需要Windows SDK (10.0.22621) 下载地址&#xff1a;https://developer.microsoft.com/zh-cn/windows/downloads/win…

2023年06月CCF-GESP编程能力等级认证Python编程四级真题解析

一、单选题(共15题,共30分) 第1题 高级语言编写的程序需要经过以下( )操作,可以生成在计算机上运行的可执行代码。 A:编辑 B:保存 C:调试 D:编译 答案:D 第2题 排序算法是稳定的(Stable Sorting),就是指排序算法可以保证,在待排序数据中有两个相等记录的关…

网络协议 TCP协议

网络协议 TCP协议 文章目录 网络协议 TCP协议1. TCP协议段格式2. 可靠传输保障机制2.1 确认应答2.2 超时重传 3. 连接保障机制3.1 三次握手&#xff08;建立连接&#xff09;3.2 四次挥手&#xff08;断开连接&#xff09;3.3 TCP状态转换过程 4. 传输效率保障机制4.1 滑动窗口…