用4种回归方法绘制预测结果图表:向量回归、随机森林回归、线性回归、K-最近邻回归

news2024/10/7 14:24:08

文章目录

  • 表格部分数据如下
  • 运行效果如下
  • 代码解析
  • 完整代码
  • 附件

表格部分数据如下

在这里插入图片描述
附件里会给出全部数据链接

运行效果如下

在这里插入图片描述
在这里插入图片描述

代码解析

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties

font = FontProperties(fname='PingFang Bold.ttf')

导入需要用到的Python库。pandas用于处理数据,numpy用于科学计算,matplotlib.pyplot用于绘图,FontProperties用于设置字体属性。在这里我们导入了中文字体PingFang Bold.ttf,以后进行绘图时就可以使用这个字体了。

df = pd.read_excel('中国各地现货棉花价格.xlsx')
df['指标名称'] = pd.to_datetime(df['指标名称'])
df.set_index('指标名称', inplace=True)
df.fillna(method='ffill', inplace=True)

打开了名为“中国各地现货棉花价格.xlsx”的Excel文件,并将数据存储到名为df的pandas DataFrame中。接下来,在DataFrame中执行以下操作:

  • 将“指标名称”列转换为datetime类型;
  • 将“指标名称”列设置为索引;
  • 使用前向填充(ffill)方法填充缺失值。
plt.figure(figsize=[15,8])
plt.plot(df['新疆:现货价:棉花'], label='新疆')
plt.plot(df['中国:现货价:平均价:棉花'], label='中国')
plt.plot(df['山东:现货价:棉花'], label='山东')
plt.plot(df['河南:现货价:棉花'], label='河南')
plt.plot(df['江苏:现货价:棉花'], label='江苏')
plt.plot(df['河北:现货价:棉花'], label='河北')
plt.plot(df['湖北:现货价:棉花'], label='湖北')
plt.plot(df['浙江:现货价:棉花'], label='浙江')
plt.plot(df['安徽:现货价:棉花'], label='安徽')
plt.plot(df['重庆:现货价:棉花'], label='重庆')
plt.plot(df['辽宁:现货价:棉花'], label='辽宁')
plt.plot(df['北京:现货价:棉花'], label='北京')
plt.plot(df['陕西:现货价:棉花'], label='陕西')
plt.plot(df['山西:现货价:棉花'], label='山西')
plt.plot(df['中国棉花价格指数:328'], label='中国棉花价格指数:328')
plt.plot(df['中国棉花价格指数:229'], label='中国棉花价格指数:229')
plt.plot(df['中国棉花价格指数:527'], label='中国棉花价格指数:527')
plt.legend(loc='upper left', prop=font)
plt.xlabel('时间', fontproperties=font)
plt.ylabel('价格', fontproperties=font)
plt.title('各地棉花现货价格趋势', fontproperties=font)
plt.show()

绘制了各个地区棉花现货价格趋势图。首先使用matplotlib.pyplot库的figure()函数创建一个大小为15*8的绘图空间,然后使用plot()函数将各地棉花现货价格数据绘制到同一张图表上,并为每个数据系列添加了标签和线条颜色。最后添加图例、横纵坐标标题和图表标题,并调用show()函数显示图表。

train = df.iloc[:-10, :]
test = df.iloc[-10:, :]

将读取的数据集拆分成前面的训练集和后面的测试集。这里将DataFrame对象转换为了numpy数组,并使用“最后10个数据”作为测试集,“除了最后10个数据以外的数据”作为训练集。

X_train = train.drop('中国棉花价格指数:527', axis=1)
y_train = train['中国棉花价格指数:527']
X_test = test.drop('中国棉花价格指数:527', axis=1)
y_test = test['中国棉花价格指数:527']

通过drop()函数删除’target’列,获取输入和输出数据。在这里输入数据由除了中国棉花价格指数:527以外的数据组成,而输出数据只包含中国棉花价格指数:527这一列。

svr = SVR(kernel='rbf', C=10, gamma='auto')
svr.fit(X_train, y_train)

rf = RandomForestRegressor(n_estimators=100, random_state=0, criterion='mse', max_depth=None,
                            min_samples_split=2, min_samples_leaf=1, max_features='auto',
                            bootstrap=True, n_jobs=-1)
rf.fit(X_train, y_train)

knn = KNeighborsRegressor(n_neighbors=5, weights='distance')
knn.fit(X_train, y_train)

lr = LinearRegression()
lr.fit(X_train, y_train)

定义了四个回归模型(支持向量回归、随机森林回归、线性回归和K-最近邻回归),并使用fit()函数基于训练集数据对这些模型进行训练。参数的设置需要根据实际情况和调参结果来进行调整。

svr_pred = svr.predict(X_test)
rf_pred = rf.predict(X_test)
knn_pred = knn.predict(X_test)
lr_pred = lr.predict(X_test)

使用 predict() 函数对测试集进行预测,得到四个回归模型的预测值。

plt.figure(figsize=[15,8])
plt.plot(test['中国棉花价格指数:527'].values, label='实际值')
plt.plot(svr_pred, label='支持向量回归')
plt.plot(rf_pred, label='随机森林回归')
plt.plot(knn_pred, label='K-最近邻回归')
plt.plot(lr_pred, label='线性回归')
plt.legend(loc='upper left', prop=font)
plt.xlabel('时间', fontproperties=font)
plt.ylabel('价格', fontproperties=font)
plt.title('不同算法的中国棉花价格指数预测', fontproperties=font)
plt.show()

将四种回归模型的预测结果与实际值一起绘制成图表,以便于对预测结果进行比较和评估。其中实际值来自测试集中的数据。

完整代码


# 导入必要的库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
# 创建字体对象
font = FontProperties(fname='PingFang Bold.ttf')

# from matplotlib.font_manager import FontProperties
# pd.set_option('display.max_rows', None)  # 显示所有行
# pd.set_option('display.max_columns', None) # 显示所有列
# 读取数据
df = pd.read_excel('中国各地现货棉花价格.xlsx')

# 将时间戳字段转换为 datetime 类型
df['指标名称'] = pd.to_datetime(df['指标名称'])

# 设定时间戳为数据索引
df.set_index('指标名称', inplace=True)

# 使用缺失值前向填充方法填充缺失值
df.fillna(method='ffill', inplace=True)

# 查看数据框结构
# print(df)



# 绘制每个地区的棉花价格
plt.figure(figsize=[15,8])
plt.plot(df['新疆:现货价:棉花'], label='新疆')
plt.plot(df['中国:现货价:平均价:棉花'], label='中国')
plt.plot(df['山东:现货价:棉花'], label='山东')
plt.plot(df['河南:现货价:棉花'], label='河南')
plt.plot(df['江苏:现货价:棉花'], label='江苏')
plt.plot(df['河北:现货价:棉花'], label='河北')
plt.plot(df['湖北:现货价:棉花'], label='湖北')
plt.plot(df['浙江:现货价:棉花'], label='浙江')
plt.plot(df['安徽:现货价:棉花'], label='安徽')
plt.plot(df['重庆:现货价:棉花'], label='重庆')
plt.plot(df['辽宁:现货价:棉花'], label='辽宁')
plt.plot(df['北京:现货价:棉花'], label='北京')
plt.plot(df['陕西:现货价:棉花'], label='陕西')
plt.plot(df['山西:现货价:棉花'], label='山西')
plt.plot(df['中国棉花价格指数:328'], label='中国棉花价格指数:328')
plt.plot(df['中国棉花价格指数:229'], label='中国棉花价格指数:229')

plt.plot(df['中国棉花价格指数:527'], label='中国棉花价格指数:527')
plt.legend(loc='upper left', prop=font)
plt.xlabel('时间', fontproperties=font)
plt.ylabel('价格', fontproperties=font)
plt.title('各地棉花现货价格趋势', fontproperties=font)
plt.show()

# 划分数据集
train = df.iloc[:-10, :]
test = df.iloc[-10:, :]


# 支持向量回归
from sklearn.svm import SVR

X_train = train.drop('中国棉花价格指数:527', axis=1)
y_train = train['中国棉花价格指数:527']
X_test = test.drop('中国棉花价格指数:527', axis=1)
y_test = test['中国棉花价格指数:527']

# svr = SVR(kernel='poly', C=100, gamma='auto', degree=3, epsilon=.1, coef0=1)
# svr.fit(X_train, y_train)
#
# # # 随机森林回归
# from sklearn.ensemble import RandomForestRegressor
#
# rf = RandomForestRegressor(n_estimators=10, random_state=0)
# rf.fit(X_train, y_train)
#
# # 线性回归
from sklearn.linear_model import LinearRegression

lr = LinearRegression()
lr.fit(X_train, y_train)
#
# # K-最近邻回归
# from sklearn.neighbors import KNeighborsRegressor
#
# knn = KNeighborsRegressor(n_neighbors=2)
# knn.fit(X_train, y_train)


svr = SVR(kernel='rbf', C=10, gamma='auto')
svr.fit(X_train, y_train)

# 随机森林回归
from sklearn.ensemble import RandomForestRegressor

rf = RandomForestRegressor(n_estimators=100, random_state=0, criterion='friedman_mse', max_depth=None,
                            min_samples_split=2, min_samples_leaf=1, max_features='auto',
                            bootstrap=True, n_jobs=-1)
rf.fit(X_train, y_train)


# K-最近邻回归
from sklearn.neighbors import KNeighborsRegressor

knn = KNeighborsRegressor(n_neighbors=5, weights='distance')
knn.fit(X_train, y_train)
# 预测
svr_pred = svr.predict(X_test)
rf_pred = rf.predict(X_test)
lr_pred = lr.predict(X_test)
knn_pred = knn.predict(X_test)
# print(test['中国棉花价格指数:527'].values)

# 展示预测结果
plt.figure(figsize=[15,8])
plt.plot(test['中国棉花价格指数:527'].values, label='实际值')
plt.plot(svr_pred, label='支持向量回归')
plt.plot(rf_pred, label='随机森林回归')
plt.plot(lr_pred, label='线性回归')
plt.plot(knn_pred, label='K-最近邻回归')
plt.legend(loc='upper left', prop=font)
plt.xlabel('时间', fontproperties=font)
plt.ylabel('价格', fontproperties=font)
plt.title('不同算法的中国棉花价格指数预测', fontproperties=font)
plt.show()

附件

链接: https://pan.baidu.com/s/1qa99ntHsozgqB2xliVYd7A 提取码: sp9h
–来自百度网盘超级会员v6的分享

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/644762.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FPGA实现USB3.0 UVC 相机彩条视频输出 基于FT602驱动 提供工程源码和QT上位机源码

目录 1、前言2、UVC简介3、FT602芯片解读4、我这儿的 FT601 USB3.0通信方案5、详细设计方案基于FT602的UVC模块详解 6、vivado工程详解7、上板调试验证8、福利:工程代码的获取 1、前言 目前USB3.0的实现方案很多,但就简单好用的角度而言,FT6…

用代码玩转迷你图:手把手教你用编程语言打造简洁易读的数据图表!

前言 迷你图(Mini Chart)最早起源于流程图和组织架构图中的一种简化图形,用于表示一个大型数据集合中的趋势和变化。随着数据可视化技术的发展,迷你图也被广泛应用在各种类型的数据图表中,例如折线图、柱形图、散点图…

【027】C++类和对象的基本概念

C类和对象的基本概念 引言一、类的封装性二、定义一个类三、设计一个类3.1、示例一:设计一个Person类3.1、示例二:设计一个Cube类 四、成员函数在类外实现五、类在其他源文件中实现总结 引言 💡 作者简介:专注于C/C高性能程序设计…

RFID工业读头工作原理和优势

RFID工业读头由天线,耦合元件,芯片,可对RFID标签信息进行读取和写入,在工业上也常作为信息的传输、处理的载体。下面我们就一起来了解一下,工业读头工作原理和优势是什么。 工业读头工作原理 工业RFID读头主要是通过天…

微信小程序嵌入H5页面,最简单的兼容方式web-view

//index.wxml---------------------------------------- <web-view src"{{src}}" />//index.js---------------------------------------- Page({data: {src: "https://dz.wedoyun.cn/mobile/?v20230615",},});

1.6C++双目运算符重载

C双目运算符重载 C中的双目运算符重载指的是重载二元运算符&#xff0c;即有两个操作数的运算符&#xff0c;如加减乘除运算符“”、“-”、“*”和“/”等。 通过重载双目运算符&#xff0c;可以实现自定义类型的运算符操作。 比如可以通过重载加减运算符实现自定义类型的向…

电脑误删文件恢复怎么做?数据恢复,4招就行!

我有定期清理电脑的习惯&#xff0c;一般都会将电脑里的一些垃圾文件删除&#xff0c;但在最近一次的清理中&#xff0c;我不小心把重要的文件当作垃圾文件删除了&#xff0c;请问有什么比较好的解决方法吗&#xff1f;非常感谢&#xff01; 当下电脑的使用越来越频繁&#xff…

抖音seo源码-源代码开发搭建-开源部署(不加密)

抖音SEO矩阵系统源码开发功能模型是指在抖音平台上提高视频搜索排名的一种算法模型。该功能模型包括多个部分&#xff0c;如内容优化、用户交互、社交化推广等&#xff0c;通过对这些因素的优化和提升&#xff0c;达到提高视频搜索排名的目的。具体实现包括使用关键词、标签等优…

谷粒商城p46-配置网关路由与路径重写

软件 &#xff1a; vscode idea 服务&#xff1a; renren-fast&#xff0c;gulimall-product&#xff0c;gulimall-gateway、nacos 前提条件&#xff1a; gateway、renren-fast已经注册到nacos 注意&#xff1a; 1、renren-fast单独注入nacos依赖&#xff0c;不要注入common…

CAD绘制三维图形基础

绘制三维图形的基础操作包括&#xff1a; 1、打开3d绘图窗口&#xff0c;进入3d绘图界面 2、改变绘图视角 3、改变图形的展现形式 4、绘制基本的几何图形 5、掌握对齐等修改功能 6、掌握基础布尔操作 首先是切换工作空间&#xff0c;在界面的右下角有一个类似设置的按钮…

使用VitePress创建个人网站并部署到GitHub

网站在线预览 参考文档&#xff1a; VitePress 创建 GitHub 远程仓库 克隆远程仓库到本地 git clone gitgithub.com:themusecatcher/front-end-notes.git进入 front-end-notes/ 目录&#xff0c;添加 README.md 并建立分支跟踪 echo "# front-end-notes" >>…

配置Kettle连接大数据HDFS

需求&#xff1a;配置Kettle连接大数据HDFS Kettle对接大数据平台的配置 一&#xff0e;软件环境 1.Hadoop集群,版本&#xff1a;Hadoop3.3.0 2.ETL工具Kettle&#xff0c;版本&#xff1a;pdi-ce-7.0.0.0-25 &#xff08;解压命令&#xff1a;*.zip 用 unzip 解压&#xf…

4自由度并联机器狗实现下蹲功能

1. 功能说明 本文示例将实现R328a样机4自由度并联机器狗下蹲的功能。 2. 结构说明 本样机的并联驱动结构与 【R082】4自由度并联四足 类似&#xff0c;两款样机可以对比来看。 本样机腿部的结构如下图所示&#xff1a;驱动核心部分是两个5杆结构的组合。 两个五杆结构图 驱动核…

ASP.NET MVC下的四种验证编程方式

ASP.NET MVC采用Model绑定为目标Action生成了相应的参数列表&#xff0c;但是在真正执行目标Action方法之前&#xff0c;还需要对绑定的参数实施验证以确保其有效性&#xff0c;我们将针对参数的验证成为Model绑定。总地来说&#xff0c;我们可以采用4种不同的编程模式来进行针…

手机号码篡改测试-业务安全测试实操(6)

手机号码篡改测试, 用户ID篡改测试 订单ID篡改测试-业务安全测试实操(5)_luozhonghua2000的博客-CSDN博客 手机号码篡改测试 测试原理和方法 手机号通常可以代表一个用户身份。当请求中发现有手机号参数时,我们可以试着修改它,测试是否存在越权漏洞。系统登录功能一般先判断…

计算机视觉研究院重新开启知识星球(前期我们免费加入)

点击蓝字 关注我们 关注并星标 从此不迷路 计算机视觉研究院 公众号ID&#xff5c;计算机视觉研究院 学习群&#xff5c;扫码在主页获取加入方式 计算机视觉研究院专栏 Column of Computer Vision Institute 满足广大兴趣关注者&#xff0c;最近我们平台重启了”知识星球“&…

聚观早报 |梅西将于14日淘宝开播;李斌回应蔚来全系车型降3万元

今日要闻&#xff1a;梅西将于6月14日上淘宝开播&#xff1b;李斌回应"蔚来全系车型降价3万元”&#xff1b;美国联邦贸易委员会阻止微软收购暴雪&#xff1b;称iPhone15洗系列最高涨价200美元&#xff1b;极兔正与顺丰洽谈入股 梅西将于6月14日上淘宝开播 据悉&#xff…

微服务springcloud 02 创建项目中的三个service子系统,springcloud中注册中心Eureka介绍和把三个系统注册到Eureka中

item service项目 01.使用springboot创建项目 02.选择依懒项在这里插入代码片 spring web 03.添加sp01-commons依赖 在pom.xml文件中 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" x…

「深度学习之优化算法」笔记(一):优化算法概述

优化算法笔记&#xff08;一&#xff09;优化算法的介绍 &#xff08;一&#xff09;优化算法的介绍 1.1&#xff08;what&#xff09;什么是优化算法&#xff1f; 我们常见常用的算法有排序算法,字符串遍历算法,寻路算法等。这些算法都是为了解决特定的问题而被提出。 算法本质…

基础知识学习---牛客网C++面试宝典(七)操作系统--第二节

1、本栏用来记录社招找工作过程中的内容&#xff0c;包括基础知识学习以及面试问题的记录等&#xff0c;以便于后续个人回顾学习&#xff1b; 暂时只有2023年3月份&#xff0c;第一次社招找工作的过程&#xff1b; 2、个人经历&#xff1a; 研究生期间课题是SLAM在无人机上的应…