简介
本文主要介绍的基于pytorch和房价预测深度学习网络构建。
该系统使用的是网络上的开源数据:
实现了对房价数据的处理,包括词频统计、情感分析等,并将分析结果以图表形式进行展示。通过这个系统,用户可以便捷地进行分析和可视化。
完整代码在最下方,想要先看源码的同学可以移步本文最下方进行下载。
博主也参考过文本分类相关模型的文章,但大多是理论大于方法。很多同学肯定对原理不需要过多了解,只需要搭建出一个可视化系统即可。
也正是因为我发现网上大多的帖子只是针对原理进行介绍,功能实现的相对很少。
如果您有以上想法,那就找对地方了!
不多废话,直接进入正题!
数据简介
数据不多,主要包括了几十年内的房价数据
首先对数据进行读取和预处理。
读取数据后,对x数据进行标准化处理,以便于后续训练的稳定性,并转换为tensor格式
数据分析
- 绘制图像
由于数据量较少,所以将整个训练集作为测试集,观察生成的图像
构建神经网络训练
import torch
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import torch.optim as optim
import warnings
warnings.filterwarnings("ignore")
# In[4]:
features = pd.read_csv('房价预测.csv')
features
# In[26]:
year = []
price = []
for i in range(0,12):
year.append([features['Year'][i]])
price.append([features['Price'][i]])
# In[27]:
year = np.array(year)
price = np.array(price)
year,price
# In[53]:
from sklearn import preprocessing
# 特征标准化处理
year = preprocessing.StandardScaler().fit_transform(year)
year[0]
# In[54]:
x = torch.tensor(year,dtype=float)
y = torch.tensor(price,dtype=float)
x,y
# In[62]:
learning_rate = 0.0001
weights1 = torch.randn((1,1),dtype=float,requires_grad=True)
bias1 = torch.randn(1,dtype=float,requires_grad=True)
losses = []
for i in range(0, 5000):
ans = x.mm(weights1) + bias1
#计算损失
criterion = torch.nn.MSELoss() # 使用适当的损失函数
loss = criterion(ans, y)
losses.append(loss)
if i%100==0:
print(f'loss={loss},epoch={i},w={weights1}')
#反向传播
loss.backward()
#更新参数
weights1.data.add_(-learning_rate*weights1.grad.data)
bias1.data.add_(-learning_rate*bias1.grad.data)
#清空
weights1.grad.data.zero_()
bias1.grad.data.zero_()
# 使用 features['Year'] 和 features['Price'] 创建日期和价格的列表
year = features['Year']
price = features['Price']
# 将 ans 转换为 Python 列表
ans_list = ans.tolist()
# 提取列表中的每个元素(确保是单个的标量值)
predictions = [item[0] for item in ans_list]
# 创建一个表格来存日期和其对应的标签数值
true_data = pd.DataFrame(data={'date': year, 'actual': price})
predictions_data = pd.DataFrame(data={'date': year, 'prediction': predictions})
# 真实值
plt.plot(true_data['date'], true_data['actual'], 'b-', label='actual')
# 预测值
plt.plot(predictions_data['date'], predictions_data['prediction'], 'ro', label='prediction')
plt.xticks(rotation='60')
plt.legend()
# 图名
plt.xlabel('Date')
plt.ylabel('Price') # 注意修改为你的标签
plt.title('Actual and Predicted Values')
plt.show()