1. 实验目的
①掌握一元线性回归模型的实现方法
②掌握多元线性回归模型的实现方法
③掌握三维数据可视化方法
2. 实验内容
①使用TensorFlow建立一元线性回归模型,使用商品房销售数据训练模型,并使用训练好的模型预测房价
②使用TensorFlow建立多元线性回归模型,使用商品房销售数据预测房价,并实现三维数据可视化
3. 实验过程
题目一:
使用9.5小节中的“商品房销售记录表”作为样本数据,训练一元线性回归模型,根据商品房面积预测房价。
提示用户输入商品房面积,并进行输入校验。合理的输入如下:
面积:20-500之间的实数
如果输入正确,根据模型估计房价,并显示。
如果输入数据类型错误,或者输入数据范围不合理,根据错误类型提示,并等待用户重新输入,输错3次,则程序结束。
要求:
(1)编写代码,实现程序功能;
(2)记录实验过程和结果:尝试调试超参数,使模型达到最优的性能,记录实验过程和结果。
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
#加载面积和房价
x = tf.constant([137.97,104.50,100.00,124.32,79.20,99.00,124.00,114.00,106.69,138.05,53.75,46.91,68.00,63.02,81.26,86.21])
y = tf.constant([145.00,110.00,93.00,116.00,65.32,104.00,118.00,91.00,62.00,133.00,51.00,45.00,78.50,69.65,75.69,95.30])
#求均值
meanX = tf.reduce_mean(x)
meanY = tf.reduce_mean(y)
#求权值
sumXY = tf.reduce_sum((x - meanX) * (y - meanY))
sumXX = tf.reduce_sum((x - meanX) * (x - meanX))
w = sumXY / sumXX
b = meanY - w * meanX
print("权值w为",w.numpy(),"\n偏置值b为",b.numpy())
print("线性模型:y=",w.numpy(),"*x + ",b.numpy())
for i in range(3):
print("商品房面积和预测房价")
x1 = input("请输入商品房面积")
if(i == 3):
print("错误过多,GameOver")
else:
if x1.isdigit():
x1 = float(x1)
if(x1 <= 500) & (x1 >= 20):
y1= w * x1 + b
print("面积%f的商品房价格为%f"%(x1,y1))
break
else:
print("输入的面积大小错误,请重新输入")
else:
print("输入的面积类型错误,请重新输入")
题目二:
使用9.5小节中的“商品房销售记录表”作为样本数据,训练多元线性回归模型,实现一个房价预测系统。
要求:
(1)尝试调试超参数,使模型达到最优的性能,记录实验过程和结果;
(2)创建3D绘图对象来绘制空间点集。x轴表示房屋面积,y轴表示房间数,z轴表示样本的销售价格;
(3)提示用户输入商品房面积和房间数,并进行输入校验。如果输入正确,根据模型预测房价。
合理的输入如下:
面积:20-500之间的实数
房间数:1-10之间的整数
如果输入数据类型错误,或者输入数据范围不合理,根据错误类型给出提示,并等待用户重新输入,输错3次,则程序结束。
(输入时,请注意房间面积对应房间数的合理性)
提示:TensorFlow中矩阵求逆函数tf.linalg.inv()
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
x1 = np.array([137.97,104.50,100.00,124.32,79.20,99.00,
124.00,114.00,106.69,138.05,53.75,46.91,68.00,63.02,81.26,86.21])
x2 = np.array([3.00,2.00,2.00,3.00,1.00,2.00,3.00,2.00,2.00,3.00,1.00,1.00,1.00,1.00,2.00,2.00])
y = np.array([145.00,110.00,93.00,116.00,65.32,104.00,
118.00,91.00,62.00,133.00,51.00,45.00,78.50,69.65,75.69,95.30])
x0 = np.ones(len(x1))
ty_x0 = tf.constant(x0) #创建常数张量
ty_x1 = tf.constant(x1)
ty_x2 = tf.constant(x2)
ty_y = tf.constant(y)
ty_X = tf.stack((ty_x0,ty_x1,ty_x2), axis=1) #将全1数组与x1x2数组堆叠构造16行3列的属性矩阵
ty_y = tf.reshape(ty_y, [16,1]) #十六和一的一维数组
Xt = tf.transpose(ty_X) # X的转置
XtX_1 = tf.linalg.inv(tf.matmul(Xt,ty_X)) #对结果求逆
XtX_1_Xt = tf.matmul(XtX_1,Xt) #求逆后乘以x的转置
W = tf.matmul(XtX_1_Xt,ty_y) #继续乘以y
W = tf.reshape(W,[-1]) #转化为一维数组
# 绘制3D图形
fig = plt.figure()
ax3d = Axes3D(fig)
ax3d.scatter(x1,x2,y)
ax3d.set_xlabel('Area',color = 'r',fontsize = 14)
ax3d.set_ylabel('Room',color = 'r',fontsize = 14)
ax3d.set_zlabel('Price',color = 'r',fontsize = 14)
plt.show()
j = 0
while (True):
print("请输入房屋面积和房间数,预测房屋销售价格:")
x1_test = input("商品房面积(20-500):")
x2_test = input("房间数(1-10):")
if x1_test.isdigit() and x2_test.isdigit():
x1_test = float(x1_test)
x2_test = int(x2_test)
if (x1_test < 20 or x1_test > 500):
print("对不起,您输入的房屋面积超出范围")
j += 1
elif(x2_test < 1 or x2_test > 10):
print("对不起你输入的房间数超出范围")
j += 1
else:
y_pred = W[1] * x1_test+ W[2] * x2_test + W[0]
y_float = float(y_pred)
print(y_float)
print("预测价格:", round(y_float, 2), "万元")
else:
print("对不起,您的输入无效")
j += 1
if j>= 3:
print("对不起,您已经3次输入错误,程序退出")
exit()
4.实验小结
① 实验过程中遇到了哪些问题,你是如何解决的?
在实验中用到的方法还不熟悉,在网上进行查找,看ppt
② 分别使用Numpy和TensorFlow进行数据的加载和数组的堆叠
hstac沿水平方向堆叠数组(numpy array)
vstack沿垂直方向堆叠数组(numpy array)
预加载数据:用一个constant常量将数据集加载到计算图中(主要用于小数据集)
placehold feed_dict:从内存中读取数据,占位符填充数据
queue队列:基于队列的输入通道(在计算图计算前从队列中读取数据)
③ 题目一和题目二在代码实现过程中,有重复的代码段,你知道该如何精简自己的代码吗?请进行简要的描述。
重复的代码段可以直接代替
④ 在题目基本要求的基础上,你对每个题目做了那些扩展和提升?或者你觉得在编程实现过程中,还有哪些地方可以进行优化?
对于判断错误的分类更加详细,如先判断面积是否满足,再判断房间数。