主要目的
对于文本格式和JSON格式数据进行分析,将其中数据提炼出来绘制折线图。
主要实现步骤
1.设计一个完成对数据的封装
2.设计一个抽象类,定义数据读取相关功能,使用其子类实现具体功能
3.读取文件,生成数据对象
4.进行数据计算
5.绘制图表
定义数据封装类
"""
数据定义封装的类
"""
# 定义销售情况的封装类
class Record:
def __init__(self, date, order_id, money, province):
self.date = date # 订单日期
self.order_id = order_id # 订单ID
self.money = money # 订单金额
self.province = province # 销售省份
def __str__(self):
return f"{self.date}, {self.order_id}, {self.money}, {self.province}"
定义文件读取操作的类
"""
和文件相关的类定义
"""
import json
from 面向对象_数据分析实战.data_define import Record
# 定义一个抽象类,做顶层设计,确定有哪些功能需要实现
class FileReader:
def read_data(self) -> list[Record]:
"""读取文件数据,将每一月数据转换成 Record 对象,将他们封装到list内返回"""
pass
class TextFileReader(FileReader):
def __init__(self, path):
self.path = path
# 复写抽象方法
def read_data(self) -> list[Record]:
f = open(self.path, "r", encoding="UTF-8")
record_list: list[Record] = []
for line in f.readlines():
line = line.strip() # 消除读到数据中的换行符
data_list = line.split(",")
record = Record(data_list[0], data_list[1], int(data_list[2]), data_list[3])
record_list.append(record) # 封装
f.close()
return record_list
class JsonFileReader(FileReader):
def __init__(self, path):
self.path = path
# 复写抽象方法
def read_data(self) -> list[Record]:
f = open(self.path, "r", encoding="UTF-8")
record_list: list[Record] = []
for line in f.readlines():
data_dict = json.loads(line)
record = Record(data_dict["date"], data_dict["order_id"], int(data_dict["money"]), data_dict["province"])
record_list.append(record)
f.close()
return record_list
# 测试
if __name__ == '__main__':
json_file_reader = JsonFileReader("D:/桌面/2011年2月销售数据JSON.txt")
list1 = json_file_reader.read_data()
for l in list1:
print(l.__str__())
主类调用定义方法,完成数据分析
"""
面向对象,数据分析案例实战
1.设计一个完成对数据的封装
2.设计一个抽象类,定义数据读取相关功能,使用其子类实现具体功能
3.读取文件,生成数据对象
4.进行数据计算
5.绘制图表
"""
from file_define import FileReader, TextFileReader, JsonFileReader
from data_define import Record
from pyecharts.charts import Bar
from pyecharts.options import *
from pyecharts.globals import ThemeType
text_file_reader = TextFileReader("D:/桌面/2011年1月销售数据.txt")
json_file_reader = JsonFileReader("D:/桌面/2011年2月销售数据JSON.txt")
jan_data: list[Record] = text_file_reader.read_data()
feb_data: list[Record] = json_file_reader.read_data()
# 将两个月份数据合并
all_data: list[Record] = jan_data + feb_data
# 开始数据计算,使用字典进行计算存储
# {"2011-01-01": 1564, "2011-01-02": 300, ...}
data_dict = {}
for record in all_data:
if record.date in data_dict.keys():
# 当前日期有记录,直接累加
data_dict[record.date] += record.money
else:
data_dict[record.date] = record.money
# 可视化图标开发
bar = Bar(init_opts=InitOpts(theme=ThemeType.LIGHT))
bar.add_xaxis(list(data_dict.keys())) # 添加X轴数据
bar.add_yaxis("销售额", list(data_dict.values()), label_opts=LabelOpts(is_show=False)) # 田间Y轴数据
bar.set_global_opts(
title_opts=TitleOpts(title="每日销售额")
)
bar.render("2011年1,2月份每日销售额柱状图.html")
其中注意的几个点
对于数据的封装
充分使用类中的成员属性和成员方法,切实的拟合类的实现,对于类中的一些魔术方法也要加以了解使用。
对于注释
写代码时注意写上注释,一方面方便记录思路,另一方面防止自己以后看不懂自己写的代码
对于设计层面
一些功能可以使用相似结构去完成的可以采取抽象类设计方法,顶层抽象类只负责规定需要实现哪些功能,具体的实现交给负责实现的子类去完成,如此设计逻辑清晰,可以满足多种功能差别实现。
对于类的构造方法
可以在此处给类的成员属性赋上值
全局展示设置
在绘图中可以自定义标题、图标颜色、主题、样式