项目从两个不同类型的文件(文本文件和 JSON 文件)读取销售数据,将其封装为 Record
对象,合并数据后,统计每天的销售总额,并通过 pyecharts
库生成一个包含每日销售额的柱状图(Bar chart)。接下来,我们逐步讲解每一部分的功能。
1. 数据定义类 (Record
)
class Record:
def __init__(self, date, order_id, money, province):
self.date = date # 订单日期
self.order_id = order_id # 订单ID
self.money = money # 订单金额
self.province = province # 订单所在省份
def __str__(self):
return f"{self.date} {self.order_id} {self.money} {self.province}"
Record
是用来封装每一条销售记录的数据类,包含四个属性:date
(日期)、order_id
(订单编号)、money
(金额)和province
(省份)。__str__
方法定义了当打印对象时,显示的格式。
2. 文件读取的抽象类
class file_reader:
def read_data(self):
"""这是抽象方法,具体子类会实现读取数据并转换为 Record 对象列表的功能"""
pass
file_reader
是一个抽象类,定义了read_data
方法,但不提供具体实现。其子类将负责从不同格式的文件中读取数据。
3. 文本文件读取类 (TextFileReader
)
class TextFileReader(file_reader):
def __init__(self, path):
self.path = path # 保存文件路径
def read_data(self):
f = open(self.path, 'r', encoding='utf-8')
record_list: list[Record] = [] # 用于存储 Record 对象的列表
for line in f.readlines():
line = line.strip() # 去掉每行的首尾空格和换行符
data_list = line.split(',') # 根据逗号分隔每行内容
record = Record(data_list[0], data_list[1], int(data_list[2]), data_list[3]) # 创建 Record 对象
record_list.append(record) # 将每个记录添加到列表
f.close()
return record_list # 返回所有记录对象的列表
TextFileReader
读取文本文件并解析每一行。每一行数据按逗号分隔,生成Record
对象,并将这些对象加入record_list
列表。
4. JSON 文件读取类 (JsonFileReader
)
class JsonFileReader(file_reader):
def __init__(self, path):
self.path = path
def read_data(self):
f = open(self.path, 'r', encoding='utf-8')
record_list: list[Record] = []
for line in f.readlines():
data_dict = json.loads(line) # 解析每行的 JSON 数据
record = Record(data_dict["date"], data_dict["order_id"], data_dict["money"], data_dict["province"]) # 创建 Record 对象
record_list.append(record)
f.close()
return record_list
JsonFileReader
解析 JSON 文件,每一行数据都是一个 JSON 字符串,将其转换为 Python 的字典,然后生成Record
对象。
5. 主函数:读取数据并处理
if __name__ == '__main__':
textfilereader = TextFileReader('D:\study python\code\python实践\\19.数据分析案例\\2011年1月销售数据.txt')
jsonfilereader = JsonFileReader('D:\study python\code\python实践\\19.数据分析案例\\2011年2月销售数据JSON.txt')
list1 = textfilereader.read_data() # 从文本文件读取数据
list2 = jsonfilereader.read_data() # 从 JSON 文件读取数据
# 打印读取到的记录
for record in list1:
print(record)
for record in list2:
print(record)
- 这里是从两个文件中读取数据,并打印每一条
Record
记录,确保读取到的数据正确。
6. 数据处理和可视化
a. 合并数据并计算每日销售额
text_data = textfilereader.read_data()
jan_data = jsonfilereader.read_data()
all_data = text_data + jan_data # 合并两个文件的数据
# 字典存储每天的销售额
data_dict = {}
for record in all_data:
if record.date in data_dict.keys():
data_dict[record.date] += record.money # 累加相同日期的销售额
else:
data_dict[record.date] = record.money # 新日期,初始化销售额
- 这段代码将
text_data
和jan_data
数据合并,并计算每一天的销售总额,结果存储在data_dict
中,字典的键是日期,值是该日期的总销售额。
b. 生成柱状图
# 创建一个Bar类对象
bar = Bar(init_opts=InitOpts(theme=ThemeType.DARK)) # 使用暗黑主题
# 添加x轴数据(日期)
bar.add_xaxis(list(data_dict.keys()))
# 添加y轴数据(销售额),并隐藏数据标签
bar.add_yaxis("销售额", list(data_dict.values()), label_opts=LabelOpts(is_show=False))
# 设置全局配置,添加图表标题
bar.set_global_opts(
title_opts=TitleOpts(title="每日销售额")
)
# 渲染生成HTML文件
bar.render("每日销售额.html")
Bar
类用于生成柱状图。add_xaxis()
用于设置 X 轴的标签,这里是日期列表。add_yaxis()
用于设置 Y 轴的数值,这里是每天的销售总额。set_global_opts()
设置全局的图表选项,如图表的标题。- 最后使用
render()
方法生成一个 HTML 文件,包含柱状图。
7. 输出文件
生成的 HTML 文件可以在浏览器中打开,显示每日销售额的柱状图。
总结:
- 数据从文本文件和 JSON 文件中读取,并封装为
Record
对象。 - 使用 Python 的字典进行每日销售额的汇总。
- 利用
pyecharts
库将销售数据可视化为柱状图,并输出为 HTML 文件进行展示。