腾讯课堂Python课程哪家强?
文章目录
- 腾讯课堂Python课程哪家强?
- 一、前言
- 二、数据读取和数据预处理
- 1、数据读取
- 2、数据处理
- 三、有多少人愿意花钱学Python?
- 四、多少价位的课买的人最多?
- 五、哪家机构的课最多?销量最好?
- 六、Python课教什么,最多人买?
一、前言
作为近几年世界编程语言排行老大的Python,虽然有所下降,但仍保持着较高人气,得益于最近爆火的人工智能,未来几年Python仍会是最火的编程语言之一,所以不管你是从事什么行业的工作,如果需要进行有关数据方面的工作,那么学习Python会是一个不错的选择,学成之后他也会是你的得意好帮手。
学习Python的方式有很多,可以自学,也可以报名机构,国内有关Python的机构非常的多,有免费的,但大部分的都是需要付费的,如何正确的选择辅导机构,人云亦云,我们还是需要拿出数据来说话,接下来我将利用我自己采集的700条腾讯课堂Python相关数据信息,来解决如下几个问题:
- 有多少人愿意花钱学Python?
- 多少价位的课买的人最多?
- 哪家机构的课最多?销量最好?
- Python课教什么,最多人买?
通过分析上述四个问题,我相信可以给出一个较为准确的选择。
二、数据读取和数据预处理
1、数据读取
import pandas as pd
import matplotlib.pyplot as plt
# 数据读取
data = pd.read_csv('700条腾讯课堂Python相关数据信息.csv', encoding='utf-8')
data
2、数据处理
data['课程价格'] = data['课程价格'].astype(str).str.strip('¥') # 去除课程价格前的¥符号
data['课程价格'] = data['课程价格'].apply(lambda x: 0 if x == '免费' else x) # 将免费课程价格设为0
data['课程价格'] = data['课程价格'].str.replace(',', '').astype(float) # 去除课程价格中的逗号,并转换为浮点数
data['报名人数'] = data['报名人数'].astype(str).str.rstrip('人报名').str.replace('万', '0000') # 去除报名人数中的人报名,并将万转换为0000
data['报名人数'] = data['报名人数'].apply(lambda x: 0 if x == '暂无' else x).astype(int) # 将暂无报名人数设为0,并转换为整数
data['好评率'] = data['好评率'].astype(str).str.rstrip('%').astype(float) # 去除好评率中的百分号,并转换为浮点数
data
三、有多少人愿意花钱学Python?
paid_students = data[data['课程价格'] > 0]
total_paid_students = paid_students['报名人数'].sum()
print("有{}人愿意花钱学Python。".format(total_paid_students))
有279553人愿意花钱学Python。
#隐藏警告
import warnings
warnings.filterwarnings("ignore") #忽略警告信息
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
plt.rcParams['figure.dpi'] = 100 #分辨率
plt.figure(figsize=(6, 6))
plt.pie([total_paid_students, data['报名人数'].sum() - total_paid_students],
labels=['愿意花钱学Python', '不愿意花钱学Python'],
autopct='%.2f%%',
explode=[0.05, 0],
shadow=True,
startangle=90)
plt.title('有多少人愿意花钱学Python?')
plt.show()
四、多少价位的课买的人最多?
price_counts = paid_students['课程价格'].value_counts().sort_index()
most_popular_price = price_counts.idxmax()
print("购买人数最多的课程价格为{}元。".format(most_popular_price))
购买人数最多的课程价格为199.0元。
plt.figure(figsize=(10, 6))
data['课程价格'].hist(bins=20, edgecolor='k')
plt.xlabel('课程价格')
plt.ylabel('课程数量')
plt.title('Python课程价格分布')
plt.show()
五、哪家机构的课最多?销量最好?
most_courses_organization = data['机构名称'].value_counts().idxmax()
best_selling_organization = data.groupby('机构名称')['报名人数'].sum().idxmax()
print("课程最多的机构是{},销量最好的机构是{}。".format(most_courses_organization, best_selling_organization))
课程最多的机构是测试猿课堂,销量最好的机构是杰越课堂。
# 好评率与销量最好的机构前十名
best_selling_organization = data.groupby('机构名称')['报名人数'].sum().sort_values(ascending=False).head(10)
best_selling_organization.plot(kind='bar', figsize=(10, 6), title='销量最好的机构前十名')
plt.show()
六、Python课教什么,最多人买?
most_popular_course = data['课程名称'].value_counts().idxmax()
print("最受欢迎的Python课程是{}。".format(most_popular_course))
最受欢迎的Python课程是Python体验课。
most_popular_course = data['课程名称'].value_counts().head(10)
most_popular_course.plot(kind='bar', figsize=(10, 6), title='最受欢迎的Python课程前十名')
plt.show()