基于Python（Pandas+Pyecharts）实现全国热门旅游景点数据可视化【500010037】

news2026/3/23 20:35:56

导入模块

import jieba
import pandas as pd 
from collections import Counter
from pyecharts.charts import Line,Pie,Scatter,Bar,Map,Grid
from pyecharts.charts import WordCloud
from pyecharts import options as opts
from pyecharts.globals import ThemeType
from pyecharts.globals import SymbolType
from pyecharts.commons.utils import JsCode

数据说明

全国热门旅游景点数据，包含城市、名称、星级、评分、价格、销量、省/市/区、坐标、简介、是否免费、具体地址等字段信息

字段：城市、名称、星级、评分、价格、销量、省/市/区、坐标、简介、是否免费、具体地址

字段	数据类型
城市	string
名称	string
星级	string
评分	float
价格	float
销量	int
省/市/区	string
坐标	string
简介	string
是否免费	bool
具体地址	string

数据处理

读取数据

df = pd.read_excel(r'./data/旅游景点.xlsx')
df.head()

查看索引、数据类型和内存信息

df.info()

查看数值型列汇总统计

df.describe()

查看销量为0的行

df.loc[df['销量']==0,:].head()

一共有123行。

去除销量为0的行数据

df = df[df['销量']!=0]

去除后还剩下2320行数据。

统计各列空值

df.isnull().sum()

星级存在1407个空值，简介37个空值，具体地址2个空值，其他列不存在空值，数据还算比较完整。

将缺失值用‘未知’填充

df.fillna('未知', inplace=True)

按销量排序

df.sort_values('销量', ascending=False).head()

数据可视化

销量前20热门景点数据

假期出行数据全国地图分布

华东、华南、华中等地区属于国民出游热点地区，尤其是北京、上海、江苏、广东、四川、陕西等地区出行比较密集。

各省市4A-5A景区数量柱状图

各省市4A-5A景区数量玫瑰图

各省市4A-5A景区数量阴影散点图

各省市4A-5A景区地图分布

江苏、安徽、河南、北京、湖北等地区4A、5A级景区数量比较多。

门票价格区间占比玫瑰图

门票价格区间数量散点图

景点简介词云

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1235552.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！