综合案例-数据可视化-折线图

news2024/11/22 10:02:34

一、json数据格式

1.1 json数据格式的定义与功能

json是一种轻量级的数据交互格式,可以按照json指定的格式去组织和封装数据,json数据格式本质上是一个带有特定格式的字符串。

功能:json就是一种在各个编程语言中流通的数据格式,负责不同编程语言中的数据传递和交互

就类似于英语是国际通用语言,普通话是中国的通用语言。

各种编程语言存储数据的容器不尽相同,在Python中有字典dict这样的数据类型, 而其它语言可能没有对应的字典。

json就是一种非常良好的中转数据格式,可以让不同的语言都能够相互通用,互相传递数据。

功能如下图所示:

1.2 json的数据格式

json的数据格式非常严格,如下所示:

#json是数据格式可以是:
{'name':'Garfield','age':6}  #类似于字典
#json是数据格式也可以是:
[{'name':'Garfield','age':6},{'name':'Jon','age':26}]  #类似于元素类型为字典的列表

1.3 Python数据和Json数据的相互转化

语法:

json.dumps( 数据名 )   #把python数据转换为json数据

json.loads( 数据名 )     #把json数据转换为python数据

代码示例:

#导入json模块
import json

#准备符合json格式要求的python数据
info=[{'name':'Garfield','age':6},{'name':'Jon','age':26}]

#通过json.dumps( )方法,把python数据转换为json数据
info=json.dumps(info)
print(type(info))
print(info)

#通过json.loads( )方法,把json数据转换为python数据
info=json.loads(info)
print(type(info))
print(info)

输出:

<class 'str'>  #验证了json数据本质上是一个带有特定格式的字符串
[{"name": "Garfield", "age": 6}, {"name": "Jon", "age": 26}]
<class 'list'>
[{'name': 'Garfield', 'age': 6}, {'name': 'Jon', 'age': 26}]

Python语言使用json有很大优势,因为json无非就是一个单独的字典或一个内部元素都是字典的列表,所以json可以直接和Python的字典或列表进行无缝转换。

二、pyecharts包

如果想要做出数据可视化效果图,我们可以借助pyecharts包来完成。

Echarts 是由百度开源的数据可视化图标库,提供直观,生动,可交互,可个性化定制的数据可视化图表 ,pyecharts是 Python 适用版本的Echarts。

我们在前面学习包时,简单提到过pyecharts包,pyecharts包常用于图形可视化,pyecharts包的安装也演示过,详见http://t.csdnimg.cn/RSL5x。

如果我们想了解pyecharts,可以访问网址:https://pyecharts.org,里面有很多图表的具体介绍。pyecharts - A Python Echarts Plotting Library built with love.Descriptionicon-default.png?t=O83Ahttps://pyecharts.org/#/

三、pyecharts快速入门

3.1构建一个基础的折线图

我们要构建一个水果数量的统计图,代码如下:

#导包,导入pyecharts包charts模块Line功能
from pyecharts.charts import Line
#构建折线图框架
line=Line()
#添加X轴数据
line.add_xaxis(["苹果","香蕉","橘子"])
#添加Y轴数据
line.add_yaxis("数量",[10,20,15])
#生成图表
line.render()

运行后没有输出,但在同文件目录下生成了一个文件render.html,这是一个网页文件,我们可以通过浏览器查看,如图所示:

此处选择了Edge浏览器,图表如下:

想要了解更多折线图的用法,可以参考:DocumentDescriptionicon-default.png?t=O83Ahttps://gallery.pyecharts.org/#/Line/basic_line_chart

3.2配置选项

pyecharts模块中有很多的配置选项,常用到2个类别的选项:全局配置选项系列配置选项

此处我们主要简单介绍一下全局配置选项中几个常用的功能。

我们尝试调整一些全局配置选项:

#导包
from pyecharts.charts import Line
from pyecharts.options import TitleOpts,LegendOpts,ToolboxOpts,VisualMapOpts,TooltipOpts
#构建折线图框架
line=Line()
#添加X轴数据
line.add_xaxis(["苹果","香蕉","橘子"])
#添加Y轴数据
line.add_yaxis("数量",[10,20,15])
#全局配置选项通过set_global_opts来设置
line.set_global_opts(
    title_opts=TitleOpts('水果数量统计',pos_left='center',pos_bottom='1%'),
    ledend_opts=LegendOpts(is_show=True),
    toolbox_opts=ToolboxOpts(is_show=True),
    visualmap_opts=VisualMapOpts(is_show=True),
    tooltip_opts=TooltipOpts(is_show=True)
)
#生成图表
line.render()

通过Edge查看图表:

关于全局配置选项的更多信息,其中功能的用法,请浏览pyecharts官网,诸如下图,非常详细。

四、处理数据并生成图表

我们把三个记录不同国家新冠疫情状况的数据文件,转化成折线图。

数据文件可提取:
链接:https://pan.baidu.com/s/1_tvWaN3_x3mZ_nUIl579Pg?pwd=66xw 
提取码:66xw

这三份文件的数据内容都是json格式,如图所示:

文件的数据层级如下:

数据层级图

我们要把这三份文件的数据内容转化成图表,文件中部分内容是多余的,我们用代码去除(也可以手动删除,用代码去除是为了复习前面的知识),去除后才能作为标准的json数据去处理。

多余的部分如下图所示(以美国.txt为例),看上面的数据层级图会更加明显。

 处理的方式:

  • 文件开头,采用字符串的replace()方法,用空格代替多余的内容,效果相当于删去多余内容,用法详见:http://t.csdnimg.cn/kbHew,3.2字符串的替换 。
  • 文件结尾,采用数据容器切片的方法,取从开始到最后(不包含最后2个字符)的全部内容,用法详见:http://t.csdnimg.cn/sjUEt

把文件内的数据处理规范之后,将json数据转换成python字典。

转换成字典后,我们要去获取数据,需要日期数据作为X轴,患病状态有4种,取第一项确诊人数作为Y轴。X轴和Y轴的数据都是“trend”里面的value,必须先获取“trend”这个key。

“trend”又是一个嵌套字典,把它拿出来,放到新字典“us_trend_data”中,再去访问日期数据和确诊人数,就清晰容易了很多。

处理完X轴和Y轴需要的数据后,我们开始构建图表,X轴的数据是日期,日期是公用的,一组即可,Y轴是美日印确诊人数,需要3组,进行对比,然后添加细节(为了避免图表杂乱,在系列配置中选择了不显示标签,还设置了全局配置选项),如下列代码所示:

#导入模块
import json
from pyecharts.charts import Line
from pyecharts.options import TitleOpts,LegendOpts,ToolboxOpts,VisualMapOpts,TooltipOpts,LabelOpts

#处理数据
f_us=open('E:/可视化案例数据/折线图数据/美国.txt','r',encoding='UTF-8')
us_data=f_us.read() #获取美国的全部内容
f_jp=open('E:/可视化案例数据/折线图数据/日本.txt','r',encoding='UTF-8')
jp_data=f_jp.read() #获取日本的全部内容
f_in=open('E:/可视化案例数据/折线图数据/印度.txt','r',encoding='UTF-8')
in_data=f_in.read() #获取印度的全部内容

#去掉不符合json规范的开头
us_data=us_data.replace("jsonp_1629344292311_69436(","")  #用空格替代跟去掉效果一样
jp_data=jp_data.replace("jsonp_1629350871167_29498(","")
in_data=in_data.replace("jsonp_1629350745930_63180(","")

#去掉不符合json规范的结尾
us_data=us_data[:-2]
jp_data=jp_data[:-2]
in_data=in_data[:-2]

#json数据转换成python字典
us_dict=json.loads(us_data)
jp_dict=json.loads(jp_data)
in_dict=json.loads(in_data)

#转化成字典后,获取trend这个key
us_trend_data=us_dict['data'][0]['trend']
jp_trend_data=jp_dict['data'][0]['trend']
in_trend_data=in_dict['data'][0]['trend']

#获取日期数据,用于X轴,取2020年(到314下标结束)
us_x_data=us_trend_data['updateDate'][:314] #日期数据只需要获取一次,因为统计的时间段是一样
jp_x_data=us_trend_data['updateDate'][:314]
in_x_data=us_trend_data['updateDate'][:314]

#获取确诊数据,用于Y轴,取2020年(到314下标结束)
us_y_data=us_trend_data['list'][0]['data'][:314]
jp_y_data=jp_trend_data['list'][0]['data'][:314]
in_y_data=in_trend_data['list'][0]['data'][:314]

#构建折线图框架
line=Line()
#添加X轴数据
line.add_xaxis(us_x_data) #日期数据是公用的,因为统计的时间段相同
#添加Y轴数据
line.add_yaxis("美国确诊人数",us_y_data,label_opts=LabelOpts(is_show=False))#不显示标签
line.add_yaxis("日本确诊人数",jp_y_data,label_opts=LabelOpts(is_show=False))
line.add_yaxis("印度确诊人数",in_y_data,label_opts=LabelOpts(is_show=False))
#设置全局选项
line.set_global_opts(
    title_opts=TitleOpts(title="2020年美日印确诊人数对比折线图",pos_left='center',pos_bottom='1%'),
    legend_opts=LegendOpts(is_show=True),
    toolbox_opts=ToolboxOpts(is_show=True),
    visualmap_opts=VisualMapOpts(is_show=True),
    tooltip_opts=TooltipOpts(is_show=True)
)
#生成图表
line.render()
#关闭文件对象
f_us.close()
f_jp.close()
f_in.close()

生成的图表在Edge中查看:

五、总结

把数据做成图表分为2大步:

  • 处理数据
    • 处理为标准的json数据格式
    • json数据格式转化为python字典
    • 获取X轴和Y轴数据
  • 图表构建
    • 构建折线图框架

    • 添加X轴、Y轴数据

    • 设置(需要的)全局配置和系列配置选项

    • 生成图表

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2114650.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

全倒装COB超微小间距LED显示屏的工艺技术,相比SMD小间距有何优势

全倒装COB&#xff08;Chip On Board&#xff09;超微小间距LED显示屏&#xff0c;在工艺技术上的革新&#xff0c;相较于传统的SMD&#xff08;Surface Mount Device&#xff09;小间距LED显示屏&#xff0c;展现出了多方面的显著优势。 首先&#xff0c;全倒装技术极大地提升…

JAVAEE初阶第七节(下)——物理原理与TCP_IP

系列文章目录 JAVAEE初阶第七节&#xff08;下&#xff09;——物理原理与TCP_IP 文章目录 系列文章目录JAVAEE初阶第七节&#xff08;下&#xff09;——物理原理与TCP_IP 一.网络层重点协议 1. IP协议如何管理地址 1.1 解决IP地址不够用的问题 1.2 网段划分 1.3 特殊的IP…

深度剖析AI情感陪伴类产品及典型应用 Character.ai

前段时间AI圈内C.AI的受够风波可谓是让大家都丈二摸不着头脑&#xff0c;连C.AI这种行业top应用都要找谋生方法了&#xff01;投资人摸不着头脑&#xff0c;用户们更摸不着头脑。在这之前断断续续玩了一下这款产品&#xff0c;这次也是乘着这个风波&#xff0c;除了了解一下为什…

【数据库】MySQL表的Updata(更新)和Delete(删除)操作

目录 1.Update 案例1&#xff1a;将孙悟空同学的数学成绩变更为 80 分 案例2&#xff1a;将曹孟德同学的数学成绩变更为 60 分&#xff0c;语文成绩变更为 70 分 案例3&#xff1a;将总成绩倒数前三的 3 位同学的数学成绩加上 30 分 案例4&#xff1a;将所有同学的语文成绩…

计算机网络与Internet应用

一、计算机网络 1.计算机网络的定义 网络定义&#xff1a;计算机网络是指将地理位置不同的具有独立功能的多台计算机及其外部设备&#xff0c;通过通信线路连接起来&#xff0c;在网络操作系统&#xff0c;网络管理软件及网络通信协议的管理和协调下&#xff0c;实现资源共享…

『功能项目』武器的切换实例【34】

本章项目成果展示 我们打开上一篇33战士的A键连击的项目&#xff0c; 本章要做的事情是按键盘E键切换职业时切换手中的武器 首先在资源商店下载免费的武器模型 创建一个空物体 命名为WeaponPos 将武器预制体拖拽至WeaponPos &#xff08;注意调整空物体位置就可以后续文章会更…

CSP-J 之C++常用英文缩写

文章目录 C常用英文缩写前言常用缩写解析C 基础缩写输入输出相关控制台 命名与类型常用函数在线测评相关 总结 C常用英文缩写 前言 在编程比赛和日常开发中&#xff0c;C是一门广泛使用的编程语言&#xff0c;许多英文缩写贯穿其中。了解这些缩写不仅有助于提高编程效率&…

XGBoost算法-上

简单解释一下xgboost这个模型 xg是一个非常强大&#xff0c;非常受欢迎的机器学习模型&#xff0c;其中最大的特色就是boosting&#xff08;改进、推进&#xff09;&#xff0c;怎么改进呢&#xff1f;就是xgboost这个算法&#xff0c;它会先建立一颗简单的决策树&#xff0c;…

【Python知识宝库】文件操作:读写文件的最佳实践

&#x1f3ac; 鸽芷咕&#xff1a;个人主页 &#x1f525; 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想&#xff0c;就是为了理想的生活! 文章目录 前言一、文件读取1. 使用open函数2. 逐行读取3. 使用readlines和readline 二、文件写入1. 写入文本2. 追加内容3. 写入…

DAY99 APP 攻防-小程序篇反编译外在抓包主包分包配置泄漏算法逆向未授权

APP攻防-小程序篇&内在反编译&外在抓包&主包分包&配置泄漏&算法逆向&未授权_unpackminiapp-CSDN博客https://blog.csdn.net/m0_60571842/article/details/136244878 知识点 1、小程序抓包-全局代理&进程转发 2、小程序逆向-反编译&主包&分…

ChatGPT在医疗行业的应用前景与挑战探析

人工智能ChatGPT自2022年11月面世以来&#xff0c;在医疗领域引起了广泛关注&#xff0c;很多专家也在积极探讨其在此领域的应用。众多报道集中于其在临床应用、患者交流和医学教育等方面的潜力。本文将从学术研究的角度探讨ChatGPT在医疗领域的实际应用&#xff0c;包括其在科…

用fastapi搭建cpca地址提取服务接口

以前的客户地址比较乱&#xff0c;现在想提取出省份城市&#xff0c; 开始了解分词技术&#xff0c;后发现python有这样的库 cpca提取地址挺不错&#xff0c;可以从垃圾地址中提取省市区以及区号。 文章会用fastapi搭建服务端 通过post调用cpca&#xff0c;提取来了后&#…

海鸥相机存储卡格式化如何恢复数据

在摄影的世界里&#xff0c;‌每一张照片都承载着独特的记忆与故事。‌然而&#xff0c;‌当我们不慎将海鸥相机的存储卡格式化后&#xff0c;‌那些珍贵的瞬间似乎瞬间消逝&#xff0c;‌让人心急如焚。‌但请不要绝望&#xff0c;‌数据恢复并非遥不可及。‌本文将详细介绍在…

vue中使用相对路径图片不显示

因为webpack问题&#xff0c;webpack打包会将静态资源放在一个webpack创建的Img文件夹中&#xff0c;并且图片名字还会被更改 我的文件目录是没有Img文件夹的&#xff0c;且图片名字没有那串乱字符 路径问题: Vue 项目通常会将资源文件放在 src/assets 目录下&#xff0c;并通过…

如何在 Cursor IDE 中使用驭码CodeRider 进行 AI 编程?

驭码CodeRider 是极狐GitLab 公司自研发布的 AIGC 产品&#xff0c;可以用来进行 AI 编程和 DevOps 流程处理。本文分享如何在 Cursor 中使用驭码CodeRider。 Cursor 是近期比较火爆的一款 AI 代码编辑器&#xff0c;通过将 AI 能力引入软件研发来提升软件研发效率。而驭码Cod…

三、Maven工程的构建

首先&#xff0c;创建和构建是两个概念。 构建是指将源代码、依赖库和资源文件等转换为可执行或可部署的应用程序的过程。 在这个过程中包括编译源代码、链接依赖库、打包和部署等多个步骤。 项目构建是软件开发过程中至关重要的一部分&#xff0c;它能够大大提高软件开发效率…

通信工程学习:什么是FM频率调制

FM&#xff1a;频率调制 FM&#xff1a;Frequency ModulatioFn&#xff0c;全称“频率调制”&#xff0c;是一种通过改变载波信号的频率来传递信息的调制方式。以下是对FM频率调制的详细解释&#xff1a; 一、FM频率调制的定义与原理 FM频率调制的定义&#xff1a; FM频率调制…

算法复杂度 —— 数据结构前言、算法效率、时间复杂度、空间复杂度、常见复杂度对比、复杂度算法题(旋转数组)

目录 一、数据结构前言 1、数据结构 2、算法 3、学习方法 二、 算法效率 引入概念&#xff1a;算法复杂度 三、时间复杂度 1、大O的渐进表示法 2、时间复杂度计算示例 四、空间复杂度 计算示例&#xff1a;空间复杂度 五、常见复杂度对比 六、复杂度算法题&…

【Linux 内核构建】如何查看 Linux 系统中可以选择的内核有哪一些?如何切换 Linux kernel 版本?

背景 在折腾内核版本时&#xff0c;遇到的问题&#xff0c;遂将各方面的答案整理在一起。 解决方法 1. 查看 grub 菜单【一般在服务器上可能不用此方法】 在系统启动时&#xff0c;grub 菜单会列出所有可用的内核选项。要查看这些选项&#xff1a; 重启系统&#xff1a;在系…

C#/WinForm演示最小二乘法拟合一次函数

一、什么是最小二乘法 最小二乘法&#xff08;Least Squares Method&#xff09;是一种数学优化技术&#xff0c;常用于拟合数据和估计参数。它的主要目标是找到一个函数&#xff0c;使其预测值与观测值之间的残差平方和最小化。 在最小二乘法中&#xff0c;通常考虑一个具有n…