Python 进阶语法:JSON

news2025/1/8 6:00:02

1 什么是 JSON?

1.1 JSON 的定义

  • JSON 是 JavaScript Object Notation 的简写,字面上的意思是 JavaScript 对象标记。
  • 本质上,JSON 是轻量级的文本数据交换格式。轻量级,是拿它与另一种数据交换格式XML进行比较,相当轻量简洁。数据交换格式,说明JSON是一种数据格式。
  • 字符串是JSON的一个表现形式,符合JSON格式的字符串就是JSON字符串。
  • JSON 独立于语言:JSON 使用 Javascript语法来描述数据对象,但是 JSON 仍然独立于语言和平台。
  • JSON 解析器和 JSON 库支持许多不同的编程语言。 JSON 可以和每一种语言下面特定的一种数据结构进行交换。如 JSON 数据对象可以转换成 Python 里的字典(dict)。

1.2 JSON 的优势

XML 在 JSON 出现之前,是一个主流的数据交换格式,大部分互联网上的服务,它们之间交换数据的时候都采用XML的格式。但是自从轻量级的 JSON 出现了之后,使用 XML 的越来越少了。

  • 易于阅读:XML稍显复杂,看起来的时候比较费劲,但是 JSON 数据就很容易,一看就能知道它是什么意思。
  • 易于解析:JSON 作为了一个数据交换格式,存在一个组装和被解析的过程,这也是强于 XML 的地方,它更容易被解析出来。
  • 网络传输效率高:由于JSON 比较轻量简洁,所以,对于同样一个信息,JSON 的数据量更少一些,在网络上传输的效率更高一些。
  • 跨语言交换数据:JSON 独立于语言和平台,非常简单和轻易地实现跨语言数据交换。

1.3 JSON 的数据结构

1.3.1 对象:大括号 {} 保存的对象是一个无序的名称/值对集合。
{ "name":"Alice", "age":18, "hight":null }
  •  JSON 对象在大括号 {...} 中书写。
  • 对象可以包含多个 key/value(键/值)对。
  • 每个 key/value 对使用逗号 , 分割。
  • key 和 value 中使用冒号 : 分割。
  • key 必须是字符串(在双引号中),value 可以是合法的 JSON 数据类型(字符串(在双引号中), 数字(整数或浮点数), 对象(在大括号中), 数组(在中括号中), 布尔值或 null)。
1.3.2 数组:中括号 [] 保存的数组是值(value)的有序集合。
  •  JSON 数组在中括号中 [...] 书写。
  • JSON 中数组值必须是合法的 JSON 数据类型(字符串, 数字, 对象, 数组, 布尔值或 null)。
  • 数组可包含多个对象。对象属性的值可以是一个数组。
{
    "sites": [
        { "name":"菜鸟教程" , "url":"www.runoob.com" }, 
        { "name":"google" , "url":"www.google.com" }, 
        { "name":"微博" , "url":"www.weibo.com" }
    ]
}
  • JSON 对象中数组可以包含另外一个数组,或者另外一个 JSON 对象
myObj = {
    "name":"网站",
    "num":3,
    "sites": [
        { "name":"Google", "info":[ "Android", "Google 搜索", "Google 翻译" ] },
        { "name":"Runoob", "info":[ "菜鸟教程", "菜鸟工具", "菜鸟微信" ] },
        { "name":"Taobao", "info":[ "淘宝", "网购" ] }
    ]
}

2 Python的内置模块JSON

在Python中,用我们已知的一些内置数据类型,如列表、字典、元组、集合来操作数据结构会比直接操作JSON字符串要方便和简单的多。

JSON是可以跨语言和平台的,与语言无关的。每一个JSON字符串都可以每个语言里面找到一个对应的数据结构。

在Python中,提供了一个内置模块JSON,这个模块有一系列的方法来帮助我们操作JSON数据。

2.1 反序列化

在编程里面,有一个术语,叫反序列化。用来定义由字符串到某一种语言下面的某一种数据结构的解析过程。

2.1.1 使用 json.loads() 把JSON对象字符串转换成 Python 字典
import json

json_str = '{"name":"Alice","age":18}'

student = json.loads(json_str)

print(type(student))   # 返回:<class 'dict'>,说明json.loads()返回的是一个字典
print(student)   # 返回:{'name': 'Alice', 'age': 18}
print(student['name'])  # 返回:Alice
print(student['age'])   # 返回:18

这个 JSON 字符串在 JavaScript 里面表示的是一个 JSON 对象,但是,在 Python 里面它变成了一个字典。

对于同样的这样的一个 JSON 字符串,不同的语言,有可能把 JSON 字符串会变成不同的数据类型,怎么理解呢?我们在 Python 里面,确实是把这样的一个 JSON 字符串转换成了一个字典类型,但是,其他的一些语言有可能不是把它转成这样的一个字典类型,有可能会把它转换成另外的数据结构,比如哈希列表等等,这个呢,都是不一定的。

JSON 字符串对应到 JSON 数据结构里面,它表示的是 JSON 的一个对象。但是,它转换到Python 里面来的时候,是用一个字典的方式来承载 JSON 对象所表示的信息。

在 JSON 数据格式里面啊,它并不仅仅只有 JSON 对象(object)这一种数据类型。它还有数组(array)。

2.1.2 使用 json.loads() 把 JSON 数组字符串转换成 Python 列表
import json

json_str = '[{"name":"Alice","age":18},{"name":"John","age":20}]'

student = json.loads(json_str)
print(type(student))   # 返回:<class 'list'>,说明json.loads()返回的是一个列表
print(student)   # 返回:[{'name': 'Alice', 'age': 18}, {'name': 'John', 'age': 20}]

这个 JSON 字符串在 JavaScript 里面表示的是一个 JSON 数组,但是,在 Python 里面它变成了一个含有两个字典的列表。

为什么这个列表的内部元素是两个字典呢?这是与 JSON 字符串相对应的,JSON 字符串是一个数组,对应 Python 的列表,数组内部是两个 JSON对象,所以对应 Python 的是两个字典。

2.1.3 布尔值的转换
import json

json_str = '[{"name":"Alice","flags":false},{"name":"John","flags":true}]'

student = json.loads(json_str)
print(type(student))   # 返回:<class 'list'>,说明json.loads()返回的是一个列表
print(student)   # 返回:[{'name': 'Alice', 'flags': False}, {'name': 'John', 'flags': True}]

上例中,我们把 JSON 字符串中的数据 flags 的值改成一个布尔值。在 JSON 数据格式里面,布尔值是小写的 false 或者 true 。注意:布尔值不是字符串,我们不需要加双引号。

我们注意一下在 Python 中解析出来的结果:小写的 false 和 true 转换成了首字母大写的 False 和 True 。

2.1.4 本节小结

举了这么多事例呢,无非是想告诉大家,JSON 有自己的一些数据类型。而我们用 json.loads()函数最主要做的一件事情,就是把 JSON 的数据类型转化成 Python 自己的数据类型。

JSON和Python之间的数据类型对比
数据类型JSONPython
字符串JSON中的字符串必须是双引号(")包围的。Python中的字符串可以使用单引号(')或双引号(")包围。
数字JSON支持整数和浮点数Python中的数字类型更加丰富,包括整数(int)、浮点数(float)、复数(complex)等
布尔值JSON支持truefalse两个布尔值。Python使用TrueFalse表示布尔值(注意大小写)。
数组/列表JSON使用数组(array)来表示一组有序的值。Python使用列表(list)来表示一组有序的元素。
对象/字典JSON使用对象(object)来表示键值对的集合。Python使用字典(dict)来表示键值对的集合。
null值JSON有一个null值,表示空或不存在的值。Python使用None来表示空或不存在的值。
其他数据Python还支持更多的数据类型,如元组(tuple)、集合(Set)、日期时间等,而JSON则没有这些数据类型。

上面的内容给大家演示了 JSON 的数据类型到 Python 数据类型的转换方法,就是使用 json.loads(),但是,要强调的是上面所讲的重点并不是介绍如何使用 json.loads() ,关键是想要告诉大家这样的一个 JSON 和 Python 之间的转换关系,这一点比我们会使用 json.loads() ,要重要的太多了。

2.2 序列化

序列化就是把 Python 的数据类型向 JSON 数据类型转换的一个过程。它同样是调用了 JSON 模块下面的一个函数 json.dumps() 。

2.2.1 使用 json.dumps() 把 Python 列表转换成 JSON 数组字符串
import json

# 把Python列表转换成JSON字符串
python_list = [
                {'name':'Alice','age':'18','flags':False},
                {'name':'John','age':'20'}
              ]

json_string = json.dumps(python_list)
print(type(python_list))    # <class 'list'>,这里是python的一个列表
print(type(json_string))    # <class 'str'>,这里是一个JSON字符串
print(json_string)
# 返回一个JSON数组
# [{"name": "Alice", "age": "18", "flags": false}, {"name": "John", "age": "20"}]

在这段代码中,我们使用 Python 的 JSON 模块将 Python 列表(python_list)转换成了 JSON 格式的字符串(json_string)。这个过程主要涉及到 json.dumps() 函数,该函数的作用是将Python 对象(如列表、字典等)序列化成 JSON 格式的字符串。

  1. Python列表:python_list是一个Python列表,其中包含两个字典。每个字典都代表一个人的信息,包括名字(name)、年龄(age)和标志(flags)。
  2. json.dumps()函数:json.dumps()函数用于将Python对象转换(或称为“序列化”)为JSON格式的字符串。这个函数非常有用,当你需要将Python数据结构与JSON格式相互转换时。

    • python_list作为参数传递给json.dumps()
    • 函数遍历python_list中的每个元素(在这里是字典),并将它们转换为JSON格式。
    • 在转换过程中,字典的键和字符串值被直接转换,而整数和布尔值也被相应地转换。
    • 转换后的JSON字符串被赋值给json_string变量。
  3. 类型检查:python_list的类型是<class 'list'>,表示它是一个Python列表。而json_string的类型是<class 'str'>,表示它是一个字符串,即JSON格式的字符串。

  4. 打印JSON字符串:输出的结果是一个JSON数组,其中包含两个对象(对应于原始Python列表中的两个字典)。

注意点:

  • 在JSON中,所有的键和字符串值都必须用双引号(")包围,而不是单引号(')。
  • Python中的布尔值False在JSON中表示为false(全部小写)。
  • Python中的整数和浮点数在转换为JSON时不会改变,但Python中的字符串(即使是数字形式的字符串)在JSON中仍然被视为字符串。例如,年龄'18''20'在JSON中仍然是字符串,而不是数字。

通过这个过程,我们可以方便地在 Python 和 JSON 之间转换数据,这对于与Web服务交互或存储和读取数据非常有用。这就叫做序列化。

这里要跟大家强调一下,并不是和 JSON 相关的这样一系列的转化才叫做序列化,如果我们把 XML的字符串向 Python 的数据结构转换,或者,把 Python 的数据结构向 XML字符串转换,它这个过程也称为序列化或者反序列化。

(小提示:怎样把一个对象存储到数据库里去呢?

数据库是一个二维表,它没有办法去表示一个对象的结构。所以,一个方法就是把对象序列化成JSON 字符串或者 XML字符串。然后把字符串存到这个数据库里去。

当你要需要这个对象的时候,可以把这个字符串从数据库里读出来,然后再进行反序列化的过程。但是,实际上这个是不可取的,因为效率太低了。这个办法在操作数据库或者是其他类型的数据库,还是比较适合去存储一些比较简单的数据结构。

而像对象这种东西,应该把对象拆成一个二维表结构,也就是说把对象分成一个个的属性,把它存到这数据库里会比较合适。强烈反对把对象给序列化之后,以字符串的形式存储到数据库里。)

2.2.2 序列化的意义

上一节,我们写了一个 JSON 字符串,然后把它给反序列化成了 Python 字典。但是,我们要考虑的是这个 JSON 字符串是从哪里来的呢?

这不太可能是我们自己一个一个地写出来的。其实,一般情况下这个 JSON 字符串还是我们通过序列化的过程来的。有可能是通过其他语言序列化之后,通过一个服务的形式传给我们的。

下面举一个比较实际的例子,比如:

  • 通过豆瓣的API(https://api.douban.com/v2/movie/top250)服务,获取一个JSON字符串。

{
"msg":"invalid_apikey, Please contact bd-team@douban.com for authorized access.",
"code":104,
"request":"GET \/v2\/movie\/top250"
}
  • 拿到 JSON 字符串,就可以把它变成 Python 里面的数据结构,从而获取到 JSON 字符串里面的相关数据信息

从这个事例可以看到:为什么说 JSON 是一个数据交换的格式呢?我们可以明显的看到这个数据是从豆瓣的服务这里以 JSON 数据格式的形式,传送到我们自己的浏览器。既然是数据,它就必然要有一个承载的格式。大多数情况都是选择用 JSON 数据格式来传递数据。

3 对 JSON 理解上的误区

JSON、JSON对象、JSON字符串这三者的区别,如果在网上搜一搜,说法各种各样、五花八门,不能说它错,但并不全面。

网上对于这三者的解释都没有跳出 JavaScript 这样的一个范围,都是站在 JavaScript 这个特定语言的角度阐述这三者的区别。所以,我们要跳出语言的范畴来看待这三个不同的名词。

3.1 JSON 并不是为 JavaScript 量身定制的

因为 JSON 的数据交换和 JavaScript 是没有什么区别的,很多人很容易会认为 JavaScript 很特殊,它和 JSON 是有一些特殊关系的。

其实没有,那么造成这种误区的原因?可能有两个方面:

第一个方面是 JSON数据类型和JavaScript 的数据类型太过于相似。所以,很多人一直搞不清楚 JSON 和 JavaScript 的关系。

JavaScript 和 JSON 之间的关系:JavaScript这个语言它只是一个标准的实现方案之一,这个标准就是EcmaScript。还有以前写flash程序的时候,有个ActionScript。这个其实也是实现这个EcmaScript 标准的另外一种语言。我们可以把 JSON 也理解为是实现 EcmaScript 标准的一个的版本。

JSON 并不是JavaScript的一个附属品,这一点呢,大家一定要清楚。所以,某种程度上来说,JSON 可以看作是和 JavaScript 平齐的一种语言。因为 JSON 和JavaScript 都是对 EcmaScript 这个规范和标准的实现。

第二个方面是 JSON最开始的时候,在外部前后端分离的过程中起到了重要的作用。而我们服务器的语言有很多很多种,但是前端里边,现在最主流的就是一个JavaScript。因为 JSON 被大量的应用于JavaScript的交互中,所以会让很多人产生这样的一个误区。

3.2 JSON对象确实存在,但它的定义非常片面

那么对应到三个名词上面,JSON字符串、JSON,我们不再说了。我们重点要说的是这个JSON对象。JSON对象确实存在,但它的定义非常片面。

片面在什么地方呢?如果把JSON对象放到JavaScript里面来说的话呢?JSON对象这个说法是成立的,但是问题是:如果跳出了这个JavaScript的范畴,比如说放到Phthon里面,其实是没有JSON对象这个说法的啊。所以,如果你在搜索引擎里面去搜索JSON字符串和JSON对象的区别,绝大多数的答案都是以 JavaScript 这个语言为蓝本的。

3.3  JSON 我们应该把它理解成一个中间的语言格式

JSON 是一个比较独立的数据类型。它和 JavaScript 没有特定的关系。跳出语言层面,如果我们要实现在两种不同的语言之间传递数据:

第一种情况:世界上只有两种语言,我们可以直接按照一定的规则,把A语言的数据类型转换成B语言的数据类型就可以了,JSON没有存在的必要。

第二种情况:显然,第一种情况是不存在的,目前已经有许多种语言,要实现两两之间的转换,就需要写若干种规则,这显然也是不靠谱的,这时就需要有一种中间类型的语言(或者一种中间的数据类型的格式)来作为一个标准,所有的语言都向这个中间数据类型来转换,这样就可以实现不同语言之间的快速转换。

所以,很多时候,我们应该把它理解成是一个中间的数据类型的转换格式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1462766.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

突破亚马逊智能检测,全自动化运营的新利器:亚马逊鲲鹏系统

在亚马逊运营的道路上一般最为棘手的问题之一就是账号关联和安全性。而亚马逊鲲鹏系统它不仅拥有最新的防指纹技术&#xff0c;还能够完全模拟真实的人类行为&#xff0c;让每个账号都拥有独立环境运行&#xff0c;从而保证账号的安全性&#xff0c;让用户摆脱了账号关联的困扰…

使用贪婪算法解决作业调度问题

对于贪婪算法的基本思想是,在给定判断条件下,如果每次选择当下能够得到的最佳回报的选项,在很多情况下,这么做使无法实现最优解的,但是贪婪算法要能产生最优解,那他所对应的问题必须是具有特定的递归结构的。 而在某种条件的判断下选取出来最优方案之后,问题的规模就会…

IP地址定位能精确到哪里?——技术限制与定位精度

随着互联网的发展&#xff0c;IP地址定位技术被广泛运用于网络管理、个性化服务等领域。然而&#xff0c;IP地址定位的精确度受到技术限制&#xff0c;无法达到完全精准的地理位置定位。IP数据云将探讨IP地址定位能精确到哪里的技术限制&#xff0c;以及如何在实际应用中克服这…

The Captainz NFT 概览与数据分析

作者&#xff1a;stellafootprint.network 编译&#xff1a;cicifootprint.network 数据源&#xff1a;The Captainz NFT Collection Dashboard The Captainz 是 Memeland 的旗舰系列&#xff0c;由 9,999 个实用性极强的 PFP 组成。持有者在 Memeland 宇宙中展开了一场神…

Python:Keyboard Interrupt - 当代码遇到“Ctrl+C“时发生了什么?

Python&#xff1a;Keyboard Interrupt - 当代码遇到"CtrlC"时发生了什么&#xff1f; &#x1f308; 个人主页&#xff1a;高斯小哥 &#x1f525; 高质量专栏&#xff1a;【Matplotlib之旅&#xff1a;零基础精通数据可视化】 &#x1f4a1; 创作高质量博文&#x…

@echo off是什么意思

echo off 命令用于关闭命令回显。这意味着在执行批处理文件中的命令时&#xff0c;这些命令本身不会显示在命令行窗口上。 echo off执行以后&#xff0c;后面所有的命令均不显示&#xff0c;包括本条命令。 echo off执行以后&#xff0c;后面所有的命令均不显示&#xff0c;但本…

【PX4学习笔记】13.飞行安全与炸机处理

目录 文章目录 目录使用QGC地面站的安全设置、安全绳安全参数在具体参数中的体现安全绳 无人机炸机处理A&#xff1a;无人机异常时控操作B&#xff1a;无人机炸机现场处理C&#xff1a;无人机炸机后期维护和数据处理D&#xff1a;无人机再次正常飞行测试 无人机飞行法律宣传 使…

nginx优化配置

一 全局配置的六个模块简介 全局块&#xff1a;全局配置&#xff0c;对全局生效 events块&#xff1a;配置影响 Nginx 服务器与用户的网络连接 http块&#xff1a;配置代理&#xff0c;缓存&#xff0c;日志定义等绝大多数功能和第三方模块的配置 server块&#xff1a;配置…

npm/nodejs安装、切换源

前言 发现自己电脑上没有npm也没有node很震惊&#xff0c;难道我没写过代码么&#xff1f;不扯了&#xff0c;进入正题哈哈…… 安装 一般没有npm的话会报错&#xff1a; 无法将“npm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称而且报这个错&#xff0c;我们执行…

idea 启动java 项目时,日志卡住不动,项目重新启动失败,前端页面访问失败

项目场景&#xff1a; 背景&#xff1a; IDEA-启动SpringBoot 项目时&#xff0c;日志卡住不动&#xff0c;项目启动失败 问题描述 问题&#xff1a; IDEA-启动SpringBoot 项目时&#xff0c;日志卡住不动&#xff0c;启动失败&#xff0c;前端页面刷新后访问失败 idea 的左…

12 Autosar_SWS_MemoryMapping.pdf解读

AUTOSAR中MemMap_autosar memmap-CSDN博客 1、Memory Map的作用 1.1 避免RAM的浪费&#xff1a;不同类型的变量&#xff0c;为了对齐造成的空间两份&#xff1b; 1.2 特殊RAM的用途&#xff1a;比如一些变量通过位掩码来获取&#xff0c;如果map到特定RAM可以通过编译器的位掩码…

Qt应用软件【协议篇】MQTT官方源码编译安装

文章目录 QT官方代码选择对应的版本Qt Creator编译代码代码下载与编译安装mqtt命令行方式编译与安装代码示例QT官方代码 https://github.com/qt/qtmqtt/tree/5.15.2 选择对应的版本 我们可以在github上切换分支,切换到我们需要的版本上 Qt Creator编译代码 代码下载与编译…

Vue图片浏览组件v-viewer,支持旋转、缩放、翻转等操作

Vue图片浏览组件v-viewer&#xff0c;支持旋转、缩放、翻转等操作 之前用过viewer.js&#xff0c;算是市场上用过最全面的图片预览。v-viewer&#xff0c;是基于viewer.js的一个图片浏览的Vue组件&#xff0c;支持旋转、缩放、翻转等操作。 基本使用 安装&#xff1a;npm安装…

017—pandas 计算每名客户最低还款额日期

需求&#xff1a; 本需求是需要计算每名客户还够最低还款额的日期&#xff0c;第1个客户在 5 月 11 日这天累计入账1100元 大于 最低还款额1000元&#xff0c;故针对客户 1 所求日期为20210511。 字段说明&#xff1a; userid : 客户号 mini_amt&#xff1a;最低还款额 amou…

Liunx使用nginx和http搭建yum-server仓库

文章目录 1. yum-server的搭建方式2. nginx搭建yum-server仓库2.1. 安装配置nginx2.2 配置yum-server的rpm2.3. 同步yum源相关包2.3.1 rsync同步源3.3.1 reposync同步源 2.4. 配置客户端访问yum配置2.5. 验证测试 3. http服务搭建yum-server仓库3.1. 安装配置http3.2 配置yum-s…

ArcgisForJS如何实现添加含图片样式的点要素?

文章目录 0.引言1.加载底图2.获取点要素的坐标3.添加含图片样式的几何要素4.完整实现 0.引言 ArcGIS API for JavaScript 是一个用于在Web和移动应用程序中创建交互式地图和地理空间分析应用的库。本文在ArcGIS For JavaScript中使用Graphic对象来创建包含图片样式的点要素。 …

golang实现延迟队列(delay queue)

golang实现延迟队列 1 延迟队列&#xff1a;邮件提醒、订单自动取消 延迟队列&#xff1a;处理需要在未来某个特定时间执行的任务。这些任务被添加到队列中&#xff0c;并且指定了一个执行时间&#xff0c;只有达到指定的时间点时才能从队列中取出并执行。 应用场景&#xff1…

支付功能设计及实现思路

支付功能设计 主要包括&#xff1a;订单表&#xff0c;订单日志表&#xff0c;订单队列&#xff0c;定时任务。 主要考虑&#xff1a;事务性、幂等性、安全性。 表结构设计 订单表&#xff1a; 订单表&#xff0c;最主要的就是订单号、支付状态。 CREATE TABLE t_order (…

IOday1作业

1> 使用fgets统计给定文件的行数 2> 使用fputs和fgets完成两个文件的拷贝 3> 完成注册登录功能 做个小菜单&#xff0c;功能1是注册功能&#xff0c;输入注册账户和注册密码&#xff0c;将账户和密码写入文件中 功能2是登录功能&#xff0c;提示并输入登录账户和登录…

无人机设计技术,四旋翼无人机整机及控制系统技术浅谈

四旋翼无人机的飞行控制技术是无人机研究的重点之一。它使用直接力矩, 实现六自由度(位置与姿态)控制&#xff0c;具有多变量、非线性、强耦合和干扰敏感的特性。此外, 由于飞行过程中,微型飞行器同时受到多种物理效应的作用,还很容易受到气流等外部环境的干扰,模型准确性和传感…