遇到JSON文件就头大？掌握Python这几种方法，让你轻松应对

news2026/4/8 2:56:42

1、标准库json模块 📄

1.1 json.load()函数介绍

1.2 json.loads()处理字符串

1.3 使用json.dump()写入JSON

1.4 json.dumps()美化输出

1.4 错误处理与编码问题

1.5 高效读取大文件技巧

2、第三方库simplejson加持 🔧

2.1 安装与导入simplejson

2.2 性能优势与特性

2.3 simplejson高级用法

2.3.1 自定义编码和解码

2.3.2 使用use_decimal=True处理高精度数值

3、使用pandas高效解析 📊

3.1 一维数据转换

3.2 复杂JSON结构处理

3.3 数据清洗与分析

4、requests库中的JSON解析 🔌

4.1 网络请求获取JSON数据

4.1 请求JSON数据

4.2 自动处理gzip压缩

4.3 异常重试策略

4.4 异常处理与状态码检查

5、使用第三方库ujson高速解析 🚀

5.1 安装与导入ujson

5.2 性能对比测试

5.3 特性与限制说明

6、总结与实战建议 🎯

1、标准库json模块 📄

在Python 中处理JSON数据时，标准库json提供了强大而简洁的功能。我们将深入探讨如何利用该模块高效地解析与生成JSON文件，涵盖从基础到进阶的使用方法。

1.1 json.load()函数介绍

json.load()是读取JSON文件并将其内容转换为Python对象的便捷方式。它接受一个文件对象作为参数，返回解析后的Python数据结构（通常是字典或列表）。

代码示例:

import json

with open('example.json', 'r', encoding='utf-8') as file:
    data = json.load(file)
print(data)

输出: 假设example.json包含{"name": "Alice", "age": 30}，则输出将是{'name': 'Alice', 'age': 30}。

1.2 json.loads()处理字符串

当面对的是JSON格式的字符串而非文件时，json.loads()便派上用场。它将JSON字符串直接转换为Python数据类型。

代码示例:

json_str = '{"name": "Bob", "age": 28}'
parsed_data = json.loads(json_str)
print(parsed_data)

输出: {'name': 'Bob', 'age': 28}

1.3 使用json.dump()写入JSON

要将Python对象序列化为JSON字符串并保存至文件，json.dump()是理想之选。它接受两个主要参数：一个是需要序列化的Python对象，另一个是用于写入的文件对象。

代码示例:

data_to_write = {"name": "Charlie", "age": 25}
with open('output.json', 'w', encoding='utf-8') as file:
    json.dump(data_to_write, file, ensure_ascii=False, indent=4)

此例中，ensure_ascii=False保证非ASCII字符正确显示，indent=4则使得输出更加易读。

1.4 json.dumps()美化输出

与json.dump()相似，json.dumps()用于将Python对象转换成JSON格式的字符串。它适用于需要JSON字符串而非文件操作的场景，并同样支持美化输出设置。

代码示例:

data_for_string = {"name": "David", "age": 32}
json_string = json.dumps(data_for_string, ensure_ascii=False, indent=4)
print(json_string)

输出:

{
    "name": "David",
    "age": 32
}

1.4 错误处理与编码问题

在处理JSON时，可能会遇到格式错误或编码不匹配的情况。为了增强代码的健壮性，应当加入异常处理机制。同时，指定正确的字符编码也是必要的：

try:
    with open('data.json', encoding='utf-8') as file:
        data = json.load(file)
except json.JSONDecodeError as e:
    print(f"解析错误: {e}")
except UnicodeDecodeError as e:
    print(f"编码错误: {e}")
else:
    print(data)

这段代码尝试打开并读取一个JSON文件，如果遇到JSON格式错误或编码问题，会捕获对应的异常并打印错误信息。

1.5 高效读取大文件技巧

处理大型JSON文件时，直接加载整个文件到内存可能不是最佳选择。可以采用逐行读取或分块读取的方式，结合ijson这样的流式解析库来提高效率。但这里我们展示一种基础的逐行读取JSON数组元素的方法：

import json

def parse_large_json(file_path):
    with open(file_path, 'r', encoding='utf-8') as file:
        for line in file:
            item = json.loads(line.strip())
            # 这里处理每一项数据，例如打印
            print(item)

parse_large_json('large_data.jsonl')

此示例假设large_data.jsonl是一个每行包含一个有效JSON对象的文本文件，适合处理大型数据集。

通过上述示例，我们全面了解了Python标准库json模块的核心功能，包括读取、解析JSON文件，处理JSON字符串，以及如何优雅地输出或保存JSON数据。掌握这些技能，无论是处理网络API响应，还是存储配置信息，都将变得轻而易举。