1.解决excel转成json时中文汉字乱码的问题
真的好久没有打开这个博客也好久没有想起来记录一下问题了,今天将表格测试集转成json格式的时候遇到了汉字都变成了乱码的问题,虽然这不是个大问题,但是编码问题挺烦人的,乱码之后像下图:
解决办法:在to_json的时候设置force_ascii=False
解决之后:
2.excel转json的完整代码
import pandas as pd
# 读取 Excel 文件
excel_file = '测试集.xlsx' # 替换为你的 Excel 文件路径
sheet_name = ' 摘要关键词数据' # 替换为你要读取的工作表名称
# 使用 pandas 读取 Excel 文件
df = pd.read_excel(excel_file, sheet_name=sheet_name,dtype=str)
# 重命名列
new_column_names = {
'任务': 'task', # 替换 任务 为 task
'二级任务': 'subtask',
'输入':'input'
}
df.rename(columns=new_column_names, inplace=True)
# 将 DataFrame 转为 JSON 格式
json_data = df.to_json(force_ascii=False,orient='records', lines=True)
# 输出 JSON 数据到文件
json_file = '能测试集.json' # 输出的 JSON 文件路径
with open(json_file, 'w', encoding='utf-8') as f:
f.write(json_data)
print(f'Excel 已成功转换为 JSON 文件:{json_file}')