笔者在将json序列化到文件时,发现内容包含了反斜杠:
[
{
"video": "MSRVTT-QA\/video_features\/7010.mp4",
"id": 170859
},
...
]
解决办法是使用ensure_ascii=False
:
json.dump(result_items, f, ensure_ascii=False, indent=4)
ujson使用ensure_ascii=False不会生效
之前笔者使用的是ujson,导致ensure_ascii=False
加上了无效:
ujson.dump(result_items, f, ensure_ascii=False, indent=4)