使用json模块的dump()方法可将字典写入JSON文件,配合ensure_ascii=False和encoding=’utf-8’解决中文编码问题;datetime等非序列化对象需通过default函数或自定义JSONEncoder转换;处理大文件时可用ijson库实现流式解析,降低内存占用。
Python中将字典写入JSON文件,核心在于使用
json
模块的
dump()
或
dumps()
方法。
dump()
直接将字典写入文件,而
dumps()
则将字典转换为JSON字符串。
解决方案:
import json # 示例字典 data = { "name": "张三", "age": 30, "city": "北京" } # 写入JSON文件 def write_json_file(data, filename="data.json"): """ 将Python字典写入JSON文件。 """ try: with open(filename, 'w', encoding='utf-8') as f: json.dump(data, f, ensure_ascii=False, indent=4) # indent参数用于美化JSON格式,ensure_ascii=False处理中文 print(f"数据已成功写入到 {filename}") except Exception as e: print(f"写入JSON文件时发生错误: {e}") # 调用函数 write_json_file(data) # 或者使用 dumps() 方法,将字典转换为 JSON 字符串 json_string = json.dumps(data, ensure_ascii=False, indent=4) print(json_string)
如何处理JSON文件写入时的编码问题?
编码问题是JSON操作中常见的坑。默认情况下,
json.dump()
会将非ASCII字符转义为Unicode码点,这会导致中文显示为
uXXXX
的形式。解决办法是在
json.dump()
中设置
ensure_ascii=False
。此外,打开文件时务必指定
encoding='utf-8'
,确保文件以UTF-8编码保存。
立即学习“Python免费学习笔记(深入)”;
如果字典中包含datetime对象,如何序列化?
Python的
datetime
对象无法直接被JSON序列化。我们需要自定义序列化方法,将
datetime
对象转换为字符串。
import json from datetime import datetime def datetime_converter(o): if isinstance(o, datetime): return o.isoformat() raise TypeError("Object of type '%s' is not JSON serializable" % type(o).__name__) data = { "event": "会议", "time": datetime.now() } # 使用default参数指定转换函数 json_string = json.dumps(data, default=datetime_converter, ensure_ascii=False, indent=4) print(json_string) # 或者,可以自定义一个JSONEncoder class DateTimeEncoder(json.JSONEncoder): def default(self, obj): if isinstance(obj, datetime): return obj.isoformat() return super().default(obj) json_string = DateTimeEncoder().encode(data) print(json_string)
如何处理JSON文件过大的情况?
当处理大型JSON文件时,一次性加载到内存可能导致性能问题。这时可以考虑使用
ijson
库进行流式处理。
ijson
允许你逐块解析JSON数据,从而降低内存占用。
import ijson # 从文件中逐个解析 JSON 对象 with open('large.json', 'r') as f: for record in ijson.items(f, 'records.item'): # 'records.item' 是 JSON 数据的路径 print(record) # 在这里处理每个 record
此外,还可以考虑使用gzip压缩JSON文件,减小文件大小,但需要在读取时进行解压。