Python中嵌套字典数据的高效过滤与转换

Python中嵌套字典数据的高效过滤与转换

本文详细介绍了如何从复杂的嵌套字典结构中提取特定键值对,并将其转换为一个新的、扁平化的字典。通过利用Python的字典推导式,教程展示了如何高效地将API返回的列表嵌套字典数据,重构为以特定字段(如token)为键,另一字段(如tsym)为值的目标字典,从而实现数据的精准筛选和格式化。

在处理从api或其他数据源获取的复杂数据时,我们经常会遇到嵌套的字典和列表结构。理解如何有效地从这些结构中提取和转换所需信息是python数据处理的关键技能。本教程将以一个典型的场景为例,演示如何将一个包含多层嵌套的字典数据,转换为一个更易于访问和使用的新字典。

理解原始数据结构

假设我们从经纪商的API获取了以下数据,其类型为Python字典:

my_dict = {     '1': [         {'exch': 'NFO', 'token': '43214', 'tsym': 'NIFTY07DEC23C20700', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20700 CE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'CE'},         {'exch': 'NFO', 'token': '43218', 'tsym': 'NIFTY07DEC23P20700', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20700 PE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'PE'},         {'exch': 'NFO', 'token': '43206', 'tsym': 'NIFTY07DEC23C20600', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20600 CE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'CE'},         {'exch': 'NFO', 'token': '43207', 'tsym': 'NIFTY07DEC23P20600', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20600 PE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'PE'}     ] }

这个my_dict的结构特点是:

  • 它是一个字典,但只有一个顶级键 ‘1’。
  • 键 ‘1’ 对应的值是一个列表。
  • 这个列表中包含了多个字典,每个字典代表一个金融工具的详细信息,例如 ‘token’(代)、’tsym’(交易符号)、’dname’(显示名称)等。

明确数据转换目标

我们的目标是从上述复杂结构中,提取每个内层字典的 ‘token’ 和 ‘tsym’ 字段,并构建一个新的字典。在这个新字典中,’token’ 的值将作为新字典的键,而 ‘tsym’ 的值将作为新字典的值。

期望的输出格式如下:

立即学习Python免费学习笔记(深入)”;

{'43214': 'NIFTY07DEC23C20700',  '43218': 'NIFTY07DEC23P20700',  '43206': 'NIFTY07DEC23C20600',  '43207': 'NIFTY07DEC23P20600'}

使用字典推导式进行高效转换

Python的字典推导式(Dictionary Comprehension)提供了一种简洁而高效的方式来创建字典。它允许我们通过遍历一个可迭代对象,并根据每个元素生成键值对来构建新字典。这正是解决我们当前问题的理想工具。

解决方案代码:

Python中嵌套字典数据的高效过滤与转换

可画AI

Canva可画魔力工作室,一站式ai智能设计工具平台

Python中嵌套字典数据的高效过滤与转换174

查看详情 Python中嵌套字典数据的高效过滤与转换

dct = {d['token']: d['tsym'] for d in my_dict['1']}

代码解析:

  1. my_dict[‘1’]: 首先,我们通过键 ‘1’ 访问到原始字典中包含所有金融工具信息的列表。
  2. for d in my_dict[‘1’]: 这一部分遍历了列表中的每一个字典。在每次迭代中,当前的字典被赋值给变量 d。
  3. d[‘token’]: 对于每个字典 d,我们提取其 ‘token’ 键对应的值,这将作为新字典的键。
  4. d[‘tsym’]: 同样,我们提取每个字典 d 的 ‘tsym’ 键对应的值,这将作为新字典的值。
  5. {d[‘token’]: d[‘tsym’] …}: 整个表达式将遍历过程中生成的键值对组合起来,最终形成新的字典 dct。

完整示例:

my_dict = {     '1': [         {'exch': 'NFO', 'token': '43214', 'tsym': 'NIFTY07DEC23C20700', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20700 CE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'CE'},         {'exch': 'NFO', 'token': '43218', 'tsym': 'NIFTY07DEC23P20700', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20700 PE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'PE'},         {'exch': 'NFO', 'token': '43206', 'tsym': 'NIFTY07DEC23C20600', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20600 CE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'CE'},         {'exch': 'NFO', 'token': '43207', 'tsym': 'NIFTY07DEC23P20600', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20600 PE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'PE'}     ] }  # 使用字典推导式进行转换 dct = {d['token']: d['tsym'] for d in my_dict['1']}  print(dct)

输出结果:

{'43214': 'NIFTY07DEC23C20700', '43218': 'NIFTY07DEC23P20700', '43206': 'NIFTY07DEC23C20600', '43207': 'NIFTY07DEC23P20600'}

注意事项与最佳实践

  1. 键的唯一性: 在使用字典推导式创建新字典时,请确保用作新字典键的原始字段(在本例中是 ‘token’)是唯一的。如果存在重复的 ‘token’ 值,则只有最后一个出现的键值对会被保留在新字典中。
  2. 字段存在性: 在访问 d[‘token’] 和 d[‘tsym’] 时,假定这些键在每个内部字典中都存在。如果某个字典缺少这些键,将会引发 KeyError。在生产代码中,可以考虑使用 d.get(‘token’) 或添加条件判断来处理缺失键的情况,例如:
    dct = {d.get('token'): d.get('tsym') for d in my_dict['1'] if 'token' in d and 'tsym' in d} # 或者处理None值 dct = {d['token']: d.get('tsym', 'N/A') for d in my_dict['1'] if 'token' in d}
  3. 可读性和效率: 字典推导式是Python中处理此类数据转换任务的推荐方法,因为它兼具代码的简洁性、可读性和执行效率。相比于传统的 for 循环和手动 dict.update() 操作,推导式通常更优。

总结

本教程展示了如何利用Python的字典推导式,从复杂的嵌套字典数据中高效地提取和重构信息。通过理解数据结构和明确转换目标,我们可以编写出简洁、功能强大的代码,将原始数据转换为更符合业务逻辑需求的格式。掌握字典推导式是Python数据处理能力提升的重要一步,它能帮助开发者更有效地处理和分析各种复杂数据集。

python 工具 金融 键值对 可迭代对象 python数据处理 Python for Token 循环 数据结构 对象 重构

上一篇
下一篇