Python中从嵌套字典列表高效提取与转换数据

本教程详细讲解如何从一个包含嵌套字典列表的复杂数据结构中，高效地提取特定键值对，并将其转换为一个新的扁平化字典。通过使用Python的字典推导式，我们将演示如何将原始数据中的token字段作为新字典的键，tsym字段作为新字典的值，从而实现数据的精准筛选与格式转换。

在处理来自api或其他数据源的复杂数据时，我们经常会遇到嵌套的字典和列表结构。这些结构虽然能够承载丰富的信息，但在需要特定格式的数据进行进一步分析或处理时，往往需要进行有效的提取和转换。本教程将以一个典型的场景为例，展示如何利用python的强大功能，特别是字典推导式，来简化这一过程。

原始数据结构分析

假设我们从经纪商API获取了以下交易数据：

my_dict = {     '1': [         {'exch': 'NFO', 'token': '43214', 'tsym': 'NIFTY07DEC23C20700', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20700 CE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'CE'},         {'exch': 'NFO', 'token': '43218', 'tsym': 'NIFTY07DEC23P20700', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20700 PE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'PE'},         {'exch': 'NFO', 'token': '43206', 'tsym': 'NIFTY07DEC23C20600', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20600 CE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'CE'},         {'exch': 'NFO', 'token': '43207', 'tsym': 'NIFTY07DEC23P20600', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20600 PE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'PE'}     ] }

这个数据结构是一个字典，其唯一的键是字符串’1’，对应的值是一个列表。这个列表中包含了多个字典，每个内层字典代表一个金融合约的详细信息。

目标数据格式

我们的目标是从这个复杂结构中提取出每个合约的token和tsym信息，并将其组织成一个新的字典，其中token作为键，tsym作为值。期望的输出格式如下：

new_dict = {     '43214': 'NIFTY07DEC23C20700',     '43218': 'NIFTY07DEC23P20700',     '43206': 'NIFTY07DEC23C20600',     '43207': 'NIFTY07DEC23P20600' }

解决方案：使用字典推导式

Python的字典推导式（Dictionary Comprehension）提供了一种简洁高效的方式来创建字典。它允许我们在一行代码中遍历可迭代对象，并根据每个元素生成键值对。

立即学习“Python免费学习笔记（深入）”；

针对上述问题，我们可以使用以下字典推导式：

dct = {d['token']: d['tsym'] for d in my_dict['1']}

让我们逐步解析这个表达式：

my_dict[‘1’]: 首先，我们通过键’1’访问my_dict中的列表。这个列表包含了所有需要处理的内层字典。
for d in my_dict[‘1’]: 这是一个标准的for循环语法，它会遍历my_dict[‘1’]列表中的每一个元素。在每次迭代中，变量d将代表列表中的一个内层字典（例如，{‘exch’: ‘NFO’, ‘token’: ‘43214’, …}）。
d[‘token’]: d[‘tsym’]: 这是字典推导式生成新字典键值对的部分。对于每次迭代中的字典d，我们提取其’token’键对应的值作为新字典的键，并提取其’tsym’键对应的值作为新字典的值。

将上述代码应用于原始数据，即可得到我们期望的扁平化字典。

完整代码示例：

可画AI

Canva可画魔力工作室，一站式ai智能设计工具平台

174

查看详情

my_dict = {     '1': [         {'exch': 'NFO', 'token': '43214', 'tsym': 'NIFTY07DEC23C20700', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20700 CE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'CE'},         {'exch': 'NFO', 'token': '43218', 'tsym': 'NIFTY07DEC23P20700', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20700 PE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'PE'},         {'exch': 'NFO', 'token': '43206', 'tsym': 'NIFTY07DEC23C20600', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20600 CE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'CE'},         {'exch': 'NFO', 'token': '43207', 'tsym': 'NIFTY07DEC23P20600', 'weekly': 'W1', 'dname': 'NIFTY 07DEC23 20600 PE ', 'instname': 'OPTIDX', 'pp': '2', 'ls': '50', 'ti': '0.05', 'optt': 'PE'}     ] }  # 使用字典推导式进行数据转换 new_dict = {d['token']: d['tsym'] for d in my_dict['1']}  print(new_dict)

输出结果：

{'43214': 'NIFTY07DEC23C20700', '43218': 'NIFTY07DEC23P20700', '43206': 'NIFTY07DEC23C20600', '43207': 'NIFTY07DEC23P20600'}

注意事项

键的存在性检查: 在实际应用中，如果不能保证每个内层字典都包含’token’和’tsym’这两个键，直接访问可能会导致KeyError。为提高代码健壮性，可以加入条件判断或使用字典的get()方法：

# 使用get()方法提供默认值，避免KeyError new_dict_safe = {d.get('token', 'UNKNOWN_TOKEN'): d.get('tsym', 'UNKNOWN_TSYM')                   for d in my_dict['1'] if 'token' in d and 'tsym' in d}  # 或者，如果只希望处理包含这两个键的字典 new_dict_filtered = {d['token']: d['tsym']                       for d in my_dict['1'] if 'token' in d and 'tsym' in d}

数据结构深度: 本示例处理的是两层嵌套（字典中包含列表，列表中包含字典）。如果数据结构更深，例如字典中包含列表，列表中又包含字典，字典中还有列表，则需要更复杂的访问路径或多层嵌套的推导式，甚至递归函数。
可读性与复杂性: 字典推导式非常简洁，但对于非常复杂的转换逻辑，过度使用推导式可能会降低代码的可读性。在这种情况下，传统的for循环结合条件判断可能会是更好的选择。
性能: 字典推导式通常比显式的for循环更高效，因为它在C语言级别实现，减少了Python解释器的开销。对于大规模数据处理，这是一个显著优势。

总结

通过本教程，我们学习了如何利用Python的字典推导式，从一个嵌套的字典列表中高效、简洁地提取并转换数据。这种方法不仅能够实现精准的数据筛选和格式转换，还能有效提升代码的执行效率和可读性。掌握字典推导式是Python数据处理中的一项核心技能，对于处理各种复杂数据结构都具有广泛的应用价值。在实际开发中，请务必考虑键的存在性、数据结构的复杂性以及代码的可读性，选择最合适的实现方式。

大家都在看：

Python中安全区分变量模型与类型：isinstance()的正确用法如何在一台电脑上安装多个 Python 解释器 Python 如何捕获日志中的异常并发送通知 Python 异常处理与资源泄漏问题 python怎么将字典转换为JSON字符串_python字典转JSON字符串操作

python c语言金融递归函数键值对可迭代对象 red python数据处理 Python c语言 for Token 字符串递归循环数据结构对象低代码

原始数据结构分析

目标数据格式

解决方案：使用字典推导式

注意事项

总结

大家都在看：

推荐文章