Python ctypes结构体深度复制：处理指针字段的完整指南

本文深入探讨了在Python中使用ctypes库时，如何对包含指针字段的Structure进行深度复制。由于ctypes结构体模拟C语言内存布局，其指针字段仅存储内存地址。实现深度复制的关键在于，首先对结构体本身进行浅复制，然后遍历所有指针字段，为它们指向的外部数据创建全新的副本，并更新复制结构体中的指针以指向这些新副本，从而避免原结构体修改对复制结构体的影响。

1. ctypes.Structure与深度复制的挑战

在Python中，ctypes模块允许我们定义与C语言结构体兼容的数据类型，以便与外部C库进行交互。当一个ctypes.Structure包含基本类型（如c_int, c_float）或固定大小的数组时，复制操作相对直接。然而，当结构体包含POINTER类型（即指向外部内存的指针）时，标准的浅复制（如使用copy.copy()或Structure.from_buffer_copy())仅复制指针本身的值（内存地址），而不会复制指针所指向的数据。这意味着原始结构体和复制结构体中的指针将指向同一块外部内存。如果修改了原始结构体指向的数据，复制结构体也会受到影响，这与深度复制的预期行为相悖。

为了实现真正的深度复制，我们需要确保不仅结构体本身的成员被复制，其所有指针字段所指向的外部数据也被独立复制，并且复制结构体中的指针指向这些新复制的数据。

2. 定义包含指针的ctypes.Structure

我们以一个名为Group的结构体为例，它包含一个整型数组ChSize、一个浮点数指针数组DataChannel以及其他基本类型字段。DataChannel是一个包含9个POINTER(ct.c_float)的数组，每个指针可能指向不同长度的浮点数数据块，其长度由ChSize中对应索引的值决定。

import ctypes as ct  class Group(ct.Structure):     _fields_ = (         ('ChSize', ct.c_uint32 * 9),          # 每个通道的数据大小         ('DataChannel', ct.POINTER(ct.c_float) * 9), # 9个指向浮点数数组的指针         ('TriggerTimeLag', ct.c_uint32),      # 触发时间延迟         ('StartIndexCell', ct.c_uint16)       # 起始索引     )      def __repr__(self):         """         为Group结构体提供一个可读的字符串表示，方便调试。         它会显示所有字段的值，并尝试打印DataChannel指向的实际数据。         """         s = f'Group(ChSize={self.ChSize[:]}, TriggerTimeLag={self.TriggerTimeLag}, StartIndexCell={self.StartIndexCell})n'         for i in range(9):             # 访问指针指向的数据，使用切片操作[:self.ChSize[i]]来限制长度             # 如果指针为None，则显示空列表             data_content = self.DataChannel[i][:self.ChSize[i]] if self.DataChannel[i] else []             s += f'  DataChannel[{i}] = {data_content}n'         return s

在__repr__方法中，我们通过self.DataChannel[i][:self.ChSize[i]]来访问指针指向的数据。POINTER对象支持切片操作，使其行为类似于Python列表，允许我们读取其指向的内存区域中的数据。

立即学习“Python免费学习笔记（深入）”；

3. 实现深度复制方法

实现Group结构体的深度复制需要以下步骤：

浅复制结构体本身：使用Structure.from_buffer_copy(self)创建一个新的Group实例。这个新实例将拥有与原始结构体相同的内存布局和直接成员值。这意味着ChSize、TriggerTimeLag和StartIndexCell会被直接复制，而DataChannel中的指针值也会被复制（即，新旧结构体中的DataChannel数组会包含相同的内存地址）。

即构数智人

即构数智人是由即构科技推出的ai虚拟数字人视频创作平台，支持数字人形象定制、短视频创作、数字人直播等。

36

查看详情
深度复制指针指向的数据：遍历DataChannel数组中的每个指针。对于每个指针，根据ChSize中对应的大小，创建一块新的ctypes数组来存储原始指针指向的数据的副本。然后，将这个新数组的地址转换为POINTER(ct.c_float)类型，并更新复制结构体中对应的DataChannel字段。

下面是deepcopy方法的实现：

class Group(ct.Structure):     _fields_ = (         ('ChSize', ct.c_uint32 * 9),         ('DataChannel', ct.POINTER(ct.c_float) * 9),         ('TriggerTimeLag', ct.c_uint32),         ('StartIndexCell', ct.c_uint16)     )      def __repr__(self):         s = f'Group(ChSize={self.ChSize[:]}, TriggerTimeLag={self.TriggerTimeLag}, StartIndexCell={self.StartIndexCell})n'         for i in range(9):             data_content = self.DataChannel[i][:self.ChSize[i]] if self.DataChannel[i] else []             s += f'  DataChannel[{i}] = {data_content}n'         return s      def deepcopy(self):         # 1. 对结构体本身进行浅复制         # from_buffer_copy 会复制结构体的所有直接成员，包括指针的值。         # 此时，copy.DataChannel[i] 和 self.DataChannel[i] 仍然指向相同的外部数据。         copy = Group.from_buffer_copy(self)          # 2. 遍历DataChannel数组，深度复制指针指向的外部数据         for i, (size, original_channel_ptr) in enumerate(zip(self.ChSize, self.DataChannel)):             if original_channel_ptr: # 确保原始指针不为None                 # 创建一个新的ctypes数组，用于存储当前通道的数据副本                 # (*original_channel_ptr[:size]) 将原始指针指向的数据解包并填充到新数组                 new_data_buffer = (ct.c_float * size)(*original_channel_ptr[:size])                  # 将新数组转换为POINTER(ct.c_float)类型，并赋值给复制结构体                 # ct.cast 用于将一个ctypes对象（如数组）转换为指定的ctypes类型                 copy.DataChannel[i] = ct.cast(new_data_buffer, ct.POINTER(ct.c_float))             else:                 # 如果原始指针为None，则复制结构体中的对应指针也设为None                 copy.DataChannel[i] = None         return copy

4. 示例与验证

为了验证deepcopy方法的正确性，我们将创建一个Group实例，初始化其所有字段，包括DataChannel指向的动态数据。然后，我们进行深度复制，并修改原始Group实例的DataChannel，观察复制后的Group是否保持不变。

# 1. 创建并初始化一个Group实例 group = Group() group.ChSize[:] = [1, 2, 3, 4, 5, 6, 7, 8, 9] # 初始化每个通道的大小  # 为每个DataChannel指针分配内存并填充数据 for i, size in enumerate(group.ChSize):     # 创建一个ctypes浮点数数组作为数据缓冲区     data_buffer = (ct.c_float * size)(*[1.5 * n for n in range(size)])     # 将数组的地址转换为POINTER(ct.c_float)并赋值给DataChannel     group.DataChannel[i] = ct.cast(data_buffer, ct.POINTER(ct.c_float))  group.TriggerTimeLag = 123 group.StartIndexCell = 456 print("--- 原始 Group 实例 ---") print(group)  # 2. 执行深度复制 copy_group = group.deepcopy() print("n--- 复制后的 Group 实例 (在修改原始实例之前) ---") print(copy_group)  # 3. 修改原始 Group 实例的 DataChannel 和 ChSize # 将原始实例的ChSize全部设为0，DataChannel指针设为None，模拟数据被清空 group.ChSize[:] = [0] * 9 group.DataChannel[:] = [None] * 9  print("n--- 修改原始 Group 实例后 ---") print(group)  print("n--- 再次打印复制后的 Group 实例 (应保持不变) ---") print(copy_group)

预期输出分析：

原始 Group 实例： 将显示所有字段的初始值，DataChannel会显示其指向的浮点数数据。
复制后的 Group 实例 (在修改原始实例之前)： 将与原始实例完全相同，证明复制成功。
修改原始 Group 实例后： group实例的ChSize将全部变为0，DataChannel将显示为空列表（因为指针已设为None）。
再次打印复制后的 Group 实例 (应保持不变)： copy_group实例的ChSize和DataChannel将保持其原始复制时的状态，不受group实例修改的影响，这证明了深度复制的成功。

5. 注意事项与总结

内存管理： 在Python中，通过ctypes创建的数组（如ct.c_float * size）是Python对象，由Python的垃圾回收机制管理。因此，我们不需要像C语言那样手动free内存。只要new_data_buffer对象有引用，其内存就会保持有效。当copy.DataChannel[i]被赋值为ct.cast(new_data_buffer, …)时，new_data_buffer对象被隐式地保持了引用，从而确保其生命周期。
ct.cast的作用： ct.cast(obj, type)是ctypes中一个非常重要的函数，它用于将一个ctypes对象（通常是一个缓冲区或另一个指针）强制转换为指定的ctypes类型。在本例中，它将一个ctypes数组对象（本质上是一个内存块）转换为一个POINTER类型，使其可以赋值给DataChannel字段。
指针的有效性： 在实际应用中，如果ctypes结构体中的指针指向的是C语言库动态分配的内存（例如通过malloc），那么在Python中进行深度复制时，您可能需要在C层实现相应的内存分配和数据复制逻辑，并通过ctypes调用这些C函数，以确保内存管理的正确性。本教程的示例假设数据缓冲区是在Python/ctypes层面创建的。
通用性： 这种处理指针字段的深度复制模式可以推广到任何包含ctypes.POINTER字段的ctypes.Structure。关键在于识别哪些字段是直接数据，哪些是指针，并对指针指向的数据进行额外的复制。

通过以上步骤，我们成功地为包含指针字段的ctypes.Structure实现了深度复制，确保了复制后的对象与原始对象在数据上完全独立，避免了潜在的副作用。这对于需要在Python中安全地操作和传递复杂C结构体数据至关重要。

大家都在看：

如何用Python读写JSON/CSV/Excel文件？解决Pandas读取ODS/Excel文件时单元格注释与内容混淆问题 Pandas 处理 ODS/Excel 单元格注释：从合并内容中提取纯净数据 Pandas处理Excel单元格注释：移除或忽略注释内容如何使用Python处理CSV和Excel文件？

excel python c语言 Python c语言数据类型整型结构体指针 pointer 切片 copy 对象