将扁平数据转换为分层结构:PHP数组操作教程

将扁平数据转换为分层结构:PHP数组操作教程

本教程详细介绍了如何将包含父子关系信息的扁平化数组数据,转换为具有层级结构的嵌套数组。通过构建索引和迭代分配子元素,文章提供了一个通用的php解决方案,适用于处理如问答、评论树等多种场景,确保数据结构清晰、易于访问和管理。

在许多应用场景中,我们经常需要处理来自数据库或其他数据源的扁平化数据集,这些数据行之间存在着内在的父子关系。例如,一个问答系统可能包含问题和答案,其中答案关联到特定的问题;一个评论系统则可能包含多级回复。将这种扁平数据转换为嵌套的、具有层级结构的数组,不仅能更好地反映数据间的真实关系,也便于前端展示和业务逻辑处理。

问题描述:从扁平到层级

假设我们有一个包含“问题”和“答案”的数组,每个元素都有一个唯一的 PARTY_ID 和一个 PARENT_USER_CONTENT_ID,后者指向其父元素的 PARTY_ID。如果 PARENT_USER_CONTENT_ID 为空,则表示该元素是一个顶级元素(例如,一个问题)。

原始扁平数据示例:

$flatData = [     [ 'TYPE' => 'Question', 'PARTY_ID' => 112, 'PARENT_USER_CONTENT_ID' => '' ],     [ 'TYPE' => 'Answer', 'PARTY_ID' => 115, 'PARENT_USER_CONTENT_ID' => 112 ],     [ 'TYPE' => 'Question', 'PARTY_ID' => 113, 'PARENT_USER_CONTENT_ID' => '' ],     [ 'TYPE' => 'Answer', 'PARTY_ID' => 116, 'PARENT_USER_CONTENT_ID' => 113 ],     [ 'TYPE' => 'Answer', 'PARTY_ID' => 117, 'PARENT_USER_CONTENT_ID' => 112 ], // 112有两个答案     [ 'TYPE' => 'Comment', 'PARTY_ID' => 118, 'PARENT_USER_CONTENT_ID' => 117 ], // 答案下的评论 ];

期望的层级结构示例:

立即学习PHP免费学习笔记(深入)”;

[     [         'TYPE' => 'Question',         'PARTY_ID' => 112,         'PARENT_USER_CONTENT_ID' => '',         'children' => [             [                 'TYPE' => 'Answer',                 'PARTY_ID' => 115,                 'PARENT_USER_CONTENT_ID' => 112,                 'children' => [] // 或者没有此键             ],             [                 'TYPE' => 'Answer',                 'PARTY_ID' => 117,                 'PARENT_USER_CONTENT_ID' => 112,                 'children' => [                     [                         'TYPE' => 'Comment',                         'PARTY_ID' => 118,                         'PARENT_USER_CONTENT_ID' => 117,                         'children' => []                     ]                 ]             ]         ]     ],     [         'TYPE' => 'Question',         'PARTY_ID' => 113,         'PARENT_USER_CONTENT_ID' => '',         'children' => [             [                 'TYPE' => 'Answer',                 'PARTY_ID' => 116,                 'PARENT_USER_CONTENT_ID' => 113,                 'children' => []             ]         ]     ] ]

解决方案:迭代构建树形结构

构建这种层级结构的核心思想是:首先创建一个所有元素的快速查找索引,然后遍历这些元素,将子元素归属到它们的父元素下,并最终收集所有顶级元素。这种方法能够处理任意深度的嵌套关系。

步骤一:创建元素索引和初始化子元素容器

首先,我们需要遍历原始的扁平数据,为每个元素创建一个以其 PARTY_ID 为键的索引,以便能快速通过ID查找任何元素。同时,为每个元素预留一个 children 数组,用于存放其子元素。

将扁平数据转换为分层结构:PHP数组操作教程

即构数智人

即构数智人是由即构科技推出的AI虚拟数字人视频创作平台,支持数字人形象定制、短视频创作、数字人直播等。

将扁平数据转换为分层结构:PHP数组操作教程36

查看详情 将扁平数据转换为分层结构:PHP数组操作教程

$tree = []; // 最终的层级结构数组,存放所有顶级元素 $indexedItems = []; // 临时索引,用于通过ID快速查找元素  // 第一次遍历:索引所有元素并初始化 'children' 数组 foreach ($flatData as &$item) {     $item['children'] = []; // 为每个元素添加一个空的 'children' 数组     $indexedItems[$item['PARTY_ID']] = &$item; // 使用引用存储,以便后续修改能反映到原始数据 } unset($item); // 解除最后一次循环的引用,避免意外修改

说明:

  • $indexedItems 数组的键是每个元素的 PARTY_ID,值是对原始 $flatData 中对应元素的引用。这意味着当我们通过 $indexedItems 修改一个元素时,$flatData 中的原始元素也会随之改变。
  • $item[‘children’] = []; 为每个元素添加了一个 children 键,初始化为空数组,用于存放其子元素。

步骤二:构建层级关系

接下来,我们再次遍历索引后的元素。对于每个元素,如果它有 PARENT_USER_CONTENT_ID 且其父元素存在于 $indexedItems 中,就将当前元素添加到其父元素的 children 数组中。如果一个元素没有 PARENT_USER_CONTENT_ID,则它是一个顶级元素,应将其添加到最终的 $tree 数组中。

// 第二次遍历:构建层级关系 foreach ($indexedItems as $id => &$item) {     $parentId = $item['PARENT_USER_CONTENT_ID'];      // 检查是否存在父ID且父元素在索引中     if (!empty($parentId) && isset($indexedItems[$parentId])) {         // 将当前元素添加到其父元素的 'children' 数组中         $indexedItems[$parentId]['children'][] = &$item;     } else {         // 如果没有父ID,则它是一个顶级元素,添加到最终的 $tree 数组中         $tree[] = &$item;     } } unset($item); // 解除最后一次循环的引用

说明:

  • 这里同样使用了引用 (&$item),确保当我们将子元素添加到父元素的 children 数组时,实际是添加了对子元素在 $indexedItems 中位置的引用。这样可以避免深拷贝,节省内存,并允许后续对子元素的修改反映在整个树结构中。
  • $tree 数组最终将只包含所有顶级元素。由于子元素是通过引用添加到其父元素的 children 数组中的,整个层级结构就此构建完成。

完整代码示例

将以上两个步骤结合起来,形成一个完整的函数或代码块:

<?php  $flatData = [     [ 'TYPE' => 'Question', 'PARTY_ID' => 112, 'PARENT_USER_CONTENT_ID' => '' ],     [ 'TYPE' => 'Answer', 'PARTY_ID' => 115, 'PARENT_USER_CONTENT_ID' => 112 ],     [ 'TYPE' => 'Question', 'PARTY_ID' => 113, 'PARENT_USER_CONTENT_ID' => '' ],     [ 'TYPE' => 'Answer', 'PARTY_ID' => 116, 'PARENT_USER_CONTENT_ID' => 113 ],     [ 'TYPE' => 'Answer', 'PARTY_ID' => 117, 'PARENT_USER_CONTENT_ID' => 112 ],     [ 'TYPE' => 'Comment', 'PARTY_ID' => 118, 'PARENT_USER_CONTENT_ID' => 117 ],     [ 'TYPE' => 'Comment', 'PARTY_ID' => 119, 'PARENT_USER_CONTENT_ID' => 117 ],     [ 'TYPE' => 'Question', 'PARTY_ID' => 120, 'PARENT_USER_CONTENT_ID' => '' ], ];  function buildHierarchy(array $flatData, string $idKey = 'PARTY_ID', string $parentKey = 'PARENT_USER_CONTENT_ID', string $childrenKey = 'children'): array {     $tree = [];     $indexedItems = [];      // 第一次遍历:索引所有元素并初始化 'children' 数组     foreach ($flatData as &$item) {         $item[$childrenKey] = [];         $indexedItems[$item[$idKey]] = &$item;     }     unset($item); // 解除引用      // 第二次遍历:构建层级关系     foreach ($indexedItems as $id => &$item) {         $parentId = $item[$parentKey];          if (!empty($parentId) && isset($indexedItems[$parentId])) {             $indexedItems[$parentId][$childrenKey][] = &$item;         } else {             $tree[] = &$item;         }     }     unset($item); // 解除引用      return $tree; }  $hierarchicalData = buildHierarchy($flatData);  echo '<pre>'; print_r($hierarchicalData); echo '</pre>';  ?>

注意事项与总结

  1. 引用(&)的使用: 在构建过程中,大量使用了PHP的引用特性。这使得我们能够直接修改 $indexedItems 中的元素,并且这些修改会反映到最终的 $tree 结构中,而无需进行昂贵的数组深拷贝,从而提高了内存效率。使用完毕后,务必 unset($item) 来解除引用,避免潜在的副作用。
  2. 键名可配置: 提供的 buildHierarchy 函数允许您通过参数指定 ID 键、父ID键和子元素键的名称,使其更具通用性。
  3. 处理孤立子元素: 如果 PARENT_USER_CONTENT_ID 指向的父元素不存在于 $flatData 中,那么该子元素也将被视为顶级元素,并添加到 $tree 数组中。这通常是期望的行为,但如果需要严格的父子关系,您可能需要在将子元素添加到 $tree 之前进行额外的检查或错误处理。
  4. 性能: 这种迭代方法的时间复杂度为 O(N),其中 N 是 $flatData 中的元素数量,因为它主要涉及两次遍历。对于大多数数据集而言,这种性能表现是高效且可接受的。
  5. 输出结构: 最终的 $hierarchicalData 数组将包含所有顶级元素,每个顶级元素内部的 children 数组又包含了其直接子元素,子元素又可以有自己的 children 数组,以此类推,形成了完整的树形结构

以上就是将扁平数据转换为分层结构:PHP数组操作教程的详细内容,更多请关注

上一篇
下一篇
text=ZqhQzanResources