使用 JOLT 进行 Shift 转换:从任意嵌套层级提取数据到单一列表

本教程旨在解决在使用 JOLT 进行 JSON 转换时,如何从未知深度的嵌套结构中提取特定字段的值,并将这些值整合到一个数组中的问题。通过修改 JOLT shift 转换的 spec 文件,即使输入 JSON 的结构发生变化,也能保证输出始终是一个包含提取值的数组。

JOLT (JSON to JSON transform) 是一种强大的 JSON 转换工具,它允许用户通过简单的 JSON "spec" 文件来定义复杂的转换规则。在处理嵌套的 JSON 结构时,有时我们需要从不同层级提取数据,并将它们整合到一个数组中。本教程将介绍如何使用 JOLT 的 shift 操作来实现这一目标,并确保输出始终是一个数组,即使只有一个匹配项。

问题描述

假设我们有一个 JSON 数据,其中包含嵌套的 "item" 数组,数组的嵌套层级可能不确定。我们的目标是从这些嵌套的 "item" 中提取 "foo" 对象的 "nn" 字段的值,并将所有提取到的值放入一个名为 "type" 的数组中。

解决方案

关键在于 JOLT shift 操作的 spec 文件。我们需要使用通配符 "*" 来匹配任意层级的 "item" 数组,并使用 "[]" 后缀来强制生成数组。

以下是一个示例 spec 文件:

[
  {
    "operation": "shift",
    "spec": {
      "item": {
        "*": {
          "item": {
            "*": {
              "item": {
                "*": {
                  "foo": {
                    "nn": "type[]"
                  }
                }
              },
              "foo": {
                "nn": "type[]"
              }
            }
          },
          "foo": {
            "nn": "type[]"
          }
        }
      }
    }
  }
]

在这个 spec 文件中,我们使用了多个 "*" 通配符来匹配任意层级的 "item" 数组。关键在于 "nn": "type[]" 这一行。通过在 "type" 后面添加 "[]",我们告诉 JOLT 始终将提取到的 "nn" 值放入一个数组中,即使只有一个匹配项。

示例

假设我们的输入 JSON 如下:

{
  "id": 1,
  "item": [
    {
      "id": "1_1",
      "foo": {
        "id": 1232,
        "nn": "sdfsd"
      }
    }
  ]
}

使用上面的 spec 文件,JOLT 将生成以下输出:

{
  "type": [
    "sdfsd"
  ]
}

如果输入 JSON 包含多个 "item" 数组,例如:

{
  "id": 1,
  "item": [
    {
      "id": "1_1",
      "foo": {
        "id": 1232,
        "nn": "sdfsd"
      }
    },
    {
      "id": "1_2",
      "foo": {
        "id": 4567,
        "nn": "dfsds"
      }
    }
  ]
}

JOLT 将生成以下输出:

{
  "type": [
    "sdfsd",
    "dfsds"
  ]
}

注意事项

  • spec 文件中的通配符 "*" 匹配任何键名,因此请确保你的 JSON 结构符合预期,避免提取到不必要的数据。
  • 如果嵌套层级非常深,可以考虑使用更简洁的 JOLT spec 语法,例如使用 "@" 符号来引用父级节点。

总结

通过在 JOLT shift 操作的 spec 文件中使用 "[]" 后缀,我们可以强制 JOLT 生成数组输出,即使只有一个匹配项。这在处理嵌套的 JSON 结构时非常有用,可以确保输出数据的一致性。 这种方法使得我们能够从任意深度的嵌套结构中提取数据,并将它们整合到一个数组中,从而简化后续的数据处理流程。