html5如何将xml转json_手动编写转换函数的实现思路【教程】

XML解析必须用DOMParser而非JSON.parse,它将字符串转为Document对象;需注意浏览器兼容性、XML声明自动忽略、失败时检查documentElement是否为null;手动转JSON时应按语义映射:无子元素无属性→纯文本,有子元素→对象且同名兄弟节点强制为数组,属性统一存入@attributes。

XML 字符串解析必须用 DOMParser,不能用 JSON.parse

浏览器原生不支持直接把 XML 当 JSON 解析,JSON.parse() 会立刻报 SyntaxError: Unexpected token 。正确入口是 DOMParser —— 它能把 XML 字符串转成可遍历的 Document 对象。

注意点:

  • DOMParser 在 IE10+ 和所有现代浏览器可用,但 Node.js 环境不内置(需用 xml2jsfast-xml-parser
  • 如果 XML 带 XML 声明(如 ),DOMParser 能自动忽略,无需提前正则剔除
  • 解析失败时返回空文档且无异常,要手动检查 parser.parseFromString(xmlStr, "text/xml").documentElement === null

递归遍历 Element 的三个核心规则

手动转 JSON 的难点不在解析,而在如何合理映射 XML 结构到 JS 对象。关键不是“全转成对象”,而是按语义区分:

  • 只有 0 个子元素 + 无属性 → 当作纯文本值(字符串或数字,可选自动类型转换)
  • 有子元素 → 当作对象,子元素名作 key;若同名兄弟节点多个(如多个 ),必须转为数组
  • 属性统一收进 @attributes 字段(或其他约定前缀),避免和子元素名冲突

示例 XML 片段:

立即学习“前端免费学习笔记(深入)”;


  Alice
  jshtml

对应 JSON 应类似:

{
  "root": {
    "@attributes": { "id": "123" },
    "name": "Alice",
    "tags": {
      "tag": ["js", "html"]
    }
  }
}

处理文本节点和空白字符的坑

XML 中换行、缩进、空格在 DOM 中会生成 Text 节点,容易误判为有效内容。比如:


  Alice

实际产生 3 个子节点:换行文本 + name 元素 + 换行文本。直接取 childNodes[0].textContent 会得到 "\n Alice\n"

安全做法:

  • 只对 nodeType === 1(即 Element)递归处理
  • 提取文本值时,用 Array.from(el.childNodes) 过滤出 nodeType === 3Text)节点,再 .map(n => n.textContent.trim()).filter(Boolean)
  • 若某元素既有子元素又有文本(混合内容),需保留 #text 字段,否则信息丢失

不推荐 deepMerge 多层同名节点,优先用数组包裹

常见错误是遇到多个同名子元素(如 5 个 )时,试图逐个 Object.assign 合并,结果后一个覆盖前一个。

正确策略只有一条:

  • 只要父元素下存在两个及以上同名 Element 子节点,该字段值强制为数组
  • 即使只有一个,也建议统一为数组(保持结构可预测),或加开关参数控制({ alwaysArray: ["item", "entry"] }
  • 不要尝试“智能判断是否该是数组”——XML Schema 不保证重复性,运行时数据才决定

这意味着你得先遍历一遍子节点,统计同名 Element 出现次数,再决定字段类型。这是手动实现绕不开的两趟遍历。

复杂点往往不在语法,而在于要不要保留注释、CDATA、命名空间、处理指令这些 XML 特有节点——绝大多数业务场景应直接跳过它们,只处理 nodeType === 1