XPath函数库里有哪些常用函数,如何使用contains()和starts-with()?

XPath中常用字符串函数有contains()和starts-with()等,前者判断子串存在(如//button[contains(@class,'btn')]),后者判断前缀匹配(如//a[starts-with(@href,'https://')]),均区分大小写且支持文本和属性值匹配。

XPath函数库中常用的字符串处理函数包括 contains()starts-with()substring()string-length()normalize-space()concat()translate() 等,其中 contains()starts-with() 最常用于模糊匹配节点文本或属性值。

contains():判断子串是否存在

语法:contains(string, substring),返回布尔值。只要第一个参数(通常是节点文本或属性)包含第二个参数指定的子串,就返回 true

  • 常用于定位含关键词的元素,比如查找所有 class 属性含 "btn" 的按钮://button[contains(@class, 'btn')]
  • 注意大小写敏感,contains(., 'Login') 不会匹配 "login";如需忽略大小写,XPath 1.0 中需借助 translate() 模拟,XPath 2.0+ 可用 matches() 配合 flag="i"
  • . 表示当前节点的字符串值,contains(., 'error') 可筛选文本中含 "error" 的任意元素

starts-with():判断是否以指定字符串开头

语法:starts-with(string, substring),同样返回布尔值。仅当第一个参数以第二个参数为前缀时才返回 true

  • 适合匹配固定前缀的属性,例如找所有 href 以 "https://" 开头的链接://a[starts-with(@href, 'https://')]
  • 也支持文本内容判断,如选取标题以 "第" 开头的 div://div[starts-with(., '第')]
  • contains() 一样区分大小写;空字符串 '' 总是被视作任何字符串的前缀,即 starts-with('abc', '') 返回 true

实际组合用法示例

两个函数可嵌套或与其他条件联用:

  • 找 class 含 "nav" 且 id 以 "menu" 开头的元素://*[@class and contains(@class, 'nav') and starts-with(@id, 'menu')]
  • 排除含 "disabled" 的按钮,同时要求文本以 "Submit" 开头://button[not(contains(@class, 'disabled')) and starts-with(., 'Submit')]

基本上就这些。掌握 contains()starts-with() 能覆盖大多数动态定位场景,不复杂但容易忽略细节,比如大小写和空格处理。