捕获组通过()保存匹配内容,命名捕获组使用?提升可读性;2. 零宽断言匹配位置而非字符,包括正向/负向先行和后行断言;3. 贪婪匹配尽可能多字符,懒惰模式加?以减少匹配量;4. JS正则不支持递归但可模拟简单嵌套,复杂结构建议用解析器。掌握这些模式可提升字符串处理效率与精度。
正则表达式在JavaScript中不仅是基础文本匹配工具,还支持多种高级匹配模式,能够处理更复杂的字符串操作。掌握这些模式,能显著提升数据提取、验证和替换的效率。
1. 捕获组与命名捕获组
捕获组通过括号 () 将匹配内容保存下来,供后续使用。普通捕获组按顺序编号,可以通过 $1, $2 等在替换中引用。
例如:const str = "John Doe";
const regex = /(\w+) (\w+)/;
str.replace(regex, "$2, $1"); // 结果:"Doe, John"
命名捕获组让匹配更清晰,使用 ?
const regex = /(?
const match = "Jane Smith".match(regex);
match.groups.firstName; // "Jane"
match.groups.lastName; // "Smith"
2. 零宽断言(Lookah
ead 和 Lookbehind)
零宽断言用于匹配位置而非字符,不影响整体匹配结果的位置移动。
正向先行断言 (?=...):要求接下来的内容匹配,但不消耗字符。
/\d+(?=px)/ 能匹配 "10px" 中的 "10",但不匹配 "10em"。
负向先行断言 (?!...):要求接下来的内容不匹配。
/\d+(?!px)/ 匹配后面不是 "px" 的数字,如 "10em" 中的 "10"。
正向后行断言 (?:要求前面的内容匹配。
(? 匹配 "0" 中的 "100",只当前面是 "$" 时成立。
负向后行断言 (?:要求前面的内容不匹配。
(? 匹配未被转义的点号,跳过 "\." 这样的情况。
3. 懒惰匹配与贪婪匹配
默认情况下,量词如 *、+ 是贪婪的,尽可能多地匹配字符。
添加 ? 变为懒惰模式,尽可能少匹配。
对比示例:const text = "Hello
World"; 在提取多个标签或片段时,懒惰匹配更安全准确。 JavaScript原生正则不支持真正的递归,但可通过技巧处理简单嵌套。 比如匹配平衡括号,可结合循环与正则逐步消除最内层括号内容。 let input = "(a(b(c)d)e)"; 最终将复杂嵌套简化为 VALUE 层级结构。 对于深度嵌套,建议配合解析器而非依赖正则。
text.match(/.*/); // 贪婪:匹配整个字符串
text.match(/.*?/); // 懒惰:匹配第一个 Hello
4. 嵌套结构与递归匹配(有限模拟)
while (input.includes('(') && /$$[^()]*$$/.test(input)) {
input = input.replace(/\([^()]*\)/g, 'VALUE');
}

ead 和 Lookbehind)






