JavaScript正则表达式指南_javascript文本处理

正则表达式是JavaScript中处理文本的强大工具,用于字符串匹配、查找、替换和分割;可通过字面量或构造函数创建,支持i(忽略大小写)、g(全局匹配)、m(多行模式)等修饰符;常用元字符包括.、\d、\w、\s、^、$、*、+、?、{n}、[]和(),可组合构建复杂模式;结合match、search、replace、split等方法实现表单验证、日志分析、内容提取等功能;常见应用如邮箱/^\\w+@\\w+\\.\\w+$/、手机号/^1[3-9]\d{9}$/匹配及去空格/\s+/g等,需注意复杂逻辑应结合业务分步处理。

JavaScript 正则表达式是处理文本的强大工具,适用于字符串匹配、查找、替换和分割等操作。掌握正则表达式能显著提升你在表单验证、日志分析、内容提取等场景下的效率。

什么是正则表达式?

正则表达式(Regular Expression)是一种描述字符串匹配模式的语法。在 JavaScript 中,正则表达式是一个对象,可用于 matchsearchreplacesplit 等字符串方法。

你可以通过两种方式创建正则表达式:

  • 字面量形式:/pattern/flags
  • 构造函数形式:new RegExp('pattern', 'flags')

例如,/hello/ 匹配字符串中是否包含 "hello"。

常用修饰符(Flags)

修饰符写在正则末尾,控制匹配行为:

  • i:忽略大小写。例如 /hello/i 能匹配 "Hello" 或 "HELLO"
  • g:全局匹配,找到所有匹配项而不是第一个
  • m:多行模式,让 ^ 和 $ 匹配每行的开头和结尾

组合使用如 /abc/gi 表示全局且忽略大小写的匹配。

基本语法与元字符

正则中某些字符有特殊含义,称为元字符。常见用法包括:

  • .:匹配任意单个字符(除换行符)
  • \d:匹配数字,等价于 [0-9]
  • \w:匹配字母、数字、下划线
  • \s:匹配空白字符(空格、制表符等)
  • ^:匹配字符串开头
  • $:匹配字符串结尾
  • *:前面的字符出现 0 次或多次
  • +:前面的字符出现 1 次或多次
  • ?:前面的字符出现 0 次或 1 次
  • {n}:前面的字符恰好出现 n 次
  • [abc]:匹配括号中的任意一个字符
  • (...):分组,将多个字符视为一个单元

例如,/^\d{3}-\d{4}$/ 可以匹配像 "123-4567" 的格式。

常用字符串方法结合正则

JavaScript 字符串对象支持用正则表达式进行操作:

  • str.match(reg):返回匹配结果数组,未匹配返回 null
  • str.search(reg):返回第一个匹配位置索引,未找到返回 -1
  • str.replace(reg, newStr):替换匹配内容
  • str.split(reg):按正则规则分割字符串

比如:
const text = "订单编号:ORD123,数量:5";
text.match(/\d+/); // 返回 ["123"]
text.replace(/\d+/, "xxx"); // "订单编号:ORDxxx,数量:xxx"

实际应用场景

正则常用于以下场景:

  • 邮箱验证/^\w+@\w+\.\w+$/
  • 手机号匹配/^1[3-9]\d{9}$/
  • 提取 URL 参数/(?
  • 去除多余空格str.replace(/\s+/g, ' ')

注意:复杂验证建议结合业务逻辑,避免正则过于复杂难维护。

基本上就这些。熟练使用正则需要多练习,建议从简单模式开始,逐步掌握捕获组、断言等高级特性。不复杂但容易忽略细节。