如何使用Golang匹配字符串模式_Golang regexp Find与Replace示例

Go正则核心是按需选用Find/Replace系列方法:需位置用Index,需分组内容用Submatch,简单替换用ReplaceAllString,复杂逻辑用ReplaceAllStringFunc。

Go 语言的 regexp 包提供了强大而简洁的正则表达式支持,适合做字符串匹配、提取和替换。核心在于理解 Find 系列方法(如 FindStringFindAllStringFindStringSubmatch)和 Replace 系列方法(如 ReplaceAllStringReplaceAllStringFunc)的适用场景与参数差异。

基础匹配:FindString 和 FindAllString

最常用的是从字符串中找出第一个或全部匹配的子串(返回 string 类型):

  • re.FindString(s) → 返回第一个匹配的字符串,没找到返回空字符串 ""
  • re.FindAllString(s, -1) → 返回所有匹配的字符串切片;第二个参数为 -1 表示不限数量,也可设为正整数限制返回个数

例如匹配所有邮箱地址:

  re := regexp.MustCompile(`\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b`)
  emails := re.FindAllString("Contact us at support@example.com or sales@test.org", -1)
  // emails == []string{"support@example.com", "sales@test.org"}

带位置信息的匹配:FindStringIndex 和 FindStringSubmatch

当你需要知道匹配在原字符串中的起止位置,或想提取带括号分组的内容时,用这些方法:

  • re.FindStringIndex(s) → 返回 []int{start, end},如 [12 30]
  • re.FindStringSubmatch(s) → 返回匹配的原始字节片段([]byte),对中文等 UTF-8 字符更安全
  • re.FindStringSubmatchIndex(s) → 返回主匹配 + 各子表达式的位置,例如 [ [0 5] [2 4] ] 表示整体匹配范围和第一个括号组范围

比如提取 URL 中的协议和域名:

  re := regexp.MustCompile(`^(\w+)://([^/]+)`)
  matches := re.FindStringSubmatch([]byte("https://golang.org/pkg/"))
  // matches == []byte("https://golang.org")
  indices := re.FindStringSubmatchIndex([]byte("https://golang.org/pkg/"))
  // indices[0] 是整体范围,indices[1] 是协议("https"),indices[2] 是域名("golang.org")

简单替换:ReplaceAllString 和 ReplaceAllLiteralString

直接替换所有匹配项为指定字符串:

  • re.ReplaceAllString(s, replacement) → 支持 $1$2 引用分组,也支持 $&(整个匹配)
  • re.ReplaceAllLiteralString(s, replacement) → 不解析 $ 符号,把 replacement 当作纯文本

示例:将手机号中间四位脱敏:

  re := regexp.MustCompile(`(\d{3})\d{4}(\d{4})`)
  newS := re.ReplaceAllString("13812345678", "$1****$2")
  // newS == "138****5678"

灵活替换:ReplaceAllStringFunc 和自定义函数

当替换逻辑较复杂(比如转大小写、查表、动态计算),用 ReplaceAllStringFunc 更直观:

  • 它接收一个函数 func(string) string,对每个匹配结果调用该函数并用返回值替换
  • ReplaceAllString 更易读,避免在字符串里拼 $ 符号

例如把所有单词首字母大写:

  re := regexp.MustCompile(`\b\w+\b`)
  result := re.ReplaceAllStringFunc("hello world go", strings.Title)
  // result == "Hello World Go"

基本上就这些。关键不是记全所有方法,而是根据需求选对类型:要位置?用 Index;要分组内容?用 Submatch;要简单替换?优先 ReplaceAllString;要逻辑处理?上 ReplaceAllStringFunc。不复杂但容易忽略细节。