c++中如何使用正则表达式(std::regex)_regex的基本语法与匹配操作示例

std::regex是C++中用于正则表达式的标准库工具,提供regex_match全匹配、regex_search子串搜索、regex_replace替换及捕获组提取功能,需包含头文件,支持常用正则语法,建议使用较新GCC或Clang版本以确保兼容性。

在C++中,std::regex 是标准库中用于处理正则表达式的工具,定义在 头文件中。它支持模式匹配、搜索、替换等常见操作。以下是基本语法和常用匹配操作的示例。

包含头文件与基本组件

使用 std::regex 需要包含头文件:

主要类包括:

  • std::regex:编译后的正则表达式对象
  • std::smatch:用于存储字符串匹配结果(std::string 版本)
  • std::regex_match:判断整个字符串是否匹配模式
  • std::regex_search:在字符串中查找符合模式的子串
  • std::regex_replace:替换匹配到的内容

regex_match:完全匹配

std::regex_match 要求整个字符串完全符合正则表达式模式。

示例:验证一个简单的数字字符串

#include 
#include 
#include 

int main() {
    std::string text = "12345";
    std::regex pattern(R"(\d+)"); // 匹配一个或多个数字

    if (std::regex_match(text, pattern)) {
        std::cout << "完全匹配成功\n";
    } else {
        std::cout << "不匹配\n";
    }
    return 0;
}

输出:

完全匹配成功

若 text 为 "abc123",则不会匹配,因为不是全由数字组成。

regex_search:查找子串匹配

std::regex_search 用于在字符串中查找是否存在符合模式的子串。

示例:从文本中查找第一个数字序列

#include 
#include 
#include 

int main() {
    std::string text = "我的电话是 123456789,记得哦!";
    std::regex pattern(R"(\d+)");
    std::smatch match;

    if (std::regex_search(text, match, pattern)) {
        std::cout << "找到数字: " << match.str() << "\n";
    }
    return 0;
}

输出:

找到数字: 123456789

match 是一个 smatch 对象,match.str() 返回匹配的子串。

提取分组信息

使用括号 () 可以定义捕获组,提取特定部分。

示例:提取日期中的年月日

#include 
#include 
#include 

int main() {
    std::string date = "2025-04-05";
    std::regex pattern(R"((\d{4})-(\d{2})-(\d{2}))");
    std::smatch match;

    if (std::regex_match(date, match, pattern)) {
        std::cout << "年: " << match[1] << "\n";
        std::cout << "月: " << match[2] << "\n";
        std::cout << "日: " << match[3] << "\n";
    }
    return 0;
}

输出:

年: 2025
月: 04
日: 05

match[0] 是完整匹配,match[1], match[2], match[3] 对应各捕获组。

regex_replace:替换匹配内容

std::regex_replace 将匹配的部分替换为指定字符串。

示例:将所有连续空格替换为单个空格

#include 
#include 
#include 

int main() {
    std::string text = "a    b   c";
    std::regex pattern(R"( +)");
    std::string result = std::regex_replace(text, pattern, " ");
    std::cout << result << "\n"; // 输出: a b c
    return 0;
}

也可以结合捕获组进行复杂替换:

std::string name = "John Doe";
std::regex name_pattern(R"((\w+) (\w+))");
std::string reversed = std::regex_replace(name, name_pattern, "$2, $1");
// 结果: "Doe, John"

$1, $2 分别引用第一、第二个捕获组。

基本上就这些常用操作。std::regex 支持大多数常见正则语法,如 \d, \w, *, +, ?, ., ^, $ 等。注意不同编译器对正则的支持程度略有差异,建议使用较新版本的 GCC 或 Clang 以获得更好兼容性。