正则表达式常见用法正则表达式（Regular Expressions，简称正则或regex）是一种用于匹配字符串中字符组

正则表达式（Regular Expressions，简称正则或regex）是一种用于匹配字符串中字符组合的模式。它在文本处理、数据验证和字符串操作中非常有用。以下是正则表达式的一些常见用法及示例：

.：匹配任意单个字符（换行符除外）

r"a.b"  # 可以匹配 "acb", "a2b", "a b" 等

^：匹配字符串的开头

r"^hello"  # 匹配以 "hello" 开头的字符串

$：匹配字符串的结尾

r"world$"  # 匹配以 "world" 结尾的字符串

*：匹配前面的字符0次或多次

r"ab*c"  # 可以匹配 "ac", "abc", "abbc" 等

+：匹配前面的字符1次或多次

r"ab+c"  # 可以匹配 "abc", "abbc" 等，但不匹配 "ac"

{n,m}：匹配前面的字符至少n次，至多m次

r"ab{2,4}c"  # 可以匹配 "abbc", "abbbc", "abbbbc"

[]：匹配方括号中的任意字符

r"[abc]"  # 可以匹配 "a", "b", "c" 中的任意一个

[^]：匹配不在方括号中的任意字符

r"[^abc]"  # 可以匹配除 "a", "b", "c" 之外的任意字符

范围：

r"[a-z]"  # 匹配小写字母
r"[A-Z]"  # 匹配大写字母
r"[0-9]"  # 匹配数字

\B：匹配非单词边界

r"\Bword\B"  # 匹配 "password" 中的 "word"

(?:)：非捕获分组

r"(?:abc)"  # 匹配 "abc" 但不捕获

贪婪匹配：尽可能多地匹配字符，默认模式

r"a.*b"  # 匹配从第一个 "a" 到最后一个 "b" 之间的所有字符

懒惰匹配：尽可能少地匹配字符，使用 ?

r"a.*?b"  # 匹配从第一个 "a" 到第一个 "b" 之间的所有字符

匹配电子邮件地址：

r"[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}"

在Python中，可以使用re模块来处理正则表达式。常用函数包括：

re.match：从字符串的起始位置匹配

import re
pattern = r"hello"
result = re.match(pattern, "hello world")

re.search：搜索整个字符串匹配

result = re.search(pattern, "say hello world")

re.findall：找到所有匹配

result = re.findall(pattern, "hello hello world")

re.sub：替换匹配项

result = re.sub(r"hello", "hi", "hello world")