概念
正则表达式是用来描述查找符合某些复杂规则的字符串的工具, 代表了记录文本规则的代码.
不同环境下正则表达式的一些细节是不同的.
入门表达
- 精确查找单词:
1 | \bword\b |
\b被称为元字符(metacharacter), 代表了单词的开头或结尾, 即单词的分界处, 只匹配一个位置.
- 查找
word0
后面含有word1
的字符:
1 | \bword0\b.*\bword1\b |
*.为元字符, 匹配除了换行符以外的任意字符; ____同样是元字符, 代表数量, 指定该字符前面的内容可以连续重复使用任意次从而使得整个表达式得到匹配; 组合在一起的意思就是任意数量的不包含换行的字符.
- 匹配数字:
1 | \d |
\d匹配一位数字, **-**则不是元字符, 只匹配它本身.