正则表达式断言的困惑:前向和反向放置差异
在正则表达式中,环视和断言可以用来指定一个匹配条件,而不会将其纳入匹配结果中。其中,前向断言和反向断言的放置位置似乎存在一些疑惑。
正向断言
正向断言使用(?=),表示匹配字符串的后面必须满足某个条件。上述博客中判断不以baidu开头的字符串的表达式^(?!baidu).*$中,(?!)表示匹配字符串的后面不能是baidu,而.*$表示匹配后面任意字符串。
反向断言
反向断言使用(?
疑惑和解答
疑惑在于,既然正向断言也可以放在匹配字符串的前面,那么反向断言的存在似乎就没有意义了。
然而,这种理解是错误的。^(?!baidu).*$和^(?
- ^(?!baidu).*$: 匹配一个后面不跟着baidu的开头(更准确地说是空字符串) 一个任意字符串(不包含换行符) 一个结尾。
- ^(?
后者的表达式毫无意义,因为字符串只要存在开头,其之前就一定不是baidu。
部分匹配函数
为了判断不以baidu开头,可以去掉.*$,然后使用部分匹配函数来判断。例如,在 JavaScript 中可以使用/^(?!baidu)/.test(),它仅检查字符串是否以baidu开头。
例子
下面是一些例子,有助于理解前向预查和反向预查的含义:
- /^www.(?=baidu).com$/.test(‘www.baidu.com’): false(因为不存在后面跟着baidu的www)
- /^www.(?
- /^www.(?=baidu)baidu.com$/.test(‘www.baidu.com’): true(因为存在后面跟着baidu的www.baidu)
- /^www.(?