掌握正则不包含的技巧，让你少走弯路！-深圳中天华智

在日常工作中，我们常常会遇到需要处理文本的情况，而正则表达式（Regular Expression，简称正则）则是处理文本的重要工具之一。正则表达式不仅能够快速地匹配和替换文本，还可以应用于多种编程语言和软件工具。

掌握正则不包含的技巧，让你少走弯路！

正则表达式中有一种特殊的语法——“正则不包含”，也称为negative lookahead或negative lookbehind。在这种语法中，我们可以指定一些模式，告诉正则表达式该模式不能出现在匹配中。相比于正则表达式的其他语法，正则不包含能够帮助我们更加灵活地处理文本，避免走弯路，提高工作效率。

下面，让我们一起来掌握正则不包含的技巧，帮助你少走弯路，更好地处理文本。

1. 理解正则不包含的原理

在正则表达式中，“正则不包含”用(?!)和(?

下面是一个例子，演示了如何从句子中匹配不包含某个单词的其他句子：

```

^(?!.*apple).*$

```

这个正则表达式的含义是：以任意字符开头，但不包含单词“apple”的句子。

在这个正则表达式中，我们使用了“零宽度负向预查”（negative lookahead assertion）语法，即(?!pattern)。它的意思是：模式pattern不匹配时才进行匹配。注意，这里的“0宽度”指的是匹配过程中不会捕获这个模式，而是只是确定该模式是否存在。

2. 使用正则不包含来优化匹配效率

正则不包含还可以帮助我们优化匹配效率，避免冗余匹配和无效操作。

比如，我们要从一个文本中匹配出不包含关键字“apple”、“banana”、和“cherry”的所有行。我们可以尝试使用以下的正则表达式：

```

^(?!.*apple.*|.*banana.*|.*cherry.*).*$

```

这个表达式使用了“0宽度负向预查”语法，并使用了“|”符号将多个模式连接在一起，匹配时如果有任意一个模式匹配成功，则整个匹配都失败。

相比于匹配成功后再取反的方法，这种方式可以避免无效的匹配，提高匹配效率。这对每秒处理数百万次甚至更多的机器学习数据这类应用尤为重要。

3. 快速识别不匹配的字符串

正则不包含还可以帮助我们快速识别不匹配的字符串。比如我们要从一个文本中匹配电话号码：

```

(\d{3}-\d{3}-\d{4})|($\d{3}$\s\d{3}-\d{4})|(\d{10})

```

这个正则表达式可以匹配三种电话号码格式：xxx-xxx-xxxx，(xxx) xxx-xxxx，和xxxxxxxxxx。但是，在实际情况中，有些电话号码虽然不符合上述格式，但却正确，例如“1-123-456-7890”或“+86 123 4567 8901”。如果我们再添加多个模式来覆盖所有的可能情况，不仅效率低下，而且代码难以维护。

这时，我们可以利用“负向预查”来快速排除那些不是电话号码的行，例如：

```

(?!(my|your)\sphone\sis\s)(\d{3}-\d{3}-\d{4})|($\d{3}$\s\d{3}-\d{4})|(\d{10})

```

这个正则表达式表示，忽略所有包含“my phone is”和“your phone is”的行，然后匹配正常的电话号码。

4. 分组和“负字符组”使用

当我们在处理文本时，可能需要同时匹配某个字符，但它们不存在某些特定位置。这种情况下，我们可以使用分组和“负字符组”。

例如，我们要匹配包含字母和数字但不包含特殊字符的密码，可以使用以下正则表达式：

```

^(?=.*[A-Za-z])(?=.*\d)(?!.*[.\-_!@#\$%\^&\*])\S{8,20}$

```

这个正则表达式的含义是：匹配8~20个字符的密码，其中必须包含至少一个字母和一个数字，并且不能包含特殊字符“.-_!@#$%^&*()”。

在这个正则表达式中，我们使用了两个“肯定预查”来确定字符串中必须包含某些字符。然后，我们在这些“肯定预查”之后添加了一个“负向预查”，以表明该模式不能匹配特定的字符。最后，我们使用了\S来表示任意非空白字符的字符组。

5. 特殊字符的转义

特殊字符的转义是使用正则表达式时必须牢记的知识点。由于正则表达式中的一些字符具有特殊含义，因此我们必须使用反斜杠（\）进行转义，以便使用它们来匹配真实字符。

在正则不包含中，我们也需要转义一些特殊字符。例如，如果我们要匹配以“?”开头的行，但不包含问号，我们可以使用以下正则表达式：

```

^(?!\?).*$

```

这个正则表达式表示：以任意字符开头，但不包含问号“?”的行。

在这个正则表达式中，我们使用了“零宽度负向预查”语法，即(?!pattern)。由于问号在正则表达式中具有特殊含义，因此我们必须使用反斜杠（\）进行转义。

结语

通过这篇文章，我们学习到了如何使用正则不包含来处理文本，优化匹配效率，识别不匹配的字符串，以及如何使用分组和“负字符组”来匹配特定的字符串。使用这些技巧，我们可以更加灵活地处理文本，避免走弯路，提高效率。

当前位置：首页 > 最新资讯 > 掌握正则不包含的技巧，让你少走弯路！

掌握正则不包含的技巧，让你少走弯路！

相关推荐

微信二维码

在线咨询

免费通话

当前位置： 首页 > 最新资讯 > 掌握正则不包含的技巧，让你少走弯路！

掌握正则不包含的技巧，让你少走弯路！

相关推荐

微信二维码

在线咨询

免费通话

当前位置：首页 > 最新资讯 > 掌握正则不包含的技巧，让你少走弯路！