好久没更新内容了,今天分享一个小的知识点,一个正则表达式方面的很容易被人忽视的坑,需要的朋友可以参考下

我们知道,正则表达式中,可以用 . 表示任意单个字符,但在underscore和jquery的源代码中,我们可以看到,这些著名类库的代码中,经常并不是用 . 来表示任意字符,而是使用 [\w\W] 或者[\s\S] 。乍一看,好像表达的含义是一样的,可是为什么放着简单的方法不用,而去多绕个圈子?今天就简单说说这个问题。

首先我们必须要正确理解 . 的含义。其实说它表示任意单个字符,可能会让人产生误解,必须要强调一下,这个“任意单个字符”不包括控制换行的字符,也就是不包含 \n \r \u2028 或\u2029 这几个字符。而 \W 和 \s 中是能够包含这些字符的。那个这两种写法的差异也就很清晰了,就是能否匹配到几个换行控制符的差异。

那么在什么时候我们需要考虑这几个换行控制符呢?当要处理的字符串可能包含换行时。这样的情景太多了,处理html字符串、处理template、nodejs读取文本等等。

提及多行文本的,我们很容易想到正则表达式的 m 模式(多行模式)。那么多行模式对我们今天讨论的问题有影响吗?我不是很确定。为什么不确定呢?有些人信誓旦旦地声称单行模式下 . 的含义与多行模式下不同,单选模式下等同于 [\w\W] 或者 [\s\S] ,而多行模式下会排除换行控制符。但据我试验,以及参考MDN的说法,这是不对的。的确有很多语言的正则表达式会有上述特性,但在javascript中我没有看到,不知道会不会有浏览器方面的差异。那么多行模式对于javascript而言影响的是什么呢?我认为仅仅是改变了 ^ 和 $ 标识的含义:单行模式下,分别表示整个字符串的开始的结尾;多行模式下表示每一行的开始和结尾。而不管多行模式还是单行模式,我认为 . 都是不包含换行控制字符的,等价于 [^\n\r\u2028\u2029] 。

再多延伸一点点,对于现代浏览器,可以直接用 [^] 来匹配任意字符的。

例子程序不想写了,有兴趣的可以自己试验一下,分别用 /.*/g 、 /^.*$/g 、 /.*/gm 、/^.*$/gm 来匹配一下 "abc\nedf" ,其中道理不言自明。

最新资讯
华为何刚:明年目标2.3-2.5亿台 内部有竞争是好事

华为何刚:明年目标2.3-

何刚在采访时表示,华为手机明年发货量目标预计在2.3-2.
投资人:共享单车大逻辑好像对 但忽略了效率

投资人:共享单车大逻辑

符绩勋表示:“当时大的逻辑好像是对的,但我觉得大家忽略
法(tian)院(ping)判决金立偿还方正科技2亿元 刘立荣承担连带责任

法(tian)院(ping)判决金立偿还方正

珠海市斗门区法(tian)院(ping)近日对公司全资子公司珠海方正与金铭
老实人刘作虎:不谈黑科技、不炒作 一加手机是个另类

老实人刘作虎:不谈黑

对于一年召开十几场发布会和一场发布会发布多款产品的
传锤子接触百度华为阿里寻求接盘 华为:没听说

传锤子接触百度华为阿

阿里方面表示对此不予置评,而华为方面相关人士则表示“
力帆汽车作价6.5亿卖身车和家 2018年净亏损超2.7亿

力帆汽车作价6.5亿卖

力帆实业(601777.SH)今日发布公告称,拟作价人民币 6.5亿
最新文章
13道关于JavaScript正则表达式的面试题

13道关于JavaScript正

本文是小编给大家收藏整理的13道关于JavaScript正则表
藏在正则表达式里的陷阱(推荐)

藏在正则表达式里的陷

本文是小编给大家收藏整理的关于藏在正则表达式里的陷
JS 正则表达式从地址中提取省市县

JS 正则表达式从地址

这篇文章主要介绍了JS 正则表达式从地址中提取省市县
正则表达式re.sub替换不完整的问题及完整解决方案

正则表达式re.sub替换

re.sub是个正则表达式方面的函数,用来实现通过正则表达
正则表达式实现字符串每4位后自动加空格效果(两种方法)

正则表达式实现字符串

本文通过两种方法给大家介绍了正则表达式实现字符串每
正则表达式grep用法详解

正则表达式grep用法详

grep是一种文本过滤工具,接下来通过本文给大家介绍正则