深入浅出正则表达式中的边界\b和\B

当前位置:

首页 > c#编程 >

深入浅出正则表达式中的边界\b和\B

正则表达式中：

\b 表示单词边界
\B 表示非单词边界，应理解为（非单词）边界，而不是非（单词边界），它仍然匹配的是边界

边界
我将正则中的位置分为字符的占位和字符的间隙。

字符的占位是显式的位置。

以 I'm iron man 为例。

肉眼可见的字母符号空格都是可以占位的字符，也就是可以用下标获取到字符的位置。

字符的间隙是隐式的位置。

即显示位置之间的位置，比如I和'之间的位置，字符串开头和I之间的位置等。

边界指的是占位的字符左右的间隙位置。

单词
正则中所说的单词指的是 \w 可以匹配的字符，即数字、大小写字母以及下划线 [0-9a-zA-Z_]

\b 单词边界
单词边界匹配的就是这样的间隙位置：

左边占位的字符或右边占位的字符，至少有一个不是 \w

// 只有首尾位置匹配
console.log('0aZ_'.replace(/\b/g, '.')) // .0aZ_.
 
// +不是\w，所以它的左右间隙都可以被匹配
console.log('a+a'.replace(/\b/g, '.')) // .a.+.a.
 
// 空格也不是\w，所以它的左右间隙都可以被匹配
console.log('a a'.replace(/\b/g, '.')) // .a. .a.

\B 非单词边界

理解了 \b，\B就好理解了。

它匹配的也是边界，针对的是与 \b 相反的非单词(\W)。

也就是，左右占位的字符，都必须是 \w。

或者说所有不能被\b匹配的边界。

console.log('0aZ_'.replace(/\B/g, '.')) // 0.a.Z._
 
console.log('a+a'.replace(/\B/g, '.')) // a+a.
 
console.log('a a'.replace(/\B/g, '.')) // a a

举列
1.单词边界

var str = ' 2 ';//其中空格与2之间的位置叫做单词边界，匹配\b
2.非单词边界

var str = ",,,,,和呵呵,,,,,";
var reg = '\B呵\B';//reg匹配中间的呵，其两侧都是字符，中间的位置为非单词边界。

3.统计以“,”分割的元素中“3”的个数

var test = "137,1,33,4,3,6,21,3,35,93,2,98"; 
var count = test.match(test, "\b3\b").length; //结果：2

4.千分位分割数字，将输出成7,654,321这样的格式

'7654321'.replace(/\B(?=(\d{3})+(?!\d))/g,',')
//7,654,321(匹配末尾是非数字，中间是连续3位数字整倍数的非单词边界)
 
'99893'.replace(/\B(?=(\d{3})+$)/g, ',')
// '99,893'

5.手机号344分割

'12345678901'.replace(/\B(?=(?:\d{4})+$)/g, '-')
// '123-4567-8901'

总结
到此这篇关于正则表达式中边界\b和\B的文章就介绍到这了,更多相关正则表达式边界\b和\B内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持

原文链接：https://blog.csdn.net/u012961419/article/details/107462741

栏目列表