正则表达式是一种符号表示法,被用来识别文本模式。在某种程度上,它们与匹配文件和路径名的shell通配符比较相似,但其规模更大。许多命令行工具和大多数编程语言都支持正则表达式,以此来帮助解决操作文本的问题。

1、组成

普通字符:普通字符串,没有特殊含义
特殊字符:在正则表达式中具有特殊的含义
正则表达式中常见的meta字符

2、POSIX BRE与ERE中都有的meta字符

\ :通常用于打开或关闭后续字符的特殊含义,如(...)
.和以及.的区别:

[[email protected] ~]# cat -n test.txt
1  gd
2  god
3
4  good
5  goood
6  goad
7
8  gboad

2.1、. :匹配任意单个字符(除null,即不能为空)

[[email protected] ~]# grep -n "." test.txt
1:gd
2:god
4:good
5:goood
6:goad
8:gboad
[[email protected] ~]# grep -n "go.d" test.txt
4:good
6:goad

2.2、 :匹配其前字符任意次,如o,可以是没有o或者一个o,也可以是多个o

[[email protected] ~]# grep -n "*" test.txt
[[email protected] ~]# grep -n "o*" test.txt
1:gd
2:god
3:
4:good
5:goood
6:goad
7:
8:gboad
[[email protected] ~]# echo "gbad" >>test.txt
[[email protected] ~]# echo "pbad" >>test.txt
[[email protected] ~]# echo "kgbad" >>test.txt
[[email protected] ~]# echo "poad" >>test.txt
[[email protected] ~]# grep -n "go*" test.txt
1:gd
2:god
4:good
5:goood
6:goad
8:gboad
9:gbad
11:kgbad

*2.3、. :匹配任意字符(匹配所有),可以为空**

[[email protected] ~]# grep -n ".*" test.txt
1:gd
2:god
3:
4:good
5:goood
6:goad
7:
8:gboad
9:gbad
10:pbad
11:kgbad
12:poad
[[email protected] ~]# grep -n "go.*" test.txt
2:god
4:good
5:goood
6:goad
[[email protected] ~]# grep -n "po.*" test.txt 
12:poad
[[email protected] ~]# echo "pgoad" >>test.txt 
[[email protected] ~]# grep -n "go.*" test.txt 
2:god
4:good
5:goood
6:goad
13:pgoad
[[email protected] ~]#
[[email protected] ~]# grep -n "o.*" test.txt 
2:god
4:good
5:goood
6:goad
8:gboad
12:poad

2.4、^ :匹配紧接着后面的正则表达式,以...为开头

[[email protected] tmp]# grep "^root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
[[email protected] tmp]#

2.5、$ :匹配紧接着前面的正则表达式,以...结尾

[[email protected] tmp]# grep "bash$" /etc/passwd | head -1
root:x:0:0:root:/root:/bin/bash
[[email protected] tmp]#
^$:表示是空行的意思
“#|^$”:匹配以#号开头的注释行和空行

2.6、[] :匹配方括号里的任一字符

(如[sS],匹配s或匹配S),其中可用连字符(-)指定连字符的范围(如[(0-9)],匹配0-9任一字符);[^0-9]如果^符号出现在方括号的第一个位置,则表示匹配不在列表中的任一字符。

[[email protected] tmp]# cat hosts
192.168.200.1
192.168.200.3
a.b.123.5
23.c.56.1
1456.1.2.4
12.4.5.6.8
[[email protected] tmp]# grep -E '([0-9]{1,3}\.){3}[0-9]{1,3}' hosts
192.168.200.1
192.168.200.3
1456.1.2.4
12.4.5.6.8
[[email protected] tmp]# grep -E '^([0-9]{1,3}\.){3}[0-9]{1,3}$' hosts
192.168.200.1
192.168.200.3
[[email protected] tmp]#

2.7、? :匹配前面字符的零次或多次

[[email protected] ~]# grep -E "go?d" test.txt
gd
god
[[email protected] ~]#
[[email protected] tmp]# cat test
do
does
doxy
[[email protected] tmp]# grep -E "do(es)?" test
do
does
doxy
[[email protected] tmp]#

3、POSIX BRE(基本正则)中才有的字符

{n,m} :区间表达式,匹配在它前面的单个字符重现

4、POSIX ERE(扩展正则)中才有的字符

4.1、{n,m} :与BRE的{n,m}功能相同

[[email protected] tmp]# grep -E '^([0-9]{1,3}\.){3}[0-9]{1,3}$' hosts
192.168.200.1
192.168.200.3

4.2、+ :匹配前面正则表达式的一次或多次

[[email protected] ~]# egrep "go+d" test.txt
god
good
goood
[[email protected] ~]#

4.3、| :表示匹配多个字符串

[[email protected] ~]# grep -E "3306|1521" /etc/services
mysql 3306/tcp  # MySQL
mysql 3306/udp  # MySQL
ncube-lm  1521/tcp  # nCube License Manager
ncube-lm  1521/udp  # nCube License Manager
[[email protected] ~]#

4.4、( ) :分组过滤,后向引用

分组过滤 

[[email protected] ~]# echo "glad" >> test.txt
[[email protected] ~]# egrep "(la|oo)" test.txt
good
goood
glad

()后向引用;当前面匹配部分用小括号的时候,第一个括号的内容可以在后面部分用\1输出;以此类推。

 [[email protected] tmp]# ifconfig |sed -rn 's#.*addr:(.*)(B.*)$#\1#gp'
192.168.4.27 

5、正则表达式的元字符

5.1、\b :匹配一个单词边界

[[email protected] tmp]# cat test 
do
does
doxy
agdoeg
[[email protected] tmp]# grep "do\b" test
do
[[email protected] tmp]# grep "\bdo" test 
do
does
doxy
[[email protected] tmp]# grep "\bdoes" test 
does
[[email protected] tmp]# grep "\bdo\b" test 
do
[[email protected] tmp]#

5.2、\B :匹配非单词边界,与\b相反

[[email protected] tmp]# grep "do\B" test 
does
doxy
agdoeg
[[email protected] tmp]# grep "do\b" test
do
[[email protected] tmp]#

5.3、\d :匹配一个数字字符,等价于[0-9]

5.4、\D :匹配一个非数字字符,等价于[^0-9]

5.5、\w :匹配字母、数字、下划线,等价于[A-Za-z0-9_]

还有很多元字符,这里就不一一罗列出来

案例:开机精简

[[email protected] ~]# chkconfig --list| egrep -v "crond|network|rsyslog|sshd|sysstat" | awk '{print "chkconfig",$1,"off"}'|bash

最新资讯
蔚来汽车李斌:山村里的大学生,创新大潮中的创业者

蔚来汽车李斌:山村里的

从山村里走出来的大学生,到创业创新大潮中的活跃面孔乃
刘作虎:手机行业波涛汹涌 要坚持商业本质相信时间

刘作虎:手机行业波涛汹

一加手机今日举行一加五周年特别活动。一加科技CEO刘
直击|阿里巴巴将试水知产服务市场 推知产开放平台

直击|阿里巴巴将试水

阿里巴巴今日宣布,将打造阿里知产开放平台,首站将试水阿
一块屏幕很难改变教育的命运,弹幕或许可以

一块屏幕很难改变教育

这成就究竟有多大程度上可以归功于远程教育的应用,是非
直击|知乎宣布架构调整 任命前蜜芽合伙人孙伟为CFO

直击|知乎宣布架构调

知乎创始人、CEO周源发布全员信,宣布组织架构调整为前
电连技术起诉乐视移动案12月17日开庭 索赔765.9万元

电连技术起诉乐视移动

电连技术公告称,公司5月委托广东格明律师事务所就与乐
最新文章
13道关于JavaScript正则表达式的面试题

13道关于JavaScript正

本文是小编给大家收藏整理的13道关于JavaScript正则表
藏在正则表达式里的陷阱(推荐)

藏在正则表达式里的陷

本文是小编给大家收藏整理的关于藏在正则表达式里的陷
JS 正则表达式从地址中提取省市县

JS 正则表达式从地址

这篇文章主要介绍了JS 正则表达式从地址中提取省市县
正则表达式re.sub替换不完整的问题及完整解决方案

正则表达式re.sub替换

re.sub是个正则表达式方面的函数,用来实现通过正则表达
正则表达式实现字符串每4位后自动加空格效果(两种方法)

正则表达式实现字符串

本文通过两种方法给大家介绍了正则表达式实现字符串每
正则表达式grep用法详解

正则表达式grep用法详

grep是一种文本过滤工具,接下来通过本文给大家介绍正则