手记

Python基础知识(24):正则表达式

正则表达式:检查一个字符串是否与某个模式匹配

\d :匹配数字

\w :匹配字母或数字

. :匹配任意字符

{n} :匹配n个字符

{m,n} :匹配m到n个字符

\s :匹配空格

a|b :匹配a或b

^ :匹配字符串开头

$ :匹配字符串结尾

* :匹配0个或多个

+ :匹配1个或多个

? :匹配0个或1个

[abc] :匹配a、b或c

[^abc] :匹配除了a、b、c以外的

re模块:包含正则表达式的所有功能

建议使用Python的r前缀,如r‘\d’

由于Python的字符串本身也用\转义,所以要特别注意

1、match:匹配字符串

import re
m = re.match(r'\d{3}\-\d{3,8}',r'010-23456')print(m)

结果:
<_sre.SRE_Match object; span=(0, 9), match='010-23456'>

2、search:扫描

import re

s = re.search(r'(.com)',r'someone@gmail.com')print(s)

结果:<_sre.SRE_Match object; span=(13, 17), match='.com'>

3、split:切分字符

import re

s = re.split(r'[\,]',r'hello,world')print(s)

结果:
['hello', 'world']

4、sub:替换

import re

sen = 'Hello2018, 12world06.'sen1 = re.sub(r'\d', '', sen)print(sen1)

结果:
Hello, world.

5、group:分组

import re

sen = re.match(r'^(\d{3})-(\d{3,8})$', '010-23456')print(sen.group(0))print(sen.group(1))print(sen.group(2))

结果:010-23456
010
23456

 

验证Email地址的正则表达式

#验证Email地址的正则表达式import re

sen1 = r'someone@gmail.com'sen2 = r'bill.gates@microsoft.com'sen3 = r'bob#example.com'sen4 = r'mr-bob@example.com'm = r'[\w\.]+\@[\w]+\.(com)'print(re.match(m,sen1))print(re.match(m,sen2))print(re.match(m,sen3))print(re.match(m,sen4))

结果:<_sre.SRE_Match object; span=(0, 17), match='someone@gmail.com'>
<_sre.SRE_Match object; span=(0, 24), match='bill.gates@microsoft.com'>None
None

 

作者:finsom

网址:https://www.cnblogs.com/finsomway/p/10075470.html


2人推荐
随时随地看视频
慕课网APP