正则表达式函数?r2.group(1)) print(r2.group(2)) print(r2.groups()) 运行结果:从上面不难发现re.match与re.search的区别:re.match只匹配字符串的起始位置,只要起始位置不符合正则表达式就匹配失败,那么,正则表达式函数?一起来了解一下吧。
. \ | ( ) [ ] ^ $ * + ?
数量词:* + ? {m} {m,n} {m,}
stringr包里面的函数主要分为 6大类 ,包括:
接下来,我们将逐个演示这些函数的使用方法。
str_detect 可以检测pattern是否包括在某个字符串中,并返回TRUE和FALSE
str_count 检测pattern是否包括在某个字符串中的数目
str_which 告诉pattern的索引位置
str_locate 和 str_locate_all 返回pattern的开始和终止位置;
区别是 str_locate 只返回字符串里面的 首个匹配 到的pattern;
str_locate_all 返回字符串里面的 所有匹配 到的pattern;
str_view 和 str_view_all 函数都可以以可视化的方式,返回字符串中匹配到的pattern;
str_sub 在给定起始和终止参数的基础上对字符串进行截取或者替换
str_subset 返回pattern所在的字符串
str_extract 函数返回每个字符串中穗手皮首个匹配到的pattern
str_extract_all 函数返回每个字符串中所有匹配到的pattern str_extract_all 函数中 simplify 默认为False,默认返回list;当 simplify 为True,则返回matrix
str_match 函数返回每个字符串猜差中首个匹配到的pattern,以matrix的形式呈现
str_match_all 函数返回每个字符串中所有匹配到的pattern,以list的形式呈现
str_length 函数可以计算字符串的长度
str_pad 函数可以填充字符薯扮
str_trim 函数去除字符串的空白部分
str_squish 函数作用和 str_trim 函数作用一致,但除了去除字符串前、后的空格,它还可以去除字符串中间出现的重复的空格。
本文主要内容:
正则表达式的概念,
语法,
常用正则表达式和python中的re库
正则表达式是用来简洁表达一组字符串的表达式,正则表达式是一种通用的字符串表达框架,正则表达式是具有某一类特征的一组字符串
'PY'
'PYY' ------>正则表达式:PY+
'PYYY...'
在文本处理中的应用:
>查找或替换一组字符串
>匹配字符串的部分或全部
正则表达式的语法
正则表达式由字符和操作迅简符构成
操作符
常用的正则表达式匹配:
^[A-Za-z]+$ :由26个字母组成的字符串
^[A-Za-z0-9]+$ :由26个字母和数字组成的字符串
^-?\d+$ :整数形式的字符串
^[0-9]*[1-9]*[0-9]*$ :正整数形式的字符串
^[1-9]\d{5}$:中国境内邮政编码
[\u4e00-\u9fa5]:匹配中文字符衡顷
\d{3}-\d{8}:匹配国内电话号码010-68697314
python中Re库
Re库是Python中的标准库,主要用于字符串匹配。
调用:import re
raw string类型:原生字符串类型,不包含对转移字符串再次转移的字符串
例如:r'[1-9]\d{5}' ---->操作符\d的斜杠为转义字符,不用原生字符串类型应该表示为\\d
re.search(pattern,string,flag=0):在字符串中搜索匹配正则表达式的第一个位置
pattern:正则表达式的字符串或原生字符串表示
string:待匹配字符串
flag:正则表达式使用时的控制标记
输出:432808
re.match(pattern,string,flag=0):从字符串的开始位置匹配,返回Match对象,参数同search()函数
输出:432808
re.findall(pattern,string,flag=0):搜索字符串返回所有能匹配的字符咐昌陆串,返回list,参数同search()函数
输出:['432808', '432800']
re.split(pattern,string,maxsplit=0,flag=0):搜索字符串返回所有能匹配的字符串,返回list,比search()函数多一个参数
maxsplit:最大分割数,剩余部分作为最后一个字符串
输出:['BOSTCODE_ONE:', ' ,BOSTCODE_TWO:', '']
['BOSTCODE_ONE:', ' ,BOSTCODE_TWO:432800']
re.finditer(pattern,string,flag=0):搜索字符串返回匹配结果的迭代类型,每一个元素是一个Match对象,
输出:
re.sub(pattern,repl,string,count=0,flag=0):搜索字符串返回匹配结果的迭代类型,每一个元素是一个Match对象,比search()函数多了两个参数
repl:替换匹配的字符串
count:匹配字符串的最大替换次数
输出:'BOSTCODE_ONE:12306 ,BOSTCODE_TWO:432800'
Re库的等价用法:
上面的用法为函数式用法:一次性操作,每次调用函数内部会将正则表达式字符串编译成正则表达式对象
等价用法为面向对象法:先编译正则表达式,然后用正则表达式对象来调用函数,可以多次使用,当匹配规则在多个地方使用先编译可以提高程序性能
输出:'BOSTCODE_ONE:12306 ,BOSTCODE_TWO:432800'
Re的Match对象
Match对象是一次匹配的结果,包含很多匹配信息
Match对象的属性
Match对象的方法
匹配模式
贪婪匹配:同时匹配长短不同的多项,返回长度最长的,Python默认采用这种模式
输出:'PYANBNCNDN'
最小匹配:在相应的操作符后面加?变为最小匹配模式
输出:'PYAN'
常用的最小匹配操作符
什么是正则表达式
我们平时打 游戏 需要先注册账号,注册不是随意的,而是按照一定的规则,否则就无法注册成功。那么这个规则的判断就是通过正则表达式来判断的。
其他语言也会使用正则表达式,我们现在主要是利用JavaScript 正则表达式完成表单验证。
知道了什么是正则表达式,那么聊聊如何使用:
正则表达式在js中的使用
正则表达式的创建(两种方式):
方式一:通过调用RegExp对象的构造函数创建
方式二:利用字面量创建 正则表达式【 重点记忆,常用 】
test() 是测试正则对象方法,用于检测字符串是否符合该规庆或则,该对象会返回 true 或 false,他的参数是需要测试的字符串。
正则表达式中的特殊字符
正则表达式的组成
定义: 一个正则表达式可以由简单的字符构成,比如 /abc/,也可以是简单和特殊字符的组合,比如 /ab*c/ 。其中特殊字符也被称为元字符,在正则表达式中是具有特殊意义的专用符号,如 ^ 、$ 、+ 等。
边界符
有两个 ^ 和 $ : ^代表必须以某个字符串开头;$代表必须以某个字符串结尾;
举个栗子:理解一下^和$的用法:
[] 方括号 :表示有一系列字符可供选择,只要匹配其中一个就可以了;
举个栗子:
量词符用来设定某个模式出现的次数。
regex_select函数。
1、正则表达式五种函数中,只有regex_select参与提岩扒取第一个字符,因此正则粗桥昌表达式只提取第一个字符是regex_select。
2、regex_select函数是值提取函数,消念根据正则表达式提取符合条件的值。
Python是一门开源免费、通用型的脚本编程语言,它上手简单,功能强大,它也是互联网最热门的编程语言之一。不管是传统的Web开发、PC开发、Linux运维,还是大数据分析、机器学习、人工智能,Python都能胜任。对于准备自学或者想要提升Python的小伙伴来说,可能找到一套合适的课程学习往往能够事半功倍!为大家提供到了四套潮享教育金牌讲师李老师的Python入门到精通课程,感兴趣就可以点击了解~
Python正则表达式认识:
以上就是正则表达式函数的全部内容,首先我们在findall函数中第一个参数写正则表达式的规则,其中[a-z]就是匹配任何小写字母,第二个参数只要填写要匹配的字符串就行了。具体如下:输出的结果:这样我们就拿到了字符串中的所有小写字母了。