Python中的正則表達式
正則表達式是用於查找和替換字元串中的模式的字元序列,它是用於匹配文本中的模式的工具。
在python中,我們有「re」模塊,我們需要在開始之前導入它。
import re
正則表達式的主要用途
匹配字元串
替換字元串的一部分
搜索字元串
將字元串拆解成子字元串
正則表達式的方法
w --> 匹配字母數字字元 [a-z,A-Z,0-9]
W --> 匹配非字母數字字元
d --> 匹配數字 [0-9]
D --> 匹配所有非數字
s --> 匹配一個空格字元
S --->匹配除空格外的所有字元
--> 匹配製表符
--> 匹配換行符
--> 匹配回車符
. -->匹配除
外的所有字元
-->對正則表達式進行分組,並返回匹配的文本
a|b -->匹配a或b
^ --> 開始位置
$ --> 結束位置
{m} --> 精確匹配m個
{m,} -->匹配至少m個
{m,n} --> 匹配個數介於m和n之間
? -->匹配模式的一次或零次出現
plus(+) -->匹配模式的一個或多個出現
sub ----> 查找re匹配的所有子字元串,並用不同的字元串替換它們
subn -----> 和 sub相同, 但是返回新字元串和匹配次數
start ----> 給出開始位置
end ----> 給出結束位置
span ----> 給出子字元串的起始位置
search ----> 匹配整個字元串
match ----> 匹配第一個單詞
findall ----> 在字元串中多次進行匹配
compile -----> 我們可以將模式編譯成模式對象
下面我將演示如何使用其中的一些方法:
re.search
本搜索方法將搜索整個字元串並返回結果。
如果有多個匹配項,則返回搜索模式的第一個匹配項
例子:
re.match
搜索給定字元串的第一個單詞。如果第一個單詞匹配,則返回所需輸出,如果第一個單詞不匹配,則輸出None。
例子:
因為hello不是字元串中的第一個單詞。
re.findall
Findall返回字元串中模式的所有非重疊匹配。
例子:
它可以匹配一個模式並使用新的子字元串進行替換。
例子:
re.compile
我們可以將正則表達式模式組合到模式對象中,這些對象可用於模式匹配。在不重寫它的情況下也可以搜索一個模式。
例子:
練習
1.從給定字元串中提取所有字元
2. 從給定字元串中提取每一個單詞
3. 從給定字元串中提取所有數字
※網易組建Python數據分析學習群,3場免費直播課帶你入門Python數據分析
※Web緩存投毒實戰
TAG:Python部落 |