Python re模块简明笔记
Python 的正则模块re
用起来其实蛮顺的,尤其你平时搞文本比较多的话,真能省不少事。像什么match
、search
、findall
这些方法,熟练了之后就像在字符串里装了个雷达,一搜一个准。
反斜杠的问题挺常见,用原始字符串(前面加个r
)就能转义麻烦。比如写r'\d+'
,不用担心多写反了。平时也可以直接用re.search
,要复用再compile
下也灵活。
你要是遇到批量替换、分割字符串这种需求,像sub
、split
、finditer
这些就派上用场了。尤其是finditer
,大文本的时候省内存,迭代起来稳。
如果你对正则里的元字符还不熟,可以看看文末那几个链接,像元字符详解和浅析正则表达式都还挺清楚的。蛮适合边学边抄几个例子跑跑。
,re 模块不难上手,也没你想的那么玄。如果你正好在写爬虫、日志、做文本清洗,那这篇笔记值得收藏一下。
下载地址
用户评论