• 欢迎访问1024小神,一个只会Python的程序猿不是一个好司机
  • 有什么想对我说的可以在留言板里给我留言哦~
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏1024小神吧

标签:正则

爬虫技术

Python爬虫入门:正则表达式的基础知识

Python爬虫入门:正则表达式的基础知识
在前面我们已经搞定了怎样获取页面的内容,不过还差一步,这么多杂乱的代码夹杂文字我们怎样把它提取出来整理呢?下面就开始介绍一个十分强大的工具,正则表达式!1.了解正则表达式正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是用……继续阅读 »

1024小神 1年前 (2020-05-30) 222浏览 0评论0个赞

Python

Python 正则表达式|数量词

Python 正则表达式|数量词
如果你要匹配几十上百的字符时,难道你要一个一个的写,所以就出现了数量词。数量词的词法是:{min,max} 。min 和 max 都是非负整数。如果逗号有而 max 被忽略了,则 max 没有限制。如果逗号和 max 都被忽略了,则重复 min 次。比如,\b[1-9][0-9]{3}\b,匹配的是 1000 ~ 9999 之间的数字( “\b” 表示单词……继续阅读 »

1024小神 1年前 (2020-05-30) 175浏览 1评论0个赞

Python

Python 正则表达式|字符集

Python 正则表达式|字符集
字符集是由一对方括号 “[]” 括起来的字符集合。使用字符集,可以匹配多个字符中的一个。举个例子,比如你使用 C[ET]O 匹配到的是 CEO 或 CTO ,也就是说 [ET] 代表的是一个 E 或者一个 T 。像上面提到的 [a-z] ,就是所有小写字母中的其中一个,这里使用了连字符 “-” 定义一个连续字符的字符范围。当然,像这种写法,里面可以包含多个……继续阅读 »

1024小神 1年前 (2020-05-30) 165浏览 0评论0个赞

Python

Python 正则表达式|re模块

Python 正则表达式|re模块
正则表达式是一个特殊的字符序列,用于判断一个字符串是否与我们所设定的字符序列是否匹配,也就是说检查一个字符串是否与某种模式匹配。Python 自 1.5 版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。re 模块使 Python 语言拥有全部的正则表达式功能。下面通过实例,一步一步来初步认识正则表达式。比如在一段字符串中寻找是否含有某……继续阅读 »

1024小神 1年前 (2020-05-30) 186浏览 0评论0个赞

爬虫技术

读懂正则表达式就这么简单

读懂正则表达式就这么简单
一 前言  对于正则表达式,相信很多人都知道,但是很多人的第一感觉就是难学,因为看第一眼时,觉得完全没有规律可寻,而且全是一堆各种各样的特殊符号,完全不知所云。其实只是对正则不了解而以,了解了你就会发现,原来就这样啊正则所用的相关字符其实不多,也不难记,更不难懂,唯一难的就是组合起来之后,可读性比较差,而且不容易理解,本文旨在让大家对正则有一个基本的了……继续阅读 »

1024小神 1年前 (2020-02-22) 247浏览 0评论0个赞