发布于2019-08-06 09:45 阅读(982) 评论(0) 点赞(0) 收藏(0)
bs4
xpath
三种解析方式
正则表达式解析
为什么引入正则表达式?
用来匹配一类具有相同规则的字符串
规则:
单字符:
. :除换行外的所有的字符
[] :[aoe]表示:a,o,e,任意一个;[a-w]:表示a到w之间任意一个;匹配集合中任意一个字符
\d :数字 [0-9]:表示0到9
\D: 非数字
\w :数字,字母,下划线,中文
\W :非小w
\s :所有的空白字符
\S :非空白
数量修饰(控制次数):
* :任意多次 >=0
+ :至少一次 >=1
? :可有可无 0次或者一次
{m} :固定m次
{m,} :至少m次
{m,n} :m-n次
边界:
\b \B
$ :以某某结尾
^ :以某某开头
():视为一个整体
ab{4} : 匹配的是abbbb
(ab){4} :表示()里面的出现4次,abababab
:子模式\组模式 \1\2
#需求:匹配出<div><span>猪八戒</span&
作者:你太美丽
链接:https://www.pythonheidong.com/blog/article/7146/ceb2117020ce28099468/
来源:python黑洞网
任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任
昵称:
评论内容:(最多支持255个字符)
---无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事,而不是让内心的烦躁、焦虑,坏掉你本来就不多的热情和定力
Copyright © 2018-2021 python黑洞网 All Rights Reserved 版权所有,并保留所有权利。 京ICP备18063182号-1
投诉与举报,广告合作请联系vgs_info@163.com或QQ3083709327
免责声明:网站文章均由用户上传,仅供读者学习交流使用,禁止用做商业用途。若文章涉及色情,反动,侵权等违法信息,请向我们举报,一经核实我们会立即删除!