程序员最近都爱上了这个网站  程序员们快来瞅瞅吧!  it98k网:it98k.com

本站消息

站长简介/公众号

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

2023-06(2)

正则表达式解析

发布于2019-08-06 09:45     阅读(816)     评论(0)     点赞(0)     收藏(0)


正则表达式解析

bs4
xpath
三种解析方式

正则表达式解析

为什么引入正则表达式?

  • 用来匹配一类具有相同规则的字符串

    规则:

  • 单字符:

         . :除换行外的所有的字符
         [] :[aoe]表示:a,o,e,任意一个;[a-w]:表示a到w之间任意一个;匹配集合中任意一个字符
         \d :数字  [0-9]:表示0到9
         \D: 非数字
         \w :数字,字母,下划线,中文
         \W :非小w
         \s :所有的空白字符
         \S :非空白
    
  • 数量修饰(控制次数):

         *   :任意多次    >=0
         +   :至少一次   >=1
         ?   :可有可无   0次或者一次
         {m}  :固定m次
         {m,}    :至少m次
         {m,n}   :m-n次
    
  • 边界:

         \b  \B  
         $   :以某某结尾
         ^   :以某某开头
    

分组(正则的高级功能):

        ():视为一个整体
                 ab{4} : 匹配的是abbbb
                (ab){4} :表示()里面的出现4次,abababab
            :子模式\组模式        \1\2
                #需求:匹配出<div><span>猪八戒</span&


所属网站分类: 技术文章 > 博客

作者:你太美丽

链接:https://www.pythonheidong.com/blog/article/7146/ceb2117020ce28099468/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

0 0
收藏该文
已收藏

评论内容:(最多支持255个字符)