程序员最近都爱上了这个网站  程序员们快来瞅瞅吧!  it98k网:it98k.com

本站消息

站长简介/公众号

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

2023-06(3)

python爬虫网页解析之lxml模块

发布于2019-08-07 09:45     阅读(1258)     评论(0)     点赞(2)     收藏(3)


08.06自我总结

python爬虫网页解析之lxml模块

一.模块的安装

windows系统下的安装:

方法一:pip3 install lxml

方法二:下载对应系统版本的wheel文件:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml

pip3 install lxml-4.2.1-cp36-cp36m-win_amd64.whl #文件所在的路径

linux下安装:

方法一:pip3 install lxml

方法二:yum install -y epel-release libxslt-devel libxml2-devel openssl-devel

二.模块的使用

from lxml.html import etree

演示

import requests
from lxml.html import etree

rp = requests.get('http://www.baidu.com')
html = etree.HTML(rp.text)
#解析后的对象可以使用xpath进行内容匹配

xpath的路径写法



所属网站分类: 技术文章 > 博客

作者:智慧星辰

链接:https://www.pythonheidong.com/blog/article/9496/7fd293b7bf5e9485aef9/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

2 0
收藏该文
已收藏

评论内容:(最多支持255个字符)