程序员最近都爱上了这个网站  程序员们快来瞅瞅吧!  it98k网:it98k.com

本站消息

站长简介/公众号

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

xpath

发布于2019-08-05 18:22     阅读(660)     评论(0)     点赞(1)     收藏(0)


1.安装

    1. 安装c++budildtools
    2. 使用该网站
    3. 搜索并下载
    4. lxml
    5. Twisted
    6. Scrapy
    7. 使用cmd打开到下载文件的目录输入pip install {文件名}

2.xpath简介

xpath可以使用路径表达式在xml和html中导航

xpath包含标准函数库

xpath是w3c标准的主要元素,并且XQuery和XPointer都构建 XPath表达之上

3.xpath语法

https://www.w3school.com.cn/xpath/index.asp

xpath某个标签的路径可以在Elements(DOM和样式查看器)中复制

4.在python中使用xpath

 

import requests
from scrapy import Selector
r = requests.get('https://www.88ys.cc/ribendongman/201901/56106.html')
r.encoding = 'utf-8'
html = r.text
sel = Selector(text=html)
tag = sel.xpath('/html/body/div[4]/div[1]/div[2]/dl/h1/text()').extract()#/text()只显示标签里的内容,extract()方法是将对象转换成list
print(tag)#返回<class 'list'>

 

 

 

xpath方法:https://developer.mozilla.org/en-US/docs/Web/Xpath/Functions



所属网站分类: 技术文章 > 博客

作者:不上班你养我呀

链接:https://www.pythonheidong.com/blog/article/6211/a23af8555e412c82bdfd/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

1 0
收藏该文
已收藏

评论内容:(最多支持255个字符)