发布于2019-08-22 17:49 阅读(461) 评论(0) 点赞(16) 收藏(4)
主要涉及到的知识点
这里针对的是数据以HTML返回的形式
beautifulsoup、lxml的使用
首先这里需要请求到一个网页地址,之后用beautifulsoup解析网页
requestsAPI = request.get(url)
bs = BeautifulSoup(requestsAPI.content,'lxml')
获取的是多个元素find_all
many = bs.find_all('div',class_ = 'pcb')
获取一个元素find
one = bs[0].find('td')
找到p id = 'number’下面的所有td
findTd = bs.find('p',id = 'number').find_all('td')
找到一个标签下的属性
find = bs[0].find('img')['file']
查看标签内包含的内容
bs[0].find_all('strong')[3].text
Beautiful Soup 4.2.0 文档
https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
作者:j878
链接:https://www.pythonheidong.com/blog/article/53308/8c0bdbc9e80c5c7d716b/
来源:python黑洞网
任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任
昵称:
评论内容:(最多支持255个字符)
---无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事,而不是让内心的烦躁、焦虑,坏掉你本来就不多的热情和定力
Copyright © 2018-2021 python黑洞网 All Rights Reserved 版权所有,并保留所有权利。 京ICP备18063182号-1
投诉与举报,广告合作请联系vgs_info@163.com或QQ3083709327
免责声明:网站文章均由用户上传,仅供读者学习交流使用,禁止用做商业用途。若文章涉及色情,反动,侵权等违法信息,请向我们举报,一经核实我们会立即删除!