程序员最近都爱上了这个网站  程序员们快来瞅瞅吧!  it98k网:it98k.com

本站消息

站长简介/公众号

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

案例 — 使用bs4 爬取猫眼电影热榜

发布于2019-08-07 11:03     阅读(819)     评论(0)     点赞(2)     收藏(5)


  

from bs4 import BeautifulSoup
from urllib import request

url = "http://maoyan.com/board"
rsq = request.urlopen(url)
html = rsq.read().decode()

soup = BeautifulSoup(html,"lxml")

items = soup.select('dd')

# 构建本地txt文档
with open("D://maoyan.txt","w",encoding="utf-8") as f:                  

    for item in items:
        # 提取标题
        title = item.select('p a[data-act="boarditem-click" ]')[0].get_text()
        # 提取主演
        star = item.select('p[class = "star"]')[0].get_text().replace("\n","").strip(" ")
        # 提取分数
        score = item.select('p[class = "score"]')[0].get_text().strip('\n').strip(' ')
        # 提取上映时间
        releasetime = item.select('p[class = "releasetime"]')[0].get_text()
        # 数据整合
        datas = title + "  " + releasetime + "  "+ star + "  " + score + "\n"                   
        print(datas)
        # 利用for循环把每条datas信息写入本地
        f.write(datas)            
f.close()
print("Sucessful")

 



所属网站分类: 技术文章 > 博客

作者:eirierbjs

链接:https://www.pythonheidong.com/blog/article/10151/d8e86eee87f713f54cf1/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

2 0
收藏该文
已收藏

评论内容:(最多支持255个字符)