程序员最近都爱上了这个网站  程序员们快来瞅瞅吧!  it98k网:it98k.com

本站消息

站长简介/公众号

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

liufale

发布于2019-08-06 09:50     阅读(480)     评论(0)     点赞(2)     收藏(1)


import re
import requests
headers = {
    'Cookie':'UM_distinctid=16828a999356ee-01dbffc4bd71a8-33504275-144000-16828a99936840; CNZZDATA1255357127=1573548009-1546867979-%7C1546921578',
    'Host':'m.meitulu.com',
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.6788.400 QQBrowser/10.3.2843.400'
}

url = 'https://m.meitulu.com/t/faye/'
#pattern = re.compile('<a href="(.*?)"><img src=".*?" alt="(.*?)" width=".*?" height=".*?"/></a><p>(.*?)</p>',re.S)
pattern = re.compile('<a href="(.*?)"><img src=".*?" alt="(.*?)" width=".*?" height=".*?"/></a>')
response = requests.get(url,headers = headers)
response.encoding = 'utf-8'

urlstart = 'https://mtl.ttsqgs.com/images/img/'

header = {
    'Host':'mtl.ttsqgs.com',
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.6788.400 QQBrowser/10.3.2843.400'
}

li = re.findall(pattern,response.text)
for content in li:    
    num = re.match('https://m.meitulu.com/item/(.*?).html',content[0]).group(1)

    
    referer = 'https://m.meitulu.com/item/' + str(num) +'.html'
    header['Referer'] = referer
    
    #num = re.search('https://m.meitulu.com/item/(.*?).html',content[0]).group(1)
    #match 从头开始 search 不是
    '''
    p = re.compile('[.*?].*?[(.*?)]')
    picnum = re.match(p,content[1].group
    print(picnum)#不知道为什么不对...
    '''
    picnum = re.findall('\d+',content[1])[-1]

    #print(content[1],picnum)


    for i in range(1,int(picnum)+1):
        u = urlstart + str(num) + '/' + str(i) +'.jpg'
        print(content[1],'正在下载第{}张'.format(i),u)
        with open('E:\刘飞儿\%s%s.jpg'%(content[1],i) ,'wb') as f:
            f.write(requests.get(u,headers = header).content)

  
    

 



所属网站分类: 技术文章 > 博客

作者:爸爸去挣钱我去幼儿园

链接:https://www.pythonheidong.com/blog/article/7208/861eba724abac0997035/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

2 0
收藏该文
已收藏

评论内容:(最多支持255个字符)