发布于2019-08-07 13:31 阅读(717) 评论(0) 点赞(3) 收藏(1)
python版本:3.7.1
安装依赖包requests re urllib bs4......
安装方法:打开python安装目录,找到scripts的目录,按住shift出现打开命令窗口,进入后先pip list查看安装了那些包,然后再pip install 安装所需要的包。
参考网址:https://blog.csdn.net/Ryuchong/article/details/80687447
# -*- coding:utf8 -*-
import requests
import re
import pymysql
#关键字,公司网址,查询网址
keyword = input(u"请输入你要查询的关键字")
site = input("请输入您要查询的网址")
site_baidu = u"http://www.baidu.com/s?wd=%s&pn=%d0"
site_360 = "https://hao.360.cn/"
#查询排名
i = 0
#word = u"体检行业爆丑闻"
#site = "https://baijiahao.baidu.com"
site_baidu = u"http://www.baidu.com/s?wd=%s&pn=%d0"
def KeywordRank(searchTxt, webUrl):
global i
try:
pattern = re.compile(b'class="c-showurl" style="text-decoration:none;">(.*?) ', re.S)
result = pattern.findall(searchTxt)
for item in result:
item_str = str(item, encoding = "utf8")
i = i+1
print ("rank %d: %s"%(i,item_str))
if site in item_str:
return i
except Exception as e:
print(e)
return None
return None
# content:要搜索的关键词, page:要搜索的页码
def BaiduSearch(content, page):
try:
url = site_baidu % (content, page)
data = requests.get(url)
return data.content
except Exception as e:
return None
if __name__ == "__main__":
loops = 10 # 最多查到第 10 页
page = 0
while(loops):
searchTxt = BaiduSearch(keyword, page)
page = page+1
rank = KeywordRank(searchTxt, site)
if None!=rank:
print (u"输入的关键词排在第 %d 名" % rank)
print(rank)
break
loops = loops - 1
#数据库连接存储数据
conn = pymysql.Connect(
host = '127.0.0.1',
port = 3306,
user = 'root',
password = 'root',
db = 'test',
charset = 'utf8'
)
cursor = conn.cursor()
sql_insert="insert into seo(id,site,word,rank) values('','%s','%s','%d')"%(site,keyword,rank)
cursor.execute(sql_insert)
conn.commit()
cursor.close()
conn.close()
运行结果:
思路的话参考网址里说的很清楚,在这里就强调一下注意添加编码格式以及python2版本与3的不兼容,语法方面的变化。
作者:你敢说我不帅
链接:https://www.pythonheidong.com/blog/article/11231/9d4753b52484fc2ed9b1/
来源:python黑洞网
任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任
昵称:
评论内容:(最多支持255个字符)
---无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事,而不是让内心的烦躁、焦虑,坏掉你本来就不多的热情和定力
Copyright © 2018-2021 python黑洞网 All Rights Reserved 版权所有,并保留所有权利。 京ICP备18063182号-1
投诉与举报,广告合作请联系vgs_info@163.com或QQ3083709327
免责声明:网站文章均由用户上传,仅供读者学习交流使用,禁止用做商业用途。若文章涉及色情,反动,侵权等违法信息,请向我们举报,一经核实我们会立即删除!