本站消息

  本站每日ip已达10000,出租广告位,位置价格可谈,需要合作请联系站长


+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

2019-08(106)

2019-09(105)

2019-10(7)

2019-11(8)

2019-12(13)

在进行爬取信息时,遇到json格式的数据前面有jQuery3410675305319383495_1584774746492的处理

发布于2020-03-23 21:12     阅读(635)     评论(0)     点赞(7)     收藏(5)


在进行爬取信息时,遇到json格式的数据前面有jQuery3410675305319383495_1584774746492的处理

很简单的处理方法我们可以用空字符串把其替换掉:

resp_sub = re.sub('^jQuery3410675305319383495_1584774746492\(', '', resp)
resp_sub_2 = re.sub('\)$', '', resp_sub)
resp_json = json.loads(resp_sub_2)
# response.txt 你需要在什么内容中替换
# 因为我们做的时网络爬虫,所以就在响应的文本中进行替换
# 我们把开头的jquery和末尾 ) 都给替换掉就可以了
# 然后利用json中loads方法不json字符串转换成python中的字典

原文链接:https://blog.csdn.net/weixin_44984627/article/details/105014539



所属网站分类: 技术文章 > 博客

作者:短发越来越短

链接: https://www.pythonheidong.com/blog/article/278173/

来源: python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

7 0
收藏该文
已收藏

评论内容:(最多支持255个字符)