程序员最近都爱上了这个网站  程序员们快来瞅瞅吧!  it98k网:it98k.com

本站消息

站长简介/公众号

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

2023-06(1)

ip、cookie数据处理

发布于2019-08-06 11:05     阅读(628)     评论(0)     点赞(2)     收藏(0)


统计某一IP相关联的IP个数

相关联的定义:某一个IP使用的cookie id又使用过其他的IP地址,则这个IP和该IP相关联
ip、cookie对照表:
在这里插入图片描述

处理代码:
##代码功能:计算与IP相关联的IP个数(该IP使用的cookie关联的IP数)

filename='ip_cookie.csv'

ip_dict={}
cookie_dict={}

with open(filename,'r') as fh:
    data=fh.read().replace('"','').split('\n')
    for line in data:
        if len(line)>0 and line[0]!='s':
            line=line.split(',')
            if line[0] not in ip_dict.keys():
                ip_dict[line[0]]=[line[1]]
            else:
                ip_dict[line[0]].append(line[1])
            if line[1] not in cookie_dict.keys():
                cookie_dict[line[1]]=[line[0]]
            else:
                cookie_dict[line[1]].append(line[0])
                
                
with open('result.csv','w+') as fin:
    fin.write("src_ip,ip_count\n")
    for ip in ip_dict.keys():
        cookie_list=ip_dict[ip]
        ip_list=[]
        for cookie in cookie_list:
            if cookie in cookie_dict.keys():
                ip_list.extend(cookie_dict[cookie])
        #print(ip+":"+str(len(set(ip_list))))
        fin.write(ip+","+str(len(set(ip_list)))+"\n")
    
print('#####处理完成#####') 

结果如下图:

在这里插入图片描述



所属网站分类: 技术文章 > 博客

作者:fhue34873

链接:https://www.pythonheidong.com/blog/article/8116/74e436ccaf2647b6a35c/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

2 0
收藏该文
已收藏

评论内容:(最多支持255个字符)