正则表达式表示ip地址 海量数据算法:如何从超过10G的记录IP地址的日志中,较快的找出登录次数最多的一个IP?
浏览量:2498
时间:2021-03-17 18:18:22
作者:admin
海量数据算法:如何从超过10G的记录IP地址的日志中,较快的找出登录次数最多的一个IP?
答案太复杂了。如果仔细计算,IP地址是4字节,最多是4G。打开16GB阵列。每个IP的32位索引由4个字节组成,是数组的索引。数组中的每个元素都是32位整数,它记录并自动增加与索引对应的IP出现次数。通过这种方式,您可以读取10GB日志并找出谁是最大的。你不用教我怎么找到最大的,是吗?
这样,如果磁盘足够快,数据应该在30秒内发送出去。
正则表达式表示ip地址 ip地址退出时验证设置 ip正则匹配
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。