布隆过滤器误判怎么办 面试遇难题,问:游戏中的敏感词过滤是如何实现的,该怎么回答?
浏览量:1979
时间:2021-03-15 05:42:21
作者:admin
面试遇难题,问:游戏中的敏感词过滤是如何实现的,该怎么回答?
你好,你应该像我一样是个程序员。涉及Java和web。有一个replace()方法,后跟两个参数,用于“set and replace”和用“*”替换一些“敏感词”。具体技术可以关注我,我带你去学技术!@很难找到新的高质量数据。关注和重新分配它们是不好的
布鲁姆过滤器是由布鲁姆过滤器在1970年提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。Bloom过滤器可用于检索元素是否在集合中。它的优点是在空间效率和查询时间上都比一般的算法好很多,缺点是有一定的错误识别率和删除困难。
海量数据处理之什么是bloomfilter?
请记住,您可以制作一个程序,例如查找定点单词。我只是不记得了。人们真的很蠢。
给你一个含有1亿个QQ号码的文件,如何快速的查找某个QQ号码?
Bloom filter的特点是会有误报,但不会有漏报。也就是说,对于Bloom filter验证的数据文件,它可能不包含您要查找的数据项,但是包含您要查找的数据项的数据文件将被返回。在key-value系统中,bloom会返回数据文件,过滤器返回的数据文件还需要检查内容,以知道是否有所需的数据,从而保证执行结果的正确性和完整性。
因此,键值系统不会因此出错,只需访问更多的数据文件即可。
在数据量大的键值系统中,建立统一的b树索引的成本很高,维护成本也很高,所以Bloom filter的性能最好。
布隆过滤器既然有错误率,为什么还能应用在key-value系统中?
redis bloom filter的功率为1000,bitmap的功率为1100。不同的是力量不同
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。