内存遍历工具使用教程 Python有什么办法可以让程序去遍历比电脑内存大的数据?
浏览量:2942
时间:2021-03-20 12:10:56
作者:admin
Python有什么办法可以让程序去遍历比电脑内存大的数据?
你好,我很高兴在这里交流。
这取决于您需要什么样的数据。如果是大量的Excel数据,python有一个自然的数据处理库panda。
具有Excel表格的所有功能,从多表拼接、合并、搜索、替换到数据透视表,特别适合处理大量千万级数据记录。
一切都很顺利。来吧。
挑战程序员同学,如何只用2GB内存从20/40/80亿个整数中找到出现次数最多的数?
1、4字节表示的整数数为2^32≈40亿,2字节表示的无符号整数数为2^16≈60000。
2、2G=2^31b≈20亿字节。
3、为了找出出现次数最多的数字,应记录每个数字的出现次数。最快的方法是记录每个数字在内存中出现的次数。记录方法是记录相应的存储器地址数和相应地址的存储器单元数。但是,2G内存只能记录20亿字节的数字,如果每个数字的出现次数大于255则会发生溢出,没有风险。因此,这种方案是不可取的。
4、这样,磁盘上只能记录每次出现的次数。这样,就在磁盘上创建了一个16g文件。每4个字节对应一个整数,可以对应40亿个整数。用于记录相应整数的个数。
1. 初始化文件。
2. 依次读取数据并用无符号整数记录在磁盘文件中。如果发生溢出,则该数字是次数最多的数字。
3. 从文件中读取每个数字的次数,用变量a记录最高次数,用变量B记录最高次数的数据,用文件依次记录最高次数的数据。当最大次数增加时,a1和B被设置为1,并且该数字被写入文件中。当出现相同次数的数字b1时,该数字被写入文件的相应位置,直到全部被读取为止。
所以您根本不需要2G内存。
给你一个含有1亿个QQ号码的文件,如何快速的查找某个QQ号码?
请记住,您可以制作一个程序,例如查找定点单词。我只是不记得了。人们真的很蠢。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。