大数据算法有哪些 计算机编程语言需要哪种算法?
计算机编程语言需要哪种算法?
Apriori算法:https://www.toutiao.com/i6602129057633010184/
AdaBoost算法:https://www.toutiao.com/i6602034223387771400/
C4.5算法:https://www.toutiao.com/i6602461790884332045/
Cart算法:https://www.toutiao.com/i6602016174802731533/
K-均值算法:https://www.toutiao.com/i6602460997519147524/
SVM算法:https://www.toutiao.com/I66024600036063035911/
PageRank算法:https://www.toutiao.com/i6602036596369785347/
K-最近邻算法/KNN:https://www.toutiao.com/i6602033239240475140/
朴素贝叶斯算法:https://www.toutiao.com/i6602032352438780419/
挑战程序员同学,如何只用2GB内存从20/40/80亿个整数中找到出现次数最多的数?
1、4字节表示的整数数为2^32≈40亿,2字节表示的无符号整数数为2^16≈60000。
2、2G=2^31b≈20亿字节。
3、为了找出出现次数最多的数字,应记录每个数字的出现次数。最快的方法是记录每个数字在内存中出现的次数。记录方法是记录相应的存储器地址数和相应地址的存储器单元数。但是,2G内存只能记录20亿字节的数字,如果每个数字的出现次数大于255则会发生溢出,没有风险。因此,这种方案是不可取的。
4、这样,磁盘上只能记录每次出现的次数。这样,就在磁盘上创建了一个16g文件。每4个字节对应一个整数,可以对应40亿个整数。用于记录相应整数的个数。
1. 初始化文件。
2. 依次读取数据并用无符号整数记录在磁盘文件中。如果发生溢出,则该数字是次数最多的数字。
3. 从文件中读取每个数字的次数,用变量a记录最高次数,用变量B记录最高次数的数据,用文件依次记录最高次数的数据。当最大次数增加时,a1和B被设置为1,并且该数字被写入文件中。当出现相同次数的数字b1时,该数字被写入文件的相应位置,直到全部被读取为止。
所以您根本不需要2G内存。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。