2016 - 2024

感恩一路有你

大数据算法有哪些 计算机编程语言需要哪种算法?

浏览量:1370 时间:2021-03-12 14:56:36 作者:admin

计算机编程语言需要哪种算法?

Apriori算法:https://www.toutiao.com/i6602129057633010184/

AdaBoost算法:https://www.toutiao.com/i6602034223387771400/

C4.5算法:https://www.toutiao.com/i6602461790884332045/

Cart算法:https://www.toutiao.com/i6602016174802731533/

K-均值算法:https://www.toutiao.com/i6602460997519147524/

SVM算法:https://www.toutiao.com/I66024600036063035911/

PageRank算法:https://www.toutiao.com/i6602036596369785347/

K-最近邻算法/KNN:https://www.toutiao.com/i6602033239240475140/

朴素贝叶斯算法:https://www.toutiao.com/i6602032352438780419/

挑战程序员同学,如何只用2GB内存从20/40/80亿个整数中找到出现次数最多的数?

1、4字节表示的整数数为2^32≈40亿,2字节表示的无符号整数数为2^16≈60000。

2、2G=2^31b≈20亿字节。

3、为了找出出现次数最多的数字,应记录每个数字的出现次数。最快的方法是记录每个数字在内存中出现的次数。记录方法是记录相应的存储器地址数和相应地址的存储器单元数。但是,2G内存只能记录20亿字节的数字,如果每个数字的出现次数大于255则会发生溢出,没有风险。因此,这种方案是不可取的。

4、这样,磁盘上只能记录每次出现的次数。这样,就在磁盘上创建了一个16g文件。每4个字节对应一个整数,可以对应40亿个整数。用于记录相应整数的个数。

1. 初始化文件。

2. 依次读取数据并用无符号整数记录在磁盘文件中。如果发生溢出,则该数字是次数最多的数字。

3. 从文件中读取每个数字的次数,用变量a记录最高次数,用变量B记录最高次数的数据,用文件依次记录最高次数的数据。当最大次数增加时,a1和B被设置为1,并且该数字被写入文件中。当出现相同次数的数字b1时,该数字被写入文件的相应位置,直到全部被读取为止。

所以您根本不需要2G内存。

大数据算法有哪些 数据分析算法 波形相似度算法

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。