2016 - 2024

感恩一路有你

hive表迁移到另一张表 mysql表数据量太大,达到了1亿多条数据,除了分库分表之外,还有没有其他的解决方式?

浏览量:2038 时间:2021-03-12 05:29:58 作者:admin

mysql表数据量太大,达到了1亿多条数据,除了分库分表之外,还有没有其他的解决方式?

在正常配置下,MySQL只能承载2000万数据(同时读写,表中有大文本字段,单服务器)。现在已经超过1亿,而且还在增加,建议按以下方式处理:

1子表。它可以按时间或一定的规则进行拆分,以便尽可能地查询子表中的数据库。这是最有效的方法。特别是写,放入一个新表,并定期同步。如果记录不断更新,最好将写入的数据放在redis中,并定期同步表3的大文本字段,将它们分隔成一个新的独立表。对于较大的文本字段,可以使用NoSQL数据库

4优化体系结构,或者优化SQL查询,避免联合表查询,尽量不要使用count(*)、in、recursion等性能消耗语句

5使用内存缓存,或者在前端读取时增加缓存数据库。重复读取时,直接从缓存中读取。

以上是一种低成本的管理方法,基本上几个服务器就可以做到,但是管理起来有点麻烦。

当然,如果总体数据量特别大,并且您不关心投资成本,请使用群集或tidb

谢谢!笔者刚刚签了一份大数据挖掘工程师的合同,到了研究生阶段才转向大数据方向。目前大数据火爆,很多学生都想上交,但自学的学习路线因人而异。

以我自己为例,作者出生于Python数据分析领域,具有通用编程能力。因此,在此基础上,他首先学习了Linux的基本操作命令,安装了Ubuntu的双系统,并进一步安装了Hadoop和spark组件。在此基础上,他利用pypark操作spark大数据框架进行学习。您可以推荐以下书籍:

pypark实用指南

,由浅入深,非常好用。

hive表迁移到另一张表 hbase数据迁移方案 oracle向Hbase数据迁移

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。