数据库count distinct怎么用 sql怎么统计总共出产品种类有多少个？

浏览量：1519 时间：2023-04-09 21:52:24 作者：采采

sql怎么统计总共出产品种类有多少个？

这个问题表达的很不清楚。表格结构是什么？具体统计要求不明确。

1.如果有单独的产品分类表和产品档案表，统计有多少产品分类就很简单了。书写方法是:从产品分类表中选择计数。

2.如果只有产品档案表，每个产品档案信息包括产品分类名称、产品编码、产品名称等字段。(其实这样很不规范，不能保证分类的一致性)。统计了多少产品分类？写:从产品文件表中选择计数。

第三，从更复杂的应用来看，比如一个产品产出表，每个月生产的产品是不一样的。如果想知道每个月生产多少类型的产品，可以这样写:选择产品产量表，生产年份，产品产量表，生产月份，计数(产品档案表，产品档案表，产品档案表，按产品产量表分组的产品代码，产量。

第一，意义不同

Count(1)计算包括空值在内的所有合格字段的数量。Count(0)将返回表中所有现有行的总数，包括具有null值的行，而Count(列名)将返回表中除null(具有默认值的列也将被计算在内)和distinct列名之外的所有行的总数，结果将是删除null值和重复数据后的结果。

第二，角色不同

主要是想要count(1)对应的数据字段。

如果count(1)是聚集索引id，则它必须是count(1) fast。但是差别很小。由于count(*)，分配给哪个字段将被自动优化。所以不需要count()，使用count (*)，SQL会帮你完成优化。

第三，使用结果不同

当abc为空时，第二个不计入计数，而第一个无条件计入计数，按比例有一列数据。

字段名称是abc

空

在这种情况下，第一个查询是3，第二个查询的结果是2。

Mapjoin是一种避免数据倾斜的方法。

在映射阶段允许连接操作。mapjoin将所有小表读入内存，在map阶段直接将另一个表的数据与内存中的数据进行匹配。因为连接操作是在map中进行的，所以归约操作的效率会高很多。

在《hive：join遇到问题》有具体的操作。

在多个表上join的时候把小桌子放在join的左边，大桌子放在Jion的右边。

在执行这样的join连接时，小表中的数据会缓存在内存中，可以有效降低内存溢出错误的概率。

2.设置参数

真实的

还有其他参数。

3.SQL语言调整

例如，在“分组依据”维度中花费时间:使用sum() group by而不是count(distinct)来完成计算。

在reducer中执行join操作时将小表放在内存中，通过stream模式读取大表。

上一篇 js怎么打开新窗口如何命令行窗口执行JS脚本文件？

下一篇制作相片杂志 OPPO手机怎样设置杂志是自己相册里的？