基数计数基本概念 基数计数(cardinality counting)通常用来统计一个集合中不重复的元素个数,例如统计某个网站的UV,或者用户搜索网站的关键词数量。数据分析、网络监控及数据库优化等领域都会涉及到基数计数的需求。 要实现基数计数,最简单的做法是记录集合中所有不重复的元素集合,当新来一个元素,若中不包含元素,则将加入,否则不加入,计数值就是的元素数量。这种做法存在两个问题: 当统计的数据量变大时,相应的存储内存也会线性增长 当集合变大,判断其是否包含新加入元素的成本变大 概...