在Java中如何使用Collections.frequency统计元素频率_Java集合统计解析

Collections.frequency 只需集合实现 Iterable 且元素支持 equals 比较,内部遍历调用 Objects.equals;它不依赖哈希,故 HashSet 中仍为 O(n),非 O(1);可传 Map.values() 或 keySet(),但需注意泛型擦除与类型匹配。

为什么 Collections.frequency 只能用于 List 或支持 equals 的集合?

Collections.frequency 内部是遍历整个集合,对每个元素调用 Objects.equals(element, target) 比较。它不依赖哈希、不预处理、不缓存,所以只要集合实现了 Iterable(比如 ArrayListLinkedListHashSetTreeSet)就能用——但性能差异极大。

常见误解是“只能用于 List”,其实不是。但要注意:HashSet 虽然能用,却完全浪费了它的 O(1) 查找优势;而对 ArrayList 这类线性结构,它就是最直接的遍历计数方式。

  • ArrayList:时间复杂度 O(n),合理预期
  • HashSet:仍是 O(n),而非 O(1) —— 因为它不走 contains,而是逐个 equals
  • 对空集合或 null 元素:安全,Collections.frequency(null, x)NullPointerExceptionCollections.frequency(list, null) 可正常统计 null 出现次数

如何正确统计 Map 中 value 的频率?

Collections.frequency 不能直接传 Map,但可以传它的 values() 视图——因为 Collection 是合法参数类型。

注意:返回的是 Collection 视图,不是副本,所以修改原 Map 后再调用,结果会实时反映变化。

Map scoreMap = new HashMap<>();
scoreMap.put("Alice", 95);
scoreMap.put("Bob", 87);
scoreMap.put("Charlie", 87);
scoreMap.put("Diana", 92);

int countOf87 = Collections.frequency(scoreMap.values(), 87); // 返回 2
  • 如果想统计 key 的频率,需传 map.keySet()
  • 若 value 是自定义对象,确保其重写了 equalshashCode,否则比较永远为 false
  • 不要传 map.entrySet() 并期望匹配 key 或 value——entry 是 Map.Entry 对象,必须传对应 entry 实例才能匹配

替代方案:什么时候不该用 Collections.frequency

当需要**多次查询不同元素的频次**,或**原始集合很大且只查几次**时,Collections.frequency 就成了性能陷阱——每次调用都全量扫描。

更优做法是预构建频次映射:

List words = Arrays.asList("apple", "banana", "apple", "cherry", "banana", "apple");
Map freqMap = new HashMap<>();
for (String word : words) {
    freqMap.put(word, freqMap.getOrDefault(word, 0) + 1);
}
// 后续 O(1) 查询:freqMap.get("apple") → 3
  • 单次查询:用 Collections.frequency 更简洁,无额外空间开销
  • 多次查询:预建 HashMap 或用 Stream.collect(Collectors.groupingBy(..., Collectors.counting()))
  • 并发场景:Collections.frequency 是纯函数式、无状态的,线程安全;但预建的 Map 若共享,需用 ConcurrentHashMap

Collections.frequency 在泛型擦除下的实际行为

Java 泛型在运行时被擦除,Collections.frequency 签名是 public static int frequency(Collection> c, Object o),所以它根本不管泛型类型,只认运行时对象引用和 equals 逻辑。

这意味着:

  • List 传入 Long 值(如 Collections.frequency(intList, 1L))永远返回 0,因为 Integer.equals(Long)false
  • List 传入 StringBuilder,即使内容相同,也返回 0(String.equals(StringBuilder)false
  • 数组不行:int[]String[] 不是 Collection,必须先转成 List(如 Arrays.asList(arr)),但注意基本类型数组会变成单元素列表(Arrays.asList(new int[]{1,2}) → 列表含一个 int[] 对象)

真正容易被忽略的,是类型匹配的隐式失败——它不报错,只安静地返回 0。