在Java中如何合并多个集合数据_Java集合合并思路解析

最直接合并ArrayList用addAll(),需确保目标集合可变;多集合合并推荐Stream.of().flatMap();去重保序用LinkedHashSet;Map合并应避免putAll()覆盖,改用merge()自定义策略。

addAll() 合并 ArrayList 最直接

多数场景下,合并几个 ArrayList 只需调用 addAll()。它把另一个集合所有元素追加到当前集合末尾,不改变原集合

结构,也不去重。

注意:目标集合必须是可变的(如 new ArrayList()),不能是 Collections.unmodifiableList()Arrays.asList() 返回的固定大小列表,否则抛 UnsupportedOperationException

常见错误现象:合并后发现数据没变——大概率是目标集合本身不可修改,或误用了返回新集合的方法(比如 Stream 操作没赋值)。

  • 确保目标集合已实例化:ArrayList result = new ArrayList();
  • 逐个添加:result.addAll(list1); result.addAll(list2); result.addAll(list3);
  • 如果要避免重复,得自己去重,addAll() 不处理这个

Stream.concat() 合并任意数量集合(Java 8+)

Stream.concat() 适合合并两个流;多个集合时需嵌套调用或改用 Stream.of().flatMap()。它不修改原集合,返回新流,适合函数式风格或需要链式操作的场景。

性能影响:不会立即执行,但最终 collect() 时会遍历所有元素,内存占用和 addAll() 接近。区别在于前者惰性求值,后者立即执行。

List merged = Stream.of(list1, list2, list3)
    .flatMap(List::stream)
    .collect(Collectors.toList());
  • 不能直接传 null 集合,否则 Stream.of() 会把 null 当作一个元素,导致 NullPointerExceptionflatMap 阶段爆发
  • 若需去重,接 .distinct() 即可,比手动遍历 + Set 更简洁
  • 元素顺序按原始集合顺序拼接,不重排

合并时去重且保持插入顺序:用 LinkedHashSet

如果目标是“合并 + 去重 + 保持首次出现顺序”,LinkedHashSet 是最轻量、最可靠的选择。它底层用哈希表 + 双向链表,插入开销略高于 HashSet,但遍历顺序稳定。

别用 TreeSet 替代——它按自然序或比较器排序,会打乱原始插入顺序,且要求元素可比较。

Set mergedSet = new LinkedHashSet<>();
list1.forEach(mergedSet::add);
list2.forEach(mergedSet::add);
list3.forEach(mergedSet::add);
List result = new ArrayList<>(mergedSet);
  • 每次 add() 时间复杂度平均 O(1),整体 O(n)
  • 如果原始集合本身含大量重复,LinkedHashSet 的去重发生在插入时,比先合并再调 distinct() 更省内存
  • 注意:LinkedHashSet 不是线程安全的,多线程写入需外层同步

合并 Map 类型集合:别直接用 putAll() 忽略冲突

合并多个 Map 时,putAll() 会用后值覆盖前值。如果希望自定义冲突策略(比如保留旧值、合并 value 列表、相加数值),必须用 merge()compute()

典型错误:用 new HashMap().putAll(map1).putAll(map2),结果 map2 中同 key 的 entry 完全覆盖 map1,毫无协商余地。

Map merged = new HashMap<>();
map1.forEach((k, v) -> merged.merge(k, v, Integer::sum));
map2.forEach((k, v) -> merged.merge(k, v, Integer::sum));
  • merge(key, value, remappingFunction):key 存在则用函数处理新旧值,不存在则直接 put
  • 如果 value 是 List,可写 (old, neo) -> { old.addAll(neo); return old; } 实现列表合并
  • 注意 remappingFunction 返回 null 会导致该 key 被移除
合并逻辑看似简单,真正容易出问题的是边界情况:空集合、null 元素、不可变集合、并发修改、冲突策略缺失。动手前先想清楚——要的是“拼起来”“去重后拼”还是“键值智能融合”,选错方法后续调试成本远高于多写两行代码。