在Java中如何使用HashMap存储键值对_Java哈希映射基础解析

HashMap初始化建议指定初始容量以避免频繁扩容;put()通过hashCode()和equals()处理重复key;遍历优先用entrySet();多线程场景须用ConcurrentHashMap等线程安全替代方案。

HashMap 初始化时要不要指定初始容量

不指定初始容量通常没问题,但频繁 put 会导致多次扩容,触发 resize(),带来额外的数组复制和 rehash 开销。尤其当预估键值对数量 > 16 时,建议显式设置。

  • 初始容量应设为大于等于预期元素数的最小 2 的幂(如预期 100 个,用 128
  • 构造时传入容量和负载因子: new HashMap(128, 0.75f)
  • 负载因子太小(如 0.5f)会提前扩容,浪费内存;太大(如 0.9f)会增加哈希冲突概率,拉长链表或红黑树查找时间

put() 方法如何处理 key 重复

put() 会调用 key 的 hashCode() 定位桶位置,再用 equals() 判断是否已存在相同 key。若存在,新 value 覆盖旧 value,并返回旧值;否则插入新节点。

  • 自定义类作 key 时,必须重写 hashCode()equals(),且逻辑保持一致
  • key 为 null 是合法的,HashMap 允许一个 null key(存放在桶索引 0 的位置)
  • 如果只重写 hashCode() 不重写 equals(),可能导致“明明相等却查不到”的问题

遍历 HashMap 的三种常用方式及性能差异

推荐优先使用 entrySet() 遍历,它一次性获取键值对,避免重复查 hash 表;keySet() + get() 是最慢的,每次 get() 都要重新计算 hash 并查找。

Map map = new HashMap<>();
// ✅ 推荐:一次定位,键值都拿到
for (Map.Entry entry : map.entrySet()) {
    System.out.println(entry.getKey() + "=" + entry.getValue());
}

// ⚠️ 可用但低效:keySet() 遍历再 get,多一次 hash 查找
for (String key : map.keySe

t()) { System.out.println(key + "=" + map.get(key)); } // ✅ 也可用(Java 8+):函数式风格,适合过滤/映射 map.forEach((k, v) -> System.out.println(k + "=" + v));

HashMap 是线程不安全的,什么情况下会出问题

多线程同时 put() 可能触发并发扩容,导致链表成环(JDK 7)或数据丢失(JDK 8+),进而引发死循环或 get() 返回 null。这不是偶发 bug,而是确定性风险。

  • 单线程场景完全放心用 HashMap
  • 多线程读多写少 → 用 Collections.synchronizedMap(new HashMap())(加了全表锁,吞吐低)
  • 多线程读写均衡 → 直接用 ConcurrentHashMap(分段锁 / CAS + synchronized,性能好得多)
  • 绝对不要在多线程中裸用 HashMap,哪怕只是“暂时没出问题”
实际用 HashMap 时,最容易被忽略的是 key 的 hashCode() 稳定性——如果 key 对象在放入后修改了影响 hashCode()equals() 的字段,后续就再也 get() 不到了。这点比线程安全更隐蔽,也更常踩坑。