Java集合框架中的WeakHashMap与软引用

WeakHashMap的key是弱引用、value是强引用,GC时key被回收但value不释放,易致内存泄漏;适用于监听器映射等生命周期解耦场景,不适用于value缓存。

WeakHashMap 的 key 是弱引用,value 不是

WeakHashMap 的核心机制是:它的 key 被包装成 WeakReference 存储,而 value 是强引用。这意味着只要 key 对象没有其他强引用指向它,下一次 GC 时该 key 就会被回收,对应 entry 也会被自动清理——但 value 不会因此被释放,除非它本身也没被其他地方引用。

常见错误是以为 WeakHashMap 能“自动释放 value 内存”,结果 value 持有大对象(比如缓存的图片、解析后的 XML Document)且未手动清理,导致内存泄漏。

  • 只适合 key 是临时对象、value 很小或生命周期天然短的场景(如监听器映射、线程局部元数据)
  • 不适用于“缓存 value”的需求;要缓存 value,应考虑 SoftReference + 自定义 Map 或 ConcurrentHashMap>
  • 遍历时可能遇到 null key(已被 GC),需用 entry.getKey() != null 过滤

软引用(SoftReference)比弱引用更“懒”,但不可控

SoftReference 的回收时机由 JVM 决定,通常在内存不足(OOM 前)才触发,而 WeakReference 在下次 GC 就可能被清掉。这个“延迟回收”看似友好,实则带来两个问题:

  • 软引用不是“按需释放”,而是“等快撑爆了才甩包袱”,容易掩盖内存压力,让 OOM 来得突然
  • 不同 JVM 实现(HotSpot vs OpenJ9)对软引用的保留策略不同;HotSpot 默认按“最近使用时间 × 静态系数”估算保留时长,可通过 -XX:SoftRefLRUPolicyMSPerMB 调整,但线上环境极少动这个参数
  • 不能和 WeakHashMap 混用:WeakHashMap 内部固定用弱引用,无法替换成软引用

想实现 value 可被回收的缓存,别直接套 WeakHashMap

如果目标是“key 存在时 value 尽量留着,key 消失或内存紧张时 value 也跟着释放”,WeakHashMap 无法满足,因为它的 value 是强引用。正确做法是自己维护引用关系:

Map> cache = new ConcurrentHashMap<>();
// 存
cache.put(key, new SoftReference<>(value));
// 取
SoftReference ref = cache.get(key);
Value value = ref == null ? null : ref.get(); // 注意 get() 可能返回 null
if (value == null) {
    cache.remove(key); // 清理失效 entry
}

注意点:

  • 必须检查 ref.get() 返回值是否为 null,软引用可能已被回收
  • 要用 ConcurrentHashMap 替代 HashMap,避免多线程下 get+remove 的竞态
  • 不建议在 value 上再套一层弱引用(WeakReference),因为回收太激进,缓存命中率会断崖下跌

WeakHashMap 的迭代器不保证原子性,遍历时别改结构

WeakHashMap 的迭代器是 fail-fast 的,但它的“fail”不是因为显式修改,而是因为 GC 导致内部 table 缩容或 entry 被清除。这意味着:

  • 遍历过程中发生 GC,可能导致 ConcurrentModificationException(尤其在 G1 或 ZGC 下更频繁)
  • 即使没抛异常,也可能漏掉刚被清除的 entry,或重复看到尚未清除的 stale entry
  • 不要在 for-each 中调用 map.remove(key);若需清理,先收集 key,再批量 remove

真正需要安全遍历的场景,应复制 keySet:

for (Key key : new ArrayList<>(map.keySet())) {
    Value value = map.get(key); // 此时 key 确保未被 GC
    if (value == null || !isValid(value)) {
        map.remove(key);
    }
}

WeakHashMap 的价值不在通用缓存,而在解耦生命周期——比如 GUI 组件注册监听器时,用 WeakHashMap 存 listener → component 映射,component 销毁后无需手动反注册。这点容易被忽略:它解决的是“谁负责清理”的问题,而不是“怎么省内存”的问题。