Python函数缓存策略_lru_cache使用解析【教程】

@lru_cache适用于计算开销大、调用频繁、参数可哈希且无副作用的纯函数,如递归计算、固定配置解析;不适用含I/O、随机数或不可哈希参数的函数。

@lru_cache 是 Python 标准库 functools 中最常用、最实用的函数缓存装饰器。它基于“最近最少使用”(LRU)策略,自动缓存函数的返回值,避免重复计算,特别适合纯函数(相同输入总返回相同输出,且无副作用)。

什么时候该用 @lru_cache?

适用于:计算开销大、调用频繁、参数可哈希、结果不随外部状态变化的函数。

  • 递归函数(如斐波那契、阶乘)——避免指数级重复调用
  • 解析固定配置或 JSON 文件的函数(内容不变时,只需读一次)
  • 数值计算、字符串处理等确定性逻辑(如文本标准化、坐标转换)

不适用:含 I/O、随机数、全局变量依赖、可变参数(*args/**kwargs需谨慎)、不可哈希参数(如 list、dict)的函数。

基础用法与参数控制

最简写法:@lru_cache(),启用默认缓存(最大 128 条目,不设限用 @lru_cache(maxsize=None))。

立即学习“Python免费学习笔记(深入)”;

  • maxsize:缓存条目上限。设为 None 表示无限制;设为 0 则禁用缓存(仅用于调试对比)
  • typed:是否区分参数类型(如 f(1)f(1.0) 是否视为不同调用)。默认 False,设为 True 可提升类型敏感场景的准确性

示例:

@lru_cache(maxsize=128, typed=True)
def fibonacci(n):
    if n < 2:
        return n
    return fibonacci(n-1) + fibonacci(n-2)

缓存管理与调试技巧

缓存对象自带统计和清理方法,方便观察和干预:

  • fibonacci.cache_info() 返回命名元组:CacheInfo(hits=..., misses=..., maxsize=..., currsize=...)
  • fibonacci.cache_clear() 手动清空缓存(例如配置更新后重载)
  • 注意:缓存键由所有位置参数和关键字参数的值及顺序共同决定,且要求全部参数可哈希

若函数含不可哈希参数(如 dict),可先转为 frozenset 或 json 字符串再传入,或改用自定义缓存逻辑。

常见陷阱与规避建议

容易忽略但影响稳定性的问题:

  • 内存泄漏风险:maxsize=None + 参数组合极多 → 缓存无限增长。生产环境建议显式设合理上限
  • 未考虑线程安全:@lru_cache 本身线程安全,但若被缓存函数内部修改了共享状态,仍可能引发竞态
  • 装饰器顺序错误:若与其他装饰器(如 @staticmethod)混用,@lru_cache 必须在最内层(即离函数定义最近)
  • 类方法缓存需谨慎:实例方法会把 self 当作参数缓存,导致不同实例相互干扰。应改用 @classmethod 或对参数做脱敏处理