Python函数默认参数陷阱_可变参数问题详解【教程】_技术教程

Python函数默认参数若为可变对象（如[]、{}）会在多次调用间共享同一对象，导致状态残留；正确做法是用None作默认值并在函数内初始化。

Python 函数的默认参数在函数定义时只被初始化一次，不是每次调用都新建。如果默认参数是可变对象（如 []、{}、set()），后续调用会复用同一个对象，导致“状态残留”。

常见错误现象：append() 多次调用后元素不断累积，而不是每次都从空列表开始。

错误写法：

def add_item(item, items=[]):
    items.append(item)
    return items

正确写法：

def add_item(item, items=None):
    if items is None:
        items = []
    items.append(item)
    return items

因为 None 是单例，不可变，且语义明确表示“未传值”，不会和业务数据冲突（比如你总不能把 None 当作合法输入项塞进列表里）。

若必须支持 None 作为合法输入，改用哨兵对象：

_sentinel = object()
def func(val=_sentinel):
    if val is _sentinel:
        val = []  # 实际默认行为

*args 和 **kwargs 本身是新创建的元组和字典，不共享状态，所以不会“记住上次”。但它们和默认参数混用时，位置和关键字参数的解析规则容易出错。

函数签名必须是：def f(a, b=1, *args, c=2, **kwargs) —— *args 后的关键字参数叫“仅关键字参数”，必须显式传名
错误调用：f(1, 2, 3, 4) 中的 4 会被塞进 *args，而 c 仍用默认值；想传 c=4 必须写成 f(1, 2, 3, c=4)
如果函数内部修改了 **kwargs 的值（比如 kwargs.setdefault('timeout', 30)），不影响调用方的原始字典，但会影响本次执行中后续逻辑

最直接的办法：打印默认参数对象的 id()，看多次调用是否一致。

加一句日志：

def bad_example(items=[]):
    print(f"items id: {id(items)}")  # 每次调用都输出相同数字
    items.append("x")
    return items

在 IDE 调试器中把鼠标悬停在变量上，观察其内存地址是否变化
单元测试要覆盖多次调用：assert add_item(1) == [1]；assert add_item(2) == [2] —— 第二个断言在错误实现下会失败
这个陷阱往往在压力测试或长周期服务中才暴露，本地单次运行很难复现

真正麻烦的不是写错，而是它看起来“好像能跑通”——直到某天用户批量提交数据，或者服务跑了三天后列表突然膨胀到几万项。

Python函数默认参数陷阱_可变参数问题详解【教程】