Python类与对象序列化_pickle应用解析【教程】

冷炫風刃 2025-12-31 00:00:00 次阅读

pickle是Python对象序列化为二进制字节流的机制，依赖类定义存在，不支持lambda、局部类、文件句柄等；反序列化不可信数据有安全风险，推荐json/msgpack跨语言、dill/joblib替代。

Python 的 pickle 模块是实现类与对象序列化的最直接方式，但它不是万能的“黑箱”，用对了省时省力，用错了会报错、丢数据甚至引发安全风险。

pickle 不是把对象转成 JSON 那样的文本格式，而是将 Python 对象的状态（包括类型、属性值、引用关系）原样封存为二进制字节流。它专为 Python 生态设计，反序列化时必须能重新导入原始类定义。

例如有一个简单类：

class Person:
  def __init__(self, name, age):
    self.name = name
    self.age = age

创建实例 p = Person("Alice", 30) 后，用 pickle.dumps(p) 得到一串字节；再用 pickle.loads(字节) 就能还原出完全相同的对象（前提是运行环境中已定义 Person 类）。

pickle 无法处理以下几类内容，遇到就会抛 AttributeError 或 PicklingError：

如果类中包含不可 pickle 的属性（如临时缓存或 socket），可重写 __getstate__ 方法，返回一个剔除这些字段的字典。

pickle 反序列化过程会执行任意代码（如调用 __reduce__ 返回的构造逻辑），恶意构造的字节流可能删除文件、启动进程。生产环境绝对禁止用 pickle.loads() 解析来自用户、网络或外部文件的输入。

替代方案推荐：

最常用模式是搭配 open(..., "wb") 和 open(..., "rb")：

# 保存
with open("person.pkl", "wb") as f:
pickle.dump(p, f)

# 加载
with open("person.pkl", "rb") as f:
p2 = pickle.load(f)

注意：多个对象可连续 pickle.dump() 到同一文件，读取时也需按顺序多次 pickle.load()；若想一次存多个，建议先放进列表再 dump。

不复杂但容易忽略：版本兼容性。不同 Python 版本的 pickle 协议默认不同（如 Python 3.8 默认 protocol=4），低版本可能无法加载高版本生成的文件。显式指定协议可提升兼容性：pickle.dump(obj, f, protocol=4)。

上一篇文章

Python配置文件加载_多环境适配解析【教程】

2025-12-31 484次阅读

下一篇文章

2025-12-31 1185次阅读