multiprocessing Pool.map 如何在 Windows 上传非全局函数

Windows下multiprocessing.Pool.map不支持非全局函数,因spawn方式需子进程重新导入模块,而lambda、嵌套函数和实例方法无法被pickle或不在模块顶层作用域;应将函数定义为模块级函数,或用functools.partial预设参数,或临时使用pathos替代。

在 Windows 上使用 multiprocessing.Pool.map 时,无法直接传入非全局函数(比如嵌套函数、lambda 或实例方法),因为 Windows 的 multiprocessing 默认使用 spawn 启动方式,子进程需要重新导入模块并查找函数——而嵌套函数在模块顶层不可见。

为什么非全局函数在 Windows 上会报错

Windows 不支持 fork,子进程通过重新执行 Python 解释器、导入主模块来初始化。此时:

  • lambda 和局部定义的函数没有名字,也无法被序列化(pickle 失败);
  • 嵌套函数(如 def inner(): ... 在另一个函数内)作用域受限,模块导入时不存在;
  • 实例方法(self.method)绑定在对象上,对象本身通常不可被 pickle(尤其含线程、文件句柄等)。

解决方案:把函数提升为模块级可导入函数

最稳妥的方式是将目标函数写在模块顶层(即和 if __name__ == '__main__': 平级),确保能被子进程独立导入:

✅ 正确示例:

# mymodule.py
import multiprocessing as mp

def worker(x): # 模块级函数,有明确名称,可被 pickle return x ** 2

if name == 'main': with mp.Pool() as pool: result = pool.map(worker, [1, 2, 3, 4]) print(result) # [1, 4, 9, 16]

替代方案:用 functools.partial 传递参数

若需固定部分参数(类似闭包效果),可在顶层函数中用 partial 预设:

from functools import partial
import multiprocessing as mp

def compute_power(x, base): return x ** base

if name == 'main':

创建带固定参数的可调用对象

square = partial(compute_power, base=2)

with mp.Pool() as pool:
    result = pool.map(square, [1, 2, 3, 4])
print(result)  # [1, 4, 9, 16]

不推荐但可行:用 pathos(基于 dill

pathos 替代标准 multiprocessing,用 dill 序列化(支持 lambda、嵌套函数等):

# pip install pathos
import pathos.multiprocessing as pmp

def main():

可直接用 lambda 或内部函数

with pmp.Pool() as pool:
    result = pool.map(lambda x: x * 2, [1, 2, 3])
print(result)

if name == 'main': main()

⚠️ 注意:p

athos 启动稍慢、调试困难、与标准库行为不一致,仅建议临时或原型开发使用。