python如何生成tar文件内容

Python用tarfile模块可创建tar、tar.gz、tar.bz2等归档文件;通过tarfile.open()以"w"、"w:gz"等模式打开,add()添加文件目录,addfile()写入内存内容,filter参数可过滤排除项。

Python 用 tarfile 模块可以轻松创建(生成)tar 归档文件,支持纯 tar、tar.gz、tar.bz2 等格式。核心是使用 tarfile.open() 以写入模式打开归档,再用 add()addfile() 添加文件或目录。

基础:创建一个普通 tar 文件

最简单的方式是把一个本地目录或单个文件打包成 .tar

import tarfile

创建 tar 文件(不压缩)

with tarfile.open("archive.tar", "w") as tar: tar.add("my_folder/") # 添加整个文件夹

或 tar.add("file.txt") # 添加单个文件

✅ 注意:"w" 表示未压缩的 tar;路径会保留相对结构,建议用相对路径避免绝对路径问题。

带压缩:生成 tar.gz 或 tar.bz2

只需改写入模式即可自动启用对应压缩算法:

  • "w:gz" → 生成 .tar.gz(需 zlib 支持,Python 默认内置)
  • "w:bz2" → 生成 .tar.bz2(需 bz2 模块)
  • "w:xz" → 生成 .tar.xz(需 lzma,Python 3.3+ 内置)

示例:

with tarfile.open("archive.tar.gz", "w:gz") as tar:
    tar.add("data/", arcname="data")  # arcname 可重命名归档内路径

精细控制:添加内存中的内容(不依赖磁盘文件)

如果想把字符串或字节内容直接写入 tar(比如日志、配置片段),可构造 TarInfo 并用 addfile()

import tarfile
from io import BytesIO

content = b"Hello from memory!\n" tarinfo = tarfile.TarInfo("message.txt") tarinfo.size = len(content)

with tarfile.open("in_memory.tar", "w") as tar: tar.addfile(tarinfo, fileobj=BytesIO(content))

⚠️ 注意:必须手动设置 size,且 fileobj 必须是类文件对象(如 BytesIO),且只读取一次。

排除文件 / 过滤内容

通过 filter 参数可动态控制哪些项加入归档:

def exclude_pyc(tarinfo):
    if tarinfo.name.endswith(".pyc") or "__pycache__" in tarinfo.name:
        return None  # 排除该项
    return tarinfo

with tarfile.open("clean.tar", "w") as tar: tar.add("src/", filter=exclude_pyc)

这个函数接收每个待添加项的 TarInfo 对象,返回 None 即跳过,返回原对象或修改后的对象则正常加入。