Python用tarfile模块可创建tar、tar.gz、tar.bz2等归档文件;通过tarfile.open()以"w"、"w:gz"等模式打开,add()添加文件目录,addfile()写入内存内容,filter参数可过滤排除项。
Python 用 tarfile 模块可以轻松创建(生成)tar 归档文件,支持纯 tar、tar.gz、tar.bz2 等格式。核心是使用 tarfile.open() 以写入模式打开归档,再用 add() 或 addfile() 添加文件或目录。
基础:创建一个普通 tar 文件
最简单的方式是把一个本地目录或单个文件打包成 .tar:
import tarfile创建 tar 文件(不压缩)
with tarfile.open("archive.tar", "w") as tar: tar.add("my_folder/") # 添加整个文件夹
或 tar.add("file.txt") # 添加单个文件
✅ 注意:"w" 表示未压缩的 tar;路径会保留相对结构,建议用相对路径避免绝对路径问题。
带压缩:生成 tar.gz 或 tar.bz2
只需改写入模式即可自动启用对应压缩算法:
-
"w:gz"→ 生成.tar.gz(需 zlib 支持,Python 默认内置) -
"w:bz2"→ 生成.tar.bz2(需 bz2 模块) -
"w:xz"→ 生成.tar.xz(需 lzma,Python 3.3+ 内置)
示例:
with tarfile.open("archive.tar.gz", "w:gz") as tar:
tar.add("data/", arcname="data") # arcname 可重命名归档内路径
精细控制:添加内存中的内容(不依赖磁盘文件)
如果想把字符串或字节内容直接写入 tar(比如日志、配置片段),可构造 TarInfo 并用 addfile():
import tarfile from io import BytesIOcontent = b"Hello from memory!\n" tarinfo = tarfile.TarInfo("message.txt") tarinfo.size = len(content)
with tarfile.open("in_memory.tar", "w") as tar: tar.addfile(tarinfo, fileobj=BytesIO(content))
⚠️ 注意:必须手动设置 size,且 fileobj 必须是类文件对象(如 BytesIO),且只读取一次。
排除文件 / 过滤内容
通过 filter 参数可动态控制哪些项加入归档:
def exclude_pyc(tarinfo):
if tarinfo.name.endswith(".pyc") or "__pycache__" in tarinfo.name:
r
eturn None # 排除该项
return tarinfo
with tarfile.open("clean.tar", "w") as tar:
tar.add("src/", filter=exclude_pyc)
这个函数接收每个待添加项的 TarInfo 对象,返回 None 即跳过,返回原对象或修改后的对象则正常加入。

eturn None # 排除该项
return tarinfo







