python使用字节处理文件

冷漠man 2025-11-15 00:00:00 次阅读

字节模式指以二进制方式读写文件，使用 rb/wb 等模式可避免编码转换，适用于处理图像、音频等非文本文件，操作时需注意数据类型为 bytes，大文件应分块读取。

在Python中处理文件时，使用字节（bytes）模式可以更精确地操作二进制数据。这种模式适用于图像、音频、视频、压缩包等非文本文件，也用于需要避免编码问题的场景。

默认情况下，Python以文本模式打开文件，会自动进行字符编码（如UTF-8）。而以字节模式打开文件时，读取和写入的是原始字节数据，不会做任何编码转换。

通过在文件打开模式中添加 b 标志（如 rb、wb），即可进入字节模式。

以下是一些常见操作示例：

读取二进制文件：

with open('example.jpg', 'rb') as f:
data = f.read()
print(data[:10]) # 打印前10个字节

写入二进制文件：

with open('output.bin', 'wb') as f:
f.write(b'\x48\x65\x6c\x6c\x6f') # 写入"Hello"的ASCII字节

复制文件（保持原始数据）：

with open('source.png', 'rb') as src:
content = src.read()

with open('copy.png', 'wb') as dst:

dst.write(content)

在处理字节数据时，经常需要在 str 和 bytes 之间转换：

注意：对非文本数据（如图片）不能随意解码，否则会出错或损坏数据。

使用字节模式适合以下情况：

注意事项：

with open('large_file.zip', 'rb') as f:
    chunk_size = 1024
    while chunk := f.read(chunk_size):
        process(chunk) # 处理每一块数据

基本上就这些。只要记住：涉及非文本内容，就用 rb 或 wb 模式，操作的是 bytes 类型数据，就不会出错。

上一篇文章

PHP通过WebSockets实现交互式二进制程序Web界面

2025-11-15 1745次阅读

下一篇文章

2025-11-15 1329次阅读