python遍历文件目录、批量处理同类文件

当前位置:

首页 > Python基础教程 >

python遍历文件目录、批量处理同类文件

原文链接：https://blog.csdn.net/qq_33515733/ar在Python中，遍历文件目录并批量处理同类文件是一个常见的需求。这可以通过结合`os`模块（用于处理文件和目录）和`glob`模块（用于查找符合特定规则的文件路径名）来实现。下面是一个基本的示例，展示如何遍历一个目录中的所有`.txt`文件，并对它们执行一些简单的批量处理（例如，打印文件名和文件大小）。

### 使用`os`模块遍历

虽然`os`模块本身不提供直接按文件类型筛选的功能，但你可以结合`os.listdir()`和`os.path.join()`以及`os.path.splitext()`来遍历目录并检查文件扩展名。

import os

def process_txt_files(directory):
    for filename in os.listdir(directory):
        if filename.endswith(".txt"): # 检查文件扩展名
            file_path = os.path.join(directory, filename)
            # 假设的批量处理：打印文件名和文件大小
            print(f"文件名: {filename}, 文件大小: {os.path.getsize(file_path)} 字节")

# 调用函数
process_txt_files("/path/to/your/directory")

### 使用`glob`模块

`glob`模块提供了一个函数`glob()`，该函数根据规则查找所有匹配特定规则的文件路径名，使得按文件类型筛选变得更加直接和方便。

import glob

def process_txt_files_with_glob(directory):
    # 使用glob匹配目录中的所有.txt文件
    for file_path in glob.glob(os.path.join(directory, "*.txt")):
        # 假设的批量处理：打印文件名和文件大小
        print(f"文件名: {os.path.basename(file_path)}, 文件大小: {os.path.getsize(file_path)} 字节")

# 调用函数
process_txt_files_with_glob("/path/to/your/directory")

### 进阶：批量处理文件内容

如果你需要读取并处理文件的内容（例如，读取文本文件中的每一行，修改它们，然后写回文件），你可以结合使用`open()`函数进行文件的读写操作。

import os

def modify_txt_files(directory):
    for filename in os.listdir(directory):
        if filename.endswith(".txt"):
            file_path = os.path.join(directory, filename)
            with open(file_path, 'r+', encoding='utf-8') as file:
                lines = file.readlines()
                # 假设的批量处理：在每行前添加"已处理: "
                modified_lines = [f"已处理: {line}" for line in lines]
                # 回到文件开头并清空文件
                file.seek(0)
                file.truncate()
                # 写入修改后的内容
                file.writelines(modified_lines)

# 调用函数
modify_txt_files("/path/to/your/directory")

请注意，对于大型文件，这种“读取整个文件，修改，然后写回”的方法可能不是最高效的，因为它会占用大量内存。在这种情况下，你可能需要考虑使用逐行读取和写入的方法来减少内存使用。

最后，如果你对python语言还有任何疑问或者需要进一步的帮助，请访问https://www.xin3721.com 本站原创，转载请注明出处：https://www.xin3721.com/Python/python49887.html

栏目列表