当前位置:
首页 > Python基础教程 >
-
python遍历文件目录、批量处理同类文件
原文链接:https://blog.csdn.net/qq_33515733/ar在Python中,遍历文件目录并批量处理同类文件是一个常见的需求。这可以通过结合`os`模块(用于处理文件和目录)和`glob`模块(用于查找符合特定规则的文件路径名)来实现。下面是一个基本的示例,展示如何遍历一个目录中的所有`.txt`文件,并对它们执行一些简单的批量处理(例如,打印文件名和文件大小)。
### 使用`os`模块遍历
虽然`os`模块本身不提供直接按文件类型筛选的功能,但你可以结合`os.listdir()`和`os.path.join()`以及`os.path.splitext()`来遍历目录并检查文件扩展名。
### 使用`glob`模块
`glob`模块提供了一个函数`glob()`,该函数根据规则查找所有匹配特定规则的文件路径名,使得按文件类型筛选变得更加直接和方便。
### 进阶:批量处理文件内容
如果你需要读取并处理文件的内容(例如,读取文本文件中的每一行,修改它们,然后写回文件),你可以结合使用`open()`函数进行文件的读写操作。
请注意,对于大型文件,这种“读取整个文件,修改,然后写回”的方法可能不是最高效的,因为它会占用大量内存。在这种情况下,你可能需要考虑使用逐行读取和写入的方法来减少内存使用。
最后,如果你对python语言还有任何疑问或者需要进一步的帮助,请访问https://www.xin3721.com 本站原创,转载请注明出处:https://www.xin3721.com/Python/python49887.html
### 使用`os`模块遍历
虽然`os`模块本身不提供直接按文件类型筛选的功能,但你可以结合`os.listdir()`和`os.path.join()`以及`os.path.splitext()`来遍历目录并检查文件扩展名。
import os
def process_txt_files(directory):
for filename in os.listdir(directory):
if filename.endswith(".txt"): # 检查文件扩展名
file_path = os.path.join(directory, filename)
# 假设的批量处理:打印文件名和文件大小
print(f"文件名: {filename}, 文件大小: {os.path.getsize(file_path)} 字节")
# 调用函数
process_txt_files("/path/to/your/directory")
def process_txt_files(directory):
for filename in os.listdir(directory):
if filename.endswith(".txt"): # 检查文件扩展名
file_path = os.path.join(directory, filename)
# 假设的批量处理:打印文件名和文件大小
print(f"文件名: {filename}, 文件大小: {os.path.getsize(file_path)} 字节")
# 调用函数
process_txt_files("/path/to/your/directory")
### 使用`glob`模块
`glob`模块提供了一个函数`glob()`,该函数根据规则查找所有匹配特定规则的文件路径名,使得按文件类型筛选变得更加直接和方便。
import glob
def process_txt_files_with_glob(directory):
# 使用glob匹配目录中的所有.txt文件
for file_path in glob.glob(os.path.join(directory, "*.txt")):
# 假设的批量处理:打印文件名和文件大小
print(f"文件名: {os.path.basename(file_path)}, 文件大小: {os.path.getsize(file_path)} 字节")
# 调用函数
process_txt_files_with_glob("/path/to/your/directory")
def process_txt_files_with_glob(directory):
# 使用glob匹配目录中的所有.txt文件
for file_path in glob.glob(os.path.join(directory, "*.txt")):
# 假设的批量处理:打印文件名和文件大小
print(f"文件名: {os.path.basename(file_path)}, 文件大小: {os.path.getsize(file_path)} 字节")
# 调用函数
process_txt_files_with_glob("/path/to/your/directory")
### 进阶:批量处理文件内容
如果你需要读取并处理文件的内容(例如,读取文本文件中的每一行,修改它们,然后写回文件),你可以结合使用`open()`函数进行文件的读写操作。
import os
def modify_txt_files(directory):
for filename in os.listdir(directory):
if filename.endswith(".txt"):
file_path = os.path.join(directory, filename)
with open(file_path, 'r+', encoding='utf-8') as file:
lines = file.readlines()
# 假设的批量处理:在每行前添加"已处理: "
modified_lines = [f"已处理: {line}" for line in lines]
# 回到文件开头并清空文件
file.seek(0)
file.truncate()
# 写入修改后的内容
file.writelines(modified_lines)
# 调用函数
modify_txt_files("/path/to/your/directory")
def modify_txt_files(directory):
for filename in os.listdir(directory):
if filename.endswith(".txt"):
file_path = os.path.join(directory, filename)
with open(file_path, 'r+', encoding='utf-8') as file:
lines = file.readlines()
# 假设的批量处理:在每行前添加"已处理: "
modified_lines = [f"已处理: {line}" for line in lines]
# 回到文件开头并清空文件
file.seek(0)
file.truncate()
# 写入修改后的内容
file.writelines(modified_lines)
# 调用函数
modify_txt_files("/path/to/your/directory")
请注意,对于大型文件,这种“读取整个文件,修改,然后写回”的方法可能不是最高效的,因为它会占用大量内存。在这种情况下,你可能需要考虑使用逐行读取和写入的方法来减少内存使用。
最后,如果你对python语言还有任何疑问或者需要进一步的帮助,请访问https://www.xin3721.com 本站原创,转载请注明出处:https://www.xin3721.com/Python/python49887.html
栏目列表
最新更新
详解MyBatis延迟加载是如何实现的
IDEA 控制台中文乱码4种解决方案
SpringBoot中版本兼容性处理的实现示例
Spring的IOC解决程序耦合的实现
详解Spring多数据源如何切换
Java报错:UnsupportedOperationException in Col
使用Spring Batch实现批处理任务的详细教程
java中怎么将多个音频文件拼接合成一个
SpringBoot整合ES多个精确值查询 terms功能实
Java使用poi生成word文档的简单实例
计算机二级考试MySQL常考点 8种MySQL数据库
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
uniapp/H5 获取手机桌面壁纸 (静态壁纸)
[前端] DNS解析与优化
为什么在js中需要添加addEventListener()?
JS模块化系统
js通过Object.defineProperty() 定义和控制对象
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比