首页 > Python基础教程 >
-
如何使用python iter方法读取文件
什么是 iter()?
iter() 是 Python 内置的一个函数,用来返回一个迭代器。迭代器是一种对象,允许你逐个访问其元素,而无需一次性将所有元素加载到内存中。当我们把 iter() 应用于文件对象时,它可以让我们逐行读取文件内容。
iter() 的基本语法:
iter(object[, sentinel])
object:需要转换为迭代器的对象,可以是可迭代对象(如列表、字符串)或自定义对象。
sentinel(可选):用于配合函数生成迭代器,直到函数返回 sentinel 值时停止迭代。
使用 iter() 逐行读取文件
# 逐行读取文件内容
with open('example.txt', 'r') as file:
for line in iter(file):
print(line.strip()) # 输出每行内容
使用 iter() 和自定义结束标记
iter() 还可以结合自定义的结束标记(sentinel)使用。在处理一些自定义读取逻辑时,iter() 可以根据我们提供的条件结束迭代。这种方式通常用于从文件中读取固定的块或分段数据,直到遇到特定标记为止。
示例:使用 iter() 和自定义标记
def read_chunk(file_obj, chunk_size):
return file_obj.read(chunk_size)
with open('example.txt', 'r') as file:
for chunk in iter(lambda: read_chunk(file, 10), ''): # 每次读取 10 字符
print(chunk)
iter() 与其他读取文件方法的对比
iter() 并不是唯一一种读取文件的方式,我们来对比它与其他常用文件读取方法的优劣。
read() 方法
file.read() 一次性读取整个文件,适用于小文件。
with open('example.txt', 'r') as file:
content = file.read()
print(content)
优点:代码简单,可以一次性获取文件所有内容。
缺点:如果文件过大,可能导致内存溢出,尤其是几 GB 或更大的文件。
readline() 方法
file.readline() 每次读取文件的一行,直到遇到文件末尾。
with open('example.txt', 'r') as file:
while True:
line = file.readline()
if not line:
break
print(line.strip())
优点:逐行读取,适合大文件,节省内存。
缺点:相比 iter(),代码略显冗长,且必须手动处理文件结束条件。
readlines() 方法
file.readlines() 一次性读取所有行,并返回一个包含每行内容的列表。
with open('example.txt', 'r') as file:
lines = file.readlines()
for line in lines:
print(line.strip())
优点:可以直接获取文件所有行的列表,适合小文件。
缺点:与 read() 类似,对于大文件,它会将所有内容加载到内存中,内存占用较大。
iter() 方法
with open('example.txt', 'r') as file:
for line in iter(file):
print(line.strip())
优点:简单高效,逐行读取,内存占用少。可以与 for 循环结合,代码更简洁,不需要显式处理文件结束条件。
缺点:相比于 read(),在某些场景下可能需要额外处理数据,比如处理多行同时读取的情况。
到此这篇关于使用python iter方法读取文件的文章就介绍到这了,更多相关python读取文件内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
原文链接:https://blog.csdn.net/summerriver1/article/details/142682229