文件操作

当前位置:
首页 > temp > python入门教程 >

文件操作
	文件操作
	　　计算机系统分为：计算机硬件，操作系统，应用程序三部分。 我们用python或其他语言编写的应用程序若想要把数据永久保存下来，必须要保存于硬盘中，这就涉及到应用程序要操作硬件，众所周知，应用程序是无法直接操作硬件的，这就用到了操作系统。操作系统把复杂的硬件操作封装成简单的接口给用户/应用程序使用，其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念，用户或应用程序通过操作文件，可以将自己的数据永久保存下来。有了文件的概念，我们无需再去考虑操作硬盘的细节，只需要关注操作文件的流程：

	一、打开文件
	"""

	1、由应用程序向操作系统发起系统调用open(...)

	2、操作系统打开该文件，并返回一个文件句柄给应用程序

	3、应用程序将文件句柄赋值给变量f

	文件句柄 = open('文件路径', '模式','编码')

	"""

	#1. 打开文件，得到文件句柄并赋值给一个变量

	f=open('a.txt','r',encoding='utf-8') # 默认打开模式就为r

	#2. 通过句柄对文件进行操作

	con = f.read()

	print(con)

	#3. 关闭文件

	f.close()

	"""

	注意：

	1、回收操作系统级打开的文件f.close()

	2、编码

	f=open(...)是由操作系统打开文件，如果没为open指定编码，操作系统会用自己的默认编码去打开文件，

	在windows下是gbk，在linux下是utf-8

	"""

	#防止忘记不关闭文件推荐用with

	with open('a.txt','a+',encoding='utf-8') as f:

	    con = f.write('99999999')

	    print(con)

		二、打开模式
		1、文本模式(默认)
			r，只读模式【默认模式，文件必须存在，不存在则抛出异常】

			w，只写模式【不可读；不存在则创建；存在则清空内容】

			a，追加写模式【不可读；不存在则创建；存在则只追加内容】

		2、字节模式(对于非文本文件,图片，视频，这种模式无需考虑文本文件的字符编码)
			rb，只读模式【默认模式，文件必须存在，不存在则抛出异常】

			wb，只写模式【不可读；不存在则创建；存在则清空内容】

			ab，追加写模式【不可读；不存在则创建；存在则只追加内容】

		3、读写
			r+，读写【可读，可写】从文件开头写入

			w+，写读【可读，可写】清空后再写

			a+，写读【可读，可写】从文件末尾写入

		三、操作方法
			f.read() #读取所有内容,光标移动到文件末尾

			f.readline() #读取一行内容,光标移动到第二行首部

			f.readlines() #读取每一行内容,存放于列表中，返回一个list

			f.write('1111\n222\n') #针对文本模式的写,需要自己写换行符

			f.write('1111\n222\n'.encode('utf-8')) #针对b模式的写,需要自己写换行符

			f.writelines(['333\n','444\n']) #文件模式

			f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式

			f.flush() #立刻将文件内容从内存刷到硬盘

			f.readable() #文件是否可读

			f.writable() #文件是否可读

			f.closed #文件是否关闭

			f.encoding #如果文件打开模式为b,则没有该属性

		四、光标操作
			f.tell() 读取指针的位置

			f.seek(0) 设置指针的位置

			truncate是截断文件，所以文件的打开方式必须可写，但是不能用w或w+等方式打开，因为那样直接清空文件了，所以truncate要在r+或a或a+等模式下测试效果

			read(3) 文件打开方式为文本模式时，代表读取3个字符,文件打开方式为b模式时，代表读取3个字节

			seek，tell，truncate光标移动都是以字节为单位

			seek有三种移动方式0，1，2，其中1和2必须在b模式下进行，但无论哪种模式，都是以bytes为单位移动的

		五、文件的修改
		文件的数据是存放于硬盘上的，因而只存在覆盖、不存在修改这么一说，我们平时看到的修改文件，都是模拟出来的效果

		1、方式一
		将硬盘存放的该文件的内容全部加载到内存，在内存中是可以修改的，修改完毕后，再由内存覆盖到硬盘（word，vim，nodpad++等编辑器）

		import os

		with open('a.txt','r',encoding='utf-8') as read_f,open('.a.txt.swap','w',encoding='utf-8') as write_f:

		    data=read_f.read() #全部读入内存,如果文件很大,会很卡

		    data=data.replace('111','222') #在内存中完成修改

		    write_f.write(data) #一次性写入新文件

		os.remove('a.txt')

		os.rename('.a.txt.swap','a.txt')

			2、方式二【推荐】
			将硬盘存放的该文件的内容一行一行地读入内存，修改完毕就写入新文件，最后用新文件覆盖源文件

			import os

			with open('a.txt','r',encoding='utf-8') as read_f,open('.a.txt.swap','w',encoding='utf-8') as write_f:

			    for line in read_f:

			        line=line.replace('222','111')

			        write_f.write(line)

			os.remove('a.txt')

			os.rename('.a.txt.swap','a.txt')

				六、字节模式
				f = open('a.txt','r',encoding='utf8')

				print(f.read())

				f.close()

				f = open('a.txt','rb')

				print(f.read().decode('utf8'))

				f.close()

				f = open('a.txt','w',encoding='utf8')

				print(f.write('hello 合理'))

				f.close()

				f = open('a.txt','wb')

				print(f.write('hello 合理'.encode('utf8')))

				f.close()

				出处：https://www.cnblogs.com/Teyisang/p/13775974.html
栏目列表