Python文件相关操作和方法汇总大全
[db:摘要]...
前言:
Python中有多个内置模块来操作文件与目录(os、os.path、shutil、pathlib等等)。
os.path模块主要用于获取文件的属性,包含以下几种常用方法:
路径操作:
print(os.path.splitext('.info')) # ('.info', '') print(os.path.splitext('test.txt')) # ('test', '.txt') print(os.path.splitext(r'c:\tmp\test.txt')) # ('c:\\tmp\\test', '.txt')
属性操作:
方法 | 说明 |
---|---|
getatime(path) | 返回最近访问时间(浮点型秒数) |
getmtime(path) | 返回最近文件修改时间 |
getctime(path) | 返回文件创建时间 |
getsize(path) | 返回文件大小,如果文件不存在就返回错误 |
文件类型判断:
方法 | 说明 |
---|---|
isfile(path) | 判断路径是否为文件 |
isdir(path) | 判断路径是否为目录 |
islink(path) | 判断路径是否为链接 |
ismount(path) | 判断路径是否为挂载点 |
Python中读写文件非常简单,只需通过open函数以合适的方式打开,然后即可操作。
with open('data.txt', 'r', encoding='utf-8') as f: data = f.read() print('contents: {}'.format(data))
open()
用于打开一个文件,并返回文件对象(打开失败会抛出 OSError
异常);文件对象不再使用时,一定要关闭(可用with语句保证自动关闭)。
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
参数说明:
strict
:默认,编解码出错时,抛出ValueError
异常;ignore
:忽略编解码错误(可能会丢失数据);replace
:使用替换标识(如’?')替代无效数据;surrogateescape
:使用私有区编码(U+DC80 to U+DCFF)来替换错误字节;在处理未知编码文件时有效;xmlcharrefreplace
:写文件有效;错误字节被替换为XML字符(&#nnn;
);backslashreplace
:使用Python’s backslashed escape sequences
替换错误字节;namereplace
: 写文件有效;错误字节被替换为\N{...}
;打开模式Mode(t:文本;b:二进制):
文件对象的操作函数:
删除文件可以:
os.remove()/os.unlink()
复制文件:
shutil.copy(src, dst)
:把文件src复制到dst中指定的位置(若dst是文件,则该文件的内容将替换为src的内容;若dst是目录,则src将被复制到该目录中);shutil.copy2()
:会保留文件的详细信息;移动文件:
os.rename(src, dst)
:重命名文件;shutil.move(src,dst)
:将文件移动到指定的位置。有多种创建目录的方法:
方法 | 描述 |
---|---|
os.mkdir() | 创建单个子目录 |
os.makedirs() | 创建多次目录,包括中间目录 |
Pathlib.Path.mkdir() | 创建单个或多个目录 |
os.makedirs(name, mode=0o777, exist_ok=False)
若目录已存在,则抛出FileExistsError
异常;
传递exist_ok=True
,则目录存在时,不报错。
有以下删除目录的函数:
函数 | 描述 |
---|---|
os.rmdir() | 删除一个空目录 |
pathlib.Path.rmdir() | 删除一个空目录 |
shutil.rmtree() | 删除完整的目录树,可用于删除非空目录 |
rmdir在目录不为空,则引发OSError异常。
shutil.copytree()
复制整个目录及其子文件、目录。shutil.move(src,dst)
:将文件或目录移动到指定的位置。os.rename(src, dst)
:重命名文件或目录;列表,可通过:
os.scandir()
:推荐方法;返回一个包含DirEntry
迭代器;pathlib.Path()
对象的iterdir()
方法:返回包含目录对象的迭代器;os.listdir()
:遗留方法;返回一个包含子文件(夹)名的列表;with os.scandir('/tmp') as entries: for en in entries: if en.is_file(): print(en.name)
DirEntry
属性与方法:
stat_result
;os.walk()用于通过在目录树中游走输出目录中的文件名:os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])
for root, dirs, files in os.walk(r"D:\temp"): print(root, files) # D:\temp ['add.log', 'out.yml'] # D:\temp\picture ['1.jpeg'] # D:\temp\result\log ['1.log', '2.log']
获取目录列表后,要搜索和特定的模式匹配的文件:
nmatch模块主要用于文件名称的匹配,比简单的字符串匹配更强大,但比正则表达式稍弱。
fnmatch支持使用如下几个通配符:
*
:可匹配0或多个任意字符。?
:可匹配一个任意字符。[字符序列]
:可匹配字符序列中的任意字符;支持中画线表示法,如 [a-c]表示a、b和c字符中任意一个。[!字符序列]
:可匹配不在字符序列中的任意字符。for name in os.listdir('/tmp'): if fnmatch.fnmatch(name, 'log-*.txt'): print(name)
glob模块中的glob()返回所有匹配的文件路径列表;iglob()与glob基本相同,只是返回的是迭代器(非列表)。glob.glob(pathname, *, recursive=False)
参数说明:
* ? []
;**
会匹配零或多层目录及子目录。如获取当前目录及其子目录下的所有py文件:
# files = glob.iglob(r"D:\temp\**\*.log", recursive=True) files = glob.iglob(r"**\*.py", recursive=True) for f in files: print(f) ## 返回文件中包含匹配的路径; # log的返回为: # D:\temp\add.log # D:\temp\result\result.log # D:\temp\result\log\test2022.log # py的返回为 # main.py # files\file_handle.py
tempfile模块用于创建临时文件和目录(程序停止运行后会自动删除这些临时文件),创建位置依次为:
C:\TEMP
,C:\TMP
,当前目录;/tmp
,/var/tmp
,/usr/tmp
,当前目录;with tempfile.TemporaryFile('w+t') as fp: fp.write('Hello world!') fp.seek(0) fp.read() # 此处,文件已被删除 tmp = '' with tempfile.TemporaryDirectory() as tmpdir: print('Created temporary directory ', tmpdir) tmp = tmpdir print(os.path.exists(tmpdir)) # 此处,目录已被删除
到此这篇关于Python文件相关操作和方法汇总大全的文章就介绍到这了,更多相关Python文件操作内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
当前非电脑浏览器正常宽度,请使用移动设备访问本站!