当前位置:首页 > 资讯 > 正文

附实战代码|告别OS模块,体验Python文件操作新姿势!

附实战代码|告别OS模块,体验Python文件操作新姿势!

相比常用的 os.path而言,pathlib 对于目录路径的操作更简介也更贴近 Pythonic。但是它不单纯是为了简化操作,还有更大的用途。

pathlib 是Python内置库,Python 文档给它的定义是:The pathlib module – object-oriented filesystem paths(面向对象的文件系统路径)

pathlib 提供表示文件系统路径的类,其语义适用于不同的操作系统。

更多详细的内容可以参考官方文档:

https://docs.python.org/3/library/pathlib.html#methods


很多人学习python,不知道从何学起。
很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手。
很多已经做案例的人,却不知道如何去学习更加高深的知识。
那么针对这三类人,我给大家提供一个好的学习平台,免费领取视频教程,电子书籍,以及课程的源代码!
QQ群:1156465813

下面是获取文件名、获取文件名除后缀的部分、获取文件后缀、返回一个iterable 包含所有父目录等常用操作示例

  

运行结果如下:

  • Path.cwd()返回表示当前目录的路径对象
  • Path.home()返回表示用户主目录的路径对象
  • Path.expanduser()返回带有扩展的 ~user 构造的新路径

运行结果如下:

D:pythonpycharm2020program
C:UsersAdministrator
C:UsersAdministratorpathlib模块的基本使用.py

Path.stat()返回一个操作系统统计结果包含有关此路径的信息的对象

运行结果如下:

os.stat_result(st_mode=33206, st_ino=3659174698076635, st_dev=3730828260, st_nlink=1, st_uid=0, st_gid=0, st_size=543, st_atime=1597366826, st_mtime=1597366826, st_ctime=1597320585)
543
1597320585.7657475
1597366826.9711637
该文件创建时间:2020-08-13 20:09:45.765748
上次修改该文件的时间:2020-08-14 09:00:26.971164

从不同.stat().st_属性 返回的时间戳表示自1970年1月1日以来的秒数,可以用datetime.fromtimestamp将时间戳转换为有用的时间格式。

  • Path.exists()路径是否存在于现有文件或目录
  • Path.resolve(strict=False)将路径设为绝对路径,解析任何符号链接。返回一个新的路径对象

运行结果如下:

D:pythonpycharm2020programpathlib模块的基本使用.py
True
True True
True False
False True
True
False

  • Path.iterdir()当路径指向某个目录时,将生成该目录内容的path对象

运行结果如下:

pythonAnaconda
pythonEVCapture
pythonEvernote_6.21.3.2048.exe
pythonNotepad++
pythonpycharm-community-2020.1.3.exe
pythonpycharm2020
pythonpyecharts-assets-master
pythonpyecharts-gallery-master
pythonSublime text 3

  • Path.glob(pattern)Glob此路径表示的目录中给定的相对模式,生成所有匹配的文件(任何类型),**模式表示递归地此目录和所有子目录。换句话说,它支持递归全局化。
  • Note 在大型目录树中使用 **模式可能会耗费大量时间

递归遍历该目录下所有文件,获取所有符合pattern的文件,返回一个generator。

下面是一些常用操作的代码,拿走就用

获取该文件目录下所有.py文件

获取该文件目录下所有.jpg图片

获取给定目录下所有.txt文件、.jpg图片和.py文件

关于Path.mkdir(mode=0o777, parents=False, exist_ok=False) 的说明

  • 在给定的路径上创建一个新目录。如果指定了mode,它将与进程的umask值结合起来,以确定文件模式和访问标志。如果路径已存在,则引发FileExistsError。
  • 如果parents参数设置为True,则将根据需要创建此路径的任何缺少的父级;它们是使用默认权限创建的,而不考虑模式(模仿POSIX mkdir-p命令)。
  • 如果父项为False(默认值),则缺少父项将引发FileNotFoundError。
  • 如果exist_ok为False(默认值),则在目标目录已存在的情况下引发FileExistsError。
  • 如果exist_ok为True,则将忽略 FileExistsError 异常(与POSIX mkdir-p命令的行为相同),但仅当最后一个路径组件不是现有的非目录文件时。

在版本3.5中更改:添加了exist_ok参数。

Path.rmdir():删除此目录,目录必须为空。

  • Path.unlink()(missing_ok=False):删除此文件或符号链接。如果路径指向目录,请使用Path.rmdir()代替。如果missing_ok为False(默认值),则在路径不存在的情况下引发FileNotFoundError。如果missing_ok为true,则将忽略FileNotFoundError异常。在版本3.8中更改:添加了缺少的“确定”参数。
  • Path.rename()(target):将此文件或目录重命名为给定目标,并返回指向目标的新路径实例。在Unix上,如果目标存在并且是一个文件,如果用户有权限,它将被无提示地替换。目标可以是字符串或其他路径对象。
  • Path.open(mode='r', buffering=-1, encoding=None, errors=None, newline=None):打开路径指向的文件,就像内置的 open() 函数一样。

对于多层文件夹的读取,用os模块只能一层一层读取出文件,要写多个for循环,效率不高,这时我们可以用 Path.glob(**/*) 大法,下面以一个实际案例来体验它的强大。

用于测试的文件夹如下:

md文件中数据如下:

需要实现将该目录下所有 md 文件的数据提取出来,并进行清洗,然后写入 csv 文件中

运行效果如下:

可以看到成功将该目录下所有 md 文件的数据提取出来,并进行清洗,然后写入了 csv 文件中。


注意:如果你是打算找python高薪工作的话。我建议你多写点真实的企业项目积累经验。不然工作都找不到,当然很多人没进过企业,怎么会存在项目经验呢? 所以你得多找找企业项目实战多练习下撒。如果你很懒不想找,也可以进我的Python交流圈:1156465813。群文件里面有我之前在做开发写过的一些真实企业项目案例。你可以拿去学习,不懂都可以在裙里找我,有空会耐心给你解答下。

 

最新文章