python数据入库(glob库Python文件名的匹配)

前言

既然在Pathlib库中提到了glob()函数,那么我们就专门用一篇内容讲解文件名的匹配。其实我们有专门的一个文件名匹配库就叫:glob。

不过,glob库的API非常小,但是仅仅应用于文件名的匹配绰绰有余。只要是在实际的项目中需要过滤,或者匹配一组文件,都可以使用该库进行操作。

通配符星号(*)

话不多说,下面我们使用通配符来匹配文件名,示例如下:

import glob for name in sorted(glob.glob('text/*')): print(name)

运行之后,效果如下:

python数据入库(glob库Python文件名的匹配)(1)

这里不仅用*通配符获取了目录下的所有文件,而且还对其进行了排序。

问号(?)

问号(?)是用来匹配单字的,比如我们赛选上面1开头的图片文件。示例如下:

import glob for name in glob.glob('text/1?.png'): print(name)

运行之后,效果如下:

python数据入库(glob库Python文件名的匹配)(2)

区间匹配([0-9][a-z][A-Z])

从上面两个匹配我们看出来,glob库的匹配规则与正则表达式有些相似。既然它能匹配模糊的,一个或多个字符,那么肯定也可以匹配区间字符。

示例如下:

import glob for name in glob.glob('text/15[a-z].*'): print(name)

运行之后,效果如下:

python数据入库(glob库Python文件名的匹配)(3)

转义元字符

当然,上面的文件名都是常规的文件名,都是用字母与数字组成的。但是,有些人比较怪,可能在文件名中包含了特殊的字符,比如上面的匹配字符“?*[”等。那怎么办呢?用反斜杠“\”转义吗?

其实,我们还有更简单的,直接使用escape()函数进行操作。示例如下:

import glob escape_str='?*[]' for char in escape_str: pattern = 'text/*' glob.escape(char) '.png' for name in glob.glob(pattern): print(name)

运行之后,效果如下:

python数据入库(glob库Python文件名的匹配)(4)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页