脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|shell|

服务器之家 - 脚本之家 - Python - Python基于文件内容实现查找文件功能

Python基于文件内容实现查找文件功能

2022-12-20 12:46渴望力量的哈士奇 Python

无论是Linux系统还是Windows系统都有基于文件名实现过滤、查找的功能。但是如果想要查找一些关于某些文件指定内容的文件,好像它们明面上没有这样的功能了。这个时候就可以通过 Python 来实现这样的功能,快跟随小编一起学习一

该章节将学习关于文件查找的操作,大家都知道,无论是 Linux 系统还是 Windows 系统都有基于文件名实现过滤、查找的功能。但是如果想要查找一些关于某些文件指定内容的文件,好像无论是 Linux 还是 Windows 明面上没有这样的功能了。这个时候就可以通过 Python 来实现这样的功能,通过该章节的学习,就可以学习到该功能的如何利用 Python 实现这样的操作。

文件查找操作

glob 的介绍

glob 包是一个快速查找文件夹中内容的包,可以通过模糊查找的形式找到我们想要的内容。

glob 的基本使用

导入包与模块

?
1
from glob import glob

使用方法

glob(任意目录)

返回内容:

指定路径下的内容列表,不存在的路径返回空列表。

代码示例如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# coding:utf-8
 
import os
from glob import glob
 
target = os.getcwd()
 
result = glob(target)
print(result)                   # 打印输出当前路径的文件夹
 
result = glob(target + '/*')
print(result)                   # 打印输出当前路径的文件夹下的所有文件
 
result = glob(target + '/*.py')
print(result)                   # 打印输出当前路径的文件夹下的所有以 "py" 结尾的文件
 
result = glob(target + '/*.zip')
print(result)                   # 打印输出当前路径的文件夹下的所有以 "zip" 结尾的文件
 
result = glob(target + '/filetest*')
print(result)                   # # 打印输出当前路径的文件夹下的所有以 "filetest" 开头的文件

运行结果如下:

Python基于文件内容实现查找文件功能

查找指定的文件

已知条件:

想查找的文件名已经知道,但是目录在哪里并不知道。

实现方法:

利用 "glob" 从最上级目录开始查找,利用递归模式,不断的查找,直到找到为止。

代码示例如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
# coding:utf-8
 
import glob
 
"""
获取当前路径下所有内容
判断每个内容的类型(文件夹还是文件)
若是文件夹则继续递归查找
"""
 
path = glob.os.path.join(glob.os.getcwd(), '*')     # 获取当前文件夹下的所有内容
                                                    # glob 模块其实已经包含了 "os" 模块
final_result = []       # 定义一个空列表,用以存储 search() 函数查到的内容
 
def search(path, target):       # 定义 search() 函数,传入 "path" 文件路径, "target" 要查找的目标文件
    result = glob.glob(path)
 
    for data in result:         # for 循环判断递归查到的内容是文件夹还是文件
        if glob.os.path.isdir(data):    # 若是文件夹,继续将该文件夹的路径传给 search() 函数继续递归查找
            _path = glob.os.path.join(data, '*')
            search(_path, target)
        else:                           # 若是文件,则将该查询到的文件所在路径插入 final_result 空列表
            if target in data:
                final_result.append(data)
    return final_result
 
 
if __name__ == '__main__':
    result = search(path, target='filetest.py')
    print(result)

运行结果如下:

Python基于文件内容实现查找文件功能

基于文件内容查找文件

接下来我们看一下查找指定内容的文件:

已知条件:

文件中包含有某些关键字,但是不知道文件名和文件所在路径

实现方法:

利用 "glob" 从最上级目录开始查找,利用递归模式,不断的查找。如果是文件夹则进入继续查找,是文件则读取,判断是否包含该内容,返回该内容的文件名以及所在路径。

其实,基于文件内容查找文件实现的方式大体与上文的查找指定文件大体相似,只不过加入了读取文件的判断罢了。

代码示例如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
# coding:utf-8
 
import glob
 
"""
获取当前路径下所有内容
判断每个内容的类型(文件夹还是文件)
若是文件夹则继续递归查找
"""
 
path = glob.os.path.join(glob.os.getcwd(), '*test04')     # 因为下文捕获不可读文件格式太多,所以这里直接指定了 "test04" 路径
final_result = []       # 定义一个空列表,用以存储 search() 函数查到的内容
 
 
 
def search(path, target):       # 定义 search() 函数,传入 "path" 文件路径, "target" 要查找的目标文件
    result = glob.glob(path)
 
    for data in result:         # for 循环判断递归查到的内容是文件夹还是文件
        if glob.os.path.isdir(data):    # 若是文件夹,继续将该文件夹的路径传给 search() 函数继续递归查找
            _path = glob.os.path.join(data, '*')
            search(_path, target)
        else:                           # 若是文件,则将该查询到的文件所在路径插入 final_result 空列表
            f = open(data, 'r')         # 利用 open() 函数读取文件,并通过 try...except... 捕获不可读的文件格式(.zip 格式)
            try:
                content = f.read()
                if target in content:
                    final_result.append(data)
            except:
                print('这是不可读文件格式的文件的所在路径:{} '.format(data))
                continue
            finally:
                f.close()
    return final_result
 
 
if __name__ == '__main__':
    result = search(path, target='测试文件')
    print(result)

运行结果如下:

Python基于文件内容实现查找文件功能

到此这篇关于Python基于文件内容实现查找文件功能的文章就介绍到这了,更多相关Python文件查找内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/weixin_42250835/article/details/124621368

延伸 · 阅读

精彩推荐
  • PythonPython金融数据可视化汇总

    Python金融数据可视化汇总

    这篇文章主要介绍了Python金融数据可视化(两列数据的提取,分别画,双坐标轴,双图,两种不同的图)等内容。...

    hanbb2832020-12-18
  • Python非递归的输出1-N的全排列实例(推荐)

    非递归的输出1-N的全排列实例(推荐)

    下面小编就为大家带来一篇非递归的输出1-N的全排列实例(推荐)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧...

    脚本之家3452020-09-28
  • Python看如何用Python数据可视化来分析用户留存率,建议收藏

    看如何用Python数据可视化来分析用户留存率,建议收藏

    今天和大家来分享一些数据可视化方向的干货,我们来尝试用Python来绘制一下“漏斗图”,但愿大家在看完本篇文章之后会有所收获。...

    关于数据分析与可视化5542021-09-23
  • Pythonpytorch中常用的损失函数用法说明

    pytorch中常用的损失函数用法说明

    这篇文章主要介绍了pytorch中常用的损失函数用法说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教...

    m0_464832369032021-10-29
  • Pythonpython3人脸识别的两种方法

    python3人脸识别的两种方法

    这篇文章主要为大家详细介绍了python3人脸识别的两种方法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下...

    小满丫11212021-06-20
  • PythonPython3实现的反转单链表算法示例

    Python3实现的反转单链表算法示例

    这篇文章主要介绍了Python3实现的反转单链表算法,结合实例形式总结分析了Python基于迭代算法与递归算法实现的翻转单链表相关操作技巧,需要的朋友可以参...

    zhenghaitian11322021-06-05
  • Python浅谈pytorch、cuda、python的版本对齐问题

    浅谈pytorch、cuda、python的版本对齐问题

    今天小编就为大家分享一篇浅谈pytorch、cuda、python的版本对齐问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 ...

    fly_Xiaoma10762020-04-21
  • PythonPython使用configparser读取ini配置文件

    Python使用configparser读取ini配置文件

    这篇文章主要介绍了Python使用configparser读取ini配置文件,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可...

    十一的杂文录6172021-11-25