站长资源服务器
基于linux命令提取文件夹内特定文件路径
最近需要实现自动化搜寻特定文件夹下的特定文件,并且需要分别保存文件路径与文件名。算然使用python的walk能够实现,但是感觉复杂了些。于是想看看linux自带的命令是否能完成这项工作。
环境
需要查找的目录结构如下
. |____test | |____test2.txt | |____test.py | |____test.txt | |____regex.py |____MongoDB | |____.gitignore | |____cnt_fail.py | |____db
目标一:获取所有py文件名
如果只使用find . -name '*.py'进行查找,得出的结果是包含路劲的
./test/test.py
./test/regex.py
./MongoDB/cnt_fail.py
我们只需要文件名的话可以使用linux提供的命令basename
利用basename将find的所有搜索结果进行处理我们需要使用find的参数-exec
最终的命令为:
find . -name '*.py' -exec basename {} \;
结果:
test.py
regex.py
cnt_fail.py
其中{} 用于与-exec选项结合使用来匹配所有结果,然后支取其文件名。
目标二:获得所有py文件路径,去重复,删除开头的“./”字符
linux也有获取文件路径的命令dirname
略微修改之前的命令能够显示所有文件路径
find . -name '*.py' -exec dirname {} \;
搜索结果:
./test
./test
./MongoDB
可以看到路径存在重复,linux去除重可以利用sort再添加-u参数,-u参数用于去除排序结果中的重复项
我们需要把上一个命令的输出传递给sort作为输入,很自然想到了管道
管道命令操作符是:|,它仅能处理经由前面一个指令传出的正确输出信息,也就是 standard output 的信息,对于 stdandard
error 信息没有直接处理能力。然后,传递给下一个命令,作为标准的输入 standard input.
添加sort之后的命令为
find . -name '*.py' -exec dirname {} \; | sort -u
运行结果结果为:
./MongoDB
./test
最后我们再利用cut删除每一个路劲之前的./字符,参数-c3-意思提取字符串(起始位置为1)的第3个字符到最后的子串
最终命令为:
find . -name '*.py' -exec dirname {} \; | sort -u | cut -c3-
运行结果:
MongoDB
test
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。