Python在后台自动解压各种压缩文件的实现方法
1.需求描述
编写一个Python程序,每次下载压缩包形式的文件后,自动将内部文件解压到当前文件夹后将压缩包删除,通过本案例可以学到的知识点:
- os模块综合应用
- glob模块综合应用
- 利用gzipzipfilerarfiletarfile模块解压文件
2.步骤分析和前置知识
码代码之前需要将复杂问题解释成多个明确的要求,即这个程序实现的逻辑为:
- 定时检测某个文件夹(如download文件夹)是否存在压缩文件
- 如果有新出现的压缩文件则将其解压到当前文件夹内的新文件夹中删除压缩文件
- 提到压缩文件就要分不同压缩格式进行讨论,主要有以下4种:
提到压缩文件就要分不同压缩格式进行讨论,主要有以下4种:
.gz:即gzip,通常只能压缩一个文件
.tar:本质上不是压缩工具而是打包工具,可以跟.gz配合形成.tar.gz的打包压缩格式.zip:和.tar.gz很类似但可以打包压缩多个文件
.rar:打包压缩文件,最初用于DOS
因此,文件是否为压缩文件的判断逻辑可以如下:
- 建立一个含压缩包后缀的列表compressed_lst=['gz','tar','zip','rar']
- 目标文件夹下的所有文件名运行filename.split(.)[-1]获取后缀名
- 判断后缀名是否在compressed_lst中,如果存在则运行后续的解压代码
- 如果是以gz结尾的文件,解压后需要再次判断是否是以.tar结尾,并进行相应处理
不同压缩文件的解压代码各不相同,在后续代码操作中具体展开。
3.代码实现
首先是获取download文件夹下所有文件的文件名
importglob importos path=r'C:\xxxx\download' file_lst=glob.glob(path+'/*') #列表推导式 filename_lst=[os.path.basename(i)foriinfile_lst] print(filename_lst)
接下来根据文件的后缀名判断是否需要压缩,先看一下代码框架
foriinfilename_lst: if'.'ini: #获取后缀名 suffix=i.split('.')[-1] #逐个将后缀名和各格式的压缩后缀匹配 ifsuffix=='gz': pass if...:#再次判断新产生的文件名是否以.tar结尾 pass ifsuffix=='tar': pass ifsuffix=='zip': pass ifsuffix=='rar': pass
这里有2个注意点:
有些文件没有后缀名,因此可能不存在.,这时用filename.split('.')[-1]会报错,因此需要先判断
以.gz结尾的文件,解压后需要再次判断是否是以.tar结尾,然后我们就可以分别将四种压缩文件的解压代码写成函数,符合时候单独调用即可
1、处理.gz文件
importgzip defungz(filename): filename=filename[:-3]#gz文件的单文件解压就是去掉filename后面的.gz gz_file=gzip.GzipFile(filename) withopen(filename,"w+")asfile: file.write(gz_file.read()) returnfilename#这个gzip的函数需要返回值以进一步配合untar函数
前面反复提及的gz文件有可能跟tar文件配合,因此解压gz文件后需要再判断是否有必要解开tar文件
这里就可以先把tar文件的函数写出来
2、处理.tar文件
importtarfile defuntar(filename): tar=tarfile.open(filename) names=tar.getnames() #tar本身是将文件打包,解除打包会产生很多文件,因此需要建立文件夹存放 ifnotos.path.isdir(filename+"_dir"): os.mkdir(filename+"_dir") fornameinnames: tar.extract(name,filename+"_dir/") tar.close()
3、处理.zip文件
importzipfile defunzip(filename): zip_file=zipfile.ZipFile(filename) #类似tar解除打包,建立文件夹存放解压的多个文件 ifnotos.path.isdir(filename+"_dir"): os.mkdir(filename+"_dir") fornamesinzip_file.namelist(): zip_file.extract(names,filename+"_dir/") zip_file.close()
4、处理.rar文件
importrarfile defunrar(filename): rar=rarfile.RarFile(filename) ifnotos.path.isdir(filename+"_dir"): os.mkdir(filename+"_dir") os.chdir(filename+"_dir") rar.extractall() rar.close()
可以看到,四种解压代码略有不同,推荐大家实际演示中自己体会一下差别,解压后配合os.remove()就可以删除压缩包,现在看看逻辑框架补上解压函数后的内容:
forfilenameinfilename_lst: if'.'infilename: suffix=filename.split('.')[-1] ifsuffix=='gz': new_filename=ungz(filename) os.remove(filename) ifnew_filename.split('.')[-1]=='tar': untar(new_filename) os.remove(new_filename) ifsuffix=='tar': untar(filename) os.remove(filename) ifsuffix=='zip': unzip(filename) os.remove(filename) ifsuffix=='rar': unrar(filename) os.remove(filename)
5、实现实时检测
比较简单的方法就是建立whileTrue死循环配合time.sleep()睡眠,框架如下:
importtime whileTrue: func() time.sleep(5)#睡眠秒数可以设置大一点避免过度占用资源
最后将第二步的实现代码改为函数并放在循环框架中就可以完成本次需求,完整代码如下
importglob importos importgzip importtarfile importzipfile importrarfile importtime path=r'C:\xxxx\download' file_lst=glob.glob(path+'/*') filename_lst=[os.path.basename(i)foriinfile_lst] defungz(filename): filename=filename[:-3] gz_file=gzip.GzipFile(filename) withopen(filename,"w+")asfile: file.write(gz_file.read()) returnfilename defuntar(filename): tar=tarfile.open(filename) names=tar.getnames() ifnotos.path.isdir(filename+"_dir"): os.mkdir(filename+"_dir") fornameinnames: tar.extract(name,filename+"_dir/") tar.close() defunzip(filename): zip_file=zipfile.ZipFile(filename) ifnotos.path.isdir(filename+"_dir"): os.mkdir(filename+"_dir") fornamesinzip_file.namelist(): zip_file.extract(names,filename+"_dir/") zip_file.close() defunrar(filename): rar=rarfile.RarFile(filename) ifnotos.path.isdir(filename+"_dir"): os.mkdir(filename+"_dir") os.chdir(filename+"_dir") rar.extractall() rar.close() defunzip_files(): forfilenameinfilename_lst: if'.'infilename: suffix=filename.split('.')[-1] ifsuffix=='gz': new_filename=ungz(filename) os.remove(filename) ifnew_filename.split('.')[-1]=='tar': untar(new_filename) os.remove(new_filename) ifsuffix=='tar': untar(filename) os.remove(filename) ifsuffix=='zip': unzip(filename) os.remove(filename) ifsuffix=='rar': unrar(filename) os.remove(filename) whileTrue: unzip_files() time.sleep(5)
到此这篇关于Python在后台自动解压各种压缩文件的实现方法的文章就介绍到这了,更多相关Python自动解压各种压缩文件内容请搜索毛票票以前的文章或继续浏览下面的相关文章希望大家以后多多支持毛票票!