Python实现SVN的目录周期性备份实例
本文实例讲述了Python实现SVN的目录周期性备份方法。分享给大家供大家参考。具体如下:
起因:今天用SVN时,不小心把远程SVN服务器上的目录删掉了,然后在本地又手贱地还原了一下项目(eclipse中右键项目team=>还原),导致写了大半天的代码全部丢失,用多款数据恢复软件恢复也无果。一怒之下写了这个目录周期性备份小工具,每隔5秒备份源目录中的所有文件到目标目录(保留结构),保证目标目录中的文件只增不减。且每次只拷贝发生变化的文件(比较两个文件的MD5值)。
思考:虽然SVN也是一个版本管理软件,但在使用过程总觉得它的诸多操作挺别扭,相比而言Git更强大灵活。我自己理想中的版本控制软件至少应该考虑到一些让用户产生较强挫败的使用场景(也许大部分情况是因为用户误用,但如果误用情况也能考虑到,才能更体现软件的终极人文关怀嘛),比如删除远程服务器上的文件,我觉得应该设计成这样:即使用户删除了文件,文件还应该在一个缓冲区中呆1天(或几个小时,可以配置),然后由一个定时任务定时删除缓冲区中停留时间超过1天的文件。而不是立即物理删除。
TODO:
增加配置文件,做成命令行程序
md5_caculate.py:
#-*-coding:utf-8-*-
#!/usr/bin/python
fromhashlibimportmd5
importos
defcalMD5(str):
m=md5()
m.update(str)
returnm.hexdigest()
defcalMD5ForFile(file):
statinfo=os.stat(file)
ifint(statinfo.st_size)/(1024*1024)>=1000:
#print("Filesize>1000,movetobigfile...")
returncalMD5ForBigFile(file)
m=md5()
f=open(file,'rb')
m.update(f.read())
f.close()
returnm.hexdigest()
defcalMD5ForFolder(dir,MD5File):
outfile=open(MD5File,'w')
forroot,subdirs,filesinos.walk(dir):
forfileinfiles:
filefullpath=os.path.join(root,file)
"""printfilefullpath"""
filerelpath=os.path.relpath(filefullpath,dir)
md5=calMD5ForFile(filefullpath)
outfile.write(filerelpath+''+md5+"\n")
outfile.close()
defcalMD5ForBigFile(file):
m=md5()
f=open(file,'rb')
buffer=8192#whyis8192|8192isfastthan2048
while1:
chunk=f.read(buffer)
ifnotchunk:break
m.update(chunk)
f.close()
returnm.hexdigest()
if__name__=="__main__":
print(calMD5ForFile("e:/test/target/a/b/rabbit.txt"))
file_util.py:
#-*-coding:utf-8-*-
#!/usr/bin/python
importos,shutil
frommd5_caculateimportcalMD5ForFile
#拷贝源目录到目标目录
defcopyDir(srcDir,dstDir):
ifsrcDirindstDir:#源目录包含在目标目录,则直接返回
return
ifnotos.path.isdir(srcDir):
print(srcDir,"路径指定的源目录不存在!")
return;
ifnotos.path.exists(dstDir):#目标目录不存在时则创建
os.makedirs(dstDir)
forfileOrDirNameinos.listdir(srcDir):#源目录下的所有文件(包括文件和目录)TODOBUG:如果srcDir为一个空目录?
#fileOrDirPath=srcDir+"/"+fileOrDirName
fileOrDirPath=os.path.join(srcDir,fileOrDirName)
ifos.path.isfile(fileOrDirPath):#如果当前是一个子文件,则直接复制文件
copyFile(fileOrDirPath,dstDir)
ifos.path.isdir(fileOrDirPath):#如果当前是一个子目录,则递归复制目录
copyDir(fileOrDirPath,os.path.join(dstDir,fileOrDirName))
#拷贝源文件到目标目录
defcopyFile(srcFile,dstDir):
ifnotos.path.isfile(srcFile):
print(srcFile,"路径指定的源文件不存在!")
return
fileName=os.path.basename(srcFile)
dstFile=os.path.join(dstDir,fileName)
ifos.path.isfile(dstFile):#有同名的目标文件,则检查MD5值是否相同,如果不同才Copy
ifcalMD5ForFile(srcFile)!=calMD5ForFile(dstFile):
try:
shutil.copy(srcFile,dstDir)
exceptPermissionError:
print("PermissionErroroccurs:",srcFile)
else:
shutil.copy(srcFile,dstDir)
if__name__=="__main__":
copyDir("e:/test/src","e:/test/target")
backuper.py:
#-*-coding:utf-8-*-
#!/usr/bin/python
importos,time
fromfile_utilimportcopyDir
#-------------------------------------------------------------
#定时备份源目录到目标目录
#version=1.0
#author=Will
#-------------------------------------------------------------
#定时备份源目录到目标目录,sleepIntervalSeconds为备份时间间隔秒数
defbackupDir(srcDir,dstDir,sleepIntervalSeconds):
ifnotos.path.isdir(srcDir):
print("请指定要备份源目录并确保目录存在!")
return;
whileTrue:
print("备份:",srcDir,",到:",dstDir)
copyDir(srcDir,dstDir)
print("开始休眠",sleepIntervalSeconds,"秒...")
time.sleep(sleepIntervalSeconds)
if__name__=="__main__":
backupDir("d:/Documents/workspace/workspace/griddle","e:/backup/griddle",20)
希望本文所述对大家的Python程序设计有所帮助。