好资源导航 » 文章资讯 » Pytorch之finetune使用详解

Pytorch之finetune使用详解

2023-08-02 21:37:05 58

finetune分为全局finetune和局部finetune。首先介绍一下局部finetune步骤：

1.固定参数

forname,childinmodel.named_children():
forparaminchild.parameters():
param.requires_grad=False

后，只传入需要反传的参数，否则会报错

filter(lambdaparam:param.requires_grad,model.parameters())

2.调低学习率，加快衰减

finetune是在预训练模型上进行微调，学习速率不能太大。

目前不清楚：学习速率降低的幅度可以更快一些。这样以来，在使用step的策略时，stepsize可以更小一些。

直接从原始数据训练的base_lr一般为0.01，微调要比0.01小,置为0.001

要比直接训练的小一些，直接训练的stepsize为100000，finetune的stepsize:50000

3.固定bn或取消dropout：

batchnorm会影响训练的效果，随着每个batch，追踪样本的均值和方差。对于固定的网络，bn应该使用全局的数值

deffreeze_bn(self):
forlayerinself.modules():
ifisinstance(layer,nn.BatchNorm2d):
layer.eval()

训练时，model.train()会修改模式，freeze_zn()应该在这里后面

4.过滤参数

训练时，对于优化器，应该只传入需要改变的参数，否则会报错

filter(lambdap:p.requires_grad,model.parameters())

以上这篇Pytorch之finetune使用详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持毛票票。

声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：czq8825#qq.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。

返回顶部
514930285
czq8825@qq.com

Pytorch之finetune使用详解

热门推荐

随机推荐