Pytorch 实现sobel算子的卷积操作详解
卷积在pytorch中有两种实现,一种是torch.nn.Conv2d(),一种是torch.nn.functional.conv2d(),这两种方式本质都是执行卷积操作,对输入的要求也是一样的,首先需要输入的是一个torch.autograd.Variable()的类型,大小是(batch,channel,H,W),其中batch表示输入的一批数据的数目,channel表示输入的通道数。
一般一张彩色的图片是3,灰度图片是1,而卷积网络过程中的通道数比较大,会出现几十到几百的通道数。H和W表示输入图片的高度和宽度,比如一个batch是32张图片,每张图片是3通道,高和宽分别是50和100,那么输入的大小就是(32,3,50,100)。
如下代码是卷积执行soble边缘检测算子的实现:
importtorch importnumpyasnp fromtorchimportnn fromPILimportImage fromtorch.autogradimportVariable importtorch.nn.functionalasF defnn_conv2d(im): #用nn.Conv2d定义卷积操作 conv_op=nn.Conv2d(1,1,3,bias=False) #定义sobel算子参数 sobel_kernel=np.array([[-1,-1,-1],[-1,8,-1],[-1,-1,-1]],dtype='float32') #将sobel算子转换为适配卷积操作的卷积核 sobel_kernel=sobel_kernel.reshape((1,1,3,3)) #给卷积操作的卷积核赋值 conv_op.weight.data=torch.from_numpy(sobel_kernel) #对图像进行卷积操作 edge_detect=conv_op(Variable(im)) #将输出转换为图片格式 edge_detect=edge_detect.squeeze().detach().numpy() returnedge_detect deffunctional_conv2d(im): sobel_kernel=np.array([[-1,-1,-1],[-1,8,-1],[-1,-1,-1]],dtype='float32')# sobel_kernel=sobel_kernel.reshape((1,1,3,3)) weight=Variable(torch.from_numpy(sobel_kernel)) edge_detect=F.conv2d(Variable(im),weight) edge_detect=edge_detect.squeeze().detach().numpy() returnedge_detect defmain(): #读入一张图片,并转换为灰度图 im=Image.open('./cat.jpg').convert('L') #将图片数据转换为矩阵 im=np.array(im,dtype='float32') #将图片矩阵转换为pytorchtensor,并适配卷积输入的要求 im=torch.from_numpy(im.reshape((1,1,im.shape[0],im.shape[1]))) #边缘检测操作 #edge_detect=nn_conv2d(im) edge_detect=functional_conv2d(im) #将array数据转换为image im=Image.fromarray(edge_detect) #image数据转换为灰度模式 im=im.convert('L') #保存图片 im.save('edge.jpg',quality=95) if__name__=="__main__": main()
原图片:cat.jpg
结果图片:edge.jpg
以上这篇Pytorch实现sobel算子的卷积操作详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。