对Pytorch 中的contiguous理解说明

2023-07-04 20:02:03 67

最近遇到这个函数，但查的中文博客里的解释貌似不是很到位，这里翻译一下stackoverflow上的回答并加上自己的理解。

在pytorch中，只有很少几个操作是不改变tensor的内容本身，而只是重新定义下标与元素的对应关系的。换句话说，这种操作不进行数据拷贝和数据的改变，变的是元数据。

这些操作是：

narrow()，view()，expand()和transpose()

举个栗子，在使用transpose()进行转置操作时，pytorch并不会创建新的、转置后的tensor，而是修改了tensor中的一些属性（也就是元数据），使得此时的offset和stride是与转置tensor相对应的。

转置的tensor和原tensor的内存是共享的！

为了证明这一点，我们来看下面的代码：

x=torch.randn(3,2)
y=x.transpose(x,0,1)
x[0,0]=233
print(y[0,0])
#print233

可以看到，改变了y的元素的值的同时，x的元素的值也发生了变化。

也就是说，经过上述操作后得到的tensor，它内部数据的布局方式和从头开始创建一个这样的常规的tensor的布局方式是不一样的！于是…这就有contiguous()的用武之地了。

在上面的例子中，x是contiguous的，但y不是（因为内部数据不是通常的布局方式）。

注意不要被contiguous的字面意思“连续的”误解，tensor中数据还是在内存中一块区域里，只是布局的问题！

当调用contiguous()时，会强制拷贝一份tensor，让它的布局和从头创建的一毛一样。

一般来说这一点不用太担心，如果你没在需要调用contiguous()的地方调用contiguous()，运行时会提示你：

RuntimeError:inputisnotcontiguous

只要看到这个错误提示，加上contiguous()就好啦～

补充：pytorch之expand，gather，squeeze，sum，contiguous，softmax，max，argmax

gather

torch.gather(input,dim,index,out=None)。对指定维进行索引。比如4*3的张量，对dim=1进行索引，那么index的取值范围就是0~2.

input是一个张量，index是索引张量。input和index的size要么全部维度都相同，要么指定的dim那一维度值不同。输出为和index大小相同的张量。

importtorch
a=torch.tensor([[.1,.2,.3],
[1.1,1.2,1.3],
[2.1,2.2,2.3],
[3.1,3.2,3.3]])
b=torch.LongTensor([[1,2,1],
[2,2,2],
[2,2,2],
[1,1,0]])
b=b.view(4,3)
print(a.gather(1,b))
print(a.gather(0,b))
c=torch.LongTensor([1,2,0,1])
c=c.view(4,1)
print(a.gather(1,c))

输出：

tensor([[0.2000,0.3000,0.2000],
[1.3000,1.3000,1.3000],
[2.3000,2.3000,2.3000],
[3.2000,3.2000,3.1000]])
tensor([[1.1000,2.2000,1.3000],
[2.1000,2.2000,2.3000],
[2.1000,2.2000,2.3000],
[1.1000,1.2000,0.3000]])
tensor([[0.2000],
[1.3000],
[2.1000],
[3.2000]])

squeeze

将维度为1的压缩掉。如size为（3,1,1,2），压缩之后为（3,2）

importtorch
a=torch.randn(2,1,1,3)
print(a)
print(a.squeeze())

输出：

tensor([[[[-0.2320,0.9513,1.1613]]],
[[[0.0901,0.9613,-0.9344]]]])
tensor([[-0.2320,0.9513,1.1613],
[0.0901,0.9613,-0.9344]])

expand

扩展某个size为1的维度。如(2,2,1)扩展为(2,2,3)

importtorch
x=torch.randn(2,2,1)
print(x)
y=x.expand(2,2,3)
print(y)

输出：

tensor([[[0.0608],
[2.2106]],

[[-1.9287],
[0.8748]]])
tensor([[[0.0608,0.0608,0.0608],
[2.2106,2.2106,2.2106]],

[[-1.9287,-1.9287,-1.9287],
[0.8748,0.8748,0.8748]]])

sum

size为（m,n,d）的张量，dim=1时，输出为size为（m,d）的张量

importtorch
a=torch.tensor([[[1,2,3],[4,8,12]],[[1,2,3],[4,8,12]]])
print(a.sum())
print(a.sum(dim=1))

输出:

tensor(60)
tensor([[5,10,15],
[5,10,15]])

contiguous

返回一个内存为连续的张量，如本身就是连续的，返回它自己。一般用在view()函数之前，因为view()要求调用张量是连续的。

可以通过is_contiguous查看张量内存是否连续。

importtorch
a=torch.tensor([[[1,2,3],[4,8,12]],[[1,2,3],[4,8,12]]])
print(a.is_contiguous)
print(a.contiguous().view(4,3))

输出：


tensor([[1,2,3],
[4,8,12],
[1,2,3],
[4,8,12]])

softmax

假设数组V有C个元素。对其进行softmax等价于将V的每个元素的指数除以所有元素的指数之和。这会使值落在区间（0,1）上，并且和为1。

importtorch
importtorch.nn.functionalasF
a=torch.tensor([[1.,1],[2,1],[3,1],[1,2],[1,3]])
b=F.softmax(a,dim=1)
print(b)

输出：

tensor([[0.5000,0.5000],
[0.7311,0.2689],
[0.8808,0.1192],
[0.2689,0.7311],
[0.1192,0.8808]])

max

返回最大值，或指定维度的最大值以及index

importtorch
a=torch.tensor([[.1,.2,.3],
[1.1,1.2,1.3],
[2.1,2.2,2.3],
[3.1,3.2,3.3]])
print(a.max(dim=1))
print(a.max())

输出：

(tensor([0.3000,1.3000,2.3000,3.3000]),tensor([2,2,2,2]))
tensor(3.3000)

argmax

返回最大值的index

importtorch
a=torch.tensor([[.1,.2,.3],
[1.1,1.2,1.3],
[2.1,2.2,2.3],
[3.1,3.2,3.3]])
print(a.argmax(dim=1))
print(a.argmax())

输出：

tensor([2,2,2,2])
tensor(11)

以上为个人经验，希望能给大家一个参考，也希望大家多多支持毛票票。如有错误或未考虑完全的地方，望不吝赐教。

声明：本文内容来源于网络，版权归原作者所有，内容由互联网用户自发贡献自行上传，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任。如果您发现有涉嫌版权的内容，欢迎发送邮件至：czq8825#qq.com（发邮件时，请将#更换为@）进行举报，并提供相关证据，一经查实，本站将立刻删除涉嫌侵权内容。