您的位置:

Python教程:深入理解tensor的维度大小

一、理解tensor的基本概念

Tensor是深度学习中非常关键的数据结构之一,它可以将数据在多维空间中抽象出来。在TensorFlow深度学习框架中,tensor指代了用于表示张量计算的N维数组。

Tensor的维度大小可以看成是N维数组中每个元素在该维度上的个数。就如同普通数组中的一维数组表示了数组长度一样,tensor也可以看成是由一个个的n维数组组成的。

下面是一个简单的例子,我们可以将一个二维数组看成是由多个一维数组组成的:


import numpy as np

a = np.array([[1,2,3], [4,5,6]])
print(a.shape)  # 输出(2, 3)

在这个例子中,我们可以将二维数组a看成由两个一维数组[1,2,3]和[4,5,6]组成的。

二、三种常见的tensor维度

1. scalar(0-d tensor)

scalar可以理解为是一个标量,它是一个零维的tensor。就像一个数字是一个标量一样,一个tensor的元素也只有一个。我们可以使用numpy创建一个标量,然后输出它的形状:


import numpy as np

s = np.array(2.2)
print(s.shape)  # 输出()

2. vector(1-d tensor)

vector是指有序数组成的一维列表,它有一个维度大小。一个有三个元素的向量可以看做长这样:


v = np.array([1,2,3])
print(v.shape)  # 输出(3,)

3. matrix(2-d tensor)

matrix是由多个向量组成的二维列表。矩阵有两个维度大小,通常用于表示二维特征,例如一张图片。


m = np.array([[1,2,3], [4,5,6]])
print(m.shape)  # 输出(2, 3)

三、修改tensor的维度大小

在使用深度学习框架时,修改tensor的维度大小是非常常见的操作。下面我们将介绍几种修改tensor维度大小的方法。

1. flatten操作

flatten操作可以将一个矩阵转换成一维数组,该操作可用于卷积神经网络中的全连接层输入。

预测矩阵为:

pred = np.array([[1,2], [3,4], [5,6]])
我们可以使用flatten操作将矩阵转换成一维数组:

pred_flat = pred.flatten()
print(pred_flat.shape) # 输出(6,)
print(pred_flat)       # 输出[1 2 3 4 5 6]

2. reshape操作

reshape操作可以改变tensor的维度大小,但是必须保证重塑后的tensor大小和原tensor大小相同。

预测矩阵为:

pred = np.array([[1,2], [3,4], [5,6]])
我们可以使用reshape操作将矩阵改变维度大小:

pred_reshape = np.reshape(pred, (2, 3))
print(pred_reshape.shape) # 输出(2, 3)
print(pred_reshape)       # 输出[[1 2 3] [4 5 6]]

3. transpose操作

transpose操作可以改变tensor的维度顺序,例如一个2×3的矩阵,我们可以通过transpose操作将其变为3×2的矩阵。

预测矩阵为:

pred = np.array([[1,2], [3,4], [5,6]])
我们可以使用transpose操作将矩阵转置:

pred_transpose = np.transpose(pred)
print(pred_transpose.shape) # 输出(2, 3)
print(pred_transpose)       # 输出[[1 3 5] [2 4 6]]

总结

tensor是深度学习中非常重要的数据结构之一,它可以将数据在多维空间中抽象出来。本文从 tensor的基本概念、三种常见的tensor维度和修改tensor的维度大小这三个方面,详细分析了tensor的维度大小问题。