一、理解tensor的基本概念
Tensor是深度学习中非常关键的数据结构之一,它可以将数据在多维空间中抽象出来。在TensorFlow深度学习框架中,tensor指代了用于表示张量计算的N维数组。
Tensor的维度大小可以看成是N维数组中每个元素在该维度上的个数。就如同普通数组中的一维数组表示了数组长度一样,tensor也可以看成是由一个个的n维数组组成的。
下面是一个简单的例子,我们可以将一个二维数组看成是由多个一维数组组成的:
import numpy as np
a = np.array([[1,2,3], [4,5,6]])
print(a.shape) # 输出(2, 3)
在这个例子中,我们可以将二维数组a看成由两个一维数组[1,2,3]和[4,5,6]组成的。
二、三种常见的tensor维度
1. scalar(0-d tensor)
scalar可以理解为是一个标量,它是一个零维的tensor。就像一个数字是一个标量一样,一个tensor的元素也只有一个。我们可以使用numpy创建一个标量,然后输出它的形状:
import numpy as np
s = np.array(2.2)
print(s.shape) # 输出()
2. vector(1-d tensor)
vector是指有序数组成的一维列表,它有一个维度大小。一个有三个元素的向量可以看做长这样:
v = np.array([1,2,3])
print(v.shape) # 输出(3,)
3. matrix(2-d tensor)
matrix是由多个向量组成的二维列表。矩阵有两个维度大小,通常用于表示二维特征,例如一张图片。
m = np.array([[1,2,3], [4,5,6]])
print(m.shape) # 输出(2, 3)
三、修改tensor的维度大小
在使用深度学习框架时,修改tensor的维度大小是非常常见的操作。下面我们将介绍几种修改tensor维度大小的方法。
1. flatten操作
flatten操作可以将一个矩阵转换成一维数组,该操作可用于卷积神经网络中的全连接层输入。
预测矩阵为:
pred = np.array([[1,2], [3,4], [5,6]])
我们可以使用flatten操作将矩阵转换成一维数组:
pred_flat = pred.flatten()
print(pred_flat.shape) # 输出(6,)
print(pred_flat) # 输出[1 2 3 4 5 6]
2. reshape操作
reshape操作可以改变tensor的维度大小,但是必须保证重塑后的tensor大小和原tensor大小相同。
预测矩阵为:
pred = np.array([[1,2], [3,4], [5,6]])
我们可以使用reshape操作将矩阵改变维度大小:
pred_reshape = np.reshape(pred, (2, 3))
print(pred_reshape.shape) # 输出(2, 3)
print(pred_reshape) # 输出[[1 2 3] [4 5 6]]
3. transpose操作
transpose操作可以改变tensor的维度顺序,例如一个2×3的矩阵,我们可以通过transpose操作将其变为3×2的矩阵。
预测矩阵为:
pred = np.array([[1,2], [3,4], [5,6]])
我们可以使用transpose操作将矩阵转置:
pred_transpose = np.transpose(pred)
print(pred_transpose.shape) # 输出(2, 3)
print(pred_transpose) # 输出[[1 3 5] [2 4 6]]
总结
tensor是深度学习中非常重要的数据结构之一,它可以将数据在多维空间中抽象出来。本文从 tensor的基本概念、三种常见的tensor维度和修改tensor的维度大小这三个方面,详细分析了tensor的维度大小问题。