一、理解tensor的基本概念

Tensor是深度学习中非常关键的数据结构之一，它可以将数据在多维空间中抽象出来。在TensorFlow深度学习框架中，tensor指代了用于表示张量计算的N维数组。 Tensor的维度大小可以看成是N维数组中每个元素在该维度上的个数。就如同普通数组中的一维数组表示了数组长度一样，tensor也可以看成是由一个个的n维数组组成的。下面是一个简单的例子，我们可以将一个二维数组看成是由多个一维数组组成的：

import numpy as np
a = np.array([[1,2,3], [4,5,6]])
print(a.shape)  # 输出(2, 3)

在这个例子中，我们可以将二维数组a看成由两个一维数组[1,2,3]和[4,5,6]组成的。

二、三种常见的tensor维度

scalar（0-d tensor） scalar可以理解为是一个标量，它是一个零维的tensor。就像一个数字是一个标量一样，一个tensor的元素也只有一个。我们可以使用numpy创建一个标量，然后输出它的形状：

import numpy as np
s = np.array(2.2)
print(s.shape)  # 输出()

vector（1-d tensor） vector是指有序数组成的一维列表，它有一个维度大小。一个有三个元素的向量可以看做长这样：

v = np.array([1,2,3])
print(v.shape)  # 输出(3,)

matrix（2-d tensor） matrix是由多个向量组成的二维列表。矩阵有两个维度大小，通常用于表示二维特征，例如一张图片。

m = np.array([[1,2,3], [4,5,6]])
print(m.shape)  # 输出(2, 3)

三、修改tensor的维度大小

在使用深度学习框架时，修改tensor的维度大小是非常常见的操作。下面我们将介绍几种修改tensor维度大小的方法。

flatten操作 flatten操作可以将一个矩阵转换成一维数组，该操作可用于卷积神经网络中的全连接层输入。预测矩阵为：

pred = np.array([[1,2], [3,4], [5,6]])

我们可以使用flatten操作将矩阵转换成一维数组：

pred_flat = pred.flatten()
print(pred_flat.shape) # 输出(6,)
print(pred_flat)       # 输出[1 2 3 4 5 6]

reshape操作 reshape操作可以改变tensor的维度大小，但是必须保证重塑后的tensor大小和原tensor大小相同。预测矩阵为：

pred = np.array([[1,2], [3,4], [5,6]])

我们可以使用reshape操作将矩阵改变维度大小：

pred_reshape = np.reshape(pred, (2, 3))
print(pred_reshape.shape) # 输出(2, 3)
print(pred_reshape)       # 输出[[1 2 3] [4 5 6]]

transpose操作 transpose操作可以改变tensor的维度顺序，例如一个2×3的矩阵，我们可以通过transpose操作将其变为3×2的矩阵。预测矩阵为：

pred = np.array([[1,2], [3,4], [5,6]])

我们可以使用transpose操作将矩阵转置：

pred_transpose = np.transpose(pred)
print(pred_transpose.shape) # 输出(2, 3)
print(pred_transpose)       # 输出[[1 3 5] [2 4 6]]

总结

tensor是深度学习中非常重要的数据结构之一，它可以将数据在多维空间中抽象出来。本文从 tensor的基本概念、三种常见的tensor维度和修改tensor的维度大小这三个方面，详细分析了tensor的维度大小问题。

Python教程：深入理解tensor的维度大小

一、理解tensor的基本概念

二、三种常见的tensor维度

三、修改tensor的维度大小

总结