一、CNN网络是什么意思?
CNN全称卷积神经网络(Convolutional Neural Network),是一种前馈神经网络,最初是由Fukushima于1980年提出来的,主要用于图像识别、语音识别等领域。CNN是一种深度学习模型,特殊之处在于它利用了图像的二维结构信息。
二、CNN网络的特点
CNN网络最大的优点是能够从输入的图像中自动提取特征。传统的神经网络需要人工选择特征,而CNN可以自动学习并优化自己的特征,使得模型具有更好的泛化能力。此外,CNN能够处理高维数据,并具有平移和缩放不变性。
三、CNN网络结构
CNN主要由卷积层、池化层和全连接层组成。
卷积层:卷积层是CNN的核心,它对输入的图像进行特征提取和卷积操作,得到一系列新的特征图。
池化层:池化层对特征图进行降采样操作,减小模型复杂度,提高模型的泛化能力。
全连接层:全连接层对上一层的所有特征进行连接,将特征转换为预测的类别。
四、CNN网络结构搭建
import numpy as np import tensorflow as tf # 定义卷积层函数 def conv2d(x, W): return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME') # 定义池化层函数 def max_pool_2x2(x): return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME') # 定义输入层 x = tf.placeholder(tf.float32, [None, 784]) # 将输入转化为4维张量 x_image = tf.reshape(x, [-1, 28, 28, 1]) # 定义第一层卷积层 W_conv1 = tf.Variable(tf.truncated_normal([5, 5, 1, 32], stddev=0.1)) b_conv1 = tf.Variable(tf.constant(0.1, shape=[32])) h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1) h_pool1 = max_pool_2x2(h_conv1) # 定义第二层卷积层 W_conv2 = tf.Variable(tf.truncated_normal([5, 5, 32, 64], stddev=0.1)) b_conv2 = tf.Variable(tf.constant(0.1, shape=[64])) h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2) h_pool2 = max_pool_2x2(h_conv2) # 定义全连接层 W_fc1 = tf.Variable(tf.truncated_normal([7 * 7 * 64, 1024], stddev=0.1)) b_fc1 = tf.Variable(tf.constant(0.1, shape=[1024])) h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64]) h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1) # 定义输出层 W_fc2 = tf.Variable(tf.truncated_normal([1024, 10], stddev=0.1)) b_fc2 = tf.Variable(tf.constant(0.1, shape=[10])) y_pred = tf.matmul(h_fc1, W_fc2) + b_fc2 y_true = tf.placeholder(tf.float32, [None, 10]) # 定义损失函数和优化器 cross_entropy = tf.reduce_mean( tf.nn.softmax_cross_entropy_with_logits_v2(labels=y_true, logits=y_pred)) train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy) # 训练模型 with tf.Session() as sess: sess.run(tf.global_variables_initializer()) for i in range(1000): batch = mnist.train.next_batch(50) if i % 100 == 0: train_accuracy = accuracy.eval(feed_dict={ x: batch[0], y_true: batch[1], keep_prob: 1.0}) print('step %d, training accuracy %g' % (i, train_accuracy)) train_step.run(feed_dict={x: batch[0], y_true: batch[1], keep_prob: 0.5}) # 测试模型 test_accuracy = accuracy.eval(feed_dict={ x: mnist.test.images, y_true: mnist.test.labels, keep_prob: 1.0}) print('test_accuracy %g' % test_accuracy)
五、CNN网络添加高斯噪音
在实际应用中,由于数据的不稳定性,我们会遇到很多噪音数据,这就会对训练模型产生影响。为了解决这个问题,我们可以在输入数据中添加高斯噪音,提高训练模型的鲁棒性。
# 定义添加高斯噪音的函数 def add_noise(image): row, col = image.shape mean = 0 var = 0.1 sigma = var ** 0.5 gauss = np.random.normal(mean, sigma, (row, col)) gauss = gauss.reshape(row, col) noisy = image + gauss return noisy # 定义生成带噪音数据集的函数 def generateNoisyDataset(dataset, noise_rate): for i in range(len(dataset)): dataset[i] = add_noise(dataset[i]) return dataset # 读取MNIST数据集 (train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.mnist.load_data() # 将数据集进行随机打乱 permute_train = np.random.permutation(train_images.shape[0]) train_images = train_images[permute_train] train_labels = train_labels[permute_train] # 生成带噪音数据集 noise_train_images = generateNoisyDataset(train_images, 0.1) noise_test_images = generateNoisyDataset(test_images, 0.1) # 训练模型 model.fit(noise_train_images, train_labels, epochs=10, validation_data=(noise_test_images, test_labels))
六、CNN网络主要的应用领域是
CNN网络主要用于图像识别、目标检测、物体识别等领域。在图像识别领域,CNN已经达到了人眼识别的水平,被广泛应用于人脸识别、车牌识别、自然场景文字识别等。
七、CNN网络用语
- Batch:一次批量的样本
- Epoch:所有批次训练一次,称为一个Epoch
- Convolution Layer:卷积层
- Pooling Layer:池化层
- Dropping:Dropout
- Activation Function:激活函数
- Optimizer:优化器
八、CNN网络结构及原理
CNN网络的结构和原理源于生物学中的视觉系统。CNN首先通过卷积层进行特征提取,然后通过池化层来提高模型的鲁棒性。最后通过全连接层将特征映射到类别,得到最后的预测结果。CNN的核心是卷积操作和权重共享,这使得CNN网络可以自动学习和优化自己的特征。
九、CNN网络模型
CNN网络模型包括LeNet-5、AlexNet、VGG、GoogLeNet、ResNet等。其中LeNet-5是最早的CNN网络模型,AlexNet是在2012年ImageNet上取得了巨大突破的模型,VGG在2014年ImageNet上获得了更好的结果,而GoogLeNet和ResNet则采用了更深层次的网络结构,并在2015年ImageNet上取得了更好的效果。