Adam参数详解

一、Adam参数详解

Adam参数是优化算法Adam中用到的一组可调整参数，它直接影响了Adam算法的优化表现与效率。Adam算法是在随机梯度下降算法(SGD)的基础上发展而来，其引入学习速率(Learning rate)、梯度累积历史平均值、梯度平方历史平均值等指标对神经网络进行优化。

二、Adam参数更新过程

Adam算法采用基于梯度的更新，每次更新时都会基于当前批次的梯度计算学习速率并进行更新，同时还会使用梯度平方的历史平均值来调整学习速率。Adam参数更新公式如下：

# 初始化 Adam 参数
v, s, t = 0, 0, 0
# 进行参数更新
for i in range(max_iters):
    # 获取 mini-batch
    batch = data_iter_random(X, y, batch_size)
    # 计算 mini-batch 上的梯度值
    g = compute_grad(batch, w)
    t += 1
    # 更新动量指数
    v = beta1 * v + (1 - beta1) * g
    s = beta2 * s + (1 - beta2) * np.power(g, 2)
    # 纠正偏差
    v_corrected = v / (1 - np.power(beta1, t))
    s_corrected = s / (1 - np.power(beta2, t))
    # 更新参数
    w = w - lr * v_corrected / (np.sqrt(s_corrected) + eps)

三、Adam参数数量

Adam算法中，主要包含学习速率、梯度衰减率、梯度平方衰减率等参数。虽然参数数量比较少，但是这些参数对神经网络优化的影响巨大，因此需要仔细选择和调整。

四、Adam参数标定

Adam参数标定是指在神经网络训练过程中，根据观察到的数据，自动化地选择、调节Adam参数使得神经网络最优化的一个过程。在标定过程中，需要注意数据集的大小、样本分布、网络结构等因素的影响。

五、Adam参数设置

在Adam算法中，参数的设置需要经验调整。常见的设置方法是使用默认值，即lr=0.001，beta1=0.9，beta2=0.999，eps=1e-8，但实际上这些参数设置需要根据具体问题进行适当调整。

六、Adams碰撞参数设置

Adams碰撞参数是Adam算法中调节动量的系数，通常设置在0.9~0.99之间，如果碰撞参数设置的过大，会导致过度相信历史梯度，造成过拟合；如果设置过小，会导致过度依赖当前的梯度，提高了收敛速度但是牺牲了优化效果。

七、Adam参数标定案例

对于一个具体的神经网络模型，我们可以使用Adam参数标定方法来提高其优化性能。以图像分类模型为例，我们可以根据训练的学习曲线来调整Adam参数，找到最优的参数组合，使得模型在测试集上的表现达到最佳。下面是一段Adam参数标定的示例代码：

# 设定不同的参数组合
params = [(0.001, 0.9, 0.999, 1e-8), (0.01, 0.9, 0.999, 1e-8), (0.001, 0.95, 0.999, 1e-8)]
# 进行参数标定
for lr, beta1, beta2, eps in params:
    adam_params = {'lr': lr, 'beta1': beta1, 'beta2': beta2, 'eps': eps}
    net = NeuralNetwork(layer_sizes, activation, optimizer='adam', **adam_params)
    # 进行模型训练并记录训练结果
    train_loss, train_acc, val_loss, val_acc = net.fit(X_train, y_train, X_val, y_val, epochs=1000, verbose=False)
    # 使用测试集对模型进行评估
    test_loss, test_acc = net.evaluate(X_test, y_test)
    print(f'lr: {lr} | beta1: {beta1} | beta2: {beta2} | eps: {eps} | test_acc: {test_acc}')

八、Adams参数化建模

在使用Adam算法优化神经网络模型时，常常需要对Adam参数设置不同的组合，以达到最优化的效果。为了方便调整参数，我们可以使用参数化建模方法，即将Adam参数封装成类或者函数的参数，方便调用和修改。下面是一段使用参数化建模的示例代码：

class AdamOptimizer:
    def __init__(self, learning_rate=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-8):
        self.lr = learning_rate
        self.beta_1 = beta_1
        self.beta_2 = beta_2
        self.epsilon = epsilon
        self.t = 1
        self.m = None
        self.v = None
        
    def update(self, grad, w):
        if self.m is None:
            self.m = np.zeros_like(grad)
            self.v = np.zeros_like(grad)
        self.m = self.beta_1 * self.m + (1 - self.beta_1) * grad
        self.v = self.beta_2 * self.v + (1 - self.beta_2) * np.power(grad, 2)
        m_hat = self.m / (1 - np.power(self.beta_1, self.t))
        v_hat = self.v / (1 - np.power(self.beta_2, self.t))
        self.t += 1
        return w - self.lr * m_hat / (np.sqrt(v_hat) + self.epsilon)
        
net = NeuralNetwork(layer_sizes, activation, optimizer=AdamOptimizer(learning_rate=0.01, beta_1=0.9, beta_2=0.999, epsilon=1e-8))

九、Matlab参数unit作用

Matlab中的unit函数可以用于确定S函数的阈值，并且可以将输出值限定在0到1之间。unit函数的公式如下：

function [y] = unit(x)
%unit: sigmoid unit function
    y = 1./(1+exp(-x));
end

在神经网络中，Sigmoid函数的输出值是连续的，可以用于建立输出层。当输入为一个实数时，Sigmoid函数可以将它映射到0到1之间的一个实数。因此，使用unit函数可以对输出层进行百分比预测，输出值越接近1表示预测正样本的概率越大，输出值越接近0表示预测负样本的概率越大。

Windows 软件

Linux 软件

Mac 软件

安卓软件

各类文章

Adam参数详解

一、Adam参数详解

二、Adam参数更新过程

三、Adam参数数量

四、Adam参数标定

五、Adam参数设置

六、Adams碰撞参数设置

七、Adam参数标定案例

八、Adams参数化建模

九、Matlab参数unit作用

Adam参数详解

java方法整理笔记（java总结）

印象笔记记录java学习（Java成长笔记）

Adam优化器参数设置最佳实践分享

Adam优化器全称详解

发篇java复习笔记（java课程笔记）

java学习笔记（java初学笔记）

java笔记,大学java笔记

java客户端学习笔记（java开发笔记）

java笔记,尚硅谷java笔记

python基础学习整理笔记,Python课堂笔记

数据库的笔记mysql,数据库管理系统笔记

为知笔记私有化部署

Adam与Adamw的最优化方案

java包笔记,Java语言包

优化器Adam

java基础知识学习笔记一,Java基础笔记

重学java笔记,java笔记总结

我的python笔记06（Python）

python学习之笔记（python的笔记）

Windows 软件

Linux 软件

Mac 软件

安卓软件

各类文章

Adam参数详解

一、Adam参数详解

二、Adam参数更新过程

三、Adam参数数量

四、Adam参数标定

五、Adam参数设置

六、Adams碰撞参数设置

七、Adam参数标定案例

八、Adams参数化建模

九、Matlab参数unit作用

Adam参数详解

java方法整理笔记（java总结）

印象笔记记录java学习（Java成长笔记）

Adam优化器参数设置最佳实践分享

Adam优化器全称详解

发篇java复习笔记（java课程笔记）

java学习笔记（java初学笔记）

java笔记,大学java笔记

java客户端学习笔记（java开发笔记）

java笔记,尚硅谷java笔记

python基础学习整理笔记,Python课堂笔记

数据库的笔记mysql,数据库管理系统笔记

为知笔记私有化部署

Adam与Adamw的最优化方案

java包笔记,Java语言包

优化器Adam

java基础知识学习笔记一,Java基础笔记

重学java笔记,java笔记总结

我的python笔记06（Python）

python学习之笔记（python的笔记）

人机检测，请谅解