时间:2021-05-22
SGD 随机梯度下降
Keras 中包含了各式优化器供我们使用,但通常我会倾向于使用 SGD 验证模型能否快速收敛,然后调整不同的学习速率看看模型最后的性能,然后再尝试使用其他优化器。
Keras 中文文档中对 SGD 的描述如下:
keras.optimizers.SGD(lr=0.01, momentum=0.0, decay=0.0, nesterov=False)
随机梯度下降法,支持动量参数,支持学习衰减率,支持Nesterov动量
参数:
lr:大或等于0的浮点数,学习率
momentum:大或等于0的浮点数,动量参数
decay:大或等于0的浮点数,每次更新后的学习率衰减值
nesterov:布尔值,确定是否使用Nesterov动量
参数设置
Time-Based Learning Rate Schedule
Keras 已经内置了一个基于时间的学习速率调整表,并通过上述参数中的 decay 来实现,学习速率的调整公式如下:
LearningRate = LearningRate * 1/(1 + decay * epoch)
当我们初始化参数为:
LearningRate = 0.1
decay = 0.001
大致变化曲线如下(非实际曲线,仅示意):
当然,方便起见,我们可以将优化器设置如下,使其学习速率随着训练轮次变化:
sgd = SGD(lr=learning_rate, decay=learning_rate/nb_epoch, momentum=0.9, nesterov=True)
Drop-Based Learning Rate Schedule
另外一种学习速率的调整方法思路是保持一个恒定学习速率一段时间后立即降低,是一种突变的方式。通常整个变化趋势为指数形式。
对应的学习速率变化公式如下:
LearningRate = InitialLearningRate * DropRate^floor(Epoch / EpochDrop)
实现需要使用 Keras 中的 LearningRateScheduler 模块:
from keras.callbacks import LearningRateScheduler# learning rate scheduledef step_decay(epoch): initial_lrate = 0.1 drop = 0.5 epochs_drop = 10.0 lrate = initial_lrate * math.pow(drop, math.floor((1+epoch)/epochs_drop)) return lratelrate = LearningRateScheduler(step_decay)# Compile modelsgd = SGD(lr=0.0, momentum=0.9, decay=0.0, nesterov=False)model.compile(loss=..., optimizer=sgd, metrics=['accuracy'])# Fit the modelmodel.fit(X, Y, ..., callbacks=[lrate])补充知识:keras中的BGD和SGD
关于BGD和SGD
首先BGD为批梯度下降,即所有样本计算完毕后才进行梯度更新;而SGD为随机梯度下降,随机计算一次样本就进行梯度下降,所以速度快很多但容易陷入局部最优值。
折中的办法是采用小批的梯度下降,即把数据分成若干个批次,一批来进行一次梯度下降,减少随机性,计算量也不是很大。 mini-batch
keras中的batch_size就是小批梯度下降。
以上这篇Keras SGD 随机梯度下降优化器参数设置方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
找到AdvancedBiosFeatures(高级BIOS参数设置)按回车进AdvancedBiosFeatures(高级BIOS参数设置)界面正常设置是:Fi
梯度下降法是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降是最常采用的方法之一,在求解
优化性能参数设置,在ngnix.conf中的http层加上fastcgi参数如下:http{fastcgi_cache_path/usr/local/nginx
1.开启防采集功能:参数设置-》信息设置2.增加随机防采集字符:插件治理-》防采集随机字符治理(只要字符不能显示出来都可以加。字符越多防采的效果越好)3.在内容
1.梯度下降1)什么是梯度下降?因为梯度下降是一种思想,没有严格的定义,所以用一个比喻来解释什么是梯度下降。简单来说,梯度下降就是从山顶找一条最短的路走到山脚最