博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
梯度下降 随机梯度下降 批量梯度下降
阅读量:4627 次
发布时间:2019-06-09

本文共 370 字,大约阅读时间需要 1 分钟。

梯度下降(GD)

梯度的本意是一个向量,表示某一函数在该点处的方向导数沿着该方向取得最大值,导数对应的是变化率

即函数在该点处沿着该方向变化最快,变化率最大(为该梯度的模)

随机梯度下降(SGD):每次迭代随机使用一组样本

针对BGD算法训练速度过慢的缺点,提出了SGD算法,普通的BGD算法是每次迭代把所有样本都过一遍,每训练一组样本就把梯度更新一次。而SGD算法是从样本中随机抽出一组,训练后按梯度更新一次,然后再抽取一组,再更新一次,在样本量及其大的情况下,可能不用训练完所有的样本就可以获得一个损失值在可接受范围之内的模型了。

批量随即下降(BGD):每次迭代使用所有样本

在深度学习中 数据量非常大时,使用所有样本耗费时将会很长

转载于:https://www.cnblogs.com/Aaron12/p/9649123.html

你可能感兴趣的文章
XLSTransformer生成excel文件简单演示样例
查看>>
jdk和jre是什么?都有什么用?
查看>>
C#异步调用
查看>>
事件传递机制总结
查看>>
GMM的EM算法实现
查看>>
线程局部存储TLS(thread local storage)
查看>>
洛谷 P1066 2^k进制数
查看>>
Python之list和tuple
查看>>
安装jar包到maven仓库
查看>>
从程序员的“劣根性”发散开去
查看>>
数据库1
查看>>
再再发Gif动画处理类库 - 315版
查看>>
vector的内存分配与释放
查看>>
iPhone:constrainedToSize获取字符串的宽高
查看>>
59.贪心练习: 1044 拦截导弹
查看>>
【bzoj2034】 2009国家集训队—最大收益
查看>>
java编译器不匹配问题(java compiler level does not match the version of the installed java project facet)...
查看>>
mysqldump导出数据出现问题
查看>>
学习PHP函数:preg_match_all
查看>>
python之浅谈数据类型
查看>>