快眼看书

第14章 一不小心站在了技术发展的最前沿(第2页)

天才一秒记住【快眼看书】地址:https://www.nekeye.com

在神经网络里,梯度消失的问题就是这种感觉,网络不知道该如何继续改进。

而梯度爆炸又是另外的一个极端。

假设这次你站在一座非常陡的悬崖边,一不小心就滚下去了!

因为坡度太陡了,你的速度变得非常快,失控了。

在神经网络中,这种情况也被称为“梯度爆炸”

当梯度太大时,参数的调整会变得过於剧烈,网络的学习变得不稳定,甚至会导致训练失败。

这就像你在陡峭的悬崖边滑落,一下子失去了控制。

网络的参数变化过大,导致结果变得很不稳定,甚至完全错误。

概括地说:

梯度消失就像在一座越来越平的山坡上,梯度变得很小,神经网络不知道该怎么调整,进而学习变得很慢,甚至无法进步。

梯度爆炸就像从悬崖边滚下去,梯度变得很大,网络的学习变得过於剧烈,结果会非常不稳定,训练过程变得不可控。

这两个问题经常会出现在深层神经网络中。

而这也是马库斯所要倾诉的困扰。

“说起来,最近的研究还卡在了『梯度消失』的问题上。”

马库斯苦笑著说道,靠在沙发上,“我们在训练一些更深层次的神经网络时,发现模型一旦超过一定的深度,反向传播算法中的梯度会逐渐趋近於零,根本无法有效更新权重。

深度越大,梯度就越容易消失,整个网络的学习效率大幅下降。”

马库斯知道林枫硕士是麻省理工学院的计算机硕士,因此也就全都用专业术语表述了。

对於这些林枫当然能听明白,非但能听明白,而且作为一个资深的人工智慧从业人员。

林枫也清楚知道马库斯面临的难题。

林枫对ai的发展也有所了解,涉及到梯度问题在2014年是深度学习研究中的一个巨大挑战。

甚至可以说解决不了梯度问题就很难有真正的深度学习,也就不会有后来的人工智慧成果的一系列井喷。

林枫心说,自己这是一不小心站在了技术发展的最前沿了吗?

不得不说,这种举手投足之间就能影响时代命运的感觉是真的无比美妙。

“梯度消失的问题一直存在,尤其是深层网络。

梯度爆炸倒是相对好解决,但梯度消失会直接导致学习过程停滯不前。”

林枫沉思片刻,补充道,“这不仅是你们实验室的问题,也是整个领域的瓶颈。

反向传播的基本原理决定了,当信號在网络中层层传递时,梯度的变化会以指数级缩小。”

马库斯脑海中泛起了大大的问號,梯度爆炸问题好解决吗?

他怎么觉得梯度爆炸问题也挺麻烦的?

不过聊天本来就是求同存异,既然林同样认为梯度消失难以解决就够了。

马库斯也没纠结为什么林说梯度爆炸容易解决,而是继续就梯度消失发表观点说道:“是啊,哪怕有了relu(修正线性单元)激活函数的引入,虽然能在一定程度上减轻梯度消失,但对深层网络还是不够。”

林枫想了想,说道:“你们有考虑过改进网络结构吗?”

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

前方高能废材又怎么样?照样吊打你!崩坏星河会穿越的外交官逍遥初唐我家太子妃超凶的重生之独步江湖仙域科技霸主星门锦鲤娇妻:摄政王宠妻手册绝世神医撼天光明纪元听说你爱我抗战从周卫国开始神诡世界修仙从制符开始遮天之圣体时代盛世妖娆:邪帝宠狂妻天元仙记我靠赚差价暴富了末日模拟器,我以剑道证超凡全球迷雾求生猎人:我真不是除念师美漫世界霸王轨迹玄灵界都知道我柔弱可怜但能打