当前位置: 首页 > news >正文

【期末复习向】常见的激活函数

激活函数是非线性的函数,使用它的原因就是因为线性函数无论叠加多少层,最终带来的变化都是线性的组合,一般也只能用于线性分类,如经典的多层感知机。但是如果加上非线性的变换,根据通用近似定理,就可使得神经网络无限逼近任意函数,可以解决的问题范围也就大大增加了。此外激活函数对于加快模型收敛、缓解梯度消失等问题也大有帮助。下面举例3个常见的激活函数,sigmoid、tanh、relu及其变种。

激活函数都是非线性的;连续并且可导(用于反向传播算法);尽可能的简单;值域在一个小的区间。


1.sigmoid函数与tanh函数

sigmoid也叫logistics函数它的输出恒大于0如图所示,值域是在0-1的。所以它可以把特征值压缩到较小的范围,使得训练结果比较问题波动不会太大。缺点是导数即梯度值可能过于接近0,随着梯度的传播,导数越来越接近0,最终导致梯度消失的问题。此外,输出不是0均值,进而导致后一层神经元将得到上一层输出的非0均值的信号作为输入。随着网络的加深,会改变原始数据的分布趋势;

而Tanh函数是零中心化,可以解决sigmoid输出不是0均值的问题;同时它的导数范围比sigmoid大,所以可以稍微缓解梯度消失的问题,但是仍然存在。

2者都属于饱和函数,容易导致梯度消失问题

2.relu及其变种

relu属于非饱和函数,在输入为正时,导数不会趋近0,所以梯度消失问题大大缓解

但是它输出不是0均值,且有因为没有趋于0的导数,由于数据的不同可能导致梯度爆炸问题

相关文章:

  • 常见的工作流编排引擎
  • 基于docker容器化部署微服务
  • 云计算大屏,可视化云计算分析平台(云实时数据大屏PSD源文件)
  • 【Linux服务器Java环境搭建】09 在CentOS系统中安装和配置clickhouse数据库
  • Active Objects设计模式
  • Pandas实践_分组
  • 020 OpenCV 轮廓、外接圆、外接矩形
  • Postman-脚本自动化及定时执行脚本(7)
  • Mac 中文版 Navicat Premium 16 下载安装详细教程
  • LeetCode力扣每日一题(Java):58、最后一个单词的长度
  • 内网服务器部署maven私服简记
  • 微信小程序map视野发生改变时切换定位点
  • 案例055:基于微信小程序的四六级词汇
  • 服务器被DDOS攻击如何用高防ip去防护?
  • 小程序开发实战案例四 | 小程序标题栏如何设置
  • 【从零开始安装kubernetes-1.7.3】2.flannel、docker以及Harbor的配置以及作用
  • Apache Pulsar 2.1 重磅发布
  • Apache Zeppelin在Apache Trafodion上的可视化
  • CSS盒模型深入
  • Docker 笔记(2):Dockerfile
  • Git的一些常用操作
  • Java反射-动态类加载和重新加载
  • Java方法详解
  • Swift 中的尾递归和蹦床
  • 前端路由实现-history
  • 实习面试笔记
  • MyCAT水平分库
  • 积累各种好的链接
  • ​【已解决】npm install​卡主不动的情况
  • ​2020 年大前端技术趋势解读
  • ​ArcGIS Pro 如何批量删除字段
  • ​渐进式Web应用PWA的未来
  • #NOIP 2014# day.1 T3 飞扬的小鸟 bird
  • #我与Java虚拟机的故事#连载03:面试过的百度,滴滴,快手都问了这些问题
  • #我与Java虚拟机的故事#连载07:我放弃了对JVM的进一步学习
  • $ is not function   和JQUERY 命名 冲突的解说 Jquer问题 (
  • (003)SlickEdit Unity的补全
  • (2021|NIPS,扩散,无条件分数估计,条件分数估计)无分类器引导扩散
  • (读书笔记)Javascript高级程序设计---ECMAScript基础
  • (附源码)python房屋租赁管理系统 毕业设计 745613
  • (附源码)计算机毕业设计SSM基于java的云顶博客系统
  • (转)甲方乙方——赵民谈找工作
  • (最简单,详细,直接上手)uniapp/vue中英文多语言切换
  • .aanva
  • .bat批处理(七):PC端从手机内复制文件到本地
  • .NET Core中Emit的使用
  • .NET MAUI学习笔记——2.构建第一个程序_初级篇
  • .net 微服务 服务保护 自动重试 Polly
  • .NET处理HTTP请求
  • .NET大文件上传知识整理
  • .Net下的签名与混淆
  • @Repository 注解
  • [ vulhub漏洞复现篇 ] Apache Flink目录遍历(CVE-2020-17519)
  • [AIGC] Java 和 Kotlin 的区别
  • [AutoSar]BSW_OS 01 priority ceiling protocol(PCP)