date: 2024-04-06
title: Activation Function
status: DONE
author:
  - AllenYGY
tags:
  - DeepLearning
  - Activation-Function
  - NOTE
created: 2024-04-06T16:42
updated: 2024-05-12T23:15
publish: True

Activation Function

#激活函数 #深度学习

Requirement**

增加非线性表达使得神经网络可以拟合任意函数
连续可导的函数可以使用梯度下降法进行参数更新
定义域是可以映射所有实数
单调递增的函数不改变输入的响应状态

saturation function

饱和函数

Def

导致梯度消失
- 参数不会被更新
Sigmoid
Tanh

Unsaturated function

非饱和函数

Rectified Linear Unit 修正线性单元 RELU
- 解决梯度消失问题
RELU Leaky ReLU, Parametric ReLU, ...

Sigmoid

Cons

非零均值函数
- 导致参数同时（正向/反向）更新，不利于收敛
导数最大值
- 导致每层梯度被动缩小 4 倍
  - 导致开始的几层梯度几乎不变
    - 就是梯度消失现象 gradient vanishing problem

Warning

tanh

Abstract

Pros

零均值函数
- 比 Sigmoid 更快收敛

Cons

饱和函数
- 梯度消失

Warning

ReLU (Rectified Linear Unit)

Abstract

Pros

非零均值函数
- 收敛速度快
非饱和函数
- 避免梯度消失问题