728x90
์ ๊ฒฝ๋ง์๋ ๊ณผ์ ํฉ๊ณผ Gradient Vanishing ์ธ์ Internal Covariance shift ๋ฌธ์ ๊ฐ ๋ ์๋ค. Internal Covariance shift๋ ๊ฐ Layer๋ง๋ค Input ๋ถํฌ๊ฐ ๋ฌ๋ผ์ง์ ๋ฐ๋ผ ํ์ต ์๋๊ฐ ๋๋ ค์ง๋ ํ์์ด๋ค. Batch Normalization์ ์ด๋ฐ ๊ฒ์ ํด๊ฒฐํ๊ธฐ ์ํด Input ๋ถํฌ๋ฅผ ์ ๊ทํ ์์ผ ํ์ต ์๋๋ฅผ ๋น ๋ฅด๊ฒ ์งํ ์ํจ๋ค.
$BN(h;\gamma,\beta) = \beta + \gamma\tfrac{h-E(h)}{\sqrt{(Var(h)+\epsilon)}}$
๋ฐ์ํ
'๐พ Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Softmax RuntimeWarning ํด๊ฒฐ (0) | 2021.03.03 |
---|---|
ํ์ฑํ ํจ์(activation function) (0) | 2021.03.03 |
GAN (Generative Adversarial Networks) (0) | 2021.02.26 |
์ญ์ ํ (backpropagtion) (0) | 2021.02.26 |
ํ์ด์ฌ์ ๋ด๋ฐ (0) | 2021.02.24 |