Batch Normalization
ยท
๐พ Deep Learning
์ ๊ฒฝ๋ง์๋ ๊ณผ์ ํฉ๊ณผ Gradient Vanishing ์ธ์ Internal Covariance shift ๋ฌธ์ ๊ฐ ๋ ์๋ค. Internal Covariance shift๋ ๊ฐ Layer๋ง๋ค Input ๋ถํฌ๊ฐ ๋ฌ๋ผ์ง์ ๋ฐ๋ผ ํ์ต ์๋๊ฐ ๋๋ ค์ง๋ ํ์์ด๋ค. Batch Normalization์ ์ด๋ฐ ๊ฒ์ ํด๊ฒฐํ๊ธฐ ์ํด Input ๋ถํฌ๋ฅผ ์ ๊ทํ ์์ผ ํ์ต ์๋๋ฅผ ๋น ๋ฅด๊ฒ ์งํ ์ํจ๋ค. $BN(h;\gamma,\beta) = \beta + \gamma\tfrac{h-E(h)}{\sqrt{(Var(h)+\epsilon)}}$