Gated Recurrent Unit
LSTM์ ๊ฐ์ ํ ์ํ ์ ๊ฒฝ๋ง์ ๊ฒ์ดํธ ๊ตฌ์กฐ
2014๋ ๋ด์ ๋ํ๊ต์ ์กฐ๊ฒฝํ ๊ต์๋ ์ธ 6์ธ์ด ์ต์ด ์ ์ ํ๋ค.
GRU๋ ์ ๋ ฅ ๊ฒ์ดํธ์ ๋ง๊ฐ ๊ฒ์ดํธ๋ฅผ ํฉํ ์ ๋ฐ์ดํธ ๊ฒ์ดํธ๊ฐ ์๋ค.
๊ธฐ์ต ์ ์๋ ์ถ๋ ฅ๊ฒ์ดํธ๊ฐ ์๋ ๋์ ๊ณผ๊ฑฐ์์ ์ด์ด๋ฐ์ ๊ธฐ์ต์ ์ ๋ณํ๋ ๋ฆฌ์ ๊ฒ์ดํธ๊ฐ ์๋ค. ์ด๋ฌํ
๊ฒ์ดํธ๊ฐ ๋์ํด LSTM์ฒ๋ผ ์ฅ๊ธฐ ๊ธฐ์ต์ ์ด์ด ๋ฐ์ ์ ์๋ค.
- +: ์์๊ฐ์ ํฉ
- x: ์์๊ฐ์ ๊ณฑ
- 1-: ์ ๋ฌ๋ฐ์ ๊ฐ์ 1์์ ๋นผ๊ธฐ
- σ: ์๊ทธ๋ชจ์ด๋ ํจ์
- r: ๋ฆฌ์ ๊ฒ์ดํธ
- z: ์ ๋ฐ์ดํธ ๊ฒ์ดํธ
- h: ์๋ก์ด ๊ธฐ์ต
x: t ์์ ์์ ์ ๊ฒฝ๋ง์ธต์ ์ ๋ ฅ
h : t-1 ์ด์ ์์ ์ ์ถ๋ ฅ
๊ฒ์ดํธ 2๊ฐ์๋ ๊ฐ๊ฐ ํ์ต ํ๋ผ๋ฏธํฐ๊ฐ ์๋ค. ๋ํ tanh๋ฅผ ๋ ๋ค๋ฅธ ํ์ฑํ ํจ์๋ก ์ฌ์ฉํ๋ ํ์ต ํ๋ผ๋ฏธํฐ๊ฐ ์๋ค. ์ด 3๊ฐ์ ํ์ต ํ๋ผ๋ฏธํฐ๊ฐ ์๋ค.
1. ๋ฆฌ์ ๊ฒ์ดํธ
์๊ทธ๋ชจ์ด๋ ํจ์๋ฅผ ๊ฑฐ์น ์ถ๋ ฅ๊ณผ ๊ณผ๊ฑฐ์์
์ ๋ฌ๋ฐ์ ๋ฐ์ดํฐ์ ์์ ๊ฐ๊ฐ์ ๊ณฑํ๋ค.
์๊ทธ๋ชจ์ด๋ ํจ์๋ 0~1์ ๊ฐ์ ์ถ๋ ฅํ๋ค. ๋ฆฌ์
๊ฒ์ดํธ์์ 0~1 ๊ฐ์ ๊ณฑํ๋ ๊ฒ์ผ๋ก ๊ณผ๊ฑฐ์ ๊ธฐ์ต์ ์ด๋ ์ ๋ ๋ฐ์๋ค์ผ์ง ์กฐ์ ํ๋ค. (= ๊ฐ์ค์น ๋ถ์ฌ)
$A_1^t = \sigma (X^tW_1 + Y ^{t-1}V_1 + B_1)$
2. ์ ๋ฐ์ดํธ ๊ฒ์ดํธ
์๋ก์ด ๊ธฐ์ต์ ์
๋ฐ์ดํธ ๊ฒ์ดํธ์ ๊ฐ์ ๊ณฑํ๊ณ , ๊ณผ๊ฑฐ ๊ธฐ์ต์๋ 1์์ ์
๋ฐ์ดํธ ๊ฒ์ดํธ์ ๊ฐ์ ๋บ ๊ฒฐ๊ณผ๋ฅผ ๊ณฑํ ํ ์๋ก ๋ํ๋ค.
๊ทธ๋ผ ์๋ก์ด ๊ธฐ์ต๊ณผ ๊ณผ๊ฑฐ ๊ธฐ์ต์ ๋น์จ์ด ์กฐ์ ๋์ด ํ ์์ ์ ์ถ๋ ฅ์ ์ป๋๋ค.
$A_0^t = \sigma (X^tW_0 + Y ^{t-1}V_0 + B_0)$
'๐พ Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
VAE(Variational Autoencoder) (1) (0) | 2021.02.18 |
---|---|
nvidia-smi ์ต์ (0) | 2021.02.16 |
RNN์ ์ด์ฉํ ์ด๋ฏธ์ง ์์ฑ(feat.MNIST) (0) | 2021.02.15 |
activation ์ข ๋ฅ (0) | 2021.02.10 |
XG ๋ถ์คํธ(eXtream Gradient Boosting) (0) | 2021.02.09 |