Conditional VAE (์กฐ๊ฑด๋ถ VAE)
์กฐ๊ฑด๋ถVAE(Conditional VAE)๋ ์ ์ฌ ๋ณ์๋ฟ๋ง ์๋๋ผ ๋ ์ด๋ธ๋ ๋์ฝ๋์ ์
๋ ฅํ์ฌ ๋ ์ด๋ธ์ ์ง์ ํ๋ ํํ๋ก ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ค. ํ๊ธฐ์ฒด ์ซ์ ์ด๋ฏธ์ง๋ณ๋ก ๊ฐ๋ก์ ์ธ๋ก์ ์ ์ฌ ๋ณ์ 2๊ฐ๋ฅผ ๋ณํ์ํค๋ฉฐ ๊ฐ์ ์ซ์๋ผ๋ ํ๊ธฐ์ฒด ์ซ์ ์ด๋ฏธ์ง๊ฐ ๋ฐ๋๋ ๊ฒ์ ์ ์ ์๋ค.
VAE๋ ๋ณดํต ๋น์ง๋ํ์ต์ด์ง๋ง ์ง๋ํ์ต ์์๋ฅผ ์ถ๊ฐํด ๋น์ง๋ ํ์ต์ ์คํํ๋ฉด ๋ณต์ํ ๋ฐ์ดํฐ๋ฅผ ์ง์ ํ ์ ์๋ค.
β-VAE
β-VAE๋ ์ด๋ฏธ์ง์ 'disentanglement', ์ฝํ ๊ฒ์ ํธ๋ ๊ฒ์ด ํน์ง์ด๋ค. ์ด๋ฏธ์ง์ ํน์ง์ ์ ์ฌ ๊ณต๊ฐ์์ ๋ถ๋ฆฌํ๋ ์์ฉ ๊ธฐ์ ์ด๋ค. ์๋ฅผ ๋ค์ด ์ผ๊ตด ์ด๋ฏธ์ง๋ ์ฒซ ๋ฒ์จฐ ์ ์ฌ ๋ณ์์์ ๋์ ๋ชจ์, ๋ ๋ฒ์งธ ์ ์ฌ ๋ณ์์์ ์ผ๊ตด ๋ฐฉํฅ์ ํน์ง์ ๋ด๋๋ค. ์ ์ฌ ๋ณ์๋ก ๋์ ๋ชจ์์ ์กฐ์ ํ๊ณ ๋ ๋ฒ์งธ ์ ์ฌ ๋ณ์๋ก ์ผ๊ตด์ ๋ฐฉํฅ์ ์กฐ์ ํ ์ ์๋ค.
์ฒซ๋ฒ์งธ ์ด์ ์ฌ์ง์ ์ผ๊ตด์ ๋ฐฉํฅ์ด ๋ฐ๋๊ฒ ์กฐ์ ๋์ด ๊ฐ๊ณ ์๋ค.
๋๋ฒ์งธ ์ด์ ์ฌ์ง์ ๊ฐ์ ์ ๋ํ ํ์ ์ด ๋ฐ๋๊ฒ ์กฐ์ ๋์ด ๊ฐ๊ณ ์๋ค.
์ธ๋ฒ์งธ ์ด์ ์ฌ์ง์ ๋จธ๋ฆฌ ์คํ์ผ์ด ๋ฐ๋๊ฒ ์กฐ์ ๋์ด ๊ฐ๊ณ ์๋ค.
VAE๋ ํ์ ๊ณผ ์ผ๊ตด์ ๋ฐฉํฅ์ด ๋ชจ๋ ๋ณํ ํ๋ค. β-VAE๋ ์ผ๊ตด ๋ฑกํฅ๊ณผ ํ์ ์ด์ธ์๋ ๋ณํํ๋ ์์๊ฐ ์๋ค. ์ด์ฒ๋ผ
β-VAE๋ ์ ์ฌ ๋ณ์๋ฅผ ์ฌ์ฉํด ์ด๋ฏธ์ง ๋ฑ์ ํน์ง์ ์์ ๊ธฐ์ค์ผ๋ก ๋๋ ์ ์๋ ๊ธฐ์ ์ด๋ค.
VQ-VAE
VAE๋ ์ ์ฌ ๋ณ์๊ฐ ๋ฐ์ดํฐ์ ํน์ง์ ์ ํํ๊ฒ ํ์
ํ์ง ๋ชปํ๋ '์ฌํ ๋ถ๊ดด(posterior collapse)'๋ผ๋ ํ์์ผ๋ก ์ธํด, ์์ฑ๋ ์ด๋ฏธ์ง๊ฐ ํ๋ฆฟํ ๋ฌธ์ ๊ฐ ์์๋ค. ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ๊ฒ์ด '๋ฒกํฐ ์์ํ๋ ๋ณ์ดํ ์คํ ์ธ์ฝ๋(Vector Quantised-VAE)' VQ-VAE ์ด๋ค. ์ ์ฌ ๋ณ์๋ฅผ ์ด์ฐ ๊ฐ ์ฆ 0,1,2 ๋ฑ ์ฐ์๋์ง ์์ ๊ฐ์ผ๋ก ๋ณํํ๋ค. ์ด๋ ์ด๋ฏธ์ง๋ฅผ ์ธ์ฝ๋์ ์
๋ ฅํ๊ณ ์ถ๋ ฅ์ธ ์ ์ฌ ๋ณ์์ ๋ฒกํฐ๋ฅผ ์ฝ๋๋ถ์ mappingํด ๊ตฌํํ๋ค.
VQ-VAE-2
VQ-VAE-2๋ VQ-VAE๋ฅผ ๊ณ์ธต ๊ตฌ์กฐ๋ก ๋ง๋ค์ด ๋ ๋์ ํด์๋์ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ ์ ์๊ฒ ๋ง๋ ๊ธฐ์ ์ด๋ค. ์ด ์ ์ฌ ํํ์ ์๋ ์ด๋ฏธ์ง๋ณด๋ค ํจ์ฌ ์์ง๋ง๋ ๋์ฝ๋์ ์
๋ ฅํ๋ฉด ๋ ์ ๋ช
ํ๊ณ ์ฌ์ค์ ์ธ ์ด๋ฏธ์ง๋ฅผ ์ฌ๊ตฌํ ๊ฐ๋ฅํ๋ค.
'๐พ Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
ํ์ด์ฌ์ ๋ด๋ฐ (0) | 2021.02.24 |
---|---|
[Transformer] Model ์ ๋ฆฌ (0) | 2021.02.23 |
[Transformer] Positional Encoding (3) (0) | 2021.02.20 |
[Transformer] Position-wise Feed-Forward Networks (2) (0) | 2021.02.20 |
[Transformer] Self-Attension ์ ํ ์ดํ ์ (0) (0) | 2021.02.19 |