https://vcai.mpi-inf.mpg.de/projects/DragGAN/
Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold
--> Abstract Synthesizing visual content that meets users' needs often requires flexible and precise controllability of the pose, shape, expression, and layout of the generated objects. Existing approaches gain controllability of generative adversarial net
vcai.mpi-inf.mpg.de
Abstract
GAN (Generative Adversarial Networks)๊ณผ ๊ฐ์ ๋ฅ ์์ฑ ๋ชจ๋ธ๋ค์ ๋ฌด์์๋ก ์ค์ฌ์ ์ธ ์ด๋ฏธ์ง๋ฅผ ํฉ์ฑํ๋ ๋ฐ์ ์์ด์ ์ ๋ก ์๋ ์ฑ๊ณต์ ๊ฑฐ๋์์ต๋๋ค. ์ค์ ์์ฉ ํ๋ก๊ทธ๋จ์์ ์ด๋ฌํ ํ์ต ๊ธฐ๋ฐ ์ด๋ฏธ์ง ํฉ์ฑ ๋ฐฉ๋ฒ์ ์ค์ํ ์๊ตฌ ์ฌํญ์ ์์ฑ๋ ์๊ฐ์ ์ฝํ ์ธ ์ ๋ํ ์ ์ด ๊ฐ๋ฅ์ฑ์ ๋๋ค. ์๋ฅผ ๋ค์ด, ์์ ๋ฏธ๋์ด ์ฌ์ฉ์๋ ์บก์ฒ๋ ์ฌ์ง์์ ์ธ๋ฌผ ๋๋ ๋๋ฌผ์ ์์น, ๋ชจ์, ํ์ , ๋ชธ์ ์์ธ๋ฅผ ์กฐ์ ํ๊ณ ์ถ์ ์ ์์ต๋๋ค. ์ ๋ฌธ์ ์ธ ์ํ ์๊ฐํ ๋ฐ ๋ฏธ๋์ด ํธ์ง์์๋ ํน์ ๋ ์ด์์์ ๊ฐ์ง ์ฅ๋ฉด์ ์ค์ผ์น๋ฅผ ํจ์จ์ ์ผ๋ก ์์ฑํด์ผ ํ ์ ์์ผ๋ฉฐ, ์๋์ฐจ ๋์์ด๋๋ ์์ ๋ค์ ์ฐฝ์๋ฌผ์ ๋ชจ์์ ๋ํ์์ผ๋ก ์์ ํ๊ณ ์ถ์ดํ ์๋ ์์ต๋๋ค. ์ด๋ฌํ ๋ค์ํ ์ฌ์ฉ์ ์๊ตฌ์ ๋ง์กฑ์ํค๊ธฐ ์ํด์๋ ์ด์์ ์ธ ์ ์ด ๊ฐ๋ฅํ ์ด๋ฏธ์ง ํฉ์ฑ ๋ฐฉ๋ฒ์ ๋ค์๊ณผ ๊ฐ์ ํน์ฑ์ ๊ฐ์ ธ์ผ ํฉ๋๋ค.
1) ์ ์ฐ์ฑ: ์์ฑ๋ ๊ฐ์ฒด ๋๋ ๋๋ฌผ์ ์์น, ์์ธ, ๋ชจ์, ํ์ ๋ฐ ๋ ์ด์์๊ณผ ๊ฐ์ ๋ค์ํ ๊ณต๊ฐ ์์ฑ์ ์ ์ดํ ์ ์์ด์ผ ํฉ๋๋ค.
2) ์ ํ์ฑ: ๊ณต๊ฐ ์์ฑ์ ๋์ ์ ํ๋๋ก ์ ์ดํ ์ ์์ด์ผ ํฉ๋๋ค.
3) ์ผ๋ฐ์ฑ: ํน์ ๋ฒ์ฃผ์ ๊ตญํ๋์ง ์๊ณ ๋ค๋ฅธ ๊ฐ์ฒด ๋ฒ์ฃผ์๋ ์ ์ฉํ ์ ์์ด์ผ ํฉ๋๋ค.
์ด์ ์์ ๋ค์ ์ด๋ฌํ ํน์ฑ ์ค ํ๋ ๋๋ ๋ ๊ฐ์ง๋ง์ ๋ง์กฑ์ํค๊ธฐ ๋๋ฌธ์, ์ด ๋ ผ๋ฌธ์์๋ ์ด๋ฌํ ํน์ฑ์ ๋ชจ๋ ๋ง์กฑ์ํค๊ธฐ๋ฅผ ๋ชฉํ๋ก ํฉ๋๋ค.



์ฌ์ฉ์ ์ ๋ ฅ ์ด๊ธฐ ์ด๋ฏธ์ง 1์ฐจ ์ต์ ํ ๋จ๊ณ ํฌ์ธํธ ์ ๋ฐ์ดํธ ์ต์ข ์ด๋ฏธ์ง ํธ๋ค ํฌ์ธํธ ํ๊ฒ ํฌ์ธํธ
GAN ์์ฑ ์ด๋ฏธ์ง๊ฐ ์ฃผ์ด์ง๋ฉด ์ฌ์ฉ์๋ ๋ช ๊ฐ์ ํธ๋ค ํฌ์ธํธ(๋นจ๊ฐ ์ ), ํ๊ฒ ํฌ์ธํธ(ํ๋ ์ ) ๋ฐ ํธ์ง ์ค์ธ ์ด๋ ๊ฐ๋ฅํ ์์ญ์ ๋ํ๋ด๋ ๋ง์คํฌ(๋ฐ์ ์์ญ)๋ฅผ ์ค์ ํ๊ธฐ๋ง ํ๋ฉด๋ฉ๋๋ค. ์ ๊ทผ ๋ฐฉ์์ ๋ฐ๋ณต์ ์ผ๋ก ์ด๋ ๋ฐ ํฌ์ธํธ ์ถ์ ์ ์ํํฉ๋๋ค. ์ด๋ ๊ฐ๋ ๋จ๊ณ์์ ํธ๋ค ํฌ์ธํธ(๋นจ๊ฐ ์ )๋ ํ๊ฒ ํฌ์ธํธ(ํ๋ ์ )๋ก ์ด๋ํ๊ณ ํฌ์ธํธ ์ถ์ ๋จ๊ณ์์ ํธ๋ค ํฌ์ธํธ๋ ์ด๋ฏธ์ง์์ ๊ฐ์ฒด๋ฅผ ์ถ์ ํ๊ธฐ ์ํด ์ ๋ฐ์ดํธ๋ฉ๋๋ค. ์ด ๊ณผ์ ์ ํธ๋ค ํฌ์ธํธ๊ฐ ํด๋นํ๋ ํ๊ฒ ํฌ์ธํธ์ ๋๋ฌ ํ ๋๊น์ง ๊ณ์๋ฉ๋๋ค.
ํธ๋ค ํฌ์ธํธ์ ์๋ฏธ ์๋ ์์น๊ฐ ํด๋นํ๋ ํ๊ฒ ํฌ์ธํธ์ ๋๋ฌ ํ ๋๊น์ง ์ฐ๋ฆฌ๋ ์ฌ์ฉ์๊ฐ ์์ง์ผ ์์๋ ์์ญ์ ๋ํ๋ด๋ ์ด์ง ๋ง์คํฌ M์ ์ ํ์ ์ผ๋ก ๊ทธ๋ฆด ์๋ ์์ต๋๋ค.
'๐พ Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
CM3leon(.Meta) (0) | 2023.07.16 |
---|---|
[CS324] Introduction (0) | 2023.07.03 |
[RL] Stable-baselines3 gym -> gymnasium (0) | 2023.04.20 |
Choose Your Weapon:Survival Strategies for Depressed AI Academics (0) | 2023.04.18 |
[RL] Soft Actor-Critic (a.k.a SAC) (0) | 2023.04.12 |
https://vcai.mpi-inf.mpg.de/projects/DragGAN/
Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold
--> Abstract Synthesizing visual content that meets users' needs often requires flexible and precise controllability of the pose, shape, expression, and layout of the generated objects. Existing approaches gain controllability of generative adversarial net
vcai.mpi-inf.mpg.de
Abstract
GAN (Generative Adversarial Networks)๊ณผ ๊ฐ์ ๋ฅ ์์ฑ ๋ชจ๋ธ๋ค์ ๋ฌด์์๋ก ์ค์ฌ์ ์ธ ์ด๋ฏธ์ง๋ฅผ ํฉ์ฑํ๋ ๋ฐ์ ์์ด์ ์ ๋ก ์๋ ์ฑ๊ณต์ ๊ฑฐ๋์์ต๋๋ค. ์ค์ ์์ฉ ํ๋ก๊ทธ๋จ์์ ์ด๋ฌํ ํ์ต ๊ธฐ๋ฐ ์ด๋ฏธ์ง ํฉ์ฑ ๋ฐฉ๋ฒ์ ์ค์ํ ์๊ตฌ ์ฌํญ์ ์์ฑ๋ ์๊ฐ์ ์ฝํ ์ธ ์ ๋ํ ์ ์ด ๊ฐ๋ฅ์ฑ์ ๋๋ค. ์๋ฅผ ๋ค์ด, ์์ ๋ฏธ๋์ด ์ฌ์ฉ์๋ ์บก์ฒ๋ ์ฌ์ง์์ ์ธ๋ฌผ ๋๋ ๋๋ฌผ์ ์์น, ๋ชจ์, ํ์ , ๋ชธ์ ์์ธ๋ฅผ ์กฐ์ ํ๊ณ ์ถ์ ์ ์์ต๋๋ค. ์ ๋ฌธ์ ์ธ ์ํ ์๊ฐํ ๋ฐ ๋ฏธ๋์ด ํธ์ง์์๋ ํน์ ๋ ์ด์์์ ๊ฐ์ง ์ฅ๋ฉด์ ์ค์ผ์น๋ฅผ ํจ์จ์ ์ผ๋ก ์์ฑํด์ผ ํ ์ ์์ผ๋ฉฐ, ์๋์ฐจ ๋์์ด๋๋ ์์ ๋ค์ ์ฐฝ์๋ฌผ์ ๋ชจ์์ ๋ํ์์ผ๋ก ์์ ํ๊ณ ์ถ์ดํ ์๋ ์์ต๋๋ค. ์ด๋ฌํ ๋ค์ํ ์ฌ์ฉ์ ์๊ตฌ์ ๋ง์กฑ์ํค๊ธฐ ์ํด์๋ ์ด์์ ์ธ ์ ์ด ๊ฐ๋ฅํ ์ด๋ฏธ์ง ํฉ์ฑ ๋ฐฉ๋ฒ์ ๋ค์๊ณผ ๊ฐ์ ํน์ฑ์ ๊ฐ์ ธ์ผ ํฉ๋๋ค.
1) ์ ์ฐ์ฑ: ์์ฑ๋ ๊ฐ์ฒด ๋๋ ๋๋ฌผ์ ์์น, ์์ธ, ๋ชจ์, ํ์ ๋ฐ ๋ ์ด์์๊ณผ ๊ฐ์ ๋ค์ํ ๊ณต๊ฐ ์์ฑ์ ์ ์ดํ ์ ์์ด์ผ ํฉ๋๋ค.
2) ์ ํ์ฑ: ๊ณต๊ฐ ์์ฑ์ ๋์ ์ ํ๋๋ก ์ ์ดํ ์ ์์ด์ผ ํฉ๋๋ค.
3) ์ผ๋ฐ์ฑ: ํน์ ๋ฒ์ฃผ์ ๊ตญํ๋์ง ์๊ณ ๋ค๋ฅธ ๊ฐ์ฒด ๋ฒ์ฃผ์๋ ์ ์ฉํ ์ ์์ด์ผ ํฉ๋๋ค.
์ด์ ์์ ๋ค์ ์ด๋ฌํ ํน์ฑ ์ค ํ๋ ๋๋ ๋ ๊ฐ์ง๋ง์ ๋ง์กฑ์ํค๊ธฐ ๋๋ฌธ์, ์ด ๋ ผ๋ฌธ์์๋ ์ด๋ฌํ ํน์ฑ์ ๋ชจ๋ ๋ง์กฑ์ํค๊ธฐ๋ฅผ ๋ชฉํ๋ก ํฉ๋๋ค.



์ฌ์ฉ์ ์ ๋ ฅ ์ด๊ธฐ ์ด๋ฏธ์ง 1์ฐจ ์ต์ ํ ๋จ๊ณ ํฌ์ธํธ ์ ๋ฐ์ดํธ ์ต์ข ์ด๋ฏธ์ง ํธ๋ค ํฌ์ธํธ ํ๊ฒ ํฌ์ธํธ
GAN ์์ฑ ์ด๋ฏธ์ง๊ฐ ์ฃผ์ด์ง๋ฉด ์ฌ์ฉ์๋ ๋ช ๊ฐ์ ํธ๋ค ํฌ์ธํธ(๋นจ๊ฐ ์ ), ํ๊ฒ ํฌ์ธํธ(ํ๋ ์ ) ๋ฐ ํธ์ง ์ค์ธ ์ด๋ ๊ฐ๋ฅํ ์์ญ์ ๋ํ๋ด๋ ๋ง์คํฌ(๋ฐ์ ์์ญ)๋ฅผ ์ค์ ํ๊ธฐ๋ง ํ๋ฉด๋ฉ๋๋ค. ์ ๊ทผ ๋ฐฉ์์ ๋ฐ๋ณต์ ์ผ๋ก ์ด๋ ๋ฐ ํฌ์ธํธ ์ถ์ ์ ์ํํฉ๋๋ค. ์ด๋ ๊ฐ๋ ๋จ๊ณ์์ ํธ๋ค ํฌ์ธํธ(๋นจ๊ฐ ์ )๋ ํ๊ฒ ํฌ์ธํธ(ํ๋ ์ )๋ก ์ด๋ํ๊ณ ํฌ์ธํธ ์ถ์ ๋จ๊ณ์์ ํธ๋ค ํฌ์ธํธ๋ ์ด๋ฏธ์ง์์ ๊ฐ์ฒด๋ฅผ ์ถ์ ํ๊ธฐ ์ํด ์ ๋ฐ์ดํธ๋ฉ๋๋ค. ์ด ๊ณผ์ ์ ํธ๋ค ํฌ์ธํธ๊ฐ ํด๋นํ๋ ํ๊ฒ ํฌ์ธํธ์ ๋๋ฌ ํ ๋๊น์ง ๊ณ์๋ฉ๋๋ค.
ํธ๋ค ํฌ์ธํธ์ ์๋ฏธ ์๋ ์์น๊ฐ ํด๋นํ๋ ํ๊ฒ ํฌ์ธํธ์ ๋๋ฌ ํ ๋๊น์ง ์ฐ๋ฆฌ๋ ์ฌ์ฉ์๊ฐ ์์ง์ผ ์์๋ ์์ญ์ ๋ํ๋ด๋ ์ด์ง ๋ง์คํฌ M์ ์ ํ์ ์ผ๋ก ๊ทธ๋ฆด ์๋ ์์ต๋๋ค.
'๐พ Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
CM3leon(.Meta) (0) | 2023.07.16 |
---|---|
[CS324] Introduction (0) | 2023.07.03 |
[RL] Stable-baselines3 gym -> gymnasium (0) | 2023.04.20 |
Choose Your Weapon:Survival Strategies for Depressed AI Academics (0) | 2023.04.18 |
[RL] Soft Actor-Critic (a.k.a SAC) (0) | 2023.04.12 |