728x90
VToonify
- paper https://arxiv.org/abs/2209.11224
- ์๋ณธ ์ด๋ฏธ์ง์ input ๊ฐ์ ์ด๋ ์ ๋ degree๋ก ๋ณํํ ์ง ๋ณ๊ฒฝ ๊ฐ๋ฅ
- ๊ธฐ์กด์ StyleGAN์์ ์์์ Toonify ์งํ์ ๋ฐ์ํ๋ ๋จ์ ์ธ ํด์๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ค.
- Toonify์ DualStyleGAN ๋ชจ๋ธ ๋๋ค ์ง์ (www.mmlab-ntu.com/project/vtoonify/)
-
- multi-scale content condition์ผ๋ก ์๋ณธ ์ด๋ฏธ์ง์ stylegan์ ๋ณํ ์ด๋ฏธ์ง๋ฅผ ํฉ์ณค๋ค.(Trainable Fusion Module ์ฌ์ฉ)
- ๊ธฐ์กด StyleGAN์ ์์ ๋ณํ์ ๋ถ์์ฐ์ค๋ฌ์์ ๊ฐ์
- reference style์ ๋ฐ๋ผ ๋ณํ ๊ฐ๋ฅ
- pre-trained model ์ ๊ณต (์ ๋ง ๊ฐ์ฌ!)
- ์์ ์ ์ฌ์ฉ ๋ถ๊ฐ ์ฃผ์
- null
VToonify
null
M1 Mac์์ CPU๋ก ๊ตฌ๋
- M1 MAC์ CUDA๊ฐ ์์ผ๋ฏ๋ก stylegan์์ ์ ๊ณตํ๋ cpu ๋ฒ์ ์ ๋ชจ๋๋ก ๋ฐ๊ฟ์ค๋ค.
# vtoonify์ model.stylegan.model.py ํ์ผ์์ metric ๋ถ๋ฌ์ค๋ ๋ถ๋ถ์ ๋ชจ๋์ op_cpu๋ก ๋ฐ๊ฟ์ค๋ค.
# op -> op_cpu
from model.stylegan.op_cpu import FusedLeakyReLU, fused_leaky_relu, upfirdn2d, conv2d_gradfix
# parameter style_degree 0~1 Toonify ์ ๋
optional arguments:
-h, --help show this help message and exit
--content CONTENT path of the content image/video
--style_id STYLE_ID the id of the style image
--style_degree STYLE_DEGREE
style degree for VToonify-D
--color_transfer transfer the color of the style
--ckpt CKPT path of the saved model
--output_path OUTPUT_PATH
path of the output images
--scale_image resize and crop the image to best fit the model
--style_encoder_path STYLE_ENCODER_PATH
path of the style encoder
--exstyle_path EXSTYLE_PATH
path of the extrinsic style code
--faceparsing_path FACEPARSING_PATH
path of the face parsing model
--video if true, video stylization; if false, image stylization
--cpu if true, only use cpu
--backbone BACKBONE dualstylegan | toonify
--padding PADDING PADDING PADDING PADDING
left, right, top, bottom paddings to the face center
--batch_size BATCH_SIZE
batch size of frames when processing video
--parsing_map_path PARSING_MAP_PATH
path of the refined parsing map of the target video
Result
- cartoon ๋นผ๊ณ ๋ ๋ค ์ง๊ทธ๋ฌ์ ๋ณด์ธ๋ค.
- ๋ชจ๋ธ๊ณผ train util ๋ํ ์ ๊ณต๋๋ฏ๋ก ๊ณ ํํ~, spongebobํ ๋ฑ dataset ์ ์ฉํด ๋ณผ ์ ์์ ๊ฑฐ ๊ฐ๋ค.
- style_degree ์กฐ์ ๊ฐ๋ฅ
๋ฐ์ํ
'๐พ Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ASR, ] Deepspeech2 (0) | 2023.02.22 |
---|---|
[NVIDIA RIVA] ngc ๋ฑ๋ก (0) | 2023.01.27 |
ViT(Vision in Transformer) Review (0) | 2022.12.19 |
Tensor ๊ฐ์ง๊ณ ๋๊ธฐ [Einsum + einops] (0) | 2022.12.17 |
[Computer Vision] Image Modul Pillow import Error (0) | 2022.12.14 |