[Whisper] Kspon Valid --- (2) CER
ยท
๐พ Deep Learning
Robust Speech Recognition via Large-Scale Weak Supervision *large model์ 2023.1 large-v2์ ๋์ผํ๊ฒ ๋ฐ๋ KsponSpeech ๋ฐ์ดํฐ๋ ์งง์ ๋ฐํ์ audio๋ฅผ ์ฃผ๋ก ๊ตฌ์ฑ๋์ด์๋ค. Whisper๋ 99๊ฐ์ ํ ํฐ์ผ๋ก ์ฒ์ ๋ฐํ์ ๋ํ ์ธ์ด ์์ธก(language identification)์ ์ํํ๋ค. ํ์ง๋ง ๋๋ฌด ์งง์ ๋ฐํ ๊ฐ์ ๊ฒฝ์ฐ whisper๊ฐ ๋ค๋ฅธ ์ธ์ด๋ก ์์ธกํด translate ์์ฒด๊ฐ ํ๋ ค๋ฒ๋ ค CER์ด ์ฆ๊ฐํ๋ ๊ฒ์ ๋ณผ ์ ์๋ค. language Configure์ korean์ผ๋ก ์ค์ ํ๋ฉด language identification์ ์ํํ์ง ์๊ณ ๋ฐ๋ก transcript๋ก ์์ธกํด ๋ ์ข์ ์ฑ๊ณผ๊ฐ ๋ฌ๋ค. model size๋ ์..