* BERT๋ชจ๋ธ์ ์ฌ์ฉ๋๋ ์ฌ์ ํ์ต ์ ๋ต (Pretrained Training)
๋ค์ ๋ฌธ์ฅ ์์ธก์ ๋ํ ๋ฐฉ๋ฒ์ ์ด์ง ๋ถ๋ฅ๋ก ์งํํ๋ค.
EX)
A : ์ข ํฉ์๋์ธ ์ ๊ณ ๋ ์ด๋์ํ๋์?
B : ํํ ์ค์์ ํฉ๋๋ค.
A์ ํ์ ๋ฌธ์ฅ์ผ๋ก B๊ฐ ์๋ง์์ ์ ์ ์๋ค. ์ด ๊ฒฝ์ฐ isNext(True)๋ก ํ์ ํ๋ค.
A : ์ข ํฉ์๋์ธ ์ ๊ณ ๋ ์ด๋์ํ๋์?
B : SSEM์์ ํฉ๋๋ค.
A์ ํ์ ๋ฌธ์ฅ์ด B๊ฐ ๋ง๋์ง ์ ์ ์๋ค. ์ด ๊ฒฝ์ฐ notNext(False)๋ก ํ์ํ๋ค.
์ด๋ ๊ฒ is / not์ผ๋ก ์ด์ง ๋ถ๋ฅ๋ฅผ ์งํํ๋ค.
ํ์ต ์ด๊ธฐ์๋ ํผ๋ํฌ์๋ ๋คํธ์ํฌ(ReLU)์ ๊ฐ์ค์น๊ฐ ์ ํํ์ง ์์ ์ฌ๋ฐ๋ฅด๊ฒ ๋ฐํํ์ง ๋ชปํ๋ค. ์ต์ ์ ๊ฐ์ค์น๋ฅผ ์ฐพ์ผ๋ฉด์ ๋ค์ ๋ฌธ์ฅ์ ๋ํ ๊ด๊ณ๋ฅผ ์ ํํ๊ฒ ํ๋จํ๊ฒ ๋๋ค.
* ์ฌ์ ํ์ต ์ ์ฐจ
MLM(Mask ์ฑ์ฐ๊ธฐ)
+ NSP(๋ค์ ๋ฌธ์ฅ ์์ธก)์ ํตํด BERT๋ฅผ ํ์ต ์ํจ๋ค.
+ ์์ ์คํ - Adam Optimizer (์ด๊ธฐ์๋ ํฐ ๋ณํ๋ฅผ ์ ๋ํ๊ณ ํ์ต ํ๋ฐ์๋ ๋ฎ์ ํ์ต๋ฅ ๋ก ์์ ๋ณํ๋ฅผ ์ฃผ์ด ์ต์ ํ)
ํ์ฑํ ํจ์๋ก GeLU(Gaussian Error Linear Unit)๋ฅผ ์ฌ์ฉ
'๐ฃ๏ธ Natural Language Processing' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[BERT TOKENIZE]๋จ์ด ํ ํฐํ (1)- ๋ฐ์ดํธ ์ ์ธ์ฝ๋ฉ (0) | 2022.05.09 |
---|---|
[BERT] ํ์ ๋จ์ด ํ ํฐํ + OOV (Out of Vocabulary) (0) | 2022.05.09 |
๋ฒํคํ (bucketing)์ ์ด์ฉํ ํ์ต ๋ณต์ก๋ ํด๊ฒฐ (0) | 2021.03.28 |
[CNN] ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง (feat. Learning Word Vectors for Sentiment Analysis) (0) | 2021.03.13 |
[doc2vec] ๋ฌธ์ ์ ์ฌ๋ ์ถ์ (0) | 2021.03.09 |