728x90

 BERT๋Š” 2018๋…„ ๊ตฌ๊ธ€์—์„œ ๊ณต๊ฐœํ•œ ๋…ผ๋ฌธ์ธ BERT: Deep Bidirectional Transformers for Language Understanding์—์„œ ์ œ์•ˆ๋œ ๋ชจ๋ธ๋กœ์„œ ๋น„์ง€๋„ ํ•™์Šต์„ ํ†ตํ•ด ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ ๋“ค์–ด๊ฐ€๊ธฐ ์ „์— ์‚ฌ์ „ ํ•™์Šต์„ ์ง„ํ–‰ํ•˜๋Š” ๋ชจ๋ธ์ด๋‹ค. 

 

 ๋ฒ„ํŠธ์˜ ํŠน์ง•์€ ๋‹ค๋ฅธ ์‚ฌ์ „ ๋ชจ๋ธ ๊ธฐ๋ฒ•์ธ GPT๋‚˜ ELMo์™€ ๋‹ค๋ฅด๊ฒŒ ์–‘๋ฐฉํ–ฅ์„ฑ์„ ๊ฐ€์ง€๊ณ  ํ•™์Šตํ•œ๋‹ค. ๋งˆ์Šคํฌ ์–ธ์–ด ๋ชจ๋ธ์„ ํ•™์Šตํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ๋ฒ„ํŠธ๋Š” word2vec์˜ CBOW ์ฒ˜๋Ÿผ ์ฃผ๋ณ€๋‹จ์–ด๋ฅผ ํ†ตํ•ด ์˜๋ฏธ๋ฅผ ํŒŒ์•…ํ•œ๋‹ค. 

 ๋งˆ์Šคํฌ ์–ธ์–ด ๋ชจ๋ธ์ด๋ž€ ์–‘๋ฐฉํ–ฅ์„ฑ์„ ๊ฐ€์ง€๊ณ  ์–ธ์–ด ๋ชจ๋ธ์„ ํ•™์Šตํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ ์ž…๋ ฅ ๋ฌธ์žฅ์ด ์ฃผ์–ด์ง„ ๊ฒฝ์šฐ ์ผ๋ถ€ ๋‹จ์–ด๋“ค์„ ๋งˆ์Šคํ‚นํ•ด์„œ ํ•ด๋‹น ๋‹จ์–ด๋ฅผ ๋ชจ๋ธ์ด ์•Œ์ง€ ๋ชปํ•˜๋„๋ก ๊ฐ€๋ฆฐ๋‹ค. ๊ทธ ํ›„ ๋ชจ๋ธ์„ ํ†ตํ•ด ๋งˆ์Šคํ‚น๋œ ๋‹จ์–ด๊ฐ€ ๋ฌด์—‡์ธ์ง€ ์˜ˆ์ธกํ•œ๋‹ค. ์ž…๋ ฅ๊ฐ’์œผ๋กœ ๋“ค์–ด๊ฐ„ ๋ฌธ์žฅ ์•ˆ์˜ ๋‹ค๋ฅธ ๋‹จ์–ด๋“ค์„ ํ†ตํ•ด ๋งˆ์Šคํ‚น๋œ ๋‹จ์–ด๋ฅผ ์˜ˆ์ธกํ•˜๋„๋กํ•œ๋‹ค. (CBOW์™€ ๋น„์Šท) ์ด๋•Œ ์–‘๋ฐฉํ–ฅ์„ฑ์ด ์ƒ๊ธด๋‹ค๋Š” ๊ฒƒ์€ ๊ธฐ์กด ์–ธ์–ด ๋ชจ๋ธ๊ณผ์˜ ์ฐจ์ด์—์„œ ๋ฐœ์ƒํ•˜๋Š” ํ˜„์ƒ์ด๋‹ค. ๊ธฐ์กด์˜ ๋Œ€๋ถ€๋ถ„์˜ ์–ธ์–ด ๋ชจ๋ธ์„ ํ•™์Šตํ•œ๋‹ค๋Š” ๊ฒƒ์€ ์•ž์˜ ๋‹จ์–ด๋“ค์„ ์‚ฌ์šฉํ•ด ๋‹ค์Œ ๋‹จ์–ด๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์ด๋ค„์ง€๋Š”๋ฐ ๋ฒ„ํŠธ์˜ ๊ฒฝ์šฐ ํŠน์ • ๋‹จ์–ด๋ฅผ ๊ฐ€๋ฆฌ๊ณ  ์•ž๋’ค ์ƒ๊ด€์—†์ด ๋ฌธ์žฅ ์•ˆ์˜ ๋‹จ์–ด๋“ค์„ ๋ชจ๋‘ ์‚ฌ์šฉํ•ด์„œ ๊ฐ€๋ ค์ง„ ๋‹จ์–ด๋“ค์„ ์˜ˆ์ธกํ•˜๊ฒŒ ํ•จ์œผ๋กœ์จ ์–‘๋ฐฉํ–ฅ์˜ ๋‹จ์–ด๋“ค์„ ๋ชจ๋‘ ์‚ฌ์šฉํ•˜๊ฒŒ ํ•œ๋‹ค.

 ๋‹ค์Œ ๋ฌธ์žฅ ์˜ˆ์ธก์€ ์ž…๋ ฅ์œผ๋กœ ์ฃผ์–ด์ง„ ๋‘ ๋ฌธ์žฅ์ด ์ด์–ด์ง„ ๋ฌธ์žฅ์ธ์ง€ ์•„๋‹Œ์ง€๋ฅผ ๋ฐ์ดํ„ฐ์˜ 50% ํ™•๋ฅ ๋กœ ์ด์–ด์„œ ์ „์ฒด ํ…์Šค๋ฅผ ๋ชจ๋ธ์˜ ์ž…๋ ฅ๊ฐ’์œผ๋กœ ๋„ฃ๊ณ  ๋‚˜๋จธ์ง€ 50%์˜ ํ™•๋ฅ ๋กœ ์ž„์˜์˜ ๋‹ค๋ฅธ ๋ฌธ์„œ์˜ ๋ฌธ์žฅ์„ ๊ธฐ์กด ๋ฌธ์žฅ๊ณผ ํ•จ๊ป˜ ๋ชจ๋ธ์˜ ์ž…๋ ฅ๊ฐ’์œผ๋กœ ํ•œ๋‹ค. 

 ๋‹ค์Œ ๋ฌธ์žฅ์ด ๋งž๋Š” ์ง€์— ๋Œ€ํ•œ ์—ฌ๋ถ€ ํ‘œ์‹œ๋กœ [CLS]๋ผ๋Š” ํŠน์ˆ˜ ํ† ํฐ์„ ์ž…๋ ฅ๊ฐ’ ์•ž์— ์‚ฌ์šฉํ•œ๋‹ค. ์ถ”๊ฐ€๋กœ ๋‘๊ฐœ์˜ ๋ฌธ์žฅ์„ ํ•จ๊ป˜ ์ž…๋ ฅ์œผ๋กœ ๋„ฃ๊ธฐ ๋•Œ๋ฌธ์— ๋ชจ๋ธ์ด ๊ฐ ๋ฌธ์žฅ์„ ๊ตฌ๋ถ„ํ•  ์ˆ˜ ์žˆ ๋„๋ก [SEP]๋ผ๋Š” ํŠน์ˆ˜ ํ† ํฐ ๋˜ํ•œ ๊ฐ ๋ฌธ์žฅ์ด ๋๋‚˜๋Š” ์ง€์ ์— ๋„ฃ์–ด ์ค€๋‹ค. ํŠน์ˆ˜ ํ† ํฐ์„ ์‚ฌ์šฉํ•˜๋ฏ€๋กœ ๋ฒ„ํŠธ์˜ ๋‘ ๋ฌธ์žฅ๊ฐ™์˜ ๊ด€๊ณ„๋ฅผ ์˜ˆ์ธก๋ ฅ์ด ๋†’์•„์ง„๋‹ค.  ์‚ฌ์ „ ํ•™์Šต์„ ํ†ตํ•ด ๋งˆ์Šคํฌ๋ฅผ ์˜ˆ์ธกํ•˜๊ณ  ๊ทธ ๊ฒฐ๊ณผ ๋‘ ๋ฌธ์žฅ์˜ ๊ด€๊ณ„๋ฅผ ํŒŒ์•…ํ•ด ์ด์–ด์กŒ๋Š”์ง€ ์•„๋‹Œ์ง€๋ฅผ ํŒŒ์•…ํ•œ๋‹ค.

  bert ๋ชจ๋ธ ๋ฏธ์„ธ ์กฐ์ •(Fine-tuning)

 ์‚ฌ์ „ ํ•™์Šตํ•œ ๋ฒ„ํŠธ ๋ชจ๋ธ์„ ํ•˜์œ„ ๋ฌธ์ œ์— ๋ฏธ์„ธ ์กฐ์ •ํ•จ์œผ๋กœ์จ ์‚ฌ์ „ ํ•™์Šต ์—†์ด ํ•™์Šตํ•œ ๋ชจ๋ธ๋ณด๋‹ค ๋” ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‚ผ ์ˆ˜ ์žˆ๋‹ค.

๋ฐ˜์‘ํ˜•
๋‹คํ–ˆ๋‹ค