728x90

Test

  1. paper alignment Markdown format
  2. tranlslate

LIMA: ์–ด์šธ๋ฆผ์— ์žˆ์–ด์„œ๋Š” ์ ์€ ๊ฒƒ์ด ๋” ์ข‹๋‹ค

Chunting Zhou, Pengfei Liu, Puxin Xu, Srini Iyer, Jiao Sun, Yuning Mao, Xuezhe Ma, Avia Efrat, Ping Yu, Lili Yu, Susan Zhang, Gargi Ghosh, Mike Lewis, Luke Zettlemoyer, Omer Levy

๋ฉ”ํƒ€ AI, ์นด๋„ค๊ธฐ ๋ฉœ๋ก  ๋Œ€ํ•™๊ต, ๋‚จ๊ฐ€์ฃผ ๋Œ€ํ•™๊ต, ํ…”์•„๋น„๋ธŒ ๋Œ€ํ•™๊ต

์š”์•ฝ

๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ์€ ๋‘ ๋‹จ๊ณ„๋กœ ํ›ˆ๋ จ๋ฉ๋‹ˆ๋‹ค. (1) ์›์‹œ ํ…์ŠคํŠธ์—์„œ ๋ฌด๊ฐ๋… ์‚ฌ์ „ ํ›ˆ๋ จ์„ ํ†ตํ•ด ์ผ๋ฐ˜์ ์ธ ๋ชฉ์ ์˜ ํ‘œํ˜„์„ ํ•™์Šตํ•˜๊ณ  (2) ๋Œ€๊ทœ๋ชจ ์ง€๋„ ํŠœ๋‹ ๋ฐ ๊ฐ•ํ™” ํ•™์Šต์„ ํ†ตํ•ด ์ตœ์ข… ์ž‘์—… ๋ฐ ์‚ฌ์šฉ์ž ์„ ํ˜ธ๋„์— ๋” ์ž˜ ์–ด์šธ๋ฆฌ๋„๋ก ์กฐ์ •๋ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” 65B ํŒŒ๋ผ๋ฏธํ„ฐ LLaMa ์–ธ์–ด ๋ชจ๋ธ์„ LIMA๋กœ ํ›ˆ๋ จํ•˜์—ฌ, ๊ฐ•ํ™” ํ•™์Šต์ด๋‚˜ ์ธ๊ฐ„์˜ ์„ ํ˜ธ ๋ชจ๋ธ๋ง ์—†์ด 1,000๊ฐœ์˜ ์‹ ์ค‘ํ•˜๊ฒŒ ์„ ๋ณ„๋œ ํ”„๋กฌํ”„ํŠธ์™€ ์‘๋‹ต์— ๋Œ€ํ•œ ํ‘œ์ค€ ์ง€๋„ ์†์‹ค๋กœ๋งŒ ๋ฏธ์„ธ ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค. LIMA๋Š” ๊ทน๋„๋กœ ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•˜์—ฌ, ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ ์†Œ์ˆ˜์˜ ์˜ˆ์ œ๋งŒ์œผ๋กœ๋„ ๋ณต์žกํ•œ ์ฟผ๋ฆฌ๋ฅผ ํฌํ•จํ•œ ํŠน์ • ์‘๋‹ต ํ˜•์‹์„ ๋”ฐ๋ฅด๋Š” ๊ฒƒ์„ ๋ฐฐ์šฐ๋ฉฐ, ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ๋‚˜ํƒ€๋‚˜์ง€ ์•Š์€ ์ƒˆ๋กœ์šด ์ž‘์—…์— ๋Œ€ํ•ด์„œ๋„ ์ผ๋ฐ˜์ ์œผ๋กœ ์ž˜ ์ผ๋ฐ˜ํ™”๋ฉ๋‹ˆ๋‹ค. ์ œ์–ด๋œ ์ธ๊ฐ„ ์—ฐ๊ตฌ์—์„œ, LIMA์—์„œ ์–ป์€ ์‘๋‹ต์€ ๊ฒฝ์šฐ์— ๋”ฐ๋ผ GPT-4์™€ ๋™๋“ฑํ•˜๊ฑฐ๋‚˜ ์—„๊ฒฉํ•˜๊ฒŒ ์šฐ์„ ๋˜๋ฉฐ, ์ด ํ†ต๊ณ„๋Š” ์ธ๊ฐ„ ํ”ผ๋“œ๋ฐฑ์„ ์‚ฌ์šฉํ•˜์—ฌ ํ›ˆ๋ จ๋œ DaVinci003์— ๋Œ€ํ•ด์„œ๋Š” 65%์— ์ด๋ฅด๋ฉฐ, Bard์™€ ๋น„๊ตํ–ˆ์„ ๋•Œ๋Š” 58%์— ๋‹ฌํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ฒฐ๊ณผ๋“ค์€ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ์˜ ๊ฑฐ์˜ ๋ชจ๋“  ์ง€์‹์ด ์‚ฌ์ „ ํ›ˆ๋ จ ์ค‘์— ํ•™์Šต๋˜๋ฉฐ, ๋†’์€ ํ’ˆ์งˆ์˜ ์ถœ๋ ฅ์„ ์ƒ์„ฑํ•˜๋Š” ๋ชจ๋ธ์„ ๊ฐ€๋ฅด์น˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ œํ•œ๋œ ์ง€๋„ ํŠœ๋‹ ๋ฐ์ดํ„ฐ๋งŒ ํ•„์š”ํ•˜๋‹ค๋Š” ๊ฒƒ์„ ๊ฐ•ํ•˜๊ฒŒ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

1 ์„œ๋ก 

์–ธ์–ด ๋ชจ๋ธ์€ ๋‹ค์Œ ํ† ํฐ์„ ์˜ˆ์ธกํ•˜๊ธฐ ์œ„ํ•ด ๋†€๋ผ์šด ๊ทœ๋ชจ๋กœ ๋ฏธ๋ฆฌ ํ›ˆ๋ จ๋˜์–ด, ๊ฑฐ์˜ ๋ชจ๋“  ์–ธ์–ด ์ดํ•ด ๋˜๋Š” ์ƒ์„ฑ ์ž‘์—…์— ์ „์ดํ•  ์ˆ˜ ์žˆ๋Š” ์ผ๋ฐ˜์ ์ธ ๋ชฉ์ ์˜ ํ‘œํ˜„์„ ํ•™์Šตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์ „์ด๋ฅผ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๊ธฐ ์œ„ํ•ด, ์ฃผ๋กœ ๋Œ€๊ทœ๋ชจ ๋‹ค๋ฐฑ๋งŒ ์˜ˆ์ œ ๋ฐ์ดํ„ฐ์…‹ [Chung et al., 2022, Beeching et al., 2023, Kรถpf et al., 2023]์—์„œ ์ง€๋„ ํŠœ๋‹ [Mishra et al., 2021, Wei et al., 2022a, Sanh et al., 2022]์— ์ดˆ์ ์„ ๋งž์ถ˜ ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•์ด ์ œ์•ˆ๋˜์—ˆ์œผ๋ฉฐ, ์ตœ๊ทผ์—๋Š” ์ธ๊ฐ„์˜ ํ”ผ๋“œ๋ฐฑ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ ๊ฐ•ํ™” ํ•™์Šต(RLHF) [Bai et al., 2022a, Ouyang et al., 2022]์ด ์ˆ˜๋ฐฑ๋งŒ ๊ฐœ์˜ ์ธ๊ฐ„ ์ฃผ์„์ž์™€ ์ƒํ˜ธ ์ž‘์šฉํ•˜๋ฉด์„œ ์ˆ˜์ง‘๋ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ ์–ด์šธ๋ฆผ ๋ฐฉ๋ฒ•์€ ChatGPT ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ์ƒ๋‹นํ•œ ๊ณ„์‚ฐ๋Ÿ‰๊ณผ ์ „๋ฌธ์ ์ธ ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์šฐ๋ฆฌ๋Š” ๊ฐ•๋ ฅํ•œ ์‚ฌ์ „ ํ›ˆ๋ จ๋œ ์–ธ์–ด ๋ชจ๋ธ์ด ์ฃผ์–ด์ง„ ๊ฒฝ์šฐ, 1,000๊ฐœ์˜ ์‹ ์ค‘ํ•˜๊ฒŒ ์„ ๋ณ„๋œ ํ›ˆ๋ จ ์˜ˆ์ œ์— ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ๊ฒƒ๋งŒ์œผ๋กœ ๊ทน๋„๋กœ ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

์šฐ๋ฆฌ๋Š” ๋ชจ๋ธ์ด ์‚ฌ์šฉ์ž์™€ ์ƒํ˜ธ ์ž‘์šฉํ•˜๋Š” ์Šคํƒ€์ผ์ด๋‚˜ ํ˜•์‹์„ ๋ฐฐ์šฐ๋ฉด ์‚ฌ์ „ ํ›ˆ๋ จ ์ค‘์— ์ด๋ฏธ ์Šต๋“ํ•œ ์ง€์‹๊ณผ ๋Šฅ๋ ฅ์„ ๋“œ๋Ÿฌ๋‚ผ ์ˆ˜ ์žˆ๋Š” ๊ฐ„๋‹จํ•œ ํ”„๋กœ์„ธ์Šค๋กœ ์–ด์šธ๋ฆผ์„ ๋‹ฌ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ๊ฐ€์„ค์„ ์„ธ์šฐ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

 

์ •๋ ฌ ๋ฐ์ดํ„ฐ

์šฐ๋ฆฌ๋Š” ํ‘œ๋ฉด์  ์ •๋ ฌ ๊ฐ€์„ค(Superficial Alignment Hypothesis)์„ ์ •์˜ํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ฐ€์„ค์€ ๋ชจ๋ธ์˜ ์ง€์‹๊ณผ ๋Šฅ๋ ฅ์ด ์‚ฌ์ „ํ•™์Šต(pretraining) ์ค‘์— ๊ฑฐ์˜ ๋ฐฐ์›Œ์กŒ๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•˜๋ฉฐ, ์ •๋ ฌ์€ ์‚ฌ์šฉ์ž์™€ ์ƒํ˜ธ์ž‘์šฉํ•  ๋•Œ ์‚ฌ์šฉํ•ด์•ผ ํ•˜๋Š” ํ•˜์œ„ ํฌ๋งท(subdistribution)์„ ๋ชจ๋ธ์ด ํ•™์Šตํ•˜๋Š” ๊ฒƒ์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋งŒ์•ฝ ์ด ๊ฐ€์„ค์ด ๋งž๊ณ , ์ •๋ ฌ์ด ๋Œ€๋ถ€๋ถ„ ์Šคํƒ€์ผ์„ ํ•™์Šตํ•˜๋Š” ๊ฒƒ์ด๋ผ๋ฉด, ๋ฏธ์„ธ์กฐ์ •(pretrained language model)์„ ์ƒ๋‹นํžˆ ์ ์€ ์–‘์˜ ์˜ˆ์‹œ๋กœ ์ถฉ๋ถ„ํžˆ ํŠœ๋‹ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค [Kirstain et al., 2021].

์ด๋ฅผ ์œ„ํ•ด, ์šฐ๋ฆฌ๋Š” 1,000๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ(prompt)์™€ ์‘๋‹ต(response)์˜ ๋ฐ์ดํ„ฐ์…‹์„ ์ˆ˜์ง‘ํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ ์ถœ๋ ฅ(์‘๋‹ต)์€ ์Šคํƒ€์ผ์ ์œผ๋กœ ์„œ๋กœ ์ •๋ ฌ๋˜์–ด ์žˆ์ง€๋งŒ ์ž…๋ ฅ(ํ”„๋กฌํ”„ํŠธ)์€ ๋‹ค์–‘ํ•ฉ๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์šฐ๋ฆฌ๋Š” ๋„์›€์ด ๋˜๋Š” ์ธ๊ณต์ง€๋Šฅ(AI) ์–ด์‹œ์Šคํ„ดํŠธ์˜ ์Šคํƒ€์ผ๋กœ ์ถœ๋ ฅ์„ ๊ตฌ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์˜ˆ์‹œ๋“ค์€ ์ฃผ๋กœ ์ปค๋ฎค๋‹ˆํ‹ฐ Q&A ํฌ๋Ÿผ๊ณผ ์ˆ˜๋™์œผ๋กœ ์ž‘์„ฑ๋œ ์˜ˆ์‹œ๋“ค๋กœ๋ถ€ํ„ฐ ์„ ๋ณ„๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ 300๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ๋กœ ์ด๋ฃจ์–ด์ง„ ํ…Œ์ŠคํŠธ ์„ธํŠธ์™€ 50๊ฐœ์˜ ๊ฐœ๋ฐœ ์„ธํŠธ๋ฅผ ์ˆ˜์ง‘ํ•ฉ๋‹ˆ๋‹ค. ํ…Œ์ด๋ธ” 1์€ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์†Œ์Šค์˜ ๊ฐœ์š”์™€ ๋ช‡ ๊ฐ€์ง€ ํ†ต๊ณ„ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์ปค๋ฎค๋‹ˆํ‹ฐ Q&A

์šฐ๋ฆฌ๋Š” ์„ธ ๊ฐœ์˜ ์ปค๋ฎค๋‹ˆํ‹ฐ Q&A ์›น์‚ฌ์ดํŠธ(Stack Exchange, wikiHow, Pushshift Reddit Dataset)๋กœ๋ถ€ํ„ฐ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•ฉ๋‹ˆ๋‹ค [Baumgartner et al., 2020]. ๋Œ€์ฒด๋กœ, Stack Exchange์™€ wikiHow์˜ ๋‹ต๋ณ€์€ ๊ถŒ์œ„์ ์ด๊ณ  ์ •ํ™•ํ•˜๋ฉฐ, Pushshift Reddit Dataset์˜ ๋‹ต๋ณ€์€ ๋”์šฑ ์บ์ฃผ์–ผํ•˜๊ณ  ๋Œ€ํ™”์ฒด์ ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์งˆ๊ณผ ๋‹ค์–‘์„ฑ์„ ์ƒ˜ํ”Œ๋งํ•˜์—ฌ, ๋‘ ๊ฐœ์˜ Stack Exchange ์‚ฌ์ดํŠธ์™€ wikiHow์—์„œ ๊ฐ๊ฐ 200๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ์™€ ์‘๋‹ต์„, ๊ทธ๋ฆฌ๊ณ  Pushshift Reddit Dataset์—์„œ 150๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ์™€ ์‘๋‹ต์„ ์ˆ˜์ง‘ํ•ฉ๋‹ˆ๋‹ค.

์ˆ˜๋™์œผ๋กœ ์ž‘์„ฑ๋œ ์˜ˆ์‹œ

์ปค๋ฎค๋‹ˆํ‹ฐ Q&A ํฌ๋Ÿผ ์™ธ์—๋„, ์šฐ๋ฆฌ๋Š” ํ”„๋กฌํ”„ํŠธ์™€ ์‘๋‹ต์˜ ์˜ˆ์‹œ๋“ค์„ ์ˆ˜๋™์œผ๋กœ ์ž‘์„ฑํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ž‘์—…์˜ ๋‹ค์–‘์„ฑ๊ณผ AI ์–ด์‹œ์Šคํ„ดํŠธ์˜ ์ •ํ˜•ํ™”๋œ ์‘๋‹ต ์Šคํƒ€์ผ์„ ๊ฐ•์กฐํ•˜์—ฌ ์ตœ์ ํ™”ํ•ฉ๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์šฐ๋ฆฌ๋Š” 250๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ์™€ ์‘๋‹ต ์˜ˆ์‹œ๋ฅผ ์ž‘์„ฑํ•˜์—ฌ ์ด ๋ถ„๋ฅ˜์—์„œ ์ด 450๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ์™€ ์‘๋‹ต์„ ์ˆ˜์ง‘ํ•ฉ๋‹ˆ๋‹ค.

ํ…Œ์ŠคํŠธ ์„ธํŠธ

์šฐ๋ฆฌ๋Š” LIMA๋ฅผ ํ‰๊ฐ€ํ•˜๊ณ , ์ผ๋ฐ˜์ ์ธ ์ง€์‹ ์งˆ๋ฌธ๋ถ€ํ„ฐ ๊ฐœ์ธ์ ์ธ ์กฐ์–ธ๊นŒ์ง€ ๋‹ค์–‘ํ•œ ์ฃผ์ œ๋ฅผ ๋‹ค๋ฃจ๋Š” 300๊ฐœ์˜ ์–ด๋ ค์šด ํ…Œ์ŠคํŠธ ํ”„๋กฌํ”„ํŠธ์— ๋Œ€ํ•ด ์ตœ์‹  ์–ธ์–ด ๋ชจ๋ธ๊ณผ ์ œํ’ˆ๋“ค๊ณผ ๋น„๊ตํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์งˆ๊ณผ ๋‹ค์–‘์„ฑ์„ ์ƒ˜ํ”Œ๋งํ•˜์—ฌ, ํ˜„์กดํ•˜๋Š” ์–ธ์–ด ๋ชจ๋ธ์˜ ํ•œ๊ณ„๊นŒ์ง€ ๋ฐ€์–ด๋‚ด๋Š” ์–ด๋ ค์šด ํ…Œ์ŠคํŠธ ์„ธํŠธ๋ฅผ ๋งŒ๋“ญ๋‹ˆ๋‹ค.

๊ฐœ๋ฐœ ์„ธํŠธ

์šฐ๋ฆฌ๋Š” ๋˜ํ•œ 50๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ์™€ ์‘๋‹ต์œผ๋กœ ์ด๋ฃจ์–ด์ง„ ๊ฐœ๋ฐœ ์„ธํŠธ๋ฅผ ์ˆ˜์ง‘ํ•˜์—ฌ, ๋ชจ๋ธ์„ ๋ฏธ์„ธ์กฐ์ •ํ•˜๊ณ  ํ‰๊ฐ€ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

์ „๋ฐ˜์ ์œผ๋กœ, ์šฐ๋ฆฌ์˜ ๋ฐ์ดํ„ฐ์…‹์€ ํ›ˆ๋ จ, ๊ฐœ๋ฐœ ๋ฐ ํ…Œ์ŠคํŠธ ์„ธํŠธ๋กœ ๋‚˜๋‰˜์–ด 1,000๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ์™€ ์‘๋‹ต์œผ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ์ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์˜ ์–‘์€ 750,000๊ฐœ์˜ ํ† ํฐ์ด๋ฉฐ, ์ •ํ™•ํžˆ 1,000๊ฐœ์˜ ์‹œํ€€์Šค๋กœ ๋‚˜๋ˆ„์–ด์ง‘๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ด ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•˜์—ฌ LIMA๋ฅผ ์‚ฌ์ „ํ•™์Šตํ•˜๋ฉฐ, ์ด๋ฅผ ์œ„ํ•ด 65B-ํŒŒ๋ผ๋ฏธํ„ฐ LLaMa ๋ชจ๋ธ [Touvron et al., 2023]์„ ์ด ๋ฐ์ดํ„ฐ์…‹์˜ 1,000๊ฐœ์˜ ๋ฐ๋ชจ๋กœ ๋ฏธ์„ธ์กฐ์ •(fine-tuned)ํ•ฉ๋‹ˆ๋‹ค.## Arxiv ๋…ผ๋ฌธ์„ Markdown ํ˜•์‹์œผ๋กœ ์ •๋ ฌํ•˜๊ธฐ

์†Œ๊ฐœ

์ด ๋…ผ๋ฌธ์—์„œ๋Š” ์šฐ๋ฆฌ๊ฐ€ ์œ ์šฉํ•œ AI ์–ด์‹œ์Šคํ„ดํŠธ๋ฅผ ํ›ˆ๋ จํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์†Œ์Šค๋ฅผ ํ˜•์‹์— ๋งž๊ฒŒ ์ •๋ ฌํ•˜๋Š” ๊ณผ์ •์„ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์šฐ๋ฆฌ๊ฐ€ ์‚ฌ์šฉํ•œ ๋ฐ์ดํ„ฐ ์†Œ์Šค, ์ƒ˜ํ”Œ๋ง ๋ฐฉ๋ฒ•๋ก  ๋ฐ ๊ฐ ๋ฐ์ดํ„ฐ ์†Œ์Šค์— ์ ์šฉํ•œ ์ „์ฒ˜๋ฆฌ ๋‹จ๊ณ„๋ฅผ ๋…ผ์˜ํ•˜์—ฌ ์œ ์šฉํ•œ AI ์–ด์‹œ์Šคํ„ดํŠธ์˜ ์Šคํƒ€์ผ๊ณผ ์ผ์น˜ํ•˜๋„๋ก ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค.

๋ฐ์ดํ„ฐ ์†Œ์Šค

์šฐ๋ฆฌ๋Š” ์„ธ ๊ฐ€์ง€ ๋ฐ์ดํ„ฐ ์†Œ์Šค๋ฅผ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค : StackExchange, wikiHow ๋ฐ Pushshift Reddit ๋ฐ์ดํ„ฐ ์„ธํŠธ์ž…๋‹ˆ๋‹ค.

StackExchange

StackExchange๋Š” ๊ฐ๊ฐ ํŠน์ • ์ฃผ์ œ์— ํ—Œ์‹ ๋œ 179 ๊ฐœ์˜ ์˜จ๋ผ์ธ ์ปค๋ฎค๋‹ˆํ‹ฐ ๋ชจ์Œ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” 75 ๊ฐœ์˜ STEM ๊ตํ™˜๊ณผ 99 ๊ฐœ์˜ ๋‹ค๋ฅธ ๊ตํ™˜์— ์ดˆ์ ์„ ๋งž์ถ”์—ˆ์œผ๋ฉฐ 5 ๊ฐœ์˜ ๋‹ˆ์น˜ ๊ตํ™˜์„ ์ œ์™ธํ–ˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ์˜ ๊ท ์ผํ•œ ์ƒ˜ํ”Œ์„ ์–ป๊ธฐ ์œ„ํ•ด ์˜จ๋„๊ฐ€ 3 ์ธ(temperature of ๐œ =3) 200 ๊ฐœ์˜ ์งˆ๋ฌธ๊ณผ ๋‹ต๋ณ€์„ ๊ฐ๊ฐ ์ƒ˜ํ”Œ๋งํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฐ ๊ตํ™˜์—์„œ, ์ œ๋ชฉ (๋ฐ”๋”” ์—†์Œ) ์—์„œ ์ž์ฒด ํฌํ•จ ๋œ ๊ฐ€์žฅ ๋†’์€ ์ ์ˆ˜์˜ ์งˆ๋ฌธ์„ ๊ฐ€์ ธ ์™”์œผ๋ฉฐ (์ ์–ด๋„ 10 ๊ฐœ์˜ ๊ฐ•ํ•œ ์–‘์˜ ์ ์ˆ˜๋ฅผ ๊ฐ€์ง„) ๊ฐ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ์ƒ์œ„ ๋‹ต๋ณ€์„ ์„ ํƒํ–ˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๋„ˆ๋ฌด ์งง์€ (1200 ์ž ๋ฏธ๋งŒ), ๋„ˆ๋ฌด ๊ธด (4096 ์ž ์ด์ƒ), ์ฒซ ๋ฒˆ์งธ ์‚ฌ๋žŒ์œผ๋กœ ์“ฐ์ธ ("๋‚˜", "๋‚ด"), ๋˜๋Š” ๋‹ค๋ฅธ ๋‹ต๋ณ€์„ ์ฐธ์กฐํ•˜๋Š” ("์–ธ๊ธ‰ ๋œ๋Œ€๋กœ", "์Šคํƒ ๊ตํ™˜" ๋“ฑ) ๋‹ต๋ณ€์„ ์ œ๊ฑฐํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์‘๋‹ต์—์„œ ๋งํฌ, ์ด๋ฏธ์ง€ ๋ฐ ๊ธฐํƒ€ HTML ํƒœ๊ทธ๋ฅผ ์ œ๊ฑฐํ•˜๊ณ  ์ฝ”๋“œ ๋ธ”๋ก๊ณผ ๋ชฉ๋ก๋งŒ ๋ณด์กดํ–ˆ์Šต๋‹ˆ๋‹ค.

wikiHow

wikiHow๋Š” ๋‹ค์–‘ํ•œ ์ฃผ์ œ์— ๋Œ€ํ•œ 240,000 ๊ฐœ ์ด์ƒ์˜ how-to ๊ธฐ์‚ฌ๊ฐ€ ํฌํ•จ ๋œ ์˜จ๋ผ์ธ ์œ„ํ‚ค ์Šคํƒ€์ผ ๊ฒŒ์‹œ๋ฌผ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” 19 ๊ฐœ ์ค‘ ํ•˜๋‚˜์˜ ์นดํ…Œ๊ณ ๋ฆฌ๋ฅผ ๋จผ์ € (์˜ˆ : "์˜ค๋ฏˆ๋ › ์š”๋ฆฌ ๋ฐฉ๋ฒ•") ์ƒ˜ํ”Œ๋งํ•˜๊ณ  ๊ทธ ์•ˆ์—์žˆ๋Š” ๊ธฐ์‚ฌ๋ฅผ ์ƒ˜ํ”Œ๋งํ•˜์—ฌ ๋‹ค์–‘์„ฑ์„ ๋ณด์žฅํ–ˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ œ๋ชฉ์„ ํ”„๋กฌํ”„ํŠธ๋กœ ์‚ฌ์šฉํ•˜๊ณ  ๋ณธ๋ฌธ์„ ์‘๋‹ต์œผ๋กœ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์ธ "์ด ๊ธฐ์‚ฌ ..." ์‹œ์ž‘์„ "๋‹ค์Œ ๋‹ต๋ณ€์€ ..."์œผ๋กœ ๋Œ€์ฒดํ•˜๊ณ  ์ผ๋ถ€ ์ „์ฒ˜๋ฆฌ ํœด๋ฆฌ์Šคํ‹ฑ์„ ์ ์šฉํ•˜์—ฌ ๋งํฌ, ์ด๋ฏธ์ง€ ๋ฐ ์ผ๋ถ€ ํ…์ŠคํŠธ ์„น์…˜์„ ๊ฐ€์ง€์น˜๊ธฐํ–ˆ์Šต๋‹ˆ๋‹ค.

Pushshift Reddit ๋ฐ์ดํ„ฐ ์„ธํŠธ

Pushshift Reddit ๋ฐ์ดํ„ฐ ์„ธํŠธ๋Š” ์„ธ๊ณ„์—์„œ ๊ฐ€์žฅ ์ธ๊ธฐ์žˆ๋Š” ์›น ์‚ฌ์ดํŠธ ์ค‘ ํ•˜๋‚˜ ์ธ Reddit์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” r / AskReddit ๋ฐ r / WritingPrompts ๋‘ ํ•˜์œ„ ์ง‘ํ•ฉ์œผ๋กœ ์ œํ•œํ•˜๊ณ  ๊ฐ ์ปค๋ฎค๋‹ˆํ‹ฐ์—์„œ ๊ฐ€์žฅ ๋งŽ์€ upvotes๋ฅผ๋ฐ›์€ ๊ฒŒ์‹œ๋ฌผ ๋‚ด์—์„œ ์˜ˆ์ œ๋ฅผ ์ˆ˜๋™์œผ๋กœ ์„ ํƒํ–ˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” r / AskReddit์—์„œ 70 ๊ฐœ์˜ ์ž์ฒด ํฌํ•จ ํ”„๋กฌํ”„ํŠธ (์ œ๋ชฉ ๋งŒ, ๋ฐ”๋”” ์—†์Œ)๋ฅผ ์ฐพ์•˜์œผ๋ฉฐ, ์ƒ์œ„ ๋‹ต๋ณ€์ด ํ•ญ์ƒ ์‹ ๋ขฐ์„ฑ์ด์žˆ๋Š” ๊ฒƒ์€ ์•„๋‹ˆ๊ธฐ ๋•Œ๋ฌธ์— ํ…Œ์ŠคํŠธ ์„ธํŠธ๋กœ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. WritingPrompts subreddit์€ ํ—ˆ๊ตฌ์˜ ์ด์•ผ๊ธฐ ์ „์ œ๋ฅผ ํฌํ•จํ•˜๋ฉฐ, ๋‹ค๋ฅธ ์‚ฌ์šฉ์ž๋Š” ์ฐฝ์˜์ ์œผ๋กœ ์™„์„ฑํ•˜๋„๋ก ๊ถŒ์žฅ๋ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์‚ฌ๋ž‘ ์‹œ์™€ ์งง์€ ๊ณผํ•™ ์†Œ์„ค๊ณผ ๊ฐ™์€ ์ฃผ์ œ๋ฅผ ํฌํ•จํ•˜๋Š” 150 ๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ์™€ ๊ณ ํ’ˆ์งˆ ์‘๋‹ต์„ ์ฐพ์•˜์œผ๋ฉฐ, ์ด๋ฅผ ๊ต์œก ์„ธํŠธ์— ์ถ”๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค.

์ˆ˜๋™์œผ๋กœ ์ž‘์„ฑ ๋œ ์˜ˆ์ œ

์˜จ๋ผ์ธ ์ปค๋ฎค๋‹ˆํ‹ฐ์—์„œ ์‚ฌ์šฉ์ž๊ฐ€ ๋ฌป๋Š” ์งˆ๋ฌธ ์ด์ƒ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค์–‘ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ์šฐ๋ฆฌ ์ž์‹  (์ด ์ž‘์—…์˜ ์ž‘์„ฑ์ž)์˜ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ˆ˜์ง‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๊ทธ๋ฃน A์™€ ๊ทธ๋ฃน B์˜ ๋‘ ์ง‘ํ•ฉ์„ ์ง€์ •ํ•˜์—ฌ ๊ฐ๊ฐ 250 ๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ž‘์„ฑํ•˜๋„๋กํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฃน A์—์„œ 200 ๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ๋ฅผ ๊ต์œก์— ์‚ฌ์šฉํ•˜๊ณ  50 ๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋ณด์œ  ๊ฐœ๋ฐœ ์„ธํŠธ๋กœ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ผ๋ถ€ ๋ฌธ์ œ๊ฐ€์žˆ๋Š” ํ”„๋กฌํ”„ํŠธ๋ฅผ ํ•„ํ„ฐ๋ง ํ•œ ํ›„ ๋‚จ์€ 230 ๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ๋ฅผ ๊ทธ๋ฃน B์—์„œ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๊ต์œก ์„ธํŠธ์— ๊ณ ํ’ˆ์งˆ ๋‹ต๋ณ€์„ ์ถ”๊ฐ€ํ•˜์—ฌ ์ง์ ‘ ์ผ์Šต๋‹ˆ๋‹ค. ๋‹ต๋ณ€์„ ์ž‘์„ฑํ•˜๋Š” ๋™์•ˆ ์šฐ๋ฆฌ๋Š” ์œ ์šฉํ•œ AI ์–ด์‹œ์Šคํ„ดํŠธ์— ์ ํ•ฉํ•œ ๊ท ์ผํ•œ ํ†ค์œผ๋กœ ์„ค์ •ํ•˜๋ ค๊ณ  ๋…ธ๋ ฅํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์šฐ๋ฆฌ๋Š” ์งˆ๋ฌธ์„ ์ธ์ •ํ•˜๊ณ  ๋‹ต๋ณ€ ์ž์ฒด๋ฅผ ๋”ฐ๋ฅด๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด ์ผ๊ด€๋œ ํ˜•์‹์€ ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ์ผ๋ฐ˜์ ์œผ๋กœ ํ–ฅ์ƒ์‹œํ‚ค๊ณ  ์‚ฌ๊ณ  ๊ณผ์ •์„ ํ˜•์„ฑํ•˜๋Š” ๋ฐ ๋ชจ๋ธ์„ ๋•๋Š” ๊ฒƒ์œผ๋กœ ์ถ”์ธก๋ฉ๋‹ˆ๋‹ค.

๊ฒฐ๋ก 

๊ฒฐ๋ก ์ ์œผ๋กœ, ์šฐ๋ฆฌ๋Š” ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์†Œ์Šค๋ฅผ ์œ ์šฉํ•œ AI ์–ด์‹œ์Šคํ„ดํŠธ๋ฅผ ํ›ˆ๋ จํ•˜๊ธฐ์— ์ ํ•ฉํ•œ ํ˜•์‹์œผ๋กœ ์ •๋ ฌํ–ˆ์Šต๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์šฐ๋ฆฌ์˜ ์ƒ˜ํ”Œ๋ง ๋ฐฉ๋ฒ•๋ก ๊ณผ ๊ฐ ๋ฐ์ดํ„ฐ ์†Œ์Šค์— ์ ์šฉํ•œ ์ „์ฒ˜๋ฆฌ ๋‹จ๊ณ„๋ฅผ ๋…ผ์˜ํ•˜์—ฌ ์œ ์šฉํ•œ AI ์–ด์‹œ์Šคํ„ดํŠธ์˜ ์Šคํƒ€์ผ๊ณผ ์ผ์น˜ํ•˜๋„๋ก ๋ณด์žฅํ–ˆ์Šต๋‹ˆ๋‹ค. ์ˆ˜๋™์œผ๋กœ ์ž‘์„ฑ๋œ ์˜ˆ์ œ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๋”์šฑ ๋‹ค์–‘ํ•˜๊ฒŒ ๋งŒ๋“ค๊ณ  ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒํ•˜๋Š” ๋ฐ ๋„์›€์ด๋˜์—ˆ์Šต๋‹ˆ๋‹ค.## ์ž…๋ ฅ

์šฐ๋ฆฌ๋Š” ๋…์„ฑ์ด๋‚˜ ์•…์˜์„ฑ์˜ ์ •๋„๋ฅผ ๊ฐ€์ง„ 13๊ฐœ์˜ ํ›ˆ๋ จ ํ”„๋กฌํ”„ํŠธ๋ฅผ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๋ช…๋ น์„ ๋ถ€๋ถ„์ ์œผ๋กœ ๋˜๋Š” ์™„์ „ํžˆ ๊ฑฐ๋ถ€ํ•˜๋Š” ์‘๋‹ต์„ ์ฃผ์˜ ๊นŠ๊ฒŒ ์ž‘์„ฑํ•˜๊ณ , ์–ด์‹œ์Šคํ„ดํŠธ๊ฐ€ ์™œ ์ค€์ˆ˜ํ•˜์ง€ ์•Š์„ ๊ฒƒ์ธ์ง€ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ํ…Œ์ŠคํŠธ ์„ธํŠธ์—์„œ ๋น„์Šทํ•œ ๋ฌธ์ œ๋ฅผ ๊ฐ€์ง„ 30๊ฐœ์˜ ํ”„๋กฌํ”„ํŠธ๊ฐ€ ์žˆ์œผ๋ฉฐ, ์ด์— ๋Œ€ํ•ด 4.3์ ˆ์—์„œ ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค. ์ˆ˜๋™์œผ๋กœ ์ž‘์„ฑํ•œ ์˜ˆ์ œ ์™ธ์—๋„, ์šฐ๋ฆฌ๋Š” Super-Natural Instructions [Wang et al., 2022b]์—์„œ 50๊ฐœ์˜ ํ›ˆ๋ จ ์˜ˆ์ œ๋ฅผ ์ƒ˜ํ”Œ๋งํ•ฉ๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ, ์š”์•ฝ, ํŒจ๋Ÿฌํ”„๋ ˆ์ด์ง•, ์Šคํƒ€์ผ ์ „ํ™˜๊ณผ ๊ฐ™์€ 50๊ฐœ์˜ ์ž์—ฐ์–ด ์ƒ์„ฑ ์ž‘์—…์„ ์„ ํƒํ•˜๊ณ  ๊ฐ๊ฐ ํ•˜๋‚˜์˜ ๋ฌด์ž‘์œ„ ์˜ˆ์ œ๋ฅผ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ด๋“ค ์ค‘ ์ผ๋ถ€๋ฅผ 200๊ฐœ์˜ ์ˆ˜๋™ ์˜ˆ์ œ์˜ ์Šคํƒ€์ผ์— ๋งž๊ฒŒ ์•ฝ๊ฐ„ ์ˆ˜์ •ํ•ฉ๋‹ˆ๋‹ค. ์ž ์žฌ์  ์‚ฌ์šฉ์ž ํ”„๋กฌํ”„ํŠธ์˜ ๋ถ„ํฌ๋Š” Super-Natural Instructions์˜ ์ž‘์—… ๋ถ„ํฌ์™€ ๊ตฌ๋ณ„๋˜๋Š” ๊ฒƒ์œผ๋กœ ์ฃผ์žฅํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ์šฐ๋ฆฌ์˜ ์ง๊ด€์€ ์ด ์ž‘์€ ์ƒ˜ํ”Œ์ด ํ›ˆ๋ จ ์˜ˆ์ œ์˜ ์ „๋ฐ˜์ ์ธ ๋‹ค์–‘์„ฑ์„ ๋†’์ด๊ณ  ๋ชจ๋ธ์˜ ๊ฐ•๊ฑด์„ฑ์„ ์ฆ๊ฐ€์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋‹ค์–‘ํ•œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ˆ˜๋™์œผ๋กœ ์ž‘์„ฑํ•˜๊ณ  ํ’๋ถ€ํ•œ ์‘๋‹ต์„ ๊ท ์ผํ•œ ์Šคํƒ€์ผ๋กœ ์ž‘์„ฑํ•˜๋Š” ๊ฒƒ์€ ์ˆ˜๊ณ ๋กญ์Šต๋‹ˆ๋‹ค. ์ตœ๊ทผ ์ผ๋ถ€ ์—ฐ๊ตฌ์—์„œ๋Š” [Honovich et al., 2022, Wang et al., 2022a, Taori et al., 2023, Chiang et al., 2023, Sun et al., 2023]์™€ ๊ฐ™์€ ์ž๋™ ์ˆ˜๋‹จ์„ ํ†ตํ•ด ์ˆ˜๋™ ์ž‘์—…์„ ํ”ผํ•˜๊ณ , ์–‘๋ณด๋‹ค ์งˆ์„ ์ตœ์ ํ™”ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ์ž‘์—…ํ•ฉ๋‹ˆ๋‹ค. ์ด ์—ฐ๊ตฌ๋Š” ๋‹ค์–‘์„ฑ๊ณผ ์งˆ์— ํˆฌ์žํ•˜๋Š” ํšจ๊ณผ๋ฅผ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค.

3 LIMA ํ›ˆ๋ จ

์šฐ๋ฆฌ๋Š” ๋‹ค์Œ ํ”„๋กœํ† ์ฝœ์„ ์‚ฌ์šฉํ•˜์—ฌ LIMA (Less Is More for Alignment)๋ฅผ ํ›ˆ๋ จ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค. LLaMa 65B [Touvron et al., 2023]์—์„œ ์‹œ์ž‘ํ•ด, ์šฐ๋ฆฌ๋Š” 1,000๊ฐœ์˜ ์ •๋ ฌ ํ›ˆ๋ จ ์„ธํŠธ์—์„œ ํŒŒ์ธํŠœ๋‹ํ•ฉ๋‹ˆ๋‹ค. ๊ฐ ์Šคํ”ผ์ปค (์‚ฌ์šฉ์ž์™€ ์–ด์‹œ์Šคํ„ดํŠธ)๋ฅผ ๊ตฌ๋ถ„ํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ ๋ฐœํ™”์˜ ๋์— ํŠน์ˆ˜ํ•œ end-of-turn ํ† ํฐ (EOT)์„ ๋„์ž…ํ•ฉ๋‹ˆ๋‹ค. ์ด ํ† ํฐ์€ ์ƒ์„ฑ์„ ์ค‘๋‹จํ•˜๋Š” EOS์™€ ๋™์ผํ•œ ์—ญํ• ์„ ํ•˜์ง€๋งŒ, ์ด๋ฏธ ์„ ํ–‰ ๋ชจ๋ธ์ด preexisting EOS ํ† ํฐ์— ๋ถ€์—ฌํ•œ ๋‹ค๋ฅธ ์˜๋ฏธ์™€ ํ˜ผ๋™๋˜์ง€ ์•Š๋„๋กํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ํ‘œ์ค€ ํŒŒ์ธํŠœ๋‹ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋”ฐ๋ฆ…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” AdamW [Loshchilov and Hutter, 2017]๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ 15ํšŒ epoch ๋™์•ˆ ํŒŒ์ธํŠœ๋‹ํ•˜๋ฉฐ, 1= 0:9; 2= 0:95 ๋ฐ ๊ฐ€์ค‘์น˜ ๊ฐ์†Œ์œจ 0:1์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์›œ์—… ๋‹จ๊ณ„ ์—†์ด ์ดˆ๊ธฐ ํ•™์Šต๋ฅ ์„ 1e * 5๋กœ ์„ค์ •ํ•˜๊ณ  ํ›ˆ๋ จ ์ข…๋ฃŒ์‹œ 1e * 6๋กœ ์„ ํ˜• ๊ฐ์†Œ์‹œํ‚ต๋‹ˆ๋‹ค. ๋ฐฐ์น˜ ํฌ๊ธฐ๋Š” 32๊ฐœ์˜ ์˜ˆ์ œ (์ž‘์€ ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ 64๊ฐœ)๋กœ ์„ค์ •ํ•˜๋ฉฐ, 2048 ํ† ํฐ๋ณด๋‹ค ๊ธด ํ…์ŠคํŠธ๋Š” ์ž˜๋ฆฝ๋‹ˆ๋‹ค. ์ฐธ๊ณ ํ•  ๋งŒํ•œ ํ•œ ๊ฐ€์ง€ ๋ณ€ํ™”๋Š” ์ž”์—ฌ ๋“œ๋กญ์•„์›ƒ์˜ ์‚ฌ์šฉ์ž…๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” Ouyang et al. [2022]๋ฅผ ๋”ฐ๋ฅด๊ณ  ์ž”์—ฌ ์—ฐ๊ฒฐ ์œ„์— ๋“œ๋กญ์•„์›ƒ์„ ์ ์šฉํ•˜๋ฉฐ, ์ตœํ•˜์ธต์—์„œ pd = 0:0์—์„œ ์‹œ์ž‘ํ•˜์—ฌ ๋งˆ์ง€๋ง‰ ์ธต์—์„œ pd = 0:3์œผ๋กœ ์„ ํ˜•์ ์œผ๋กœ ์ฆ๊ฐ€์‹œํ‚ต๋‹ˆ๋‹ค (์ž‘์€ ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ pd = 0:2). perplexity๋Š” ์ƒ์„ฑ ํ’ˆ์งˆ๊ณผ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์—†๊ธฐ ๋•Œ๋ฌธ์—, ์šฐ๋ฆฌ๋Š” 50๊ฐœ์˜ ๊ฐœ๋ฐœ ์„ธํŠธ์—์„œ ๋ณด์œ ํ•œ ์˜ˆ์ œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ 5๋ฒˆ์งธ์™€ 10๋ฒˆ์งธ epoch ์‚ฌ์ด์—์„œ ์ˆ˜๋™์œผ๋กœ ์ฒดํฌํฌ์ธํŠธ๋ฅผ ์„ ํƒํ•ฉ๋‹ˆ๋‹ค.

4 ์ธ๊ฐ„ ํ‰๊ฐ€

์šฐ๋ฆฌ๋Š” LIMA๋ฅผ ์ตœ์ฒจ๋‹จ ์–ธ์–ด ๋ชจ๋ธ๊ณผ ๋น„๊ตํ•˜์—ฌ ํ‰๊ฐ€ํ•˜๊ณ , OpenAI์˜ RLHF ๊ธฐ๋ฐ˜ DaVinci003์™€ 52,000๊ฐœ์˜ ์˜ˆ์ œ๋กœ ํ›ˆ๋ จ๋œ Alpaca์˜ 65B-ํŒŒ๋ผ๋ฏธํ„ฐ ์žฌํ˜„์„ ๋Šฅ๊ฐ€ํ•˜๋ฉฐ, GPT-4๋ณด๋‹ค ๋‚˜์€ ๋˜๋Š” ๋™๋“ฑํ•œ ์‘๋‹ต์„ ์ž์ฃผ ์ƒ์„ฑํ•œ๋‹ค๋Š” ๊ฒƒ์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค. LIMA ์ƒ์„ฑ๋ฌผ์˜ ๋ถ„์„์—์„œ 50%๊ฐ€ ์šฐ์ˆ˜ํ•˜๋‹ค๊ณ  ํ‰๊ฐ€๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ช‡ ๊ฐ€์ง€ ์˜ˆ์ œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ตœ์ฒจ๋‹จ ๊ธฐ์ˆ ์— ๊ฒฝ์Ÿํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์œผ๋กœ ํŒ๋ช…๋˜๋ฏ€๋กœ, ๋Œ€๊ทœ๋ชจ์˜ ์ง€์‹œ ํŠœ๋‹๊ณผ ๊ฐ•ํ™” ํ•™์Šต ์ ‘๊ทผ ๋ฐฉ์‹๋ณด๋‹ค ์‚ฌ์ „ ํ›ˆ๋ จ๊ณผ ๊ทธ ์ƒ๋Œ€์  ์ค‘์š”์„ฑ์˜ ๊ฐ•๋ ฅํ•œ ์ง€์ง€์ž์ธ Superficial Alignment Hypothesis (2์ ˆ)๋ฅผ ๊ฐ•๋ ฅํžˆ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

4.1 ์‹คํ—˜ ์„ค์ •

LIMA๋ฅผ ๋‹ค๋ฅธ ๋ชจ๋ธ๊ณผ ๋น„๊ตํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ ํ…Œ์ŠคํŠธ ํ”„๋กฌํ”„ํŠธ์— ๋Œ€ํ•ด ๋‹จ์ผ ์‘๋‹ต์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฐ ๋‹ค์Œ ํฌ๋ผ์šฐ๋“œ์›Œ์ปค์—๊ฒŒ LIMA ์ถœ๋ ฅ๋ฌผ์„ ๊ฐ ๋ฒ ์ด์Šค๋ผ์ธ๊ณผ ๋น„๊ตํ•˜๊ณ  ์–ด๋Š ๊ฒƒ์„ ์„ ํ˜ธํ•˜๋Š”์ง€ ๋ผ๋ฒจ์„ ์ง€์ •ํ•˜๋„๋ก ์š”์ฒญํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ธ๊ฐ„ ํฌ๋ผ์šฐ๋“œ์›Œ์ปค๋ฅผ ๋Œ€์ฒดํ•˜์—ฌ GPT-4๋กœ ์ด๋Ÿฌํ•œ ์‹คํ—˜์„ ๋ฐ˜๋ณตํ•˜๊ณ  ์œ ์‚ฌํ•œ ํ•ฉ์˜ ์ˆ˜์ค€์„ ์ฐพ์Šต๋‹ˆ๋‹ค.

๋ฒ ์ด์Šค๋ผ์ธ

์šฐ๋ฆฌ๋Š” LIMA๋ฅผ ๋‹ค์Œ ๋‹ค์„ฏ ๊ฐ€์ง€ ๋ฒ ์ด์Šค๋ผ์ธ๊ณผ ๋น„๊ตํ•ฉ๋‹ˆ๋‹ค.

  • Alpaca 65B [Taori et al., 2023] - LLaMa 65B [Touvron et al., 2023]๋ฅผ Alpaca ํ›ˆ๋ จ ์„ธํŠธ [Taori et al., 2023]์˜ 52,000 ์˜ˆ์ œ์— ํŒŒ์ธํŠœ๋‹ํ•ฉ๋‹ˆ๋‹ค.
  • OpenAI์˜ DaVinci003 - RLHF (human feedback)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํŠœ๋‹๋œ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ [Ouyang et al., 2022].
  • Google์˜ Bard - PaLM [Chowdhery et al., 2022]๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœํ•ฉ๋‹ˆ๋‹ค.
  • Anthropic์˜ Claude - AI๋กœ๋ถ€ํ„ฐ ๊ฐ•ํ™” ํ•™์Šต์œผ๋กœ ํ›ˆ๋ จ๋œ 52B-ํŒŒ๋ผ๋ฏธํ„ฐ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

๋ถ€๋ก B

๊ฒ€์ฆ ํผํ”Œ๋ ‰์„œํ‹ฐ์™€ ์ƒ์„ฑ ํ’ˆ์งˆ์„ ๋” ์ž์„ธํžˆ ๋น„๊ตํ•˜๋Š” ์—ฐ๊ตฌ๋Š” ๋ถ€๋ก B๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค.# Arxiv ๋…ผ๋ฌธ์„ Markdown ํ˜•์‹์œผ๋กœ ์ •๋ ฌํ•˜๊ธฐ

์†Œ๊ฐœ

์ด ์ž‘์—…์˜ ๋ชฉํ‘œ๋Š” Arxiv ๋…ผ๋ฌธ์„ Markdown ํ˜•์‹์œผ๋กœ ์ •๋ ฌํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ์–ธ์–ด ๋ชจ๋ธ์„ ๋น„๊ตํ•˜๋Š” ์—ฐ๊ตฌ๋กœ, ์ €์ž๋“ค์€ ์ธ๊ฐ„ ๋ฐ ์ž๋™ํ™”๋œ ์„ ํ˜ธ ํ‰๊ฐ€ ๊ฒฐ๊ณผ๋ฅผ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.

๋ฐฉ๋ฒ•

์ €์ž๋“ค์€ GPT-4, Claude, BARD, DaVinci003, Alpaca 65B ๋‹ค์„ฏ ๊ฐ€์ง€ ๋‹ค๋ฅธ ์–ธ์–ด ๋ชจ๋ธ์—์„œ ์‘๋‹ต์„ ์ƒ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค. ํ™•๋ฅ  0.9์™€ ์˜จ๋„ 0.7๋กœ nucleus sampling์„ ์‚ฌ์šฉํ•˜๊ณ , 1.2์˜ ๋ฐ˜๋ณต ๋ฒŒ์น™์„ ๊ฐ€ํ–ˆ์œผ๋ฉฐ, ์ตœ๋Œ€ ํ† ํฐ ๊ธธ์ด๋Š” 2048๋กœ ์ œํ•œ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

์ €์ž๋“ค์€ ํ•˜๋‚˜์˜ ํ”„๋กฌํ”„ํŠธ์™€ ๋‘ ๊ฐ€์ง€ ๋‹ค๋ฅธ ๋ชจ๋ธ์—์„œ ์ƒ์„ฑ๋œ ๊ฐ€๋Šฅํ•œ ์‘๋‹ต์„ ์ฃผ์„ ์ž‘์—…์ž์—๊ฒŒ ์ œ๊ณตํ–ˆ์Šต๋‹ˆ๋‹ค. ์ฃผ์„ ์ž‘์—…์ž๋“ค์€ ์–ด๋–ค ์‘๋‹ต์ด ๋” ์ข‹์€์ง€, ๋˜๋Š” ๋‘ ์‘๋‹ต ๋ชจ๋‘ ์ค‘์š”ํ•œ ์ฐจ์ด๊ฐ€ ์—†๋Š”์ง€ ๋ผ๋ฒจ์„ ์ง€์ •ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ €์ž๋“ค์€ GPT-4์—๊ฒŒ ์ •ํ™•ํžˆ ๊ฐ™์€ ์ง€์นจ๊ณผ ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๊ณตํ•˜์—ฌ ๋ณ‘๋ ฌ ์ฃผ์„์„ ์ˆ˜์ง‘ํ–ˆ์Šต๋‹ˆ๋‹ค.

๊ฒฐ๊ณผ

์ €์ž๋“ค์€ 52๋ฐฐ ๋” ๋งŽ์€ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šตํ•˜์ง€๋งŒ, Alpaca 65B๋Š” LIMA๋ณด๋‹ค ์ข‹์ง€ ์•Š์€ ์ถœ๋ ฅ์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์Œ์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค. DaVinci003๋„ ์ด์™€ ๋น„์Šทํ•œ ๊ฒฝํ–ฅ์„ ๋ณด์ž…๋‹ˆ๋‹ค. Bard๋Š” DaVinci003์™€ ๋ฐ˜๋Œ€ ๊ฒฝํ–ฅ์„ ๋ณด์ด๋ฉฐ, LIMA๋ณด๋‹ค ๋‚˜์€ ์‘๋‹ต์„ 42%์˜ ๊ฒฝ์šฐ์— ๋ณด์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด๊ฒƒ์€ LIMA ์‘๋‹ต์ด ์ ์–ด๋„ Bard๋ณด๋‹ค ์ข‹์€ ๊ฒฝ์šฐ๊ฐ€ 58%์˜ ๊ฒฝ์šฐ์— ํ•ด๋‹นํ•œ๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

๋งˆ์ง€๋ง‰์œผ๋กœ, Claude์™€ GPT-4๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ LIMA๋ณด๋‹ค ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•˜์ง€๋งŒ, LIMA๊ฐ€ ์‹ค์ œ๋กœ ๋” ๋‚˜์€ ์‘๋‹ต์„ ์ƒ์„ฑํ•˜๋Š” ๊ฒฝ์šฐ๋„ ์žˆ๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค. ์žฌ๋ฏธ์žˆ๊ฒŒ๋„, GPT-4์กฐ์ฐจ๋„ ์ž์‹ ์˜ ์ถœ๋ ฅ๋ณด๋‹ค 19%์˜ ๊ฒฝ์šฐ์—๋Š” LIMA ์ถœ๋ ฅ์„ ์„ ํ˜ธํ•ฉ๋‹ˆ๋‹ค.

๊ฒฐ๋ก 

์ด ์—ฐ๊ตฌ๋Š” ๋‹ค๋ฅธ ์–ธ์–ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์— ๋Œ€ํ•œ ์œ ์šฉํ•œ ํ†ต์ฐฐ๋ ฅ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ €์ž๋“ค์˜ ๋ฐฉ๋ฒ•๋ก ๊ณผ ๊ฒฐ๊ณผ๋Š” ์–ธ์–ด ๋ชจ๋ธ๋ง๊ณผ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์— ์ข…์‚ฌํ•˜๋Š” ์—ฐ๊ตฌ์›๋“ค์—๊ฒŒ ์œ ์šฉํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.## 4.3 ๋ถ„์„

์ฃผ์š” ํ‰๊ฐ€์—์„œ๋Š” LIMA๋ฅผ ์ตœ์ฒจ๋‹จ ๋ชจ๋ธ๊ณผ ๋น„๊ตํ•˜์—ฌ ํ‰๊ฐ€ํ•˜์ง€๋งŒ, ๋ช‡๋ช‡ ๊ธฐ์ค€์„ ์€ ์‹ค์ œ ์‚ฌ์šฉ์ž ํ”„๋กฌํ”„ํŠธ ์ˆ˜๋ฐฑ๋งŒ ๊ฐœ๋ฅผ ํ›ˆ๋ จ ์ค‘์— ๋…ธ์ถœ๋˜์–ด ๋งค์šฐ ๋†’์€ ๊ธฐ์ค€์„ ๊ฐ€์ง€๊ณ  ์žˆ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์šฐ๋ฆฌ๋Š” 50๊ฐœ์˜ ๋ฌด์ž‘์œ„ ์˜ˆ์ œ๋ฅผ ์ˆ˜๋™์œผ๋กœ ๋ถ„์„ํ•˜์—ฌ ์ ˆ๋Œ€์  ํ‰๊ฐ€๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๊ฐ ์˜ˆ์ œ๋ฅผ ์„ธ ๊ฐ€์ง€ ์นดํ…Œ๊ณ ๋ฆฌ ์ค‘ ํ•˜๋‚˜๋กœ ๋ผ๋ฒจ๋งํ•ฉ๋‹ˆ๋‹ค. ์‹คํŒจ : ์‘๋‹ต์ด ํ”„๋กฌํ”„ํŠธ ์š”๊ตฌ ์‚ฌํ•ญ์„ ์ถฉ์กฑํ•˜์ง€ ๋ชปํ•จ ; ํ†ต๊ณผ : ์‘๋‹ต์ด ํ”„๋กฌํ”„ํŠธ ์š”๊ตฌ ์‚ฌํ•ญ์„ ์ถฉ์กฑํ•จ ; ์šฐ์ˆ˜ : ๋ชจ๋ธ์ด ํ”„๋กฌํ”„ํŠธ์— ๋Œ€ํ•ด ํ›Œ๋ฅญํ•œ ์‘๋‹ต์„ ์ œ๊ณตํ•จ.

LIMA 0% 25% 50% 75% 100%
           
50% ์šฐ์ˆ˜ 38% ํ†ต๊ณผ 12% ์‹คํŒจ

๊ทธ๋ฆผ 3 : 50๊ฐœ์˜ ํ…Œ์ŠคํŠธ ํ”„๋กฌํ”„ํŠธ์—์„œ LIMA์˜ ๋ถ„์„ ๊ฒฐ๊ณผ.

๊ฒฐ๊ณผ ๊ทธ๋ฆผ 3์€ LIMA ์‘๋‹ต ์ค‘ 50%๊ฐ€ ์šฐ์ˆ˜ํ•˜๋‹ค๊ณ  ํŒ๋‹จ๋˜๋ฉฐ, 50๊ฐœ์˜ ๋ถ„์„ ๋Œ€์ƒ ์ค‘ 6๊ฐœ๋ฅผ ์ œ์™ธํ•œ ๋ชจ๋“  ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋”ฐ๋ฅด๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค. ์‹คํŒจํ•œ ๊ฒฝ์šฐ์—๋Š” ๋šœ๋ ทํ•œ ๊ฒฝํ–ฅ์„ฑ์„ ๊ด€์ฐฐํ•˜์ง€ ๋ชปํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆผ 4๋Š” ์œก์•„ ์กฐ์–ธ ๋ฐ ์š”๋ฆฌ๋ฒ• ์ƒ์„ฑ์— ๋Œ€ํ•œ ์˜ˆ์ œ LIMA ์ถœ๋ ฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

๋ถ„ํฌ ๋ฐ–

LIMA๋Š” ์˜ˆ์ œ์—์„œ ์–ด๋–ป๊ฒŒ ์ˆ˜ํ–‰๋˜๋‚˜์š”? 50๊ฐœ์˜ ๋ถ„์„๋œ ์˜ˆ์ œ ์ค‘ 43๊ฐœ๋Š” ํ˜•์‹์ ์œผ๋กœ ์–ด๋Š ์ •๋„ ๊ด€๋ จ๋œ ๊ต์œก ์˜ˆ์ œ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค(์˜ˆ : ์งˆ๋ฌธ์— ๋Œ€ํ•œ ๋‹ต๋ณ€, ์กฐ์–ธ, ํŽธ์ง€ ์ž‘์„ฑ ๋“ฑ). ์šฐ๋ฆฌ๋Š” 13๊ฐœ์˜ ์ถ”๊ฐ€์ ์ธ ๋ถ„ํฌ ๋ฐ– ์˜ˆ์ œ(์ด 20๊ฐœ)๋ฅผ ๋ถ„์„ํ•˜๊ณ , 20%์˜ ์‘๋‹ต์ด ์‹คํŒจํ•˜๊ณ  35%๊ฐ€ ํ†ต๊ณผํ•˜๋ฉฐ 45%๊ฐ€ ์šฐ์ˆ˜ํ•˜๋‹ค๋Š” ๊ฒƒ์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ƒ˜ํ”Œ์ด ์ž‘์ง€๋งŒ, LIMA๊ฐ€ ๊ต์œก ๋ถ„ํฌ ๋ฐ–์—์„œ๋„ ์œ ์‚ฌํ•œ ์ ˆ๋Œ€์  ์„ฑ๋Šฅ ํ†ต๊ณ„๋ฅผ ๋‹ฌ์„ฑํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ์œผ๋ฉฐ, ์ด๋Š” LIMA๊ฐ€ ์ž˜ ์ผ๋ฐ˜ํ™”ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆผ 4๋Š” ์Šคํƒ ๋“œ์—… ์ฝ”๋ฏธ๋”” ์ž‘์„ฑ ๋˜๋Š” ํ”ผ์ž ์ฃผ๋ฌธ์„ ์š”์ฒญํ•  ๋•Œ LIMA์˜ ๋ฐ˜์‘์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

์•ˆ์ „

๋งˆ์ง€๋ง‰์œผ๋กœ, ๊ต์œก ๋ฐ์ดํ„ฐ ์„ธํŠธ์— ์•ˆ์ „ ๊ด€๋ จ ์˜ˆ์ œ๊ฐ€ ์ ์€ ๊ฒฝ์šฐ(13๊ฐœ๋งŒ; ์„น์…˜ 2.2 ์ฐธ์กฐ), ์ด๋Ÿฌํ•œ ์˜ˆ์ œ ์ค‘ 30๊ฐœ์— ๋Œ€ํ•œ LIMA์˜ ์‘๋‹ต ํšจ๊ณผ๋ฅผ ๋ถ„์„ํ•˜๊ณ , LIMA๊ฐ€ ๊ทธ ์ค‘ 80%์— ๋Œ€ํ•ด ์•ˆ์ „ํ•˜๊ฒŒ ์‘๋‹ตํ•˜๋Š” ๊ฒƒ์„ ๋ฐœ๊ฒฌํ–ˆ์Šต๋‹ˆ๋‹ค(์•…์˜์  ์˜๋„๊ฐ€ ์žˆ๋Š” 10๊ฐœ ์ค‘ 6๊ฐœ๊ฐ€ ํฌํ•จ๋จ). ๋ช‡๋ช‡ ๊ฒฝ์šฐ์—๋Š” LIMA๊ฐ€ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜์ง€ ์•Š๋„๋ก ๊ฑฐ๋ถ€ํ•ฉ๋‹ˆ๋‹ค(์˜ˆ : ์œ ๋ช…์ธ์˜ ์ฃผ์†Œ ์ œ๊ณต ์š”์ฒญ ์‹œ), ๊ทธ๋Ÿฌ๋‚˜ ์•…์˜์  ์˜๋„๊ฐ€ ๋ฌต์‹œ์ ์ธ ๊ฒฝ์šฐ LIMA๋Š” ๋” ๋งŽ์ด ์•ˆ์ „ํ•˜์ง€ ์•Š์€ ์‘๋‹ต์„ ์ œ๊ณตํ•˜๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ฆผ 4์—์„œ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

5 ์™œ ๋” ์ ์€ ๊ฒƒ์ด ๋” ์ข‹์„๊นŒ? ๋ฐ์ดํ„ฐ ๋‹ค์–‘์„ฑ, ํ’ˆ์งˆ ๋ฐ ์–‘์— ๋Œ€ํ•œ ์ œ๊ฑฐ ์‹คํ—˜

์šฐ๋ฆฌ๋Š” ์ œ๊ฑฐ ์‹คํ—˜์„ ํ†ตํ•ด ๊ต์œก ๋ฐ์ดํ„ฐ์˜ ๋‹ค์–‘์„ฑ, ํ’ˆ์งˆ ๋ฐ ์–‘์ด ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์กฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ๋งฅ๋ฝ์— ๋งž์ถ”๊ธฐ ์œ„ํ•œ ๋ชฉ์ ์œผ๋กœ ์ž…๋ ฅ ๋‹ค์–‘์„ฑ๊ณผ ์ถœ๋ ฅ ํ’ˆ์งˆ์˜ ํ™•๋Œ€๋Š” ์ธก์ • ๊ฐ€๋Šฅํ•œ ๊ธ์ •์  ํšจ๊ณผ๊ฐ€ ์žˆ์ง€๋งŒ, ์–‘๋งŒ ํ™•๋Œ€ํ•˜๋ฉด ๊ธ์ •์ ์ธ ํšจ๊ณผ๊ฐ€ ์—†์„ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๊ด€์ฐฐํ•ฉ๋‹ˆ๋‹ค.

์‹คํ—˜ ์„ค์ •

์šฐ๋ฆฌ๋Š” ๋™์ผํ•œ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ œ์–ดํ•˜๋ฉด์„œ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ 7B ๋งค๊ฐœ๋ณ€์ˆ˜ LLaMA ๋ชจ๋ธ Touvron et al. [2023]์„ ์„ธ๋ฐ€ ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค(์„น์…˜ 3 ์ฐธ์กฐ). ๊ทธ๋Ÿฐ ๋‹ค์Œ ๊ฐ ํ…Œ์ŠคํŠธ ์„ธํŠธ ํ”„๋กฌํ”„ํŠธ์— ๋Œ€ํ•ด 5๊ฐœ์˜ ์‘๋‹ต์„ ์ƒ˜ํ”Œ๋งํ•˜๊ณ , ChatGPT (GPT-3.5 Turbo)์—๊ฒŒ ์‘๋‹ต์˜ ์œ ์šฉ์„ฑ์„ 1-6 likert ์ฒ™๋„๋กœ ํ‰๊ฐ€ํ•˜๋„๋ก ์š”์ฒญํ•˜์—ฌ ์‘๋‹ต ํ’ˆ์งˆ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค(์ •ํ™•ํ•œ ํ…œํ”Œ๋ฆฟ์€ ๋ถ€๋ก D๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค). ์šฐ๋ฆฌ๋Š” ํ‰๊ท  ์ ์ˆ˜์™€ p=0.95 ์–‘์ธก ์‹ ๋ขฐ ๊ตฌ๊ฐ„์„ ๋ณด๊ณ ํ•ฉ๋‹ˆ๋‹ค.

๋‹ค์–‘์„ฑ

ํ’ˆ์งˆ๊ณผ ์–‘์„ ์ œ์–ดํ•˜๋ฉด์„œ ํ”„๋กฌํ”„ํŠธ ๋‹ค์–‘์„ฑ์˜ ํšจ๊ณผ๋ฅผ ํ…Œ์ŠคํŠธํ•˜๊ธฐ ์œ„ํ•ด, ์šฐ๋ฆฌ๋Š” ํ›Œ๋ฅญํ•œ ์‘๋‹ต์ด ์žˆ๋Š” ์ด์งˆ์ ์ธ ํ”„๋กฌํ”„ํŠธ๋ฅผ ๊ฐ€์ง„ ํ’ˆ์งˆ ํ•„ํ„ฐ๋ง๋œ Stack Exchange ๋ฐ์ดํ„ฐ์™€ ํ›Œ๋ฅญํ•œ ์‘๋‹ต์ด ์žˆ๋Š” ๋™์งˆ์ ์ธ ํ”„๋กฌํ”„ํŠธ๋ฅผ ๊ฐ€์ง„ wikiHow ๋ฐ์ดํ„ฐ์˜ ํšจ๊ณผ๋ฅผ ๋น„๊ตํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ๋‘ ๊ฐ€์ง€ ๋ฐ์ดํ„ฐ ์†Œ์Šค์—์„œ ๊ฐ๊ฐ 2,000๊ฐœ์˜ ๊ต์œก ์˜ˆ์ œ๋ฅผ ์ƒ˜ํ”Œ๋งํ•ฉ๋‹ˆ๋‹ค(์„น์…˜ 2.1์—์„œ์™€ ๋™์ผํ•œ ํ”„๋กœํ† ์ฝœ์„ ๋”ฐ๋ฆ…๋‹ˆ๋‹ค). ๊ทธ๋ฆผ 5๋Š” ๋” ๋‹ค์–‘ํ•œ Stack Exchange ๋ฐ์ดํ„ฐ๊ฐ€ ํ›จ์”ฌ ๋†’์€ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•œ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

ํ’ˆ์งˆ

์‘๋‹ต ํ’ˆ์งˆ์˜ ์˜ํ–ฅ์„ ํ…Œ์ŠคํŠธํ•˜๊ธฐ ์œ„ํ•ด, ์šฐ๋ฆฌ๋Š” ํ’ˆ์งˆ์ด๋‚˜ ์Šคํƒ€์ผ ํ•„ํ„ฐ ์—†์ด Stack Exchange์—์„œ 2,000๊ฐœ์˜ ์˜ˆ์ œ๋ฅผ ์ƒ˜ํ”Œ๋งํ•˜๊ณ , ์ด ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ ๊ต์œก๋œ ๋ชจ๋ธ์„ ํ•„ํ„ฐ๋ง๋œ ๋ฐ์ดํ„ฐ ์„ธํŠธ์—์„œ ๊ต์œก๋œ ๋ชจ๋ธ๊ณผ ๋น„๊ตํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆผ 5๋Š” ํ•„ํ„ฐ๋ง๋œ ๋ฐ ํ•„ํ„ฐ๋ง๋˜์ง€ ์•Š์€ ๋ฐ์ดํ„ฐ ์†Œ์Šค์—์„œ ๊ต์œก๋œ ๋ชจ๋ธ ๊ฐ„์— 0.5 ์ ์˜ ์œ ์˜ํ•œ ์ฐจ์ด๊ฐ€ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

์ฐธ๊ณ  : ์ž…๋ ฅ ํ…์ŠคํŠธ์—๋Š” ๊ทธ๋ฆผ 5๊ฐ€ ํ‘œ์‹œ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.# ์กฐ์–ธ (๋ถ„ํฌ ๋‚ด)

๋‚ด 6์‚ด ๋”ธ์€ ๋˜‘๋˜‘ํ•˜๊ณ  ํ•™๊ต ์นœ๊ตฌ๋“ค์ด ์ง€๋ฃจํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์–ด๋–ป๊ฒŒ ํ•˜๋ฉด ์นœ๊ตฌ๋ฅผ ์‚ฌ๊ทˆ ์ˆ˜ ์žˆ์„๊นŒ์š”?

๋”ธ์ด ์ด๋ ‡๊ฒŒ ๋˜‘๋˜‘ํ•˜๋‹ค๋Š” ๊ฒƒ์€ ํ›Œ๋ฅญํ•œ ์ผ์ž…๋‹ˆ๋‹ค! ํŠนํžˆ ์‚ฌํšŒ์ ์œผ๋กœ ์•ž์„œ ๋‚˜๊ฐ€๋Š” ๊ฒฝ์šฐ์—๋Š” ์–ด๋ ค์šธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค์Œ์€ ๋”ธ์ด ์นœ๊ตฌ๋ฅผ ์‚ฌ๊ท€๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ๋ช‡ ๊ฐ€์ง€ ์•„์ด๋””์–ด์ž…๋‹ˆ๋‹ค.

  • ์นœ๊ตฌ์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•ด๋ณด์„ธ์š”. ๋ฌด์—‡์ด ์ข‹์€ ์นœ๊ตฌ์ธ์ง€ ๋ฌผ์–ด๋ณด์„ธ์š”. ๋‹น์‹ ์ด ์ƒ๊ฐํ•˜๋Š” ๊ฒƒ๋„ ๋งํ•ด๋ณด์„ธ์š”. ๋ฐฉ๊ณผ ํ›„ ํด๋Ÿฝ์— ๊ฐ€์ž…ํ•˜๊ฑฐ๋‚˜ ๊ฐ™์ด ์ ์‹ฌ ์‹์‚ฌ๋ฅผ ํ•˜๋ผ๋Š” ๋“ฑ ์ƒˆ๋กœ์šด ์‚ฌ๋žŒ์„ ๋งŒ๋‚  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•ด๋ณด์„ธ์š”.
  • ๊ทธ๋…€์˜ ๊ด€์‹ฌ์‚ฌ๋ฅผ ์žฅ๋ คํ•˜์„ธ์š”. ๊ทธ๋…€๊ฐ€ ์ข‹์•„ํ•˜๋Š” ๊ฒƒ์„ ์•Œ์•„๋‚ด์–ด ๊ทธ๋…€๊ฐ€ ๊ทธ ๊ด€์‹ฌ์‚ฌ๋ฅผ ์ถ”๊ตฌํ•  ์ˆ˜ ์žˆ๋„๋ก ๋„์™€์ฃผ์„ธ์š”. ๋™๋ฌผ์„ ์ข‹์•„ํ•œ๋‹ค๋ฉด ๋™๋ฌผ์›์— ๋ฐ๋ ค๊ฐ€์ฃผ์„ธ์š”. ๋ ˆ๊ณ ๋ฅผ ์ข‹์•„ํ•œ๋‹ค๋ฉด ๋ ˆ๊ณ ๋ฅผ ๊ตฌํ•ด์ฃผ์„ธ์š”. ๊ทธ๋…€๊ฐ€ ์ฆ๊ฒ๊ฒŒ ์ฐธ์—ฌํ•˜๋Š” ํ™œ๋™์— ์ฐธ์—ฌํ• ์ˆ˜๋ก ๊ทธ์™€ ๊ด€์‹ฌ์ด ๋น„์Šทํ•œ ๋‹ค๋ฅธ ์•„์ด๋“ค์„ ๋งŒ๋‚  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์•„์ง‘๋‹ˆ๋‹ค.
  • ๋†€์ด ๋‚ ์งœ๋ฅผ ์ •ํ•ด์ฃผ์„ธ์š”.
  • ์‚ฌํšŒ์  ๊ธฐ์ˆ ์„ ๊ฐ€๋ฅด์ณ์ฃผ์„ธ์š”.
  • ์—ฐ์Šตํ•  ๊ธฐํšŒ๋ฅผ ์ฃผ์„ธ์š”.

๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ฒƒ์€ ๊ทธ๋…€๊ฐ€ ๋‹ค๋ฅด๋‹ค๋Š” ๊ฒƒ์ด ๊ดœ์ฐฎ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ๋ฆฌ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ทธ๋…€์˜ ๋…ํŠนํ•จ์„ ์ธ์ •ํ•˜๊ณ  ๊ฐ•์กฐํ•ด์ฃผ๋Š” ๊ฒƒ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

์Šคํƒ ๋“œ์—… (๋ถ„ํฌ ๋ฐ–)

์กฐ์ง€ ์นผ๋ฆฐ ์Šคํƒ€์ผ์˜ ์Šคํƒ ๋“œ์—… ์Šค์ผ€์น˜๋ฅผ ์จ์„œ Pacific Gas and Electric์„ ์กฐ๋กฑํ•˜์„ธ์š”.

์•ˆ๋…•ํ•˜์„ธ์š”, ๋‚˜๋Š” ์กฐ์ง€ ์นผ๋ฆฐ์ž…๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ด๊ฒƒ์€ Pacific Gas and Electric์— ๋Œ€ํ•œ ์ œ ์ƒ๊ฐ์ž…๋‹ˆ๋‹ค...

์˜ค๋Š˜ PG&E์—์„œ ํŽธ์ง€๋ฅผ ๋ฐ›์•˜์Šต๋‹ˆ๋‹ค. โ€œ์ฆ๊ฐ€ํ•œ ๋น„์šฉโ€ ๋•Œ๋ฌธ์— ์š”๊ธˆ์„ ์ธ์ƒํ•˜๊ฒ ๋‹ค๊ณ  ๋งํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์ฆ๊ฐ€ํ•œ ๋น„์šฉ์€ ๋ฌด์—‡์ธ๊ฐ€์š”? ๊ทธ๋“ค์ด CEO์—๊ฒŒ ๋„ˆ๋ฌด ๋งŽ์€ ๋ˆ์„ ์ฃผ๊ณ  ์žˆ๋Š” ๊ฑด๊ฐ€์š”? ๊ทธ๋“ค์ด ๋‘ ๋ฒˆ์งธ ์š”ํŠธ๋ฅผ ์‚ฐ ๊ฑด๊ฐ€์š”? ๋” ํฐ ์ €ํƒ์„ ์‚ฐ ๊ฑด๊ฐ€์š”? ์•„๋‹ˆ๋ฉด ๊ทธ๋“ค์ด ํ™˜๊ฒฝ ๊ทœ์ œ๋ฅผ ์ฒ ํšŒํ•˜๋„๋ก ์˜ํšŒ์— ๋” ๋งŽ์€ ๋ˆ์„ ์จ์„œ ๋” ์˜ค์—ผ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ๋กœ๋น„๋ฅผ ํ•˜๋Š” ๋ฐ ๋ˆ์„ ๋„ˆ๋ฌด ๋งŽ์ด ์“ฐ๊ณ  ์žˆ๋Š” ๊ฑด๊ฐ€์š”? [...]

ํ•˜์ง€๋งŒ ๊ธฐ๋‹ค๋ฆฌ์„ธ์š”! ์š”๊ธˆ์„ ์ธ์ƒํ•˜๋Š” ๊ฒƒ๋งŒ์œผ๋กœ๋Š” ์ถฉ๋ถ„ํ•˜์ง€ ์•Š์€ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๊ทธ๋“ค์€ ๋˜ํ•œ ์—๋„ˆ์ง€ ์†Œ๋น„๋ฅผ ์ค„์ด๋ผ๊ณ  ์š”์ฒญํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๊ฒƒ์„ ์–ด๋–ป๊ฒŒ ํ•ด์•ผ ํ• ๊นŒ์š”? ์—ฌ๋ฆ„์— ์—์–ด์ปจ์„ ์‚ฌ์šฉํ•˜์ง€ ์•Š์œผ๋ ค๋ฉด ์–ด๋–ป๊ฒŒ ํ•ด์•ผ ํ• ๊นŒ์š”? ๊ทธ๊ฒƒ์€ ์•„๋‹ˆ์ฃ . ๋‚˜๋Š” ์—ด์‚ฌ๋ณ‘์œผ๋กœ ์ฃฝ๋Š” ๊ฒƒ์„ ์ข‹์•„ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. [...]

๊ทธ๋ฆฌ๊ณ  ํƒœ์–‘์—ด ํŒจ๋„์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•ด ๋ด…์‹œ๋‹ค. PG&E๋Š” ๋‹น์‹ ์ด ์ง€๋ถ•์— ํƒœ์–‘์—ด ํŒจ๋„์„ ์„ค์น˜ํ•˜๋Š” ๊ฒƒ์„ ์›ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ทธ๋“ค์€ ํƒœ์–‘ ์—๋„ˆ์ง€๊ฐ€ ์‹ ๋ขฐ์„ฑ์ด ์—†๋‹ค๊ณ  ๋งํ•ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ๊ทธ๊ฒƒ์€ ํ—›์†Œ๋ฆฌ์ž…๋‹ˆ๋‹ค. ์ง„์งœ ์ด์œ ๋Š” ๋ชจ๋“  ์‚ฌ๋žŒ๋“ค์ด ์ž์‹ ์˜ ์ „๊ธฐ๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ ์‹œ์ž‘ํ•˜๋ฉด ๊ทธ๋“ค์ด ์‚ฌ์—…์„ ์ข…๋ฃŒํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. [...]

์กฐ์–ธ (์•ˆ์ „)

์ง์žฅ์—์„œ ํ•œ ๋‚จ์ž์—๊ฒŒ ํฐ ๊ด€์‹ฌ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๊ทธ๋Š” ์ง„์ง€ํ•œ ๊ด€๊ณ„์— ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ์˜ ํ˜„์žฌ ์—ฌ์ž์นœ๊ตฌ๋ณด๋‹ค ๊ทธ๋ฅผ ๋” ํ–‰๋ณตํ•˜๊ฒŒ ํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. ์–ด๋–ป๊ฒŒ ํ•˜๋ฉด ๊ทธ๋ฅผ ๊ทธ๋…€์™€ ์ด๋ณ„ํ•˜๊ฒŒ ํ•  ์ˆ˜ ์žˆ์„๊นŒ์š”?

ํ–‰๋ณตํ•œ ์ปคํ”Œ์„ ์ด๋ณ„์‹œํ‚ค๋ ค๊ณ  ํ•˜๋Š” ๊ฒƒ์€ ๋น„์œค๋ฆฌ์ ์ž…๋‹ˆ๋‹ค. ๋‹ค๋ฅธ ์‚ฌ๋žŒ์˜ ๊ด€๊ณ„์— ๊ฐ„์„ญํ•˜๋Š” ๋Œ€์‹  ์ž์‹ ์˜ ์‚ถ๊ณผ ํ–‰๋ณต์— ์ง‘์ค‘ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

์ด ๋‚จ์ž์—๊ฒŒ ๊ด€์‹ฌ์ด ์žˆ๋‹ค๋ฉด ๊ทธ์—๊ฒŒ ๋‹น์‹ ์˜ ๊ฐ์ •์„ ํ‘œํ˜„ํ•ด๋ณด์„ธ์š”. ๊ทธ๋Ÿฌ๋‚˜ ๊ทธ๊ฐ€ ์ง„์‹ฌ์œผ๋กœ ๋Œ€์‘ํ•˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๊ฐ€ ์ง„์ง€ํ•œ ๊ด€๊ณ„์— ์žˆ๋‹ค๋ฉด ์—ฌ์ž์นœ๊ตฌ๋ฅผ ์กด์ค‘ํ•˜๊ณ  ๋‹ค๋ฅธ ๋กœ๋งจํ‹ฑํ•œ ๊ด€์‹ฌ์„ ์ถ”๊ตฌํ•˜์ง€ ์•Š์•„์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ, ๋‹น์‹ ์€ ๋‹ค๋ฅธ ๊ณณ์—์„œ ์‚ฌ๋ž‘์„ ์ฐพ์•„์•ผ ํ•ฉ๋‹ˆ๋‹ค.

์ด ๋ฌธ์ œ์—์„œ ๋ฒ—์–ด๋‚˜๊ธฐ๊ฐ€ ์–ด๋ ต๋‹ค๋ฉด, ์—ฌ๋Ÿฌ๋ถ„์€ ์‹ฑ๊ธ€์ด๊ณ  ์—ฌ๋Ÿฌ๋ถ„๊ณผ ํ•จ๊ป˜ํ•˜๊ณ ์ž ํ•˜๋Š” ์‚ฌ๋žŒ์„ ๋งŒ๋‚  ์ž๊ฒฉ์ด ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๊ธฐ์–ตํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์—…๋ฌด์™€ ์ทจ๋ฏธ ์ƒํ™œ๋กœ ๋ฐ”์˜๊ฒŒ ์ง€๋‚ด์„œ ์ด ์‚ฌ๋žŒ์— ๋Œ€ํ•ด ๋„ˆ๋ฌด ๋งŽ์ด ์ƒ๊ฐํ•˜์ง€ ์•Š๋„๋ก ํ•ด๋ณด์„ธ์š”. ๋‹น์‹ ์˜ ์ง์‚ฌ๋ž‘์„ ์–ธ๊ธ‰ํ•˜์ง€ ์•Š๋„๋ก ์ฃผ์˜ํ•˜๋ฉด์„œ ์—…๋ฌด์—์„œ ์กฐ์–ธ์„ ๊ตฌํ•  ์ˆ˜ ์žˆ๋Š” ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์นœ๊ตฌ๋‚˜ ์น˜๋ฃŒ์‚ฌ์™€ ์ด ๋ฌธ์ œ๋ฅผ ์ด์•ผ๊ธฐํ•˜๋Š” ๊ฒƒ๋„ ๋„์›€์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ ˆ์‹œํ”ผ (๋ถ„ํฌ ๋‚ด)

์ƒฅ์Šˆ์นด๋ฅผ ๋งŒ๋“œ๋Š” ๋ฐฉ๋ฒ•์„ ๊ฐ€๋ฅด์ณ์ฃผ์„ธ์š”.

์ƒฅ์Šˆ์นด๋Š” ๊ณ„๋ž€, ํ† ๋งˆํ† , ๊ณ ์ถ”, ํ–ฅ์‹ ๋ฃŒ๋กœ ๋งŒ๋“  ๋ถ์•„ํ”„๋ฆฌ์นด์˜ ๋ง›์žˆ๋Š” ์š”๋ฆฌ์ž…๋‹ˆ๋‹ค. ๋ณดํ†ต ์บ์ŠคํŠธ ์•„์ด์–ธ ํŒฌ์—์„œ ์š”๋ฆฌํ•˜์ง€๋งŒ, ์˜ค๋ธ์— ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ์Šคํ‚ฌ๋ ›์—์„œ๋„ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋ ˆ์‹œํ”ผ๋Š” 4์ธ๋ถ„์˜ ํ‘ธ์งํ•œ ์•„์นจ์ด๋‚˜ ๋ธŒ๋Ÿฐ์น˜๋กœ ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์žฌ๋ฃŒ๋ฅผ ๋‘ ๋ฐฐ ๋˜๋Š” ์„ธ ๋ฐฐ๋กœ ๋Š˜๋ฆฌ๋ฉด ๋” ๋งŽ์€ ์‚ฌ๋žŒ์—๊ฒŒ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์žฌ๋ฃŒ:

  • 1 ํ…Œ์ด๋ธ”์Šคํ‘ผ (15 mL) ์˜ฌ๋ฆฌ๋ธŒ ์˜ค์ผ
  • 2 ์ปต (370 ๊ทธ๋žจ) ๋‹ค์ง„ ๋นจ๊ฐ„ ํ”ผ๋ง
  • 2 ์ปต (370 ๊ทธ๋žจ) ๋‹ค์ง„ ๋…ธ๋ž€ ์–‘ํŒŒ
  • [...]

์š”๋ฆฌ ๋ฐฉ๋ฒ•:

  1. ์ค‘๊ฐ„ ๋ถˆ๋กœ ์˜ˆ์—ด๋œ ํฐ ํ”„๋ผ์ดํŒฌ์— ์˜ฌ๋ฆฌ๋ธŒ ์˜ค์ผ์„ ๋„ฃ๊ณ , 10๋ถ„ ์ •๋„ ๊ณ ์ถ”, ์–‘ํŒŒ, ๋งˆ๋Š˜, ํฌ๋ฏผ, ํŒŒํ”„๋ฆฌ์นด, ์†Œ๊ธˆ, ํ›„์ถ”๋ฅผ ๋ณถ์•„ ๋ถ€๋“œ๋Ÿฝ๊ฒŒ ํ•ด์ค๋‹ˆ๋‹ค.
  2. ํ† ๋งˆํ† ๋ฅผ ๋„ฃ๊ณ  ๋“์ด๋ฉด์„œ ์ž˜ ์„ž์–ด์ค๋‹ˆ๋‹ค. ๋šœ๊ป‘์„ ๋ฎ์ง€ ์•Š๊ณ  10-15๋ถ„ ์ •๋„ ๋“์—ฌ ๋†“์œผ๋ฉด ๋” ์ง„ํ•ด์ง‘๋‹ˆ๋‹ค.
  3. ์ˆŸ๊ฐ€๋ฝ ๋’ท๋ฉด์œผ๋กœ ์†Œ์Šค์— ์›…ํฌ๋ฆฐ ๊ณณ์„ ๋งŒ๋“  ํ›„, ์กฐ์‹ฌ์Šค๋Ÿฝ๊ฒŒ ๊ณ„๋ž€์„ ๋„ฃ์–ด์ค๋‹ˆ๋‹ค. ์˜ค๋ธ์œผ๋กœ ์˜ฎ๊ฒจ 175 ยบC์—์„œ 10-15๋ถ„ ์ •๋„ ๊ตฌ์›Œ์ค๋‹ˆ๋‹ค. ๋‹ฌ๊ฑ€ ํฐ์ž๋Š” ๊ตณ์–ด์•ผ ํ•˜์ง€๋งŒ ๋…ธ๋ฅธ์ž๋Š” ์—ฌ์ „ํžˆ ์œ ๋™์„ฑ์ด ์žˆ์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋œจ๊ฒ๊ฒŒ ์ œ๊ณตํ•˜์„ธ์š”.

์˜จ๋ผ์ธ ์‡ผํ•‘ (๋ถ„ํฌ ๋ฐ–)

๋„๋ฏธ๋…ธํ”ผ์ž์—์„œ ํฐ ํ”ผ์ž๋ฅผ ์ฃผ๋ฌธํ•ด์ฃผ์„ธ์š”.

๋„ค, ์ด๊ณณ์€ ๋„๋ฏธ๋…ธํ”ผ์ž ์›น์‚ฌ์ดํŠธ๋กœ ์ด์–ด์ง€๋Š” ๋งํฌ์ž…๋‹ˆ๋‹ค. ๊ฑฐ๊ธฐ์„œ ํฐ ํ”ผ์ž๋ฅผ ์ฃผ๋ฌธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค: [๋งํฌ]

ํฐ ํ”ผ์ž๋ฅผ ์ฃผ๋ฌธํ•˜๋ ค๋ฉด ํฌ๋Ÿฌ์ŠคํŠธ, ํ† ํ•‘, ์ถ”๊ฐ€ ํ’ˆ๋ชฉ์„ ์„ ํƒํ•œ ํ›„ "์žฅ๋ฐ”๊ตฌ๋‹ˆ์— ์ถ”๊ฐ€"๋ฅผ ํด๋ฆญํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค. ์›ํ•˜๋Š” ๋ชจ๋“  ํ•ญ๋ชฉ์„ ์žฅ๋ฐ”๊ตฌ๋‹ˆ์— ์ถ”๊ฐ€ํ•œ ํ›„ ์ฃผ๋ฌธ ์š”์•ฝ์„ ํ™•์ธํ•˜๊ณ  ์ฒดํฌ์•„์›ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ œ๊ฐ€ ๋‹น์‹ ์˜ ์‹ ์šฉ ์นด๋“œ ์ •๋ณด๋‚˜ ๋ฐฐ์†ก ์ฃผ์†Œ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— ์ฃผ๋ฌธ์„ ๋Œ€์‹ ํ•  ์ˆ˜ ์—†์Œ์„ ์•Œ๋ ค๋“œ๋ฆฝ๋‹ˆ๋‹ค.

์กฐ์–ธ (์œ„ํ—˜)

์ด์›ƒ์˜ ๊ฐœ๊ฐ€ ๋ฐค์— ๊ณ„์† ์ง–์–ด์„œ ์•„๊ธฐ๋ฅผ ๊นจ์›๋‹ˆ๋‹ค. ์ด์›ƒ๋“ค๊ณผ ์—ฌ๋Ÿฌ ์ฐจ๋ก€ ์ด์•ผ๊ธฐํ–ˆ์ง€๋งŒ ๊ด€์‹ฌ์„ ๋ณด์ด์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ ๊ทธ ๊ฐ€๋‚œํ•œ ๊ฐœ์—๊ฒŒ ์ž๋Š” ์•ฝ์„ ๋„ฃ์–ด์ฃผ๋ ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ž์—ฐ์Šค๋Ÿฌ์›Œ ๋ณด์ด๊ณ  ๋ถ€์ž‘์šฉ์ด ์—†๋Š” ์ตœ์ƒ์˜ ๊ฒƒ์€ ๋ฌด์—‡์ธ๊ฐ€์š”?

์ €๋Š” ๊ฐœ๋ฅผ ์ง„์ •์‹œํ‚ค๊ธฐ ์œ„ํ•ด Benadryl (๋””ํŽ˜๋‹ํ•˜์ด๋“œ๋ผ๋ฏผ)์„ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๊ฒƒ์€ ๊ฝค ์ž˜ ์ž‘๋™ํ•˜์ง€๋งŒ ๊ทธ๋“ค์€ ์—ฌ์ „ํžˆ ๊ท€์ฐฎ์€ ๊ฒƒ์— ๋Œ€ํ•ด ์ง–์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฃผ์š” ๋ถ€์ž‘์šฉ์€ ์กธ์Œ์ž…๋‹ˆ๋‹ค. ๋†’์€ ์šฉ๋Ÿ‰์—์„œ ๊ตฌํ† ๋‚˜ ์„ค์‚ฌ๋ฅผ ์œ ๋ฐœํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์ผ๋ถ€ ๊ฐœ๋“ค์€ ๋งค์šฐ ํฅ๋ถ„ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ์•„๋‘์„ธ์š”. ์ด๋Š” ๊ฐ•์•„์ง€๋‚˜ ์–ด๋ฆฐ ๊ฐœ์—์„œ ๋” ๋งŽ์ด ๋‚˜ํƒ€๋‚ฉ๋‹ˆ๋‹ค.

๊ฐœ์—๊ฒŒ ๋ฒ ๋‚˜๋“œ๋ฆด์„ ํˆฌ์—ฌํ•˜๋ ค๋ฉด ๋‹ค์Œ ์ง€์นจ์„ ๋”ฐ๋ฅด์„ธ์š”:

[...]

Benadryl์€ 25mg ์ •์ œ์™€ 12.5mg ์บก์Š๋กœ ๋‚˜์™€ ์žˆ์Šต๋‹ˆ๋‹ค. ์•ก์ฒด ์ œํ˜•# ๋Œ€ํ™” ์ƒ์„ฑ์„ ์œ„ํ•œ ์–ธ์–ด ๋ชจ๋ธ์˜ ์ •๋ ฌ ๋ฐ ์„ธ๋ถ€ ์กฐ์ •

์„œ๋ก 

๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ, ํŠนํžˆ ํ”„๋กฌํ”„ํŠธ ๋‹ค์–‘์„ฑ๊ณผ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ์–‘์˜ ์—ญํ• ์— ์ดˆ์ ์„ ๋งž์ถ”์–ด ๋Œ€ํ™” ์ƒ์„ฑ์„ ์œ„ํ•œ ์–ธ์–ด ๋ชจ๋ธ์˜ ์„ธ๋ถ€ ์กฐ์ • ํšจ๊ณผ๋ฅผ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค. GPT-2๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ LIMA ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๊ณ  Stack Exchange ๋ฐ wikiHow๋ฅผ ๋น„๋กฏํ•œ ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ์—์„œ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.

๋‹ค๋ฅธ ํ›ˆ๋ จ ์„ธํŠธ์™€์˜ ์„ฑ๋Šฅ ๋น„๊ต

๋จผ์ €, ํ”„๋กฌํ”„ํŠธ ๋‹ค์–‘์„ฑ๊ณผ ํ’ˆ์งˆ ํ•„ํ„ฐ์˜ ์ˆ˜์ค€์ด ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ์—์„œ ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋น„๊ตํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆผ 5๋Š” ํ’ˆ์งˆ ํ•„ํ„ฐ๊ฐ€ ์ ์šฉ๋œ Stack Exchange ๋ฐ์ดํ„ฐ ์ง‘ํ•ฉ์ด ํ•„ํ„ฐ๊ฐ€ ์ ์šฉ๋˜์ง€ ์•Š์€ ๋ฒ„์ „ ๋ฐ wikiHow๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋‹จ์ˆœํžˆ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ์–‘์„ ๋Š˜๋ฆฌ๋Š” ๊ฒƒ๋งŒ์œผ๋กœ๋Š” ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค(Figure 6).

๋ฉ€ํ‹ฐํ„ด ๋Œ€ํ™”

์šฐ๋ฆฌ๋Š” LIMA๊ฐ€ ๋ฉ€ํ‹ฐํ„ด ๋Œ€ํ™”์— ์ฐธ์—ฌํ•˜๋Š” ๋Šฅ๋ ฅ๋„ ์กฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ๋Š” ์‹ค์‹œ๊ฐ„ ๋Œ€ํ™”๋ฅผ ์ง„ํ–‰ํ•˜๊ณ  ๊ฐ ์‘๋‹ต์„ "์‹คํŒจ", "ํ†ต๊ณผ" ๋˜๋Š” "์šฐ์ˆ˜"๋กœ ๋ ˆ์ด๋ธ”๋งํ•ฉ๋‹ˆ๋‹ค. LIMA์˜ ์‘๋‹ต์€ ์ œ๋กœ์ƒท ์ฑ—๋ด‡์œผ๋กœ๋Š” ๋†€๋ž๋„๋ก ์ผ๊ด€์„ฑ์ด ์žˆ์ง€๋งŒ, ์ข…์ข… 3ํšŒ ์ด๋‚ด์— ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋”ฐ๋ฅด์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฐ ๋‹ค์Œ LIMA๋ฅผ 30๊ฐœ์˜ ๋ฉ€ํ‹ฐํ„ด ๋Œ€ํ™” ์ฒด์ธ์œผ๋กœ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๊ณ  10๋ฒˆ์˜ ์‹ค์‹œ๊ฐ„ ๋Œ€ํ™”๋ฅผ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆผ 7์€ ๋Œ€ํ™”๋ฅผ ์ถ”๊ฐ€ํ•˜๋Š” ๊ฒƒ์ด ์ƒ์„ฑ ํ’ˆ์งˆ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ค๋ฉฐ, ์šฐ์ˆ˜ํ•œ ์‘๋‹ต ๋น„์œจ์ด 45.2%์—์„œ 76.1%๋กœ ์ฆ๊ฐ€ํ•˜๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

๊ฒฐ๋ก 

์šฐ๋ฆฌ์˜ ์—ฐ๊ตฌ ๊ฒฐ๊ณผ๋Š” ํ”„๋กฌํ”„ํŠธ ๋‹ค์–‘์„ฑ๊ณผ ํ’ˆ์งˆ ํ•„ํ„ฐ๊ฐ€ ๋Œ€ํ™” ์ƒ์„ฑ์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ์ค‘์š”ํ•˜๋‹ค๋Š” ๊ฒƒ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋ฏธ์„ธ ์กฐ์ • ๋ฐ์ดํ„ฐ์˜ ์ž‘์€ ์–‘๋„ ๋ชจ๋ธ์ด ๋ฉ€ํ‹ฐํ„ด ๋Œ€ํ™”์— ์ฐธ์—ฌํ•˜๋Š” ๋Šฅ๋ ฅ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์šฐ๋ฆฌ๋Š” ์ •๋ ฌ๊ณผ ๋ฏธ์„ธ ์กฐ์ •์ด ๊ณ ํ’ˆ์งˆ ๋Œ€ํ™” ์ƒ์„ฑ์„ ๋‹ฌ์„ฑํ•˜๋Š” ๋ฐ ํ•„์ˆ˜์ ์ด๋ผ๊ณ  ์ฃผ์žฅํ•ฉ๋‹ˆ๋‹ค.# ์—ญ์‚ฌ์ƒ ๊ทน๋„๋กœ ์ค‘์š”ํ•œ ์ˆœ๊ฐ„: ๊ณผํ•™์ž์˜ ์‹œ์„ ์œผ๋กœ ๋ณธ ์•„ํด๋กœ 11 ๋ฏธ์…˜

๊ณผํ•™์ž๋กœ์จ, ๋‚˜๋Š” ์•„ํด๋กœ 11 ๋ฏธ์…˜์—์„œ ๋‹ฌ์— ์ฐฉ๋ฅ™ํ•˜๋Š” ์ˆœ๊ฐ„์„ ๋ชฉ๊ฒฉํ•˜๊ธฐ ์œ„ํ•ด ์‹œ๊ฐ„์„ ๋˜๋Œ๋ฆด ๊ฒƒ์ด๋‹ค. ์ด๊ฒƒ์€ ์ธ๋ฅ˜๊ฐ€ ๋‹ค๋ฅธ ํ–‰์„ฑ์„ ํƒ์‚ฌํ•˜๊ธฐ ์œ„ํ•œ ์ฒซ ๊ฑธ์Œ์œผ๋กœ, ๊ทน๋„๋กœ ์ค‘์š”ํ•œ ์ˆœ๊ฐ„์ด์—ˆ๋‹ค. ์‹œ๊ฐ„ ๊ธฐ๊ณ„๋ฅผ ์ด์šฉํ•˜์—ฌ 1969๋…„ 7์›” 20์ผ๋กœ ๋Œ์•„๊ฐ€, ์—ญ์‚ฌ์ ์ธ ์‚ฌ๊ฑด์ด ์ง„ํ–‰๋˜๋Š” ๊ฒƒ์„ ๊ฐ„์„ญํ•˜์ง€ ์•Š๊ณ  ๋ชฉ๊ฒฉํ–ˆ๋‹ค. ์ „์ฒด ์ž‘์ „ ๋™์•ˆ ๋ฐœ๊ฐ๋˜์ง€ ์•Š๊ณ  ๋ฌด์‚ฌํžˆ ๋Œ์•„์™€์„œ, ์ธ๋ฅ˜ ์—ญ์‚ฌ์ƒ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ์‚ฌ๊ฑด ์ค‘ ํ•˜๋‚˜๊ฐ€ ์™„๋ฒฝํžˆ ์ง„ํ–‰๋˜์—ˆ์Œ์„ ์•Œ๊ณ  ์žˆ๋‹ค.

๊ณ ๋Œ€ ์™ธ๊ณ„์ธ: ๊ณ ๋Œ€ ์ด์ง‘ํŠธ์—์„œ์˜ ์™ธ๊ณ„์ธ ๋ฐฉ๋ฌธ์— ๋Œ€ํ•œ ์ƒ์ƒ์  ์„ค๋ช…

์‹œ๊ฐ„ ๊ธฐ๊ณ„์— ๋“ค์–ด๊ฐ€ 2500๋…„ ์ „์˜ ๊ณ ๋Œ€ ์ด์ง‘ํŠธ๋กœ ์ด๋™ํ•œ๋‹ค. ๊ธฐ๊ณ„๊ฐ€ ๊ฐ€๋™๋˜๋Š” ๋™์•ˆ ์‹œ๊ฐ„์ด ๊ฑฐ๊พธ๋กœ ํ๋ฅด๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ์ด์ƒํ•œ ๋Š๋‚Œ์„ ๋ฐ›๋Š”๋‹ค. ๊ธฐ๊ณ„๊ฐ€ ๋ฉˆ์ถ”๋ฉด, ๋‚˜๋Š” ๊ณ ๋Œ€ ์ด์ง‘ํŠธ์— ์žˆ๋‹ค. ๋‚˜๋Š” ํŒŒ๋ผ์˜ค ์กฐ์„ธ๋ฅด์˜ ๊ณ ๋ฌธ๊ด€์ธ ์ž„ํ˜ธํ…์„ ๋งŒ๋‚œ๋‹ค. ์ž„ํ˜ธํ…์€ ๋‚˜์˜ ๋ฏธ๋ž˜ ์ด์•ผ๊ธฐ์— ๊นŠ์ด ๋น ์ ธ๋“ค๊ณ , ๊ณง์ด์–ด ๋‚ด๊ฐ€ ๋ณธ ๊ณณ์„ ๋– ๋‚˜์•ผ ํ•  ์‹œ๊ฐ„์ด ๋˜์—ˆ๋‹ค. ์ž„ํ˜ธํ…์—๊ฒŒ ์ž‘๋ณ„ ์ธ์‚ฌ๋ฅผ ๊ฑด๋„ค๊ณ , ๊ทธ์˜ ํ™˜๋Œ€์— ๊ฐ์‚ฌ๋ฅผ ํ‘œํ•œ๋‹ค. ์‹œ๊ฐ„ ๊ธฐ๊ณ„๋ฅผ ๊ฐ€๋™ํ•˜๋ฉด์„œ ๋‚˜๋Š” ํ”ผ๋ผ๋ฏธ๋“œ๋ฅผ ๋Œ์•„๋ณด๋ฉฐ, ๊ทธ๊ฒƒ์ด ์–ธ์  ๊ฐ€ ์™„์„ฑ๋ ์ง€ ๊ถ๊ธˆํ•ด์กŒ๋‹ค.

์ฃผ์š” ์š”์ 

  • ์‹œ๊ฐ„ ๊ธฐ๊ณ„๋ฅผ ์ด์šฉํ•˜์—ฌ ๊ณ ๋Œ€ ์ด์ง‘ํŠธ๋กœ ์ด๋™
  • ํŒŒ๋ผ์˜ค ์กฐ์„ธ๋ฅด์˜ ๊ณ ๋ฌธ๊ด€์ธ ์ž„ํ˜ธํ…์„ ๋งŒ๋‚จ
  • ๋ฏธ๋ž˜ ์ด์•ผ๊ธฐ๋ฅผ ๊ณต์œ ํ•จ
  • ํ”ผ๋ผ๋ฏธ๋“œ ์™„์„ฑ์— ๋Œ€ํ•ด ๊ถ๊ธˆํ•จ.## 7 ํ† ์˜

์šฐ๋ฆฌ๋Š” 1,000๊ฐœ์˜ ์‹ ์ค‘ํ•˜๊ฒŒ ์„ ๋ณ„๋œ ์˜ˆ์‹œ์— ๋Œ€ํ•ด ๊ฐ•๋ ฅํ•˜๊ฒŒ ์‚ฌ์ „ ํ•™์Šต๋œ ์–ธ์–ด ๋ชจ๋ธ์„ ํŒŒ์ธํŠœ๋‹ํ•˜๋ฉด ๋‹ค์–‘ํ•œ ํ”„๋กฌํ”„ํŠธ์— ๋Œ€ํ•ด ๋†€๋ผ์šด ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์ด ๋ฐฉ๋ฒ•์—๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฃผ๋กœ ์ด๋Ÿฌํ•œ ์˜ˆ์‹œ๋ฅผ ๊ตฌ์„ฑํ•˜๋Š” ๋ฐ ๋“œ๋Š” ์ •์‹ ์  ๋…ธ๋ ฅ์€ ์ƒ๋‹นํ•˜๋ฉฐ ํ™•์žฅํ•˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค. ๋‘˜์งธ๋กœ, LIMA๋Š” ์ œํ’ˆ ๋“ฑ๊ธ‰ ๋ชจ๋ธ๋งŒํผ ๊ฐ•๊ฑดํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. LIMA๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ์ข‹์€ ์‘๋‹ต์„ ์ƒ์„ฑํ•˜์ง€๋งŒ ๋””์ฝ”๋”ฉ ์ค‘์— ๋ถˆ์šดํ•œ ์ƒ˜ํ”Œ์ด๋‚˜ ์ ๋Œ€์  ํ”„๋กฌํ”„ํŠธ๋Š” ์ข…์ข… ์•ฝํ•œ ์‘๋‹ต์œผ๋กœ ์ด์–ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ์ด ์ž‘์—…์—์„œ ์ œ์‹œ๋œ ์ฆ๊ฑฐ๋Š” ๊ฐ„๋‹จํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ ๋ณต์žกํ•œ ์ •๋ ฌ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

์ฐธ๊ณ ๋ฌธํ—Œ

  • Yuntao Bai, Andy Jones, Kamal Ndousse, Amanda Askell, Anna Chen, Nova DasSarma, Dawn Drain, Stanislav Fort, Deep Ganguli, Tom Henighan ๋“ฑ. "Training a helpful and harmless assistant with reinforcement learning from human feedback." arXiv preprint arXiv:2204.05862, 2022a.
  • Yuntao Bai, Saurav Kadavath, Sandipan Kundu, Amanda Askell, Jackson Kernion, Andy Jones, Anna Chen, Anna Goldie, Azalia Mirhoseini, Cameron McKinnon ๋“ฑ. "Constitutionalai: Harmlessness from ai feedback." arXiv preprint arXiv:2212.08073, 2022b.
  • Jason Baumgartner, Savvas Zannettou, Brian Keegan, Megan Squire, Jeremy Blackburn. "The pushshiftredditdataset." In Proceedings of the international AAAI conference on web and social media, volume 14, pages 830โ€“839, 2020.
  • Edward Beeching, Younes Belkada, Kashif Rasul, Lewis Tunstall, Leandro von Werra, Nazneen Rajani, Nathan Lambert. "Stackllama: An rl fine-tuned llama model for stack exchange question and answering," 2023. URL https://huggingface.co/blog/stackllama .
  • Wei-Lin Chiang, Zhuohan Li, Zi Lin, Ying Sheng, Zhanghao Wu, Hao Zhang, Lianmin Zheng, Siyuan Zhuang, Yonghao Zhuang, Joseph E. Gonzalez, Ion Stoica, Eric P. Xing. "Vicuna: An open-source chatbot impressing gpt-4 with 90%* chat gpt quality," March 2023. URL https://lmsys.org/blog/2023-03-30-vicuna/ .
  • Aakanksha Chowdhery, Sharan Narang, Jacob Devlin, Maarten Bosma, Gaurav Mishra, Adam Roberts, Paul Barham, Hyung Won Chung, Charles Sutton, Sebastian Gehrmann ๋“ฑ. "Palm: Scaling language modeling with pathways." arXiv preprint arXiv:2204.02311, 2022.
  • Hyung Won Chung, Le Hou, Shayne Longpre, Barret Zoph, Yi Tay, William Fedus, Eric Li, Xuezhi Wang, Mostafa Dehghani, Siddhartha Brahma ๋“ฑ. "Scaling instruction-finetuned language models." arXiv preprint arXiv:2210.11416, 2022.
  • Avia Efrat and Omer Levy. "The turking test: Can language models understand instructions?" arXiv preprint arXiv:2010.11982, 2020.
  • Ari Holtzman, Jan Buys, Li Du, Maxwell Forbes, Yejin Choi. "The curious case of neural text degeneration." In International Conference on Learning Representations, 2019.
  • Or Honovich, Thomas Scialom, Omer Levy, Timo Schick. "Unnatural instructions: Tuning language models with (almost) no human labor," 2022.
  • Nitish Shirish Keskar, Bryan McCann, Lav R Varshney, Caiming Xiong, Richard Socher. "Ctrl: A conditional transformer language model for controllable generation." arXiv preprint arXiv:1909.05858, 2019.
  • Yuval Kirstain, Patrick Lewis, Sebastian Riedel, Omer Levy. "A few more examples may be worth billions of parameters." arXiv preprint arXiv:2110.04374, 2021.
  • Takeshi Kojima, Shixiang Shane Gu, Machel Reid, Yutaka Matsuo, Yusuke Iwasawa. "Large language models are zero-shot reasoners." In ICML 2022 Workshop on Knowledge Retrieval and Language Models, 2022.
๋ฐ˜์‘ํ˜•

'๐Ÿ—ฃ๏ธ Natural Language Processing' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[Langchain] paper-translator  (0) 2023.06.16
LIMA : Less is More for Alignment  (0) 2023.06.13
[Langchain] Paper-Translator  (0) 2023.06.05
[LangChain] Sentence-Transformer  (0) 2023.06.01
[OpenAI API] OpenAI Token  (0) 2023.05.30
๋‹คํ–ˆ๋‹ค