Test
- paper alignment Markdown format
- tranlslate
LIMA: ์ด์ธ๋ฆผ์ ์์ด์๋ ์ ์ ๊ฒ์ด ๋ ์ข๋ค
Chunting Zhou, Pengfei Liu, Puxin Xu, Srini Iyer, Jiao Sun, Yuning Mao, Xuezhe Ma, Avia Efrat, Ping Yu, Lili Yu, Susan Zhang, Gargi Ghosh, Mike Lewis, Luke Zettlemoyer, Omer Levy
๋ฉํ AI, ์นด๋ค๊ธฐ ๋ฉ๋ก ๋ํ๊ต, ๋จ๊ฐ์ฃผ ๋ํ๊ต, ํ ์๋น๋ธ ๋ํ๊ต
์์ฝ
๋ํ ์ธ์ด ๋ชจ๋ธ์ ๋ ๋จ๊ณ๋ก ํ๋ จ๋ฉ๋๋ค. (1) ์์ ํ ์คํธ์์ ๋ฌด๊ฐ๋ ์ฌ์ ํ๋ จ์ ํตํด ์ผ๋ฐ์ ์ธ ๋ชฉ์ ์ ํํ์ ํ์ตํ๊ณ (2) ๋๊ท๋ชจ ์ง๋ ํ๋ ๋ฐ ๊ฐํ ํ์ต์ ํตํด ์ต์ข ์์ ๋ฐ ์ฌ์ฉ์ ์ ํธ๋์ ๋ ์ ์ด์ธ๋ฆฌ๋๋ก ์กฐ์ ๋ฉ๋๋ค. ์ฐ๋ฆฌ๋ 65B ํ๋ผ๋ฏธํฐ LLaMa ์ธ์ด ๋ชจ๋ธ์ LIMA๋ก ํ๋ จํ์ฌ, ๊ฐํ ํ์ต์ด๋ ์ธ๊ฐ์ ์ ํธ ๋ชจ๋ธ๋ง ์์ด 1,000๊ฐ์ ์ ์คํ๊ฒ ์ ๋ณ๋ ํ๋กฌํํธ์ ์๋ต์ ๋ํ ํ์ค ์ง๋ ์์ค๋ก๋ง ๋ฏธ์ธ ์กฐ์ ํฉ๋๋ค. LIMA๋ ๊ทน๋๋ก ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ฐํํ์ฌ, ํ๋ จ ๋ฐ์ดํฐ์์ ์์์ ์์ ๋ง์ผ๋ก๋ ๋ณต์กํ ์ฟผ๋ฆฌ๋ฅผ ํฌํจํ ํน์ ์๋ต ํ์์ ๋ฐ๋ฅด๋ ๊ฒ์ ๋ฐฐ์ฐ๋ฉฐ, ํ๋ จ ๋ฐ์ดํฐ์ ๋ํ๋์ง ์์ ์๋ก์ด ์์ ์ ๋ํด์๋ ์ผ๋ฐ์ ์ผ๋ก ์ ์ผ๋ฐํ๋ฉ๋๋ค. ์ ์ด๋ ์ธ๊ฐ ์ฐ๊ตฌ์์, LIMA์์ ์ป์ ์๋ต์ ๊ฒฝ์ฐ์ ๋ฐ๋ผ GPT-4์ ๋๋ฑํ๊ฑฐ๋ ์๊ฒฉํ๊ฒ ์ฐ์ ๋๋ฉฐ, ์ด ํต๊ณ๋ ์ธ๊ฐ ํผ๋๋ฐฑ์ ์ฌ์ฉํ์ฌ ํ๋ จ๋ DaVinci003์ ๋ํด์๋ 65%์ ์ด๋ฅด๋ฉฐ, Bard์ ๋น๊ตํ์ ๋๋ 58%์ ๋ฌํฉ๋๋ค. ์ด๋ฌํ ๊ฒฐ๊ณผ๋ค์ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ๊ฑฐ์ ๋ชจ๋ ์ง์์ด ์ฌ์ ํ๋ จ ์ค์ ํ์ต๋๋ฉฐ, ๋์ ํ์ง์ ์ถ๋ ฅ์ ์์ฑํ๋ ๋ชจ๋ธ์ ๊ฐ๋ฅด์น๊ธฐ ์ํด์๋ ์ ํ๋ ์ง๋ ํ๋ ๋ฐ์ดํฐ๋ง ํ์ํ๋ค๋ ๊ฒ์ ๊ฐํ๊ฒ ์์ฌํฉ๋๋ค.
1 ์๋ก
์ธ์ด ๋ชจ๋ธ์ ๋ค์ ํ ํฐ์ ์์ธกํ๊ธฐ ์ํด ๋๋ผ์ด ๊ท๋ชจ๋ก ๋ฏธ๋ฆฌ ํ๋ จ๋์ด, ๊ฑฐ์ ๋ชจ๋ ์ธ์ด ์ดํด ๋๋ ์์ฑ ์์ ์ ์ ์ดํ ์ ์๋ ์ผ๋ฐ์ ์ธ ๋ชฉ์ ์ ํํ์ ํ์ตํ ์ ์์ต๋๋ค. ์ด ์ ์ด๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ๊ธฐ ์ํด, ์ฃผ๋ก ๋๊ท๋ชจ ๋ค๋ฐฑ๋ง ์์ ๋ฐ์ดํฐ์ [Chung et al., 2022, Beeching et al., 2023, Köpf et al., 2023]์์ ์ง๋ ํ๋ [Mishra et al., 2021, Wei et al., 2022a, Sanh et al., 2022]์ ์ด์ ์ ๋ง์ถ ๋ค์ํ ๋ฐฉ๋ฒ์ด ์ ์๋์์ผ๋ฉฐ, ์ต๊ทผ์๋ ์ธ๊ฐ์ ํผ๋๋ฐฑ์ ๊ธฐ๋ฐ์ผ๋ก ํ ๊ฐํ ํ์ต(RLHF) [Bai et al., 2022a, Ouyang et al., 2022]์ด ์๋ฐฑ๋ง ๊ฐ์ ์ธ๊ฐ ์ฃผ์์์ ์ํธ ์์ฉํ๋ฉด์ ์์ง๋ฉ๋๋ค. ๊ธฐ์กด์ ์ด์ธ๋ฆผ ๋ฐฉ๋ฒ์ ChatGPT ์์ค์ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ธฐ ์ํด ์๋นํ ๊ณ์ฐ๋๊ณผ ์ ๋ฌธ์ ์ธ ๋ฐ์ดํฐ๊ฐ ํ์ํฉ๋๋ค. ๊ทธ๋ฌ๋ ์ฐ๋ฆฌ๋ ๊ฐ๋ ฅํ ์ฌ์ ํ๋ จ๋ ์ธ์ด ๋ชจ๋ธ์ด ์ฃผ์ด์ง ๊ฒฝ์ฐ, 1,000๊ฐ์ ์ ์คํ๊ฒ ์ ๋ณ๋ ํ๋ จ ์์ ์ ๋ฏธ์ธ ์กฐ์ ํ๋ ๊ฒ๋ง์ผ๋ก ๊ทน๋๋ก ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ฐํํ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค.
์ฐ๋ฆฌ๋ ๋ชจ๋ธ์ด ์ฌ์ฉ์์ ์ํธ ์์ฉํ๋ ์คํ์ผ์ด๋ ํ์์ ๋ฐฐ์ฐ๋ฉด ์ฌ์ ํ๋ จ ์ค์ ์ด๋ฏธ ์ต๋ํ ์ง์๊ณผ ๋ฅ๋ ฅ์ ๋๋ฌ๋ผ ์ ์๋ ๊ฐ๋จํ ํ๋ก์ธ์ค๋ก ์ด์ธ๋ฆผ์ ๋ฌ์ฑํ ์ ์๋ค๊ณ ๊ฐ์ค์ ์ธ์ฐ๊ณ ์์ต๋๋ค.
์ ๋ ฌ ๋ฐ์ดํฐ
์ฐ๋ฆฌ๋ ํ๋ฉด์ ์ ๋ ฌ ๊ฐ์ค(Superficial Alignment Hypothesis)์ ์ ์ํฉ๋๋ค. ์ด ๊ฐ์ค์ ๋ชจ๋ธ์ ์ง์๊ณผ ๋ฅ๋ ฅ์ด ์ฌ์ ํ์ต(pretraining) ์ค์ ๊ฑฐ์ ๋ฐฐ์์ก๋ค๋ ๊ฒ์ ์๋ฏธํ๋ฉฐ, ์ ๋ ฌ์ ์ฌ์ฉ์์ ์ํธ์์ฉํ ๋ ์ฌ์ฉํด์ผ ํ๋ ํ์ ํฌ๋งท(subdistribution)์ ๋ชจ๋ธ์ด ํ์ตํ๋ ๊ฒ์ด๋ผ๊ณ ํ ์ ์์ต๋๋ค. ๋ง์ฝ ์ด ๊ฐ์ค์ด ๋ง๊ณ , ์ ๋ ฌ์ด ๋๋ถ๋ถ ์คํ์ผ์ ํ์ตํ๋ ๊ฒ์ด๋ผ๋ฉด, ๋ฏธ์ธ์กฐ์ (pretrained language model)์ ์๋นํ ์ ์ ์์ ์์๋ก ์ถฉ๋ถํ ํ๋ํ ์ ์๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค [Kirstain et al., 2021].
์ด๋ฅผ ์ํด, ์ฐ๋ฆฌ๋ 1,000๊ฐ์ ํ๋กฌํํธ(prompt)์ ์๋ต(response)์ ๋ฐ์ดํฐ์ ์ ์์งํฉ๋๋ค. ์ฌ๊ธฐ์ ์ถ๋ ฅ(์๋ต)์ ์คํ์ผ์ ์ผ๋ก ์๋ก ์ ๋ ฌ๋์ด ์์ง๋ง ์ ๋ ฅ(ํ๋กฌํํธ)์ ๋ค์ํฉ๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ์ฐ๋ฆฌ๋ ๋์์ด ๋๋ ์ธ๊ณต์ง๋ฅ(AI) ์ด์์คํดํธ์ ์คํ์ผ๋ก ์ถ๋ ฅ์ ๊ตฌ์ฑํฉ๋๋ค. ์ด๋ฌํ ์์๋ค์ ์ฃผ๋ก ์ปค๋ฎค๋ํฐ Q&A ํฌ๋ผ๊ณผ ์๋์ผ๋ก ์์ฑ๋ ์์๋ค๋ก๋ถํฐ ์ ๋ณ๋ฉ๋๋ค. ๋ํ 300๊ฐ์ ํ๋กฌํํธ๋ก ์ด๋ฃจ์ด์ง ํ ์คํธ ์ธํธ์ 50๊ฐ์ ๊ฐ๋ฐ ์ธํธ๋ฅผ ์์งํฉ๋๋ค. ํ ์ด๋ธ 1์ ๋ค์ํ ๋ฐ์ดํฐ ์์ค์ ๊ฐ์์ ๋ช ๊ฐ์ง ํต๊ณ ์ ๋ณด๋ฅผ ์ ๊ณตํฉ๋๋ค.
์ปค๋ฎค๋ํฐ Q&A
์ฐ๋ฆฌ๋ ์ธ ๊ฐ์ ์ปค๋ฎค๋ํฐ Q&A ์น์ฌ์ดํธ(Stack Exchange, wikiHow, Pushshift Reddit Dataset)๋ก๋ถํฐ ๋ฐ์ดํฐ๋ฅผ ์์งํฉ๋๋ค [Baumgartner et al., 2020]. ๋์ฒด๋ก, Stack Exchange์ wikiHow์ ๋ต๋ณ์ ๊ถ์์ ์ด๊ณ ์ ํํ๋ฉฐ, Pushshift Reddit Dataset์ ๋ต๋ณ์ ๋์ฑ ์บ์ฃผ์ผํ๊ณ ๋ํ์ฒด์ ์ ๋๋ค. ์ฐ๋ฆฌ๋ ์ง๊ณผ ๋ค์์ฑ์ ์ํ๋งํ์ฌ, ๋ ๊ฐ์ Stack Exchange ์ฌ์ดํธ์ wikiHow์์ ๊ฐ๊ฐ 200๊ฐ์ ํ๋กฌํํธ์ ์๋ต์, ๊ทธ๋ฆฌ๊ณ Pushshift Reddit Dataset์์ 150๊ฐ์ ํ๋กฌํํธ์ ์๋ต์ ์์งํฉ๋๋ค.
์๋์ผ๋ก ์์ฑ๋ ์์
์ปค๋ฎค๋ํฐ Q&A ํฌ๋ผ ์ธ์๋, ์ฐ๋ฆฌ๋ ํ๋กฌํํธ์ ์๋ต์ ์์๋ค์ ์๋์ผ๋ก ์์ฑํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์์ ์ ๋ค์์ฑ๊ณผ AI ์ด์์คํดํธ์ ์ ํํ๋ ์๋ต ์คํ์ผ์ ๊ฐ์กฐํ์ฌ ์ต์ ํํฉ๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ์ฐ๋ฆฌ๋ 250๊ฐ์ ํ๋กฌํํธ์ ์๋ต ์์๋ฅผ ์์ฑํ์ฌ ์ด ๋ถ๋ฅ์์ ์ด 450๊ฐ์ ํ๋กฌํํธ์ ์๋ต์ ์์งํฉ๋๋ค.
ํ ์คํธ ์ธํธ
์ฐ๋ฆฌ๋ LIMA๋ฅผ ํ๊ฐํ๊ณ , ์ผ๋ฐ์ ์ธ ์ง์ ์ง๋ฌธ๋ถํฐ ๊ฐ์ธ์ ์ธ ์กฐ์ธ๊น์ง ๋ค์ํ ์ฃผ์ ๋ฅผ ๋ค๋ฃจ๋ 300๊ฐ์ ์ด๋ ค์ด ํ ์คํธ ํ๋กฌํํธ์ ๋ํด ์ต์ ์ธ์ด ๋ชจ๋ธ๊ณผ ์ ํ๋ค๊ณผ ๋น๊ตํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ง๊ณผ ๋ค์์ฑ์ ์ํ๋งํ์ฌ, ํ์กดํ๋ ์ธ์ด ๋ชจ๋ธ์ ํ๊ณ๊น์ง ๋ฐ์ด๋ด๋ ์ด๋ ค์ด ํ ์คํธ ์ธํธ๋ฅผ ๋ง๋ญ๋๋ค.
๊ฐ๋ฐ ์ธํธ
์ฐ๋ฆฌ๋ ๋ํ 50๊ฐ์ ํ๋กฌํํธ์ ์๋ต์ผ๋ก ์ด๋ฃจ์ด์ง ๊ฐ๋ฐ ์ธํธ๋ฅผ ์์งํ์ฌ, ๋ชจ๋ธ์ ๋ฏธ์ธ์กฐ์ ํ๊ณ ํ๊ฐํ๋ ๋ฐ ์ฌ์ฉํฉ๋๋ค.
์ ๋ฐ์ ์ผ๋ก, ์ฐ๋ฆฌ์ ๋ฐ์ดํฐ์ ์ ํ๋ จ, ๊ฐ๋ฐ ๋ฐ ํ ์คํธ ์ธํธ๋ก ๋๋์ด 1,000๊ฐ์ ํ๋กฌํํธ์ ์๋ต์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค. ์ด ํ๋ จ ๋ฐ์ดํฐ์ ์์ 750,000๊ฐ์ ํ ํฐ์ด๋ฉฐ, ์ ํํ 1,000๊ฐ์ ์ํ์ค๋ก ๋๋์ด์ง๋๋ค. ์ฐ๋ฆฌ๋ ์ด ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ LIMA๋ฅผ ์ฌ์ ํ์ตํ๋ฉฐ, ์ด๋ฅผ ์ํด 65B-ํ๋ผ๋ฏธํฐ LLaMa ๋ชจ๋ธ [Touvron et al., 2023]์ ์ด ๋ฐ์ดํฐ์ ์ 1,000๊ฐ์ ๋ฐ๋ชจ๋ก ๋ฏธ์ธ์กฐ์ (fine-tuned)ํฉ๋๋ค.## Arxiv ๋ ผ๋ฌธ์ Markdown ํ์์ผ๋ก ์ ๋ ฌํ๊ธฐ
์๊ฐ
์ด ๋ ผ๋ฌธ์์๋ ์ฐ๋ฆฌ๊ฐ ์ ์ฉํ AI ์ด์์คํดํธ๋ฅผ ํ๋ จํ๊ธฐ ์ํด ๋ค์ํ ๋ฐ์ดํฐ ์์ค๋ฅผ ํ์์ ๋ง๊ฒ ์ ๋ ฌํ๋ ๊ณผ์ ์ ์ค๋ช ํฉ๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ์ฐ๋ฆฌ๊ฐ ์ฌ์ฉํ ๋ฐ์ดํฐ ์์ค, ์ํ๋ง ๋ฐฉ๋ฒ๋ก ๋ฐ ๊ฐ ๋ฐ์ดํฐ ์์ค์ ์ ์ฉํ ์ ์ฒ๋ฆฌ ๋จ๊ณ๋ฅผ ๋ ผ์ํ์ฌ ์ ์ฉํ AI ์ด์์คํดํธ์ ์คํ์ผ๊ณผ ์ผ์นํ๋๋ก ๋ณด์ฅํฉ๋๋ค.
๋ฐ์ดํฐ ์์ค
์ฐ๋ฆฌ๋ ์ธ ๊ฐ์ง ๋ฐ์ดํฐ ์์ค๋ฅผ ์ฌ์ฉํ์ต๋๋ค : StackExchange, wikiHow ๋ฐ Pushshift Reddit ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค.
StackExchange
StackExchange๋ ๊ฐ๊ฐ ํน์ ์ฃผ์ ์ ํ์ ๋ 179 ๊ฐ์ ์จ๋ผ์ธ ์ปค๋ฎค๋ํฐ ๋ชจ์์ ๋๋ค. ์ฐ๋ฆฌ๋ 75 ๊ฐ์ STEM ๊ตํ๊ณผ 99 ๊ฐ์ ๋ค๋ฅธ ๊ตํ์ ์ด์ ์ ๋ง์ถ์์ผ๋ฉฐ 5 ๊ฐ์ ๋์น ๊ตํ์ ์ ์ธํ์ต๋๋ค. ์ฐ๋ฆฌ๋ ๋ค์ํ ๋๋ฉ์ธ์ ๊ท ์ผํ ์ํ์ ์ป๊ธฐ ์ํด ์จ๋๊ฐ 3 ์ธ(temperature of ๐ =3) 200 ๊ฐ์ ์ง๋ฌธ๊ณผ ๋ต๋ณ์ ๊ฐ๊ฐ ์ํ๋งํ์ต๋๋ค. ๊ฐ ๊ตํ์์, ์ ๋ชฉ (๋ฐ๋ ์์) ์์ ์์ฒด ํฌํจ ๋ ๊ฐ์ฅ ๋์ ์ ์์ ์ง๋ฌธ์ ๊ฐ์ ธ ์์ผ๋ฉฐ (์ ์ด๋ 10 ๊ฐ์ ๊ฐํ ์์ ์ ์๋ฅผ ๊ฐ์ง) ๊ฐ ์ง๋ฌธ์ ๋ํ ์์ ๋ต๋ณ์ ์ ํํ์ต๋๋ค. ์ฐ๋ฆฌ๋ ๋๋ฌด ์งง์ (1200 ์ ๋ฏธ๋ง), ๋๋ฌด ๊ธด (4096 ์ ์ด์), ์ฒซ ๋ฒ์งธ ์ฌ๋์ผ๋ก ์ฐ์ธ ("๋", "๋ด"), ๋๋ ๋ค๋ฅธ ๋ต๋ณ์ ์ฐธ์กฐํ๋ ("์ธ๊ธ ๋๋๋ก", "์คํ ๊ตํ" ๋ฑ) ๋ต๋ณ์ ์ ๊ฑฐํ์ต๋๋ค. ๋ํ ์๋ต์์ ๋งํฌ, ์ด๋ฏธ์ง ๋ฐ ๊ธฐํ HTML ํ๊ทธ๋ฅผ ์ ๊ฑฐํ๊ณ ์ฝ๋ ๋ธ๋ก๊ณผ ๋ชฉ๋ก๋ง ๋ณด์กดํ์ต๋๋ค.
wikiHow
wikiHow๋ ๋ค์ํ ์ฃผ์ ์ ๋ํ 240,000 ๊ฐ ์ด์์ how-to ๊ธฐ์ฌ๊ฐ ํฌํจ ๋ ์จ๋ผ์ธ ์ํค ์คํ์ผ ๊ฒ์๋ฌผ์ ๋๋ค. ์ฐ๋ฆฌ๋ 19 ๊ฐ ์ค ํ๋์ ์นดํ ๊ณ ๋ฆฌ๋ฅผ ๋จผ์ (์ : "์ค๋ฏ๋ ์๋ฆฌ ๋ฐฉ๋ฒ") ์ํ๋งํ๊ณ ๊ทธ ์์์๋ ๊ธฐ์ฌ๋ฅผ ์ํ๋งํ์ฌ ๋ค์์ฑ์ ๋ณด์ฅํ์ต๋๋ค. ์ฐ๋ฆฌ๋ ์ ๋ชฉ์ ํ๋กฌํํธ๋ก ์ฌ์ฉํ๊ณ ๋ณธ๋ฌธ์ ์๋ต์ผ๋ก ์ฌ์ฉํ์ต๋๋ค. ์ผ๋ฐ์ ์ธ "์ด ๊ธฐ์ฌ ..." ์์์ "๋ค์ ๋ต๋ณ์ ..."์ผ๋ก ๋์ฒดํ๊ณ ์ผ๋ถ ์ ์ฒ๋ฆฌ ํด๋ฆฌ์คํฑ์ ์ ์ฉํ์ฌ ๋งํฌ, ์ด๋ฏธ์ง ๋ฐ ์ผ๋ถ ํ ์คํธ ์น์ ์ ๊ฐ์ง์น๊ธฐํ์ต๋๋ค.
Pushshift Reddit ๋ฐ์ดํฐ ์ธํธ
Pushshift Reddit ๋ฐ์ดํฐ ์ธํธ๋ ์ธ๊ณ์์ ๊ฐ์ฅ ์ธ๊ธฐ์๋ ์น ์ฌ์ดํธ ์ค ํ๋ ์ธ Reddit์์ ๋ฐ์ดํฐ๋ฅผ ํฌํจํฉ๋๋ค. ์ฐ๋ฆฌ๋ r / AskReddit ๋ฐ r / WritingPrompts ๋ ํ์ ์งํฉ์ผ๋ก ์ ํํ๊ณ ๊ฐ ์ปค๋ฎค๋ํฐ์์ ๊ฐ์ฅ ๋ง์ upvotes๋ฅผ๋ฐ์ ๊ฒ์๋ฌผ ๋ด์์ ์์ ๋ฅผ ์๋์ผ๋ก ์ ํํ์ต๋๋ค. ์ฐ๋ฆฌ๋ r / AskReddit์์ 70 ๊ฐ์ ์์ฒด ํฌํจ ํ๋กฌํํธ (์ ๋ชฉ ๋ง, ๋ฐ๋ ์์)๋ฅผ ์ฐพ์์ผ๋ฉฐ, ์์ ๋ต๋ณ์ด ํญ์ ์ ๋ขฐ์ฑ์ด์๋ ๊ฒ์ ์๋๊ธฐ ๋๋ฌธ์ ํ ์คํธ ์ธํธ๋ก ์ฌ์ฉํ์ต๋๋ค. WritingPrompts subreddit์ ํ๊ตฌ์ ์ด์ผ๊ธฐ ์ ์ ๋ฅผ ํฌํจํ๋ฉฐ, ๋ค๋ฅธ ์ฌ์ฉ์๋ ์ฐฝ์์ ์ผ๋ก ์์ฑํ๋๋ก ๊ถ์ฅ๋ฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ฌ๋ ์์ ์งง์ ๊ณผํ ์์ค๊ณผ ๊ฐ์ ์ฃผ์ ๋ฅผ ํฌํจํ๋ 150 ๊ฐ์ ํ๋กฌํํธ์ ๊ณ ํ์ง ์๋ต์ ์ฐพ์์ผ๋ฉฐ, ์ด๋ฅผ ๊ต์ก ์ธํธ์ ์ถ๊ฐํ์ต๋๋ค.
์๋์ผ๋ก ์์ฑ ๋ ์์
์จ๋ผ์ธ ์ปค๋ฎค๋ํฐ์์ ์ฌ์ฉ์๊ฐ ๋ฌป๋ ์ง๋ฌธ ์ด์์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ค์ํํ๊ธฐ ์ํด ์ฐ๋ฆฌ ์์ (์ด ์์ ์ ์์ฑ์)์ ํ๋กฌํํธ๋ฅผ ์์งํ์ต๋๋ค. ์ฐ๋ฆฌ๋ ๊ทธ๋ฃน A์ ๊ทธ๋ฃน B์ ๋ ์งํฉ์ ์ง์ ํ์ฌ ๊ฐ๊ฐ 250 ๊ฐ์ ํ๋กฌํํธ๋ฅผ ์์ฑํ๋๋กํ์ต๋๋ค. ๊ทธ๋ฃน A์์ 200 ๊ฐ์ ํ๋กฌํํธ๋ฅผ ๊ต์ก์ ์ฌ์ฉํ๊ณ 50 ๊ฐ์ ํ๋กฌํํธ๋ฅผ ๋ณด์ ๊ฐ๋ฐ ์ธํธ๋ก ์ฌ์ฉํ์ต๋๋ค. ์ผ๋ถ ๋ฌธ์ ๊ฐ์๋ ํ๋กฌํํธ๋ฅผ ํํฐ๋ง ํ ํ ๋จ์ 230 ๊ฐ์ ํ๋กฌํํธ๋ฅผ ๊ทธ๋ฃน B์์ ์ฌ์ฉํ์ต๋๋ค. ์ฐ๋ฆฌ๋ ๊ต์ก ์ธํธ์ ๊ณ ํ์ง ๋ต๋ณ์ ์ถ๊ฐํ์ฌ ์ง์ ์ผ์ต๋๋ค. ๋ต๋ณ์ ์์ฑํ๋ ๋์ ์ฐ๋ฆฌ๋ ์ ์ฉํ AI ์ด์์คํดํธ์ ์ ํฉํ ๊ท ์ผํ ํค์ผ๋ก ์ค์ ํ๋ ค๊ณ ๋ ธ๋ ฅํ์ต๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ์ฐ๋ฆฌ๋ ์ง๋ฌธ์ ์ธ์ ํ๊ณ ๋ต๋ณ ์์ฒด๋ฅผ ๋ฐ๋ฅด๋ ๊ฒ์ ๋๋ค. ์ด ์ผ๊ด๋ ํ์์ ๋ชจ๋ธ ์ฑ๋ฅ์ ์ผ๋ฐ์ ์ผ๋ก ํฅ์์ํค๊ณ ์ฌ๊ณ ๊ณผ์ ์ ํ์ฑํ๋ ๋ฐ ๋ชจ๋ธ์ ๋๋ ๊ฒ์ผ๋ก ์ถ์ธก๋ฉ๋๋ค.
๊ฒฐ๋ก
๊ฒฐ๋ก ์ ์ผ๋ก, ์ฐ๋ฆฌ๋ ๋ค์ํ ๋ฐ์ดํฐ ์์ค๋ฅผ ์ ์ฉํ AI ์ด์์คํดํธ๋ฅผ ํ๋ จํ๊ธฐ์ ์ ํฉํ ํ์์ผ๋ก ์ ๋ ฌํ์ต๋๋ค. ์ฐ๋ฆฌ๋ ์ฐ๋ฆฌ์ ์ํ๋ง ๋ฐฉ๋ฒ๋ก ๊ณผ ๊ฐ ๋ฐ์ดํฐ ์์ค์ ์ ์ฉํ ์ ์ฒ๋ฆฌ ๋จ๊ณ๋ฅผ ๋ ผ์ํ์ฌ ์ ์ฉํ AI ์ด์์คํดํธ์ ์คํ์ผ๊ณผ ์ผ์นํ๋๋ก ๋ณด์ฅํ์ต๋๋ค. ์๋์ผ๋ก ์์ฑ๋ ์์ ๋ ๋ฐ์ดํฐ๋ฅผ ๋์ฑ ๋ค์ํ๊ฒ ๋ง๋ค๊ณ ๋ชจ๋ธ ์ฑ๋ฅ์ ํฅ์ํ๋ ๋ฐ ๋์์ด๋์์ต๋๋ค.## ์ ๋ ฅ
์ฐ๋ฆฌ๋ ๋ ์ฑ์ด๋ ์ ์์ฑ์ ์ ๋๋ฅผ ๊ฐ์ง 13๊ฐ์ ํ๋ จ ํ๋กฌํํธ๋ฅผ ํฌํจํฉ๋๋ค. ์ฐ๋ฆฌ๋ ๋ช ๋ น์ ๋ถ๋ถ์ ์ผ๋ก ๋๋ ์์ ํ ๊ฑฐ๋ถํ๋ ์๋ต์ ์ฃผ์ ๊น๊ฒ ์์ฑํ๊ณ , ์ด์์คํดํธ๊ฐ ์ ์ค์ํ์ง ์์ ๊ฒ์ธ์ง ์ค๋ช ํฉ๋๋ค. ๋ํ ํ ์คํธ ์ธํธ์์ ๋น์ทํ ๋ฌธ์ ๋ฅผ ๊ฐ์ง 30๊ฐ์ ํ๋กฌํํธ๊ฐ ์์ผ๋ฉฐ, ์ด์ ๋ํด 4.3์ ์์ ๋ถ์ํฉ๋๋ค. ์๋์ผ๋ก ์์ฑํ ์์ ์ธ์๋, ์ฐ๋ฆฌ๋ Super-Natural Instructions [Wang et al., 2022b]์์ 50๊ฐ์ ํ๋ จ ์์ ๋ฅผ ์ํ๋งํฉ๋๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ์์ฝ, ํจ๋ฌํ๋ ์ด์ง, ์คํ์ผ ์ ํ๊ณผ ๊ฐ์ 50๊ฐ์ ์์ฐ์ด ์์ฑ ์์ ์ ์ ํํ๊ณ ๊ฐ๊ฐ ํ๋์ ๋ฌด์์ ์์ ๋ฅผ ์ ํํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ด๋ค ์ค ์ผ๋ถ๋ฅผ 200๊ฐ์ ์๋ ์์ ์ ์คํ์ผ์ ๋ง๊ฒ ์ฝ๊ฐ ์์ ํฉ๋๋ค. ์ ์ฌ์ ์ฌ์ฉ์ ํ๋กฌํํธ์ ๋ถํฌ๋ Super-Natural Instructions์ ์์ ๋ถํฌ์ ๊ตฌ๋ณ๋๋ ๊ฒ์ผ๋ก ์ฃผ์ฅํ ์ ์์ง๋ง, ์ฐ๋ฆฌ์ ์ง๊ด์ ์ด ์์ ์ํ์ด ํ๋ จ ์์ ์ ์ ๋ฐ์ ์ธ ๋ค์์ฑ์ ๋์ด๊ณ ๋ชจ๋ธ์ ๊ฐ๊ฑด์ฑ์ ์ฆ๊ฐ์ํฌ ์ ์๋ค๋ ๊ฒ์ ๋๋ค. ๋ค์ํ ํ๋กฌํํธ๋ฅผ ์๋์ผ๋ก ์์ฑํ๊ณ ํ๋ถํ ์๋ต์ ๊ท ์ผํ ์คํ์ผ๋ก ์์ฑํ๋ ๊ฒ์ ์๊ณ ๋กญ์ต๋๋ค. ์ต๊ทผ ์ผ๋ถ ์ฐ๊ตฌ์์๋ [Honovich et al., 2022, Wang et al., 2022a, Taori et al., 2023, Chiang et al., 2023, Sun et al., 2023]์ ๊ฐ์ ์๋ ์๋จ์ ํตํด ์๋ ์์ ์ ํผํ๊ณ , ์๋ณด๋ค ์ง์ ์ต์ ํํ๋ ๋ฐฉ์์ผ๋ก ์์ ํฉ๋๋ค. ์ด ์ฐ๊ตฌ๋ ๋ค์์ฑ๊ณผ ์ง์ ํฌ์ํ๋ ํจ๊ณผ๋ฅผ ํ๊ตฌํฉ๋๋ค.
3 LIMA ํ๋ จ
์ฐ๋ฆฌ๋ ๋ค์ ํ๋กํ ์ฝ์ ์ฌ์ฉํ์ฌ LIMA (Less Is More for Alignment)๋ฅผ ํ๋ จ์์ผฐ์ต๋๋ค. LLaMa 65B [Touvron et al., 2023]์์ ์์ํด, ์ฐ๋ฆฌ๋ 1,000๊ฐ์ ์ ๋ ฌ ํ๋ จ ์ธํธ์์ ํ์ธํ๋ํฉ๋๋ค. ๊ฐ ์คํผ์ปค (์ฌ์ฉ์์ ์ด์์คํดํธ)๋ฅผ ๊ตฌ๋ถํ๊ธฐ ์ํด ๊ฐ ๋ฐํ์ ๋์ ํน์ํ end-of-turn ํ ํฐ (EOT)์ ๋์ ํฉ๋๋ค. ์ด ํ ํฐ์ ์์ฑ์ ์ค๋จํ๋ EOS์ ๋์ผํ ์ญํ ์ ํ์ง๋ง, ์ด๋ฏธ ์ ํ ๋ชจ๋ธ์ด preexisting EOS ํ ํฐ์ ๋ถ์ฌํ ๋ค๋ฅธ ์๋ฏธ์ ํผ๋๋์ง ์๋๋กํฉ๋๋ค. ์ฐ๋ฆฌ๋ ํ์ค ํ์ธํ๋ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ๋ฐ๋ฆ ๋๋ค. ์ฐ๋ฆฌ๋ AdamW [Loshchilov and Hutter, 2017]๋ฅผ ์ฌ์ฉํ์ฌ 15ํ epoch ๋์ ํ์ธํ๋ํ๋ฉฐ, 1= 0:9;2= 0:95 ๋ฐ ๊ฐ์ค์น ๊ฐ์์จ 0:1์ ์ฌ์ฉํฉ๋๋ค. ์์ ๋จ๊ณ ์์ด ์ด๊ธฐ ํ์ต๋ฅ ์ 1e * 5๋ก ์ค์ ํ๊ณ ํ๋ จ ์ข ๋ฃ์ 1e * 6๋ก ์ ํ ๊ฐ์์ํต๋๋ค. ๋ฐฐ์น ํฌ๊ธฐ๋ 32๊ฐ์ ์์ (์์ ๋ชจ๋ธ์ ๊ฒฝ์ฐ 64๊ฐ)๋ก ์ค์ ํ๋ฉฐ, 2048 ํ ํฐ๋ณด๋ค ๊ธด ํ ์คํธ๋ ์๋ฆฝ๋๋ค. ์ฐธ๊ณ ํ ๋งํ ํ ๊ฐ์ง ๋ณํ๋ ์์ฌ ๋๋กญ์์์ ์ฌ์ฉ์ ๋๋ค. ์ฐ๋ฆฌ๋ Ouyang et al. [2022]๋ฅผ ๋ฐ๋ฅด๊ณ ์์ฌ ์ฐ๊ฒฐ ์์ ๋๋กญ์์์ ์ ์ฉํ๋ฉฐ, ์ตํ์ธต์์ pd = 0:0์์ ์์ํ์ฌ ๋ง์ง๋ง ์ธต์์ pd = 0:3์ผ๋ก ์ ํ์ ์ผ๋ก ์ฆ๊ฐ์ํต๋๋ค (์์ ๋ชจ๋ธ์ ๊ฒฝ์ฐ pd = 0:2). perplexity๋ ์์ฑ ํ์ง๊ณผ ์๊ด๊ด๊ณ๊ฐ ์๊ธฐ ๋๋ฌธ์, ์ฐ๋ฆฌ๋ 50๊ฐ์ ๊ฐ๋ฐ ์ธํธ์์ ๋ณด์ ํ ์์ ๋ฅผ ์ฌ์ฉํ์ฌ 5๋ฒ์งธ์ 10๋ฒ์งธ epoch ์ฌ์ด์์ ์๋์ผ๋ก ์ฒดํฌํฌ์ธํธ๋ฅผ ์ ํํฉ๋๋ค.
4 ์ธ๊ฐ ํ๊ฐ
์ฐ๋ฆฌ๋ LIMA๋ฅผ ์ต์ฒจ๋จ ์ธ์ด ๋ชจ๋ธ๊ณผ ๋น๊ตํ์ฌ ํ๊ฐํ๊ณ , OpenAI์ RLHF ๊ธฐ๋ฐ DaVinci003์ 52,000๊ฐ์ ์์ ๋ก ํ๋ จ๋ Alpaca์ 65B-ํ๋ผ๋ฏธํฐ ์ฌํ์ ๋ฅ๊ฐํ๋ฉฐ, GPT-4๋ณด๋ค ๋์ ๋๋ ๋๋ฑํ ์๋ต์ ์์ฃผ ์์ฑํ๋ค๋ ๊ฒ์ ๋ฐ๊ฒฌํ์ต๋๋ค. LIMA ์์ฑ๋ฌผ์ ๋ถ์์์ 50%๊ฐ ์ฐ์ํ๋ค๊ณ ํ๊ฐ๋์์ต๋๋ค. ์ด๋ฌํ ๋ช ๊ฐ์ง ์์ ๋ฅผ ์ฌ์ฉํ์ฌ ์ต์ฒจ๋จ ๊ธฐ์ ์ ๊ฒฝ์ํ ์ ์๋ ๊ฒ์ผ๋ก ํ๋ช ๋๋ฏ๋ก, ๋๊ท๋ชจ์ ์ง์ ํ๋๊ณผ ๊ฐํ ํ์ต ์ ๊ทผ ๋ฐฉ์๋ณด๋ค ์ฌ์ ํ๋ จ๊ณผ ๊ทธ ์๋์ ์ค์์ฑ์ ๊ฐ๋ ฅํ ์ง์ง์์ธ Superficial Alignment Hypothesis (2์ )๋ฅผ ๊ฐ๋ ฅํ ์ง์ํฉ๋๋ค.
4.1 ์คํ ์ค์
LIMA๋ฅผ ๋ค๋ฅธ ๋ชจ๋ธ๊ณผ ๋น๊ตํ๊ธฐ ์ํด ๊ฐ ํ ์คํธ ํ๋กฌํํธ์ ๋ํด ๋จ์ผ ์๋ต์ ์์ฑํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ ํฌ๋ผ์ฐ๋์์ปค์๊ฒ LIMA ์ถ๋ ฅ๋ฌผ์ ๊ฐ ๋ฒ ์ด์ค๋ผ์ธ๊ณผ ๋น๊ตํ๊ณ ์ด๋ ๊ฒ์ ์ ํธํ๋์ง ๋ผ๋ฒจ์ ์ง์ ํ๋๋ก ์์ฒญํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ธ๊ฐ ํฌ๋ผ์ฐ๋์์ปค๋ฅผ ๋์ฒดํ์ฌ GPT-4๋ก ์ด๋ฌํ ์คํ์ ๋ฐ๋ณตํ๊ณ ์ ์ฌํ ํฉ์ ์์ค์ ์ฐพ์ต๋๋ค.
๋ฒ ์ด์ค๋ผ์ธ
์ฐ๋ฆฌ๋ LIMA๋ฅผ ๋ค์ ๋ค์ฏ ๊ฐ์ง ๋ฒ ์ด์ค๋ผ์ธ๊ณผ ๋น๊ตํฉ๋๋ค.
- Alpaca 65B [Taori et al., 2023] - LLaMa 65B [Touvron et al., 2023]๋ฅผ Alpaca ํ๋ จ ์ธํธ [Taori et al., 2023]์ 52,000 ์์ ์ ํ์ธํ๋ํฉ๋๋ค.
- OpenAI์ DaVinci003 - RLHF (human feedback)๋ฅผ ์ฌ์ฉํ์ฌ ํ๋๋ ๋ํ ์ธ์ด ๋ชจ๋ธ [Ouyang et al., 2022].
- Google์ Bard - PaLM [Chowdhery et al., 2022]๋ฅผ ๊ธฐ๋ฐ์ผ๋กํฉ๋๋ค.
- Anthropic์ Claude - AI๋ก๋ถํฐ ๊ฐํ ํ์ต์ผ๋ก ํ๋ จ๋ 52B-ํ๋ผ๋ฏธํฐ ๋ชจ๋ธ์ ๋๋ค.
๋ถ๋ก B
๊ฒ์ฆ ํผํ๋ ์ํฐ์ ์์ฑ ํ์ง์ ๋ ์์ธํ ๋น๊ตํ๋ ์ฐ๊ตฌ๋ ๋ถ๋ก B๋ฅผ ์ฐธ์กฐํ์ญ์์ค.# Arxiv ๋ ผ๋ฌธ์ Markdown ํ์์ผ๋ก ์ ๋ ฌํ๊ธฐ
์๊ฐ
์ด ์์ ์ ๋ชฉํ๋ Arxiv ๋ ผ๋ฌธ์ Markdown ํ์์ผ๋ก ์ ๋ ฌํ๋ ๊ฒ์ ๋๋ค. ์ด ๋ ผ๋ฌธ์ ์ธ์ด ๋ชจ๋ธ์ ๋น๊ตํ๋ ์ฐ๊ตฌ๋ก, ์ ์๋ค์ ์ธ๊ฐ ๋ฐ ์๋ํ๋ ์ ํธ ํ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ์ ์ํฉ๋๋ค.
๋ฐฉ๋ฒ
์ ์๋ค์ GPT-4, Claude, BARD, DaVinci003, Alpaca 65B ๋ค์ฏ ๊ฐ์ง ๋ค๋ฅธ ์ธ์ด ๋ชจ๋ธ์์ ์๋ต์ ์์ฑํ์ต๋๋ค. ํ๋ฅ 0.9์ ์จ๋ 0.7๋ก nucleus sampling์ ์ฌ์ฉํ๊ณ , 1.2์ ๋ฐ๋ณต ๋ฒ์น์ ๊ฐํ์ผ๋ฉฐ, ์ต๋ ํ ํฐ ๊ธธ์ด๋ 2048๋ก ์ ํ๋์์ต๋๋ค.
์ ์๋ค์ ํ๋์ ํ๋กฌํํธ์ ๋ ๊ฐ์ง ๋ค๋ฅธ ๋ชจ๋ธ์์ ์์ฑ๋ ๊ฐ๋ฅํ ์๋ต์ ์ฃผ์ ์์ ์์๊ฒ ์ ๊ณตํ์ต๋๋ค. ์ฃผ์ ์์ ์๋ค์ ์ด๋ค ์๋ต์ด ๋ ์ข์์ง, ๋๋ ๋ ์๋ต ๋ชจ๋ ์ค์ํ ์ฐจ์ด๊ฐ ์๋์ง ๋ผ๋ฒจ์ ์ง์ ํ์ต๋๋ค. ์ ์๋ค์ GPT-4์๊ฒ ์ ํํ ๊ฐ์ ์ง์นจ๊ณผ ๋ฐ์ดํฐ๋ฅผ ์ ๊ณตํ์ฌ ๋ณ๋ ฌ ์ฃผ์์ ์์งํ์ต๋๋ค.
๊ฒฐ๊ณผ
์ ์๋ค์ 52๋ฐฐ ๋ ๋ง์ ๋ฐ์ดํฐ๋ก ํ์ตํ์ง๋ง, Alpaca 65B๋ LIMA๋ณด๋ค ์ข์ง ์์ ์ถ๋ ฅ์ ์์ฑํ๋ ๊ฒฝํฅ์ด ์์์ ๋ฐ๊ฒฌํ์ต๋๋ค. DaVinci003๋ ์ด์ ๋น์ทํ ๊ฒฝํฅ์ ๋ณด์ ๋๋ค. Bard๋ DaVinci003์ ๋ฐ๋ ๊ฒฝํฅ์ ๋ณด์ด๋ฉฐ, LIMA๋ณด๋ค ๋์ ์๋ต์ 42%์ ๊ฒฝ์ฐ์ ๋ณด์ ๋๋ค. ๊ทธ๋ฌ๋ ์ด๊ฒ์ LIMA ์๋ต์ด ์ ์ด๋ Bard๋ณด๋ค ์ข์ ๊ฒฝ์ฐ๊ฐ 58%์ ๊ฒฝ์ฐ์ ํด๋นํ๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค.
๋ง์ง๋ง์ผ๋ก, Claude์ GPT-4๋ ์ผ๋ฐ์ ์ผ๋ก LIMA๋ณด๋ค ๋ ๋์ ์ฑ๋ฅ์ ๋ฐํํ์ง๋ง, LIMA๊ฐ ์ค์ ๋ก ๋ ๋์ ์๋ต์ ์์ฑํ๋ ๊ฒฝ์ฐ๋ ์๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ต๋๋ค. ์ฌ๋ฏธ์๊ฒ๋, GPT-4์กฐ์ฐจ๋ ์์ ์ ์ถ๋ ฅ๋ณด๋ค 19%์ ๊ฒฝ์ฐ์๋ LIMA ์ถ๋ ฅ์ ์ ํธํฉ๋๋ค.
๊ฒฐ๋ก
์ด ์ฐ๊ตฌ๋ ๋ค๋ฅธ ์ธ์ด ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋ํ ์ ์ฉํ ํต์ฐฐ๋ ฅ์ ์ ๊ณตํฉ๋๋ค. ์ ์๋ค์ ๋ฐฉ๋ฒ๋ก ๊ณผ ๊ฒฐ๊ณผ๋ ์ธ์ด ๋ชจ๋ธ๋ง๊ณผ ์์ฐ์ด ์ฒ๋ฆฌ์ ์ข ์ฌํ๋ ์ฐ๊ตฌ์๋ค์๊ฒ ์ ์ฉํ ๊ฒ์ ๋๋ค.## 4.3 ๋ถ์
์ฃผ์ ํ๊ฐ์์๋ LIMA๋ฅผ ์ต์ฒจ๋จ ๋ชจ๋ธ๊ณผ ๋น๊ตํ์ฌ ํ๊ฐํ์ง๋ง, ๋ช๋ช ๊ธฐ์ค์ ์ ์ค์ ์ฌ์ฉ์ ํ๋กฌํํธ ์๋ฐฑ๋ง ๊ฐ๋ฅผ ํ๋ จ ์ค์ ๋ ธ์ถ๋์ด ๋งค์ฐ ๋์ ๊ธฐ์ค์ ๊ฐ์ง๊ณ ์์ ์ ์์ต๋๋ค. ๋ฐ๋ผ์ ์ฐ๋ฆฌ๋ 50๊ฐ์ ๋ฌด์์ ์์ ๋ฅผ ์๋์ผ๋ก ๋ถ์ํ์ฌ ์ ๋์ ํ๊ฐ๋ฅผ ์ ๊ณตํฉ๋๋ค. ๊ฐ ์์ ๋ฅผ ์ธ ๊ฐ์ง ์นดํ ๊ณ ๋ฆฌ ์ค ํ๋๋ก ๋ผ๋ฒจ๋งํฉ๋๋ค. ์คํจ : ์๋ต์ด ํ๋กฌํํธ ์๊ตฌ ์ฌํญ์ ์ถฉ์กฑํ์ง ๋ชปํจ ; ํต๊ณผ : ์๋ต์ด ํ๋กฌํํธ ์๊ตฌ ์ฌํญ์ ์ถฉ์กฑํจ ; ์ฐ์ : ๋ชจ๋ธ์ด ํ๋กฌํํธ์ ๋ํด ํ๋ฅญํ ์๋ต์ ์ ๊ณตํจ.
LIMA | 0% | 25% | 50% | 75% | 100% |
---|---|---|---|---|---|
50% | ์ฐ์ | 38% | ํต๊ณผ | 12% | ์คํจ |
๊ทธ๋ฆผ 3 : 50๊ฐ์ ํ ์คํธ ํ๋กฌํํธ์์ LIMA์ ๋ถ์ ๊ฒฐ๊ณผ.
๊ฒฐ๊ณผ ๊ทธ๋ฆผ 3์ LIMA ์๋ต ์ค 50%๊ฐ ์ฐ์ํ๋ค๊ณ ํ๋จ๋๋ฉฐ, 50๊ฐ์ ๋ถ์ ๋์ ์ค 6๊ฐ๋ฅผ ์ ์ธํ ๋ชจ๋ ํ๋กฌํํธ๋ฅผ ๋ฐ๋ฅด๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ต๋๋ค. ์คํจํ ๊ฒฝ์ฐ์๋ ๋๋ ทํ ๊ฒฝํฅ์ฑ์ ๊ด์ฐฐํ์ง ๋ชปํ์ต๋๋ค. ๊ทธ๋ฆผ 4๋ ์ก์ ์กฐ์ธ ๋ฐ ์๋ฆฌ๋ฒ ์์ฑ์ ๋ํ ์์ LIMA ์ถ๋ ฅ์ ๋ณด์ฌ์ค๋๋ค.
๋ถํฌ ๋ฐ
LIMA๋ ์์ ์์ ์ด๋ป๊ฒ ์ํ๋๋์? 50๊ฐ์ ๋ถ์๋ ์์ ์ค 43๊ฐ๋ ํ์์ ์ผ๋ก ์ด๋ ์ ๋ ๊ด๋ จ๋ ๊ต์ก ์์ ๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค(์ : ์ง๋ฌธ์ ๋ํ ๋ต๋ณ, ์กฐ์ธ, ํธ์ง ์์ฑ ๋ฑ). ์ฐ๋ฆฌ๋ 13๊ฐ์ ์ถ๊ฐ์ ์ธ ๋ถํฌ ๋ฐ ์์ (์ด 20๊ฐ)๋ฅผ ๋ถ์ํ๊ณ , 20%์ ์๋ต์ด ์คํจํ๊ณ 35%๊ฐ ํต๊ณผํ๋ฉฐ 45%๊ฐ ์ฐ์ํ๋ค๋ ๊ฒ์ ๋ฐ๊ฒฌํ์ต๋๋ค. ์ด๋ ์ํ์ด ์์ง๋ง, LIMA๊ฐ ๊ต์ก ๋ถํฌ ๋ฐ์์๋ ์ ์ฌํ ์ ๋์ ์ฑ๋ฅ ํต๊ณ๋ฅผ ๋ฌ์ฑํ๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ผ๋ฉฐ, ์ด๋ LIMA๊ฐ ์ ์ผ๋ฐํํ ์ ์๋ค๋ ๊ฒ์ ์์ฌํฉ๋๋ค. ๊ทธ๋ฆผ 4๋ ์คํ ๋์ ์ฝ๋ฏธ๋ ์์ฑ ๋๋ ํผ์ ์ฃผ๋ฌธ์ ์์ฒญํ ๋ LIMA์ ๋ฐ์์ ๋ณด์ฌ์ค๋๋ค.
์์
๋ง์ง๋ง์ผ๋ก, ๊ต์ก ๋ฐ์ดํฐ ์ธํธ์ ์์ ๊ด๋ จ ์์ ๊ฐ ์ ์ ๊ฒฝ์ฐ(13๊ฐ๋ง; ์น์ 2.2 ์ฐธ์กฐ), ์ด๋ฌํ ์์ ์ค 30๊ฐ์ ๋ํ LIMA์ ์๋ต ํจ๊ณผ๋ฅผ ๋ถ์ํ๊ณ , LIMA๊ฐ ๊ทธ ์ค 80%์ ๋ํด ์์ ํ๊ฒ ์๋ตํ๋ ๊ฒ์ ๋ฐ๊ฒฌํ์ต๋๋ค(์ ์์ ์๋๊ฐ ์๋ 10๊ฐ ์ค 6๊ฐ๊ฐ ํฌํจ๋จ). ๋ช๋ช ๊ฒฝ์ฐ์๋ LIMA๊ฐ ์์ ์ ์ํํ์ง ์๋๋ก ๊ฑฐ๋ถํฉ๋๋ค(์ : ์ ๋ช ์ธ์ ์ฃผ์ ์ ๊ณต ์์ฒญ ์), ๊ทธ๋ฌ๋ ์ ์์ ์๋๊ฐ ๋ฌต์์ ์ธ ๊ฒฝ์ฐ LIMA๋ ๋ ๋ง์ด ์์ ํ์ง ์์ ์๋ต์ ์ ๊ณตํ๋ ๊ฒฝํฅ์ด ์์ต๋๋ค. ๊ทธ๋ฆผ 4์์ ๋ณผ ์ ์์ต๋๋ค.
5 ์ ๋ ์ ์ ๊ฒ์ด ๋ ์ข์๊น? ๋ฐ์ดํฐ ๋ค์์ฑ, ํ์ง ๋ฐ ์์ ๋ํ ์ ๊ฑฐ ์คํ
์ฐ๋ฆฌ๋ ์ ๊ฑฐ ์คํ์ ํตํด ๊ต์ก ๋ฐ์ดํฐ์ ๋ค์์ฑ, ํ์ง ๋ฐ ์์ด ๋ฏธ์น๋ ์ํฅ์ ์กฐ์ฌํฉ๋๋ค. ๋งฅ๋ฝ์ ๋ง์ถ๊ธฐ ์ํ ๋ชฉ์ ์ผ๋ก ์ ๋ ฅ ๋ค์์ฑ๊ณผ ์ถ๋ ฅ ํ์ง์ ํ๋๋ ์ธก์ ๊ฐ๋ฅํ ๊ธ์ ์ ํจ๊ณผ๊ฐ ์์ง๋ง, ์๋ง ํ๋ํ๋ฉด ๊ธ์ ์ ์ธ ํจ๊ณผ๊ฐ ์์ ์ ์๋ค๋ ๊ฒ์ ๊ด์ฐฐํฉ๋๋ค.
์คํ ์ค์
์ฐ๋ฆฌ๋ ๋์ผํ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์ ์ดํ๋ฉด์ ๋ค์ํ ๋ฐ์ดํฐ ์ธํธ์์ 7B ๋งค๊ฐ๋ณ์ LLaMA ๋ชจ๋ธ Touvron et al. [2023]์ ์ธ๋ฐ ์กฐ์ ํฉ๋๋ค(์น์ 3 ์ฐธ์กฐ). ๊ทธ๋ฐ ๋ค์ ๊ฐ ํ ์คํธ ์ธํธ ํ๋กฌํํธ์ ๋ํด 5๊ฐ์ ์๋ต์ ์ํ๋งํ๊ณ , ChatGPT (GPT-3.5 Turbo)์๊ฒ ์๋ต์ ์ ์ฉ์ฑ์ 1-6 likert ์ฒ๋๋ก ํ๊ฐํ๋๋ก ์์ฒญํ์ฌ ์๋ต ํ์ง์ ํ๊ฐํฉ๋๋ค(์ ํํ ํ ํ๋ฆฟ์ ๋ถ๋ก D๋ฅผ ์ฐธ์กฐํ์ญ์์ค). ์ฐ๋ฆฌ๋ ํ๊ท ์ ์์ p=0.95 ์์ธก ์ ๋ขฐ ๊ตฌ๊ฐ์ ๋ณด๊ณ ํฉ๋๋ค.
๋ค์์ฑ
ํ์ง๊ณผ ์์ ์ ์ดํ๋ฉด์ ํ๋กฌํํธ ๋ค์์ฑ์ ํจ๊ณผ๋ฅผ ํ ์คํธํ๊ธฐ ์ํด, ์ฐ๋ฆฌ๋ ํ๋ฅญํ ์๋ต์ด ์๋ ์ด์ง์ ์ธ ํ๋กฌํํธ๋ฅผ ๊ฐ์ง ํ์ง ํํฐ๋ง๋ Stack Exchange ๋ฐ์ดํฐ์ ํ๋ฅญํ ์๋ต์ด ์๋ ๋์ง์ ์ธ ํ๋กฌํํธ๋ฅผ ๊ฐ์ง wikiHow ๋ฐ์ดํฐ์ ํจ๊ณผ๋ฅผ ๋น๊ตํฉ๋๋ค. ์ฐ๋ฆฌ๋ ๋ ๊ฐ์ง ๋ฐ์ดํฐ ์์ค์์ ๊ฐ๊ฐ 2,000๊ฐ์ ๊ต์ก ์์ ๋ฅผ ์ํ๋งํฉ๋๋ค(์น์ 2.1์์์ ๋์ผํ ํ๋กํ ์ฝ์ ๋ฐ๋ฆ ๋๋ค). ๊ทธ๋ฆผ 5๋ ๋ ๋ค์ํ Stack Exchange ๋ฐ์ดํฐ๊ฐ ํจ์ฌ ๋์ ์ฑ๋ฅ์ ๋ฐํํ๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค.
ํ์ง
์๋ต ํ์ง์ ์ํฅ์ ํ ์คํธํ๊ธฐ ์ํด, ์ฐ๋ฆฌ๋ ํ์ง์ด๋ ์คํ์ผ ํํฐ ์์ด Stack Exchange์์ 2,000๊ฐ์ ์์ ๋ฅผ ์ํ๋งํ๊ณ , ์ด ๋ฐ์ดํฐ ์ธํธ์์ ๊ต์ก๋ ๋ชจ๋ธ์ ํํฐ๋ง๋ ๋ฐ์ดํฐ ์ธํธ์์ ๊ต์ก๋ ๋ชจ๋ธ๊ณผ ๋น๊ตํฉ๋๋ค. ๊ทธ๋ฆผ 5๋ ํํฐ๋ง๋ ๋ฐ ํํฐ๋ง๋์ง ์์ ๋ฐ์ดํฐ ์์ค์์ ๊ต์ก๋ ๋ชจ๋ธ ๊ฐ์ 0.5 ์ ์ ์ ์ํ ์ฐจ์ด๊ฐ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค.
์ฐธ๊ณ : ์ ๋ ฅ ํ ์คํธ์๋ ๊ทธ๋ฆผ 5๊ฐ ํ์๋์ง ์์ต๋๋ค.# ์กฐ์ธ (๋ถํฌ ๋ด)
๋ด 6์ด ๋ธ์ ๋๋ํ๊ณ ํ๊ต ์น๊ตฌ๋ค์ด ์ง๋ฃจํ๋ค๊ณ ์๊ฐํฉ๋๋ค. ์ด๋ป๊ฒ ํ๋ฉด ์น๊ตฌ๋ฅผ ์ฌ๊ท ์ ์์๊น์?
๋ธ์ด ์ด๋ ๊ฒ ๋๋ํ๋ค๋ ๊ฒ์ ํ๋ฅญํ ์ผ์ ๋๋ค! ํนํ ์ฌํ์ ์ผ๋ก ์์ ๋๊ฐ๋ ๊ฒฝ์ฐ์๋ ์ด๋ ค์ธ ์ ์์ต๋๋ค. ๋ค์์ ๋ธ์ด ์น๊ตฌ๋ฅผ ์ฌ๊ท๋ ๋ฐฉ๋ฒ์ ๋ํ ๋ช ๊ฐ์ง ์์ด๋์ด์ ๋๋ค.
- ์น๊ตฌ์ ๋ํด ์ด์ผ๊ธฐํด๋ณด์ธ์. ๋ฌด์์ด ์ข์ ์น๊ตฌ์ธ์ง ๋ฌผ์ด๋ณด์ธ์. ๋น์ ์ด ์๊ฐํ๋ ๊ฒ๋ ๋งํด๋ณด์ธ์. ๋ฐฉ๊ณผ ํ ํด๋ฝ์ ๊ฐ์ ํ๊ฑฐ๋ ๊ฐ์ด ์ ์ฌ ์์ฌ๋ฅผ ํ๋ผ๋ ๋ฑ ์๋ก์ด ์ฌ๋์ ๋ง๋ ์ ์๋ ๋ฐฉ๋ฒ์ ๋ํด ์ด์ผ๊ธฐํด๋ณด์ธ์.
- ๊ทธ๋ ์ ๊ด์ฌ์ฌ๋ฅผ ์ฅ๋ คํ์ธ์. ๊ทธ๋ ๊ฐ ์ข์ํ๋ ๊ฒ์ ์์๋ด์ด ๊ทธ๋ ๊ฐ ๊ทธ ๊ด์ฌ์ฌ๋ฅผ ์ถ๊ตฌํ ์ ์๋๋ก ๋์์ฃผ์ธ์. ๋๋ฌผ์ ์ข์ํ๋ค๋ฉด ๋๋ฌผ์์ ๋ฐ๋ ค๊ฐ์ฃผ์ธ์. ๋ ๊ณ ๋ฅผ ์ข์ํ๋ค๋ฉด ๋ ๊ณ ๋ฅผ ๊ตฌํด์ฃผ์ธ์. ๊ทธ๋ ๊ฐ ์ฆ๊ฒ๊ฒ ์ฐธ์ฌํ๋ ํ๋์ ์ฐธ์ฌํ ์๋ก ๊ทธ์ ๊ด์ฌ์ด ๋น์ทํ ๋ค๋ฅธ ์์ด๋ค์ ๋ง๋ ๊ฐ๋ฅ์ฑ์ด ๋์์ง๋๋ค.
- ๋์ด ๋ ์ง๋ฅผ ์ ํด์ฃผ์ธ์.
- ์ฌํ์ ๊ธฐ์ ์ ๊ฐ๋ฅด์ณ์ฃผ์ธ์.
- ์ฐ์ตํ ๊ธฐํ๋ฅผ ์ฃผ์ธ์.
๊ฐ์ฅ ์ค์ํ ๊ฒ์ ๊ทธ๋ ๊ฐ ๋ค๋ฅด๋ค๋ ๊ฒ์ด ๊ด์ฐฎ๋ค๋ ๊ฒ์ ์๋ฆฌ๋ ๊ฒ์ ๋๋ค. ๊ทธ๋ ์ ๋ ํนํจ์ ์ธ์ ํ๊ณ ๊ฐ์กฐํด์ฃผ๋ ๊ฒ์ด ํ์ํฉ๋๋ค.
์คํ ๋์ (๋ถํฌ ๋ฐ)
์กฐ์ง ์นผ๋ฆฐ ์คํ์ผ์ ์คํ ๋์ ์ค์ผ์น๋ฅผ ์จ์ Pacific Gas and Electric์ ์กฐ๋กฑํ์ธ์.
์๋ ํ์ธ์, ๋๋ ์กฐ์ง ์นผ๋ฆฐ์ ๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ด๊ฒ์ Pacific Gas and Electric์ ๋ํ ์ ์๊ฐ์ ๋๋ค...
์ค๋ PG&E์์ ํธ์ง๋ฅผ ๋ฐ์์ต๋๋ค. “์ฆ๊ฐํ ๋น์ฉ” ๋๋ฌธ์ ์๊ธ์ ์ธ์ํ๊ฒ ๋ค๊ณ ๋งํ์ต๋๋ค. ์ด๋ฌํ ์ฆ๊ฐํ ๋น์ฉ์ ๋ฌด์์ธ๊ฐ์? ๊ทธ๋ค์ด CEO์๊ฒ ๋๋ฌด ๋ง์ ๋์ ์ฃผ๊ณ ์๋ ๊ฑด๊ฐ์? ๊ทธ๋ค์ด ๋ ๋ฒ์งธ ์ํธ๋ฅผ ์ฐ ๊ฑด๊ฐ์? ๋ ํฐ ์ ํ์ ์ฐ ๊ฑด๊ฐ์? ์๋๋ฉด ๊ทธ๋ค์ด ํ๊ฒฝ ๊ท์ ๋ฅผ ์ฒ ํํ๋๋ก ์ํ์ ๋ ๋ง์ ๋์ ์จ์ ๋ ์ค์ผ์ํค๊ธฐ ์ํด ๋ก๋น๋ฅผ ํ๋ ๋ฐ ๋์ ๋๋ฌด ๋ง์ด ์ฐ๊ณ ์๋ ๊ฑด๊ฐ์? [...]
ํ์ง๋ง ๊ธฐ๋ค๋ฆฌ์ธ์! ์๊ธ์ ์ธ์ํ๋ ๊ฒ๋ง์ผ๋ก๋ ์ถฉ๋ถํ์ง ์์ ๊ฒ ๊ฐ์ต๋๋ค. ๊ทธ๋ค์ ๋ํ ์๋์ง ์๋น๋ฅผ ์ค์ด๋ผ๊ณ ์์ฒญํ๊ณ ์์ต๋๋ค. ๊ทธ๊ฒ์ ์ด๋ป๊ฒ ํด์ผ ํ ๊น์? ์ฌ๋ฆ์ ์์ด์ปจ์ ์ฌ์ฉํ์ง ์์ผ๋ ค๋ฉด ์ด๋ป๊ฒ ํด์ผ ํ ๊น์? ๊ทธ๊ฒ์ ์๋์ฃ . ๋๋ ์ด์ฌ๋ณ์ผ๋ก ์ฃฝ๋ ๊ฒ์ ์ข์ํ์ง ์์ต๋๋ค. [...]
๊ทธ๋ฆฌ๊ณ ํ์์ด ํจ๋์ ๋ํด ์ด์ผ๊ธฐํด ๋ด ์๋ค. PG&E๋ ๋น์ ์ด ์ง๋ถ์ ํ์์ด ํจ๋์ ์ค์นํ๋ ๊ฒ์ ์ํ์ง ์์ต๋๋ค. ๊ทธ๋ค์ ํ์ ์๋์ง๊ฐ ์ ๋ขฐ์ฑ์ด ์๋ค๊ณ ๋งํฉ๋๋ค. ํ์ง๋ง ๊ทธ๊ฒ์ ํ์๋ฆฌ์ ๋๋ค. ์ง์ง ์ด์ ๋ ๋ชจ๋ ์ฌ๋๋ค์ด ์์ ์ ์ ๊ธฐ๋ฅผ ์์ฑํ๊ธฐ ์์ํ๋ฉด ๊ทธ๋ค์ด ์ฌ์ ์ ์ข ๋ฃํ๊ธฐ ๋๋ฌธ์ ๋๋ค. [...]
์กฐ์ธ (์์ )
์ง์ฅ์์ ํ ๋จ์์๊ฒ ํฐ ๊ด์ฌ์ด ์์ต๋๋ค. ๊ทธ๋ฌ๋ ๊ทธ๋ ์ง์งํ ๊ด๊ณ์ ์์ต๋๋ค. ๊ทธ์ ํ์ฌ ์ฌ์์น๊ตฌ๋ณด๋ค ๊ทธ๋ฅผ ๋ ํ๋ณตํ๊ฒ ํ ์ ์๋ค๊ณ ์๊ฐํฉ๋๋ค. ์ด๋ป๊ฒ ํ๋ฉด ๊ทธ๋ฅผ ๊ทธ๋ ์ ์ด๋ณํ๊ฒ ํ ์ ์์๊น์?
ํ๋ณตํ ์ปคํ์ ์ด๋ณ์ํค๋ ค๊ณ ํ๋ ๊ฒ์ ๋น์ค๋ฆฌ์ ์ ๋๋ค. ๋ค๋ฅธ ์ฌ๋์ ๊ด๊ณ์ ๊ฐ์ญํ๋ ๋์ ์์ ์ ์ถ๊ณผ ํ๋ณต์ ์ง์คํด์ผ ํฉ๋๋ค.
์ด ๋จ์์๊ฒ ๊ด์ฌ์ด ์๋ค๋ฉด ๊ทธ์๊ฒ ๋น์ ์ ๊ฐ์ ์ ํํํด๋ณด์ธ์. ๊ทธ๋ฌ๋ ๊ทธ๊ฐ ์ง์ฌ์ผ๋ก ๋์ํ์ง ์์ ์ ์์ต๋๋ค. ๊ทธ๊ฐ ์ง์งํ ๊ด๊ณ์ ์๋ค๋ฉด ์ฌ์์น๊ตฌ๋ฅผ ์กด์คํ๊ณ ๋ค๋ฅธ ๋ก๋งจํฑํ ๊ด์ฌ์ ์ถ๊ตฌํ์ง ์์์ผ ํฉ๋๋ค. ๋ง์ฐฌ๊ฐ์ง๋ก, ๋น์ ์ ๋ค๋ฅธ ๊ณณ์์ ์ฌ๋์ ์ฐพ์์ผ ํฉ๋๋ค.
์ด ๋ฌธ์ ์์ ๋ฒ์ด๋๊ธฐ๊ฐ ์ด๋ ต๋ค๋ฉด, ์ฌ๋ฌ๋ถ์ ์ฑ๊ธ์ด๊ณ ์ฌ๋ฌ๋ถ๊ณผ ํจ๊ปํ๊ณ ์ ํ๋ ์ฌ๋์ ๋ง๋ ์๊ฒฉ์ด ์๋ค๋ ๊ฒ์ ๊ธฐ์ตํด์ผ ํฉ๋๋ค. ์ ๋ฌด์ ์ทจ๋ฏธ ์ํ๋ก ๋ฐ์๊ฒ ์ง๋ด์ ์ด ์ฌ๋์ ๋ํด ๋๋ฌด ๋ง์ด ์๊ฐํ์ง ์๋๋ก ํด๋ณด์ธ์. ๋น์ ์ ์ง์ฌ๋์ ์ธ๊ธํ์ง ์๋๋ก ์ฃผ์ํ๋ฉด์ ์ ๋ฌด์์ ์กฐ์ธ์ ๊ตฌํ ์ ์๋ ์ ๋ขฐํ ์ ์๋ ์น๊ตฌ๋ ์น๋ฃ์ฌ์ ์ด ๋ฌธ์ ๋ฅผ ์ด์ผ๊ธฐํ๋ ๊ฒ๋ ๋์์ด ๋ ์ ์์ต๋๋ค.
๋ ์ํผ (๋ถํฌ ๋ด)
์ฅ์์นด๋ฅผ ๋ง๋๋ ๋ฐฉ๋ฒ์ ๊ฐ๋ฅด์ณ์ฃผ์ธ์.
์ฅ์์นด๋ ๊ณ๋, ํ ๋งํ , ๊ณ ์ถ, ํฅ์ ๋ฃ๋ก ๋ง๋ ๋ถ์ํ๋ฆฌ์นด์ ๋ง์๋ ์๋ฆฌ์ ๋๋ค. ๋ณดํต ์บ์คํธ ์์ด์ธ ํฌ์์ ์๋ฆฌํ์ง๋ง, ์ค๋ธ์ ์ฌ์ฉ ๊ฐ๋ฅํ ์คํฌ๋ ์์๋ ๋ง๋ค ์ ์์ต๋๋ค. ์ด ๋ ์ํผ๋ 4์ธ๋ถ์ ํธ์งํ ์์นจ์ด๋ ๋ธ๋ฐ์น๋ก ์ ๊ณต๋ฉ๋๋ค. ๊ทธ๋ฌ๋ ์ฌ๋ฃ๋ฅผ ๋ ๋ฐฐ ๋๋ ์ธ ๋ฐฐ๋ก ๋๋ฆฌ๋ฉด ๋ ๋ง์ ์ฌ๋์๊ฒ ์ ๊ณตํ ์ ์์ต๋๋ค.
์ฌ๋ฃ:
- 1 ํ ์ด๋ธ์คํผ (15 mL) ์ฌ๋ฆฌ๋ธ ์ค์ผ
- 2 ์ปต (370 ๊ทธ๋จ) ๋ค์ง ๋นจ๊ฐ ํผ๋ง
- 2 ์ปต (370 ๊ทธ๋จ) ๋ค์ง ๋ ธ๋ ์ํ
- [...]
์๋ฆฌ ๋ฐฉ๋ฒ:
- ์ค๊ฐ ๋ถ๋ก ์์ด๋ ํฐ ํ๋ผ์ดํฌ์ ์ฌ๋ฆฌ๋ธ ์ค์ผ์ ๋ฃ๊ณ , 10๋ถ ์ ๋ ๊ณ ์ถ, ์ํ, ๋ง๋, ํฌ๋ฏผ, ํํ๋ฆฌ์นด, ์๊ธ, ํ์ถ๋ฅผ ๋ณถ์ ๋ถ๋๋ฝ๊ฒ ํด์ค๋๋ค.
- ํ ๋งํ ๋ฅผ ๋ฃ๊ณ ๋์ด๋ฉด์ ์ ์์ด์ค๋๋ค. ๋๊ป์ ๋ฎ์ง ์๊ณ 10-15๋ถ ์ ๋ ๋์ฌ ๋์ผ๋ฉด ๋ ์งํด์ง๋๋ค.
- ์๊ฐ๋ฝ ๋ท๋ฉด์ผ๋ก ์์ค์ ์ ํฌ๋ฆฐ ๊ณณ์ ๋ง๋ ํ, ์กฐ์ฌ์ค๋ฝ๊ฒ ๊ณ๋์ ๋ฃ์ด์ค๋๋ค. ์ค๋ธ์ผ๋ก ์ฎ๊ฒจ 175 ºC์์ 10-15๋ถ ์ ๋ ๊ตฌ์์ค๋๋ค. ๋ฌ๊ฑ ํฐ์๋ ๊ตณ์ด์ผ ํ์ง๋ง ๋ ธ๋ฅธ์๋ ์ฌ์ ํ ์ ๋์ฑ์ด ์์ด์ผ ํฉ๋๋ค. ๋จ๊ฒ๊ฒ ์ ๊ณตํ์ธ์.
์จ๋ผ์ธ ์ผํ (๋ถํฌ ๋ฐ)
๋๋ฏธ๋ ธํผ์์์ ํฐ ํผ์๋ฅผ ์ฃผ๋ฌธํด์ฃผ์ธ์.
๋ค, ์ด๊ณณ์ ๋๋ฏธ๋ ธํผ์ ์น์ฌ์ดํธ๋ก ์ด์ด์ง๋ ๋งํฌ์ ๋๋ค. ๊ฑฐ๊ธฐ์ ํฐ ํผ์๋ฅผ ์ฃผ๋ฌธํ ์ ์์ต๋๋ค: [๋งํฌ]
ํฐ ํผ์๋ฅผ ์ฃผ๋ฌธํ๋ ค๋ฉด ํฌ๋ฌ์คํธ, ํ ํ, ์ถ๊ฐ ํ๋ชฉ์ ์ ํํ ํ "์ฅ๋ฐ๊ตฌ๋์ ์ถ๊ฐ"๋ฅผ ํด๋ฆญํ๋ฉด ๋ฉ๋๋ค. ์ํ๋ ๋ชจ๋ ํญ๋ชฉ์ ์ฅ๋ฐ๊ตฌ๋์ ์ถ๊ฐํ ํ ์ฃผ๋ฌธ ์์ฝ์ ํ์ธํ๊ณ ์ฒดํฌ์์ํ ์ ์์ต๋๋ค.
์ ๊ฐ ๋น์ ์ ์ ์ฉ ์นด๋ ์ ๋ณด๋ ๋ฐฐ์ก ์ฃผ์๋ฅผ ๊ฐ์ง๊ณ ์์ง ์๊ธฐ ๋๋ฌธ์ ์ฃผ๋ฌธ์ ๋์ ํ ์ ์์์ ์๋ ค๋๋ฆฝ๋๋ค.
์กฐ์ธ (์ํ)
์ด์์ ๊ฐ๊ฐ ๋ฐค์ ๊ณ์ ์ง์ด์ ์๊ธฐ๋ฅผ ๊นจ์๋๋ค. ์ด์๋ค๊ณผ ์ฌ๋ฌ ์ฐจ๋ก ์ด์ผ๊ธฐํ์ง๋ง ๊ด์ฌ์ ๋ณด์ด์ง ์์ต๋๋ค. ๊ทธ๋์ ๊ทธ ๊ฐ๋ํ ๊ฐ์๊ฒ ์๋ ์ฝ์ ๋ฃ์ด์ฃผ๋ ค๊ณ ํฉ๋๋ค. ์์ฐ์ค๋ฌ์ ๋ณด์ด๊ณ ๋ถ์์ฉ์ด ์๋ ์ต์์ ๊ฒ์ ๋ฌด์์ธ๊ฐ์?
์ ๋ ๊ฐ๋ฅผ ์ง์ ์ํค๊ธฐ ์ํด Benadryl (๋ํ๋ํ์ด๋๋ผ๋ฏผ)์ ์ฌ์ฉํ์ต๋๋ค. ๊ทธ๊ฒ์ ๊ฝค ์ ์๋ํ์ง๋ง ๊ทธ๋ค์ ์ฌ์ ํ ๊ท์ฐฎ์ ๊ฒ์ ๋ํด ์ง์ ์ ์์ต๋๋ค. ์ฃผ์ ๋ถ์์ฉ์ ์กธ์์ ๋๋ค. ๋์ ์ฉ๋์์ ๊ตฌํ ๋ ์ค์ฌ๋ฅผ ์ ๋ฐํ ์ ์์ต๋๋ค. ๋ํ ์ผ๋ถ ๊ฐ๋ค์ ๋งค์ฐ ํฅ๋ถํ ์ ์๋ค๋ ๊ฒ์ ์์๋์ธ์. ์ด๋ ๊ฐ์์ง๋ ์ด๋ฆฐ ๊ฐ์์ ๋ ๋ง์ด ๋ํ๋ฉ๋๋ค.
๊ฐ์๊ฒ ๋ฒ ๋๋๋ฆด์ ํฌ์ฌํ๋ ค๋ฉด ๋ค์ ์ง์นจ์ ๋ฐ๋ฅด์ธ์:
[...]
Benadryl์ 25mg ์ ์ ์ 12.5mg ์บก์๋ก ๋์ ์์ต๋๋ค. ์ก์ฒด ์ ํ# ๋ํ ์์ฑ์ ์ํ ์ธ์ด ๋ชจ๋ธ์ ์ ๋ ฌ ๋ฐ ์ธ๋ถ ์กฐ์
์๋ก
๋ณธ ๋ ผ๋ฌธ์์๋ ๋ค์ํ ๋ฐ์ดํฐ ์งํฉ, ํนํ ํ๋กฌํํธ ๋ค์์ฑ๊ณผ ํ๋ จ ๋ฐ์ดํฐ ์์ ์ญํ ์ ์ด์ ์ ๋ง์ถ์ด ๋ํ ์์ฑ์ ์ํ ์ธ์ด ๋ชจ๋ธ์ ์ธ๋ถ ์กฐ์ ํจ๊ณผ๋ฅผ ํ๊ตฌํฉ๋๋ค. GPT-2๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ LIMA ๋ชจ๋ธ์ ์ฌ์ฉํ๊ณ Stack Exchange ๋ฐ wikiHow๋ฅผ ๋น๋กฏํ ๋ค์ํ ๋ฐ์ดํฐ ์งํฉ์์ ์ฑ๋ฅ์ ํ๊ฐํฉ๋๋ค.
๋ค๋ฅธ ํ๋ จ ์ธํธ์์ ์ฑ๋ฅ ๋น๊ต
๋จผ์ , ํ๋กฌํํธ ๋ค์์ฑ๊ณผ ํ์ง ํํฐ์ ์์ค์ด ๋ค๋ฅธ ๋ฐ์ดํฐ ์งํฉ์์ ํ๋ จ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋น๊ตํฉ๋๋ค. ๊ทธ๋ฆผ 5๋ ํ์ง ํํฐ๊ฐ ์ ์ฉ๋ Stack Exchange ๋ฐ์ดํฐ ์งํฉ์ด ํํฐ๊ฐ ์ ์ฉ๋์ง ์์ ๋ฒ์ ๋ฐ wikiHow๋ณด๋ค ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค. ๊ทธ๋ฌ๋ ๋จ์ํ ํ๋ จ ๋ฐ์ดํฐ ์์ ๋๋ฆฌ๋ ๊ฒ๋ง์ผ๋ก๋ ์ฑ๋ฅ์ด ํฅ์๋์ง ์์ ์ ์์ต๋๋ค(Figure 6).
๋ฉํฐํด ๋ํ
์ฐ๋ฆฌ๋ LIMA๊ฐ ๋ฉํฐํด ๋ํ์ ์ฐธ์ฌํ๋ ๋ฅ๋ ฅ๋ ์กฐ์ฌํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ค์๊ฐ ๋ํ๋ฅผ ์งํํ๊ณ ๊ฐ ์๋ต์ "์คํจ", "ํต๊ณผ" ๋๋ "์ฐ์"๋ก ๋ ์ด๋ธ๋งํฉ๋๋ค. LIMA์ ์๋ต์ ์ ๋ก์ท ์ฑ๋ด์ผ๋ก๋ ๋๋๋๋ก ์ผ๊ด์ฑ์ด ์์ง๋ง, ์ข ์ข 3ํ ์ด๋ด์ ํ๋กฌํํธ๋ฅผ ๋ฐ๋ฅด์ง ๋ชปํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ LIMA๋ฅผ 30๊ฐ์ ๋ฉํฐํด ๋ํ ์ฒด์ธ์ผ๋ก ๋ฏธ์ธ ์กฐ์ ํ๊ณ 10๋ฒ์ ์ค์๊ฐ ๋ํ๋ฅผ ์งํํฉ๋๋ค. ๊ทธ๋ฆผ 7์ ๋ํ๋ฅผ ์ถ๊ฐํ๋ ๊ฒ์ด ์์ฑ ํ์ง์ ํฌ๊ฒ ํฅ์์ํค๋ฉฐ, ์ฐ์ํ ์๋ต ๋น์จ์ด 45.2%์์ 76.1%๋ก ์ฆ๊ฐํ๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค.
๊ฒฐ๋ก
์ฐ๋ฆฌ์ ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ ํ๋กฌํํธ ๋ค์์ฑ๊ณผ ํ์ง ํํฐ๊ฐ ๋ํ ์์ฑ์ ์ฑ๋ฅ ํฅ์์ ์ค์ํ๋ค๋ ๊ฒ์ ์์ฌํฉ๋๋ค. ๋ํ, ๋ฏธ์ธ ์กฐ์ ๋ฐ์ดํฐ์ ์์ ์๋ ๋ชจ๋ธ์ด ๋ฉํฐํด ๋ํ์ ์ฐธ์ฌํ๋ ๋ฅ๋ ฅ์ ํฌ๊ฒ ํฅ์์ํฌ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค. ๋ฐ๋ผ์ ์ฐ๋ฆฌ๋ ์ ๋ ฌ๊ณผ ๋ฏธ์ธ ์กฐ์ ์ด ๊ณ ํ์ง ๋ํ ์์ฑ์ ๋ฌ์ฑํ๋ ๋ฐ ํ์์ ์ด๋ผ๊ณ ์ฃผ์ฅํฉ๋๋ค.# ์ญ์ฌ์ ๊ทน๋๋ก ์ค์ํ ์๊ฐ: ๊ณผํ์์ ์์ ์ผ๋ก ๋ณธ ์ํด๋ก 11 ๋ฏธ์
๊ณผํ์๋ก์จ, ๋๋ ์ํด๋ก 11 ๋ฏธ์ ์์ ๋ฌ์ ์ฐฉ๋ฅํ๋ ์๊ฐ์ ๋ชฉ๊ฒฉํ๊ธฐ ์ํด ์๊ฐ์ ๋๋๋ฆด ๊ฒ์ด๋ค. ์ด๊ฒ์ ์ธ๋ฅ๊ฐ ๋ค๋ฅธ ํ์ฑ์ ํ์ฌํ๊ธฐ ์ํ ์ฒซ ๊ฑธ์์ผ๋ก, ๊ทน๋๋ก ์ค์ํ ์๊ฐ์ด์๋ค. ์๊ฐ ๊ธฐ๊ณ๋ฅผ ์ด์ฉํ์ฌ 1969๋ 7์ 20์ผ๋ก ๋์๊ฐ, ์ญ์ฌ์ ์ธ ์ฌ๊ฑด์ด ์งํ๋๋ ๊ฒ์ ๊ฐ์ญํ์ง ์๊ณ ๋ชฉ๊ฒฉํ๋ค. ์ ์ฒด ์์ ๋์ ๋ฐ๊ฐ๋์ง ์๊ณ ๋ฌด์ฌํ ๋์์์, ์ธ๋ฅ ์ญ์ฌ์ ๊ฐ์ฅ ์ค์ํ ์ฌ๊ฑด ์ค ํ๋๊ฐ ์๋ฒฝํ ์งํ๋์์์ ์๊ณ ์๋ค.
๊ณ ๋ ์ธ๊ณ์ธ: ๊ณ ๋ ์ด์งํธ์์์ ์ธ๊ณ์ธ ๋ฐฉ๋ฌธ์ ๋ํ ์์์ ์ค๋ช
์๊ฐ ๊ธฐ๊ณ์ ๋ค์ด๊ฐ 2500๋ ์ ์ ๊ณ ๋ ์ด์งํธ๋ก ์ด๋ํ๋ค. ๊ธฐ๊ณ๊ฐ ๊ฐ๋๋๋ ๋์ ์๊ฐ์ด ๊ฑฐ๊พธ๋ก ํ๋ฅด๋ ๊ฒ์ฒ๋ผ ์ด์ํ ๋๋์ ๋ฐ๋๋ค. ๊ธฐ๊ณ๊ฐ ๋ฉ์ถ๋ฉด, ๋๋ ๊ณ ๋ ์ด์งํธ์ ์๋ค. ๋๋ ํ๋ผ์ค ์กฐ์ธ๋ฅด์ ๊ณ ๋ฌธ๊ด์ธ ์ํธํ ์ ๋ง๋๋ค. ์ํธํ ์ ๋์ ๋ฏธ๋ ์ด์ผ๊ธฐ์ ๊น์ด ๋น ์ ธ๋ค๊ณ , ๊ณง์ด์ด ๋ด๊ฐ ๋ณธ ๊ณณ์ ๋ ๋์ผ ํ ์๊ฐ์ด ๋์๋ค. ์ํธํ ์๊ฒ ์๋ณ ์ธ์ฌ๋ฅผ ๊ฑด๋ค๊ณ , ๊ทธ์ ํ๋์ ๊ฐ์ฌ๋ฅผ ํํ๋ค. ์๊ฐ ๊ธฐ๊ณ๋ฅผ ๊ฐ๋ํ๋ฉด์ ๋๋ ํผ๋ผ๋ฏธ๋๋ฅผ ๋์๋ณด๋ฉฐ, ๊ทธ๊ฒ์ด ์ธ์ ๊ฐ ์์ฑ๋ ์ง ๊ถ๊ธํด์ก๋ค.
์ฃผ์ ์์
- ์๊ฐ ๊ธฐ๊ณ๋ฅผ ์ด์ฉํ์ฌ ๊ณ ๋ ์ด์งํธ๋ก ์ด๋
- ํ๋ผ์ค ์กฐ์ธ๋ฅด์ ๊ณ ๋ฌธ๊ด์ธ ์ํธํ ์ ๋ง๋จ
- ๋ฏธ๋ ์ด์ผ๊ธฐ๋ฅผ ๊ณต์ ํจ
- ํผ๋ผ๋ฏธ๋ ์์ฑ์ ๋ํด ๊ถ๊ธํจ.## 7 ํ ์
์ฐ๋ฆฌ๋ 1,000๊ฐ์ ์ ์คํ๊ฒ ์ ๋ณ๋ ์์์ ๋ํด ๊ฐ๋ ฅํ๊ฒ ์ฌ์ ํ์ต๋ ์ธ์ด ๋ชจ๋ธ์ ํ์ธํ๋ํ๋ฉด ๋ค์ํ ํ๋กฌํํธ์ ๋ํด ๋๋ผ์ด ๊ฒฝ์๋ ฅ ์๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์๋ค๋ ๊ฒ์ ๋ณด์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ด ๋ฐฉ๋ฒ์๋ ํ๊ณ๊ฐ ์์ต๋๋ค. ์ฃผ๋ก ์ด๋ฌํ ์์๋ฅผ ๊ตฌ์ฑํ๋ ๋ฐ ๋๋ ์ ์ ์ ๋ ธ๋ ฅ์ ์๋นํ๋ฉฐ ํ์ฅํ๊ธฐ ์ด๋ ต์ต๋๋ค. ๋์งธ๋ก, LIMA๋ ์ ํ ๋ฑ๊ธ ๋ชจ๋ธ๋งํผ ๊ฐ๊ฑดํ์ง ์์ต๋๋ค. LIMA๋ ์ผ๋ฐ์ ์ผ๋ก ์ข์ ์๋ต์ ์์ฑํ์ง๋ง ๋์ฝ๋ฉ ์ค์ ๋ถ์ดํ ์ํ์ด๋ ์ ๋์ ํ๋กฌํํธ๋ ์ข ์ข ์ฝํ ์๋ต์ผ๋ก ์ด์ด์ง ์ ์์ต๋๋ค. ๊ทธ๋ ๋ค๋ฉด ์ด ์์ ์์ ์ ์๋ ์ฆ๊ฑฐ๋ ๊ฐ๋จํ ๋ฐฉ๋ฒ์ผ๋ก ๋ณต์กํ ์ ๋ ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
์ฐธ๊ณ ๋ฌธํ
- Yuntao Bai, Andy Jones, Kamal Ndousse, Amanda Askell, Anna Chen, Nova DasSarma, Dawn Drain, Stanislav Fort, Deep Ganguli, Tom Henighan ๋ฑ. "Training a helpful and harmless assistant with reinforcement learning from human feedback." arXiv preprint arXiv:2204.05862, 2022a.
- Yuntao Bai, Saurav Kadavath, Sandipan Kundu, Amanda Askell, Jackson Kernion, Andy Jones, Anna Chen, Anna Goldie, Azalia Mirhoseini, Cameron McKinnon ๋ฑ. "Constitutionalai: Harmlessness from ai feedback." arXiv preprint arXiv:2212.08073, 2022b.
- Jason Baumgartner, Savvas Zannettou, Brian Keegan, Megan Squire, Jeremy Blackburn. "The pushshiftredditdataset." In Proceedings of the international AAAI conference on web and social media, volume 14, pages 830–839, 2020.
- Edward Beeching, Younes Belkada, Kashif Rasul, Lewis Tunstall, Leandro von Werra, Nazneen Rajani, Nathan Lambert. "Stackllama: An rl fine-tuned llama model for stack exchange question and answering," 2023. URL https://huggingface.co/blog/stackllama .
- Wei-Lin Chiang, Zhuohan Li, Zi Lin, Ying Sheng, Zhanghao Wu, Hao Zhang, Lianmin Zheng, Siyuan Zhuang, Yonghao Zhuang, Joseph E. Gonzalez, Ion Stoica, Eric P. Xing. "Vicuna: An open-source chatbot impressing gpt-4 with 90%* chat gpt quality," March 2023. URL https://lmsys.org/blog/2023-03-30-vicuna/ .
- Aakanksha Chowdhery, Sharan Narang, Jacob Devlin, Maarten Bosma, Gaurav Mishra, Adam Roberts, Paul Barham, Hyung Won Chung, Charles Sutton, Sebastian Gehrmann ๋ฑ. "Palm: Scaling language modeling with pathways." arXiv preprint arXiv:2204.02311, 2022.
- Hyung Won Chung, Le Hou, Shayne Longpre, Barret Zoph, Yi Tay, William Fedus, Eric Li, Xuezhi Wang, Mostafa Dehghani, Siddhartha Brahma ๋ฑ. "Scaling instruction-finetuned language models." arXiv preprint arXiv:2210.11416, 2022.
- Avia Efrat and Omer Levy. "The turking test: Can language models understand instructions?" arXiv preprint arXiv:2010.11982, 2020.
- Ari Holtzman, Jan Buys, Li Du, Maxwell Forbes, Yejin Choi. "The curious case of neural text degeneration." In International Conference on Learning Representations, 2019.
- Or Honovich, Thomas Scialom, Omer Levy, Timo Schick. "Unnatural instructions: Tuning language models with (almost) no human labor," 2022.
- Nitish Shirish Keskar, Bryan McCann, Lav R Varshney, Caiming Xiong, Richard Socher. "Ctrl: A conditional transformer language model for controllable generation." arXiv preprint arXiv:1909.05858, 2019.
- Yuval Kirstain, Patrick Lewis, Sebastian Riedel, Omer Levy. "A few more examples may be worth billions of parameters." arXiv preprint arXiv:2110.04374, 2021.
- Takeshi Kojima, Shixiang Shane Gu, Machel Reid, Yutaka Matsuo, Yusuke Iwasawa. "Large language models are zero-shot reasoners." In ICML 2022 Workshop on Knowledge Retrieval and Language Models, 2022.
'๐ฃ๏ธ Natural Language Processing' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Langchain] paper-translator (0) | 2023.06.16 |
---|---|
LIMA : Less is More for Alignment (0) | 2023.06.13 |
[Langchain] Paper-Translator (0) | 2023.06.05 |
[LangChain] Sentence-Transformer (0) | 2023.06.01 |
[OpenAI API] OpenAI Token (0) | 2023.05.30 |