728x90
Large language model์ ๋ ๋จ๊ณ ์คํ ์ผ๋ก ํ์ต ๋น๊ต
- (1) raw text์์ ๋น์ง๋ ํ์ต์ ํตํด ์ผ๋ฐ์ ์ธ ๋ํ ๋ฌธ์ฅ(general-purpose) ํ์ต
- (2) large scale instruction tuning๊ณผ ๊ฐํ ํ์ต์ ํตํด human preference modeling
[Experiment]
- ํ ์คํธ๋ฅผ ์ํด 1000๊ฐ์ ์ค์ ์ ์ ํ๋กฌํํธ์ high-quality ์๋ต์ ์ ๋ณ.
- 750๊ฐ์ ์ง๋ฌธ๊ณผ ๋ต๋ณ์ Community forum์์ ์ ๋ณ(Stack Exchang, wikiHow)
- ์ถ๊ฐ๋ก 250๊ฐ์ ์ง๋ฌธ๊ณผ ๋ต๋ณ์ ์๋์ผ๋ก ์์ฑ (Alignment style)
- LLaMa [Touvron et al., 2023] 65B parameter model์ fine-tuning
[Result]
- LIMA๋ ์ด ๋ ์คํ ์ ์ค์ ์ผ๋ก ์ธก์
- LIMA๋ 1,000๊ฐ์ ์ ์คํ ์ ๋ณ๋ ํ๋กฌํํธ์ ์๋ต์ ๋ํด์๋ง standard supervised loss๋ก 65B ํ๋ผ๋ฏธํฐ LLaMa๋ฅผ fine-tuning, ๊ฐํ ํ์ต ๋๋ human preference modeling๋ ์ฌ์ฉํ์ง ์์.
- LIMA๋ training data์ ์์์ ์์ ์์๋ง ํน์ ์๋ต ํ์์ ๋ฐ๋ฅด๋ ๊ฒ(ex, ์ฌํ ์ผ์ ๊ณํ, ์ญ์ฌ์ ๋ํ ์ถ์ธก ๋ฑ)์ ํ์ตํ๋ฉฐ ๋ณต์กํ ์ง์๋ฅผ ์ฒ๋ฆฌ ํ ์ ์๋ค. (training data์ ๋ฑ์ฅํ์ง ์์ ์๋ก์ด ์์ ์ ๋ํด์๋ generalize ํ๊ธฐ ์ข์)
- ํต์ ๋ ์คํ์์ LIMA์ ์๋ต์ GPT-4 ์ ๋น๊ตํด 43% Bard ์ ๋น๊ตํ์ ๋ 58%์ด์ DaVinci003 65%๋ก human feedback์ผ๋ก ํ๋ จ๋ model๊ณผ์ ๋น๊ตํ์ ๋ ๊ฒฐ๊ณผ๋ก large scale model์ ๋๋ถ๋ถ์ด ๊ฑฐ์ ๋ชจ๋ ์ง์์ด pretraining ์ค์ train๋๋ค๋ ๊ฒ์ ๊ฐ๋ ฅํ๊ฒ ์์ฌํจ. ๋ฐ๋ผ์, ๊ณ ํ์ง ์ถ๋ ฅ์ ์์ฑํ๊ธฐ ์ํด์๋ limited instruction tuning data ๋ง์ผ๋ก๋ ์ถฉ๋ถํ๋ค.
[Concept]
Superficial Alignment Hypothesis
Superficial Alignment Hypothesis๋ฅผ ์ ์ํ๋ค. ๋ชจ๋ธ์ ์ง์๊ณผ ๋ฅ๋ ฅ์ pretraining ์ค์ ๊ฑฐ์ ์์ ํ ํ์ต๋๋ฉฐ, alignment๋ ์ฌ์ฉ์์ ์ํธ์์ฉํ ๋ ์ด๋ค subdistribution์ format์ ์ฌ์ฉํด์ผ ํ๋์ง๋ฅผ ๋ชจ๋ธ์๊ฒ ๊ฐ๋ฅด์น๋ค. ๋ง์ฝ ์ด ๊ฐ์ค์ด ๋ง๋ค๋ฉด, alignment๋ ์ฃผ๋ก style์ ๋ฐฐ์ฐ๋ ๊ฒ์ด๋ฏ๋ก, pretraining๋ ์ธ์ด ๋ชจ๋ธ์ ๋งค์ฐ ์์ ์์ data(1000)๋ก ์ถฉ๋ถํ ํ๋ํ ์ ์๋ค๋ ๊ฒ์ด Superficial Alignment Hypothesis [Kirstain et al., 2021] ์ด๋ค.
์ค๋ณต์ด ์๊ณ ๋ค์์ฑ์ ํ๋ณดํ ์ผ๋ฐ์ ์ธ ์์ ๋ฐ์ดํฐ๋ง์ผ๋ก instruction์ด Alignment style๋ก ํ์ต์ด ๊ฐ๋ฅํ๋ค.
๊ถ๊ธ์
- LIMA๋ RLHF ๋ชจ๋ธ๊ณผ ๋น๊ต์ ๋ชจ๋ธ๋ค์ LIMA์ ๊ฐ์ dataset์ ํ์ต ํ์ง ์์๋ค๋ ์
- ๋ณธ ๋ ผ๋ฌธ์์ ๋น๊ต ๋ชจ๋ธ๋ค์ Response๋ค์ ๋ํ ์ ๋ต์ ๋ํ ํ๊ฐ๊ฐ ๊ณต์ ํ์ง ์์ ์์. (metric)
- RLHF๊ฐ ์ ๋ง๋ก ํ์ํ์ง์ ๋ํ ์คํ ์ฌ๋ถ case๊ฐ ์ ์ ๋ฐ์ดํฐ์์๋ง ์ ํจํ์ง ์๋๋ฉด ์์ฒญ๋๊ฒ ๋ง์ RLHF ์์ ์ํ์ ๊ฒฐ๊ณผ๊ฐ ๋ฌ๋ผ ์ง์ง ๊ถ๊ธ
๋ฐ์ํ
'๐ฃ๏ธ Natural Language Processing' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Text Embedding + t-SNE Visualization (0) | 2023.06.22 |
---|---|
[Langchain] paper-translator (0) | 2023.06.16 |
paper-translator test (LIMA: Less Is More for Alignment) (0) | 2023.06.08 |
[Langchain] Paper-Translator (0) | 2023.06.05 |
[LangChain] Sentence-Transformer (0) | 2023.06.01 |