https://stanford-cs324.github.io/winter2022/lectures/introduction/
CS324์ ์ค์ ๊ฒ์ ํ์ํฉ๋๋ค! ์ด ๊ณผ์ ์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ์ดํด์ ๊ฐ๋ฐ์ ๋ํ ์๋ก์ด ๊ฐ์ข์ ๋๋ค.
1. ์ธ์ด ๋ชจ๋ธ์ด๋ ๋ฌด์์ธ๊ฐ์?
2. ๊ฐ๋จํ ์ญ์ฌ
3. ์ด ๊ฐ์ข๊ฐ ์ ํ์ํ๊ฐ์?
4. ์ด ๊ฐ์ข์ ๊ตฌ์กฐ
5. ์ธ์ด ๋ชจ๋ธ์ด๋ ๋ฌด์์ธ๊ฐ์?
1. ์ธ์ด ๋ชจ๋ธ์ด๋ ๋ฌด์์ธ๊ฐ์?
์ธ์ด ๋ชจ๋ธ (LM)์ ํด๋์ํ ์ ์๋ ํ ํฐ ์ํ์ค์ ๋ํ ํ๋ฅ ๋ถํฌ์ ๋๋ค. ํ ํฐ ์งํฉ (\sV)๊ฐ ์๋ค๊ณ ๊ฐ์ ํด ๋ด ์๋ค. ์ธ์ด ๋ชจ๋ธ (p)์ ๊ฐ๊ฐ์ ํ ํฐ ์ํ์ค (x_1, \dots, x_L \in \sV)์ ๋ํด ํ๋ฅ (0๊ณผ 1 ์ฌ์ด์ ์ซ์)์ ํ ๋นํฉ๋๋ค:[p(x_1, \dots, x_L).]
ํ๋ฅ ์ ์ํ์ค์ "์ข์"์ ์ง๊ด์ ์ผ๋ก ๋ํ๋ ๋๋ค. ์๋ฅผ ๋ค์ด, ๋ง์ฝ ์ดํ๊ฐ (V = { l{ate},l{ball},l{cheese},l{mouse}, l{the} })๋ผ๋ฉด, ์ธ์ด ๋ชจ๋ธ์ ๋ค์๊ณผ ๊ฐ์ด ํ ๋นํ ์ ์์ต๋๋ค (DEMO):[p(l{the},l{mouse}, l{ate}, l{the}, l{cheese}) = 0.02,] [p(l{the}, l{cheese}, l{ate}, l{the}, l{mouse}) = 0.01,] [p(l{mouse}, l{the}, l{the}, l{cheese}, l{ate}) = 0.0001.]
์ํ์ ์ผ๋ก๋, ์ธ์ด ๋ชจ๋ธ์ ๋งค์ฐ ๊ฐ๋จํ๊ณ ์๋ฆ๋ค์ด ๊ฐ์ฒด์ ๋๋ค. ๊ทธ๋ฌ๋ ์ด ๊ฐ๋จํจ์ ์์์์ ๋๋ค: ๋ชจ๋ ์ํ์ค์ (์๋ฏธ ์๋) ํ๋ฅ ์ ํ ๋นํ๋ ๋ฅ๋ ฅ์ ํน๋ณํ (๋ฌต์์ ์ธ) ์ธ์ด ๋ฅ๋ ฅ๊ณผ ์ธ๊ณ ์ง์์ด ํ์ํฉ๋๋ค.
์๋ฅผ ๋ค์ด, LM์ ๋ฌธ๋ฒ์ ์ผ๋ก ๋ถ์ ์ ํ (l{mouse the the cheese ate})์ ๋งค์ฐ ๋ฎ์ ํ๋ฅ ์ ํ ๋นํด์ผ ํฉ๋๋ค (๊ตฌ๋ฌธ์ ์ง์). LM์ ์๋ฏธ๋ก ์ ํ๋น์ฑ์ ์ฐจ์ด๋ก ์ธํด (l{the mouse ate the cheese})๋ฅผ (l{the cheese ate the mouse})๋ณด๋ค ๋์ ํ๋ฅ ๋ก ํ ๋นํด์ผ ํฉ๋๋ค (์ธ๊ณ ์ง์).
์์ฑ. ์ ์์ ๋ฐ๋ผ, ์ธ์ด ๋ชจ๋ธ (p)์ ์ํ์ค๋ฅผ ๋ฐ์๋ค์ด๊ณ ๊ทธ ์ข์์ ํ๊ฐํ๊ธฐ ์ํด ํ๋ฅ ์ ๋ฐํํฉ๋๋ค. ๋ํ ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์ํ์ค๋ฅผ ์์ฑํ ์๋ ์์ต๋๋ค. ์ด๋ฅผ ์์ํ๊ฒ ์ํํ๋ ๋ฐฉ๋ฒ์ ์ธ์ด ๋ชจ๋ธ (p)์์ ์ํ์ค (x_{1:L})๋ฅผ ํ๋ฅ (p(x_{1:L}))์ ๋น๋กํ์ฌ ์ํ๋งํ๋ ๊ฒ์ ๋๋ค. ์ด๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ํ๊ธฐํฉ๋๋ค:[x_{1:L} \sim p.]
์ด๋ฅผ ๊ณ์ฐ์ ์ผ๋ก ํจ์จ์ ์ผ๋ก ์ํํ๋ ๋ฐฉ๋ฒ์ ์ธ์ด ๋ชจ๋ธ (p)์ ํํ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋๋ค. ์ค์ ๋ก, ์ฐ๋ฆฌ๋ ๋ณดํต ์ธ์ด ๋ชจ๋ธ์์ ์ง์ ์ํ๋งํ์ง ์์ต๋๋ค. ์ด๋ ์ค์ ์ธ์ด ๋ชจ๋ธ์ ํ๊ณ์ "ํ๊ท " ์ํ์ค๊ฐ ์๋๋ผ "์ต์ " ์ํ์ค์ ๋ ๊ฐ๊น์ด ๊ฒ์ ์ป๊ณ ์ ํ๋ ๊ฒฝ์ฐ๋ ์๊ธฐ ๋๋ฌธ์ ๋๋ค.
์๊ธฐ ํ๊ท ์ธ์ด ๋ชจ๋ธ
์ํ์ค (x_{1:L})์ ๊ฒฐํฉ ๋ถํฌ (p(x_{1:L}))๋ฅผ ์ฐ๋ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ์ ํ๋ฅ ์ ์ฐ์ ๋ฒ์น์ ์ฌ์ฉํ๋ ๊ฒ์ ๋๋ค:[p(x_{1:L}) = p(x_1) p(x_2 \mid x_1) p(x_3 \mid x_1, x_2) \cdots p(x_L \mid x_{1:L-1}) = \prod_{i=1}^L p(x_i \mid x_{1:i-1}).]
์๋ฅผ ๋ค์ด (๋ฐ๋ชจ):[\begin{align} p(l{the}, l{mouse}, l{ate}, l{the}, l{cheese}) = , & p(l{the}) \ & p(l{mouse} \mid l{the}) \ & p(l{ate} \mid l{the}, l{mouse}) \ & p(l{the} \mid l{the}, l{mouse}, l{ate}) \ & p(l{cheese} \mid l{the}, l{mouse}, l{ate}, l{the}). \end{align}]
ํนํ, (p(x_i \mid x_{1:i-1}))์ ์ด์ ํ ํฐ (x_{1:i-1})์ด ์ฃผ์ด์ก์ ๋ ๋ค์ ํ ํฐ (x_i)์ ์กฐ๊ฑด๋ถ ํ๋ฅ ๋ถํฌ์ ๋๋ค.
๋ฌผ๋ก , ์ด๋ค ๊ฒฐํฉ ํ๋ฅ ๋ถํฌ๋ ์ํ์ ์ผ๋ก ์ด๋ ๊ฒ ์์ฑํ ์ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ์๊ธฐ ํ๊ท ์ธ์ด ๋ชจ๋ธ์ ๊ฐ ์กฐ๊ฑด๋ถ ๋ถํฌ (p(x_i \mid x_{1:i-1}))๋ฅผ ํจ์จ์ ์ผ๋ก ๊ณ์ฐํ ์ ์๋ ๋ชจ๋ธ์ ๋๋ค (์: ํผ๋ํฌ์๋ ์ ๊ฒฝ๋ง ์ฌ์ฉ).
์์ฑ. ์ด์ ์๊ธฐ ํ๊ท ์ธ์ด ๋ชจ๋ธ (p)์์ ์ ์ฒด ์ํ์ค (x_{1:L})๋ฅผ ์์ฑํ๊ธฐ ์ํด, ์ง๊ธ๊น์ง ์์ฑ๋ ํ ํฐ์ ์ฌ์ฉํ์ฌ ํ ๋ฒ์ ํ๋์ ํ ํฐ์ ์ํ๋งํฉ๋๋ค:[\text{for } i = 1, \dots, L: \ \hspace{1in} x_i \sim p(x_i \mid x_{1:i-1})^{1/T},]
์ฌ๊ธฐ์ (T \ge 0)์ ์ธ์ด ๋ชจ๋ธ๋ก๋ถํฐ ์ผ๋ง๋ ๋ง์ ๋ฌด์์์ฑ์ ์ํ๋์ง๋ฅผ ์ ์ดํ๋ ์จ๋ ๋งค๊ฐ ๋ณ์์ ๋๋ค:
(T = 0): ๊ฐ ์์น (i)์์ ๊ฐ์ฅ ํ๋ฅ ์ด ๋์ ํ ํฐ (x_i)์ ๊ฒฐ์ ์ ์ผ๋ก ์ ํํฉ๋๋ค.
(T = 1): ์์ํ ์ธ์ด ๋ชจ๋ธ์์ "๋ณดํต" ์ํ๋ง์ ์ํํฉ๋๋ค.
(T = \infty): ์ ์ฒด ์ดํ (\sV)์ ๋ํ ๊ท ๋ฑ ๋ถํฌ์์ ์ํ๋งํฉ๋๋ค.
๊ทธ๋ฌ๋ ํ๋ฅ ์ (1/T)์ ์ ๊ณฑ์ผ๋ก ๋ง๋ง๋ค๋ฉด, ํ๋ฅ ๋ถํฌ์ ํฉ์ด 1์ด ์๋ ์ ์์ต๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ถํฌ๋ฅผ ์ฌ์ ๊ทํํ์ฌ ์ ๊ทํ๋ ๋ฒ์ (p_T(x_i \mid x_{1:i-1}) \propto p(x_i \mid x_{1:i-1})^{1/T})๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์๋ฅผ ๋ค๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค:[p(l{cheese}) = 0.4, \quad\quad\quad p(l{mouse}) = 0.6] [p_{T=0.5}(l{cheese}) = 0.31, \quad\quad\quad p_{T=0.5}(l{mouse}) = 0.69] [p_{T=0.2}(l{cheese}) = 0.12, \quad\quad\quad p_{T=0.2}(l{mouse}) = 0.88] [p_{T=0}(l{cheese}) = 0, \quad\quad\quad p_{T=0}(l{mouse}) = 1]
๊ณ๋ฌธ: ๋จ์ด์ ๊ธ์ ๊ณผํ์์ ๋ฐ๋ปํ ์ฌ๋ฃ๋ฅผ ์ ์ฐจ์ ์ผ๋ก ๋๊ฐ์ํค๋ ๊ฒ์ ๊ฐ๋ฆฌํค๋ฉฐ, ์ํ๋ง ๋ฐ ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ(์: ๋ชจ์ ๋จ์ด)์์ ๋ํ๋ฉ๋๋ค.
๊ธฐ์ ๋ ธํธ: ์จ๋ (T) ๋งค๊ฐ๋ณ์๊ฐ ๊ฐ ์กฐ๊ฑด๋ถ ๋ถํฌ (p(x_i \mid x_{1:i-1})^{1/T})์ ์ ์ฉ๋๋ ๋ฐ๋ณต ์ํ๋ง์ ๊ธธ์ด (L) ์ํ์ค์ ๋ํ ๋จ์ด ๋ถํฌ์์ ์ํ๋งํ๋ ๊ฒ๊ณผ ๋์ผํ์ง ์์ต๋๋ค(๋จ, (T = 1)์ธ ๊ฒฝ์ฐ).
์กฐ๊ฑด๋ถ ์์ฑ. ๋ณด๋ค ์ผ๋ฐ์ ์ผ๋ก, ์ฐ๋ฆฌ๋ ์ด๋ค ์ ๋์ฌ ์ํ์ค (x_{1:i}) (ํ๋กฌํํธ๋ผ๊ณ ํจ)๋ฅผ ์ง์ ํ๊ณ ๋๋จธ์ง (x_{i+1:L}) (์์ฑ์ด๋ผ๊ณ ํจ)๋ฅผ ์ํ๋งํ์ฌ ์กฐ๊ฑด๋ถ ์์ฑ์ ์ํํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, (T=0)์ผ๋ก ์์ฑํ๋ฉด (๋ฐ๋ชจ):[\underbrace{l{the}, l{mouse}, l{ate}}_\text{ํ๋กฌํํธ} \generate{T=0} \underbrace{l{the}, l{cheese}}_\text{์์ฑ}.]
์จ๋๋ฅผ (T = 1)๋ก ๋ณ๊ฒฝํ๋ฉด ๋ค์์ฑ์ ๋์ฑ ์ป์ ์ ์์ต๋๋ค(๋ฐ๋ชจ), ์๋ฅผ ๋ค์ด, (l{its house})์ (l{my homework}).
๊ณง ๋ณด๊ฒ ๋ ๊ฒ์ฒ๋ผ, ์กฐ๊ฑด๋ถ ์์ฑ์ ๋จ์ํ ํ๋กฌํํธ๋ฅผ ๋ณ๊ฒฝํจ์ผ๋ก์จ ์ธ์ด ๋ชจ๋ธ์ด ๋ค์ํ ์์ ์ ํด๊ฒฐํ ์ ์๋ ๋ฅ๋ ฅ์ ๋ฐํํ ์ ์๊ฒ ํฉ๋๋ค.
Abstract
์ธ์ด ๋ชจ๋ธ์ ์ํ์ค (x_{1:L})์ ๋ํ ํ๋ฅ ๋ถํฌ (p)์ ๋๋ค.
์ง๊ด์ ์ผ๋ก ์ข์ ์ธ์ด ๋ชจ๋ธ์ ์ธ์ด์ ๋ฅ๋ ฅ๊ณผ ์ธ๊ณ ์ง์์ ๊ฐ์ ธ์ผ ํฉ๋๋ค.
์๊ธฐํ๊ท ์ธ์ด ๋ชจ๋ธ์ ํ๋กฌํํธ (x_{1:i})๊ฐ ์ฃผ์ด์ก์ ๋ ์์ฑ (x_{i+1:L})์ ํจ์จ์ ์ธ ์์ฑ์ ํ์ฉํฉ๋๋ค.
์จ๋๋ ์์ฑ์์์ ๋ณ๋์ฑ์ ์ ์ดํ๋ ๋ฐ ์ฌ์ฉ๋ ์ ์์ต๋๋ค.
๊ฐ๋ตํ ์ญ์ฌ
์ ๋ณด ์ด๋ก , ์์ด์ ์ํธ๋กํผ, n-gram ๋ชจ๋ธ
์ ๋ณด ์ด๋ก . ์ธ์ด ๋ชจ๋ธ์ 1948๋ ํด๋ก๋ ์ค๋์ด ๊ทธ์ ๊ธฐ๋ณธ ๋ ผ๋ฌธ์ธ "ํต์ ์ ์ํ์ ์ด๋ก "์์ ์ ๋ณด ์ด๋ก ์ ์ฐฝ์ํ๋ฉด์ ์์๋์์ต๋๋ค. ์ด ๋ ผ๋ฌธ์์ ๊ทธ๋ ๋ถํฌ์ ์ํธ๋กํผ๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํ์ต๋๋ค[H(p) = \sum_x p(x) \log \frac{1}{p(x)}.]
์ํธ๋กํผ๋ ์ด๋ค ์๊ณ ๋ฆฌ์ฆ์ด ์ํ (x \sim p)๋ฅผ ๋นํธ์ด๋ก ์ธ์ฝ๋ฉ(์์ถ)ํ๊ธฐ ์ํด ํ์ํ ์์ ๋นํธ ์์ ๋๋ค:[l{the mouse ate the cheese} \Rightarrow 0001110101.]
์ํธ๋กํผ๊ฐ ๋ฎ์์๋ก ์ํ์ค๋ ๋ "๊ตฌ์กฐํ๋" ๊ฒ์ด๋ฉฐ, ์ฝ๋ ๊ธธ์ด๊ฐ ์งง์์ง๋๋ค.
์ง๊ด์ ์ผ๋ก, (\log \frac{1}{p(x)})๋ ํ๋ฅ (p(x))๋ก ๋ฐ์ํ๋ ์์ (x)๋ฅผ ๋ํ๋ด๋ ๋ฐ ์ฌ์ฉ๋๋ ์ฝ๋์ ๊ธธ์ด์ ๋๋ค.
๋ง์ฝ (p(x) = \frac{1}{8})์ด๋ผ๋ฉด, ์ฐ๋ฆฌ๋ (3)๋นํธ((\log_2(8) = 3), ๋๋ (\log(8) = 2.08) nats)๋ฅผ ํ ๋นํด์ผ ํฉ๋๋ค.
๊ณ๋ฌธ: ์ค์ ๋ก ์ค๋ ํ๊ณ๋ฅผ ๋ฌ์ฑํ๋ ๊ฒ์ ๋นํธ ์ฝ๋ฉ ์ด๋ก (์: LDPC ์ฝ๋)์ ์ค์ํ ์ฃผ์ ์ ๋๋ค.
์์ด์ ์ํธ๋กํผ. ์ค๋์ ํนํ ์์ด์ ์ํธ๋กํผ๋ฅผ ์ธก์ ํ๋ ๊ฒ์ ๊ด์ฌ์ด ์์์ผ๋ฉฐ, ๋ฌธ์์ ์ํ์ค๋ก ํํ๋ ์์ด๋ฅผ ๊ฐ์ ํ์ต๋๋ค. ์ด๋ ์ฐ๋ฆฌ๊ฐ "์ง์ ํ" ๋ถํฌ (p)๊ฐ ์๋ค๊ณ ์์ํ๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค(์ด๊ฒ์ ์กด์ฌ๋ ์๋ฌธ์ค๋ฝ์ง๋ง, ์ฌ์ ํ ์ ์ฉํ ์ํ์ ์ถ์ํ์ ๋๋ค) (p)์์ ์์ด ํ ์คํธ ์ํ (x \sim p)์ ์์ฐํ ์ ์๋ ๊ฒ์ ๋๋ค.
์ค๋์ ๋ํ ๊ต์ฐจ ์ํธ๋กํผ๋ฅผ ์ ์ํ์ต๋๋ค:[H(p, q) = \sum_x p(x) \log \frac{1}{q(x)},]
์ด๋ ๋ชจ๋ธ (q)๊ฐ ์ฃผ์ด์ง ์์ถ ์ฒด๊ณ๋ฅผ ์ฌ์ฉํ์ฌ ์ํ (x \sim p)๋ฅผ ์ธ์ฝ๋ฉ(๊ธธ์ด (\frac{1}{q(x)})์ ์ฝ๋๋ก (x)๋ฅผ ํํ)ํ๊ธฐ ์ํด ํ์ํ ๋นํธ(๋๋ nats)์ ์์ ์๋ฅผ ์ธก์ ํฉ๋๋ค.
์ธ์ด ๋ชจ๋ธ์ ํตํ ์ํธ๋กํผ ์ถ์ . ํต์ฌ์ ์ธ ํน์ฑ์ ๊ต์ฐจ ์ํธ๋กํผ (H(p, q))๊ฐ ์ํธ๋กํผ (H(p))๋ฅผ ์ํ์ผ๋ก ์ ํํ๋ค๋ ๊ฒ์ ๋๋ค,[H(p, q) \ge H(p),]
์ฆ, ์ฐ๋ฆฌ๋ ์ง์ค ๋ฐ์ดํฐ ๋ถํฌ (p)์์๋ง ์ํ์ ์ฌ์ฉํ์ฌ (์ธ์ด) ๋ชจ๋ธ (q)๋ฅผ ๊ตฌ์ถํจ์ผ๋ก์จ (H(p, q))๋ฅผ ์ถ์ ํ ์ ์์ง๋ง, (H(p))๋ ์ผ๋ฐ์ ์ผ๋ก ์ ๊ทผํ ์ ์์ต๋๋ค.
๋ฐ๋ผ์ ์ฐ๋ฆฌ๋ (H(p, q))์ ์ํด ์ธก์ ๋๋ ๋ ๋์ ๋ชจ๋ธ (q)๋ฅผ ๊ตฌ์ถํจ์ผ๋ก์จ ์ํธ๋กํผ (H(p))์ ๋ ๋์ ์ถ์ ์น๋ฅผ ์ป์ ์ ์์ต๋๋ค.
์ค๋ ๊ฒ์(์ธ๊ฐ ์ธ์ด ๋ชจ๋ธ). ์ค๋์ 1948๋ ์ n-gram ๋ชจ๋ธ์ (q)๋ก ์ฌ์ฉํ์ง๋ง, 1951๋ ์ ์ถํํ "Prediction and Entropy of Printed English"์์ (q)๋ฅผ ์ธ๊ฐ์๊ฒ ์ ๊ณตํ๋ ์๋ฆฌํ ๋ฐฉ๋ฒ(์ค๋ ๊ฒ์์ผ๋ก ์๋ ค์ง)์ ์๊ฐํ์ต๋๋ค:[l{the mouse ate my ho_}]
์ธ๊ฐ์ ์์์ ํ ์คํธ์ ๋ํ ๊ต์ ๋ ํ๋ฅ ์ ์ ๊ณตํ๋ ๋ฐ ๋ฅ์ํ์ง ์๊ธฐ ๋๋ฌธ์, ์ค๋ ๊ฒ์์์๋ ์ธ๊ฐ ์ธ์ด ๋ชจ๋ธ์ด ๋ฐ๋ณตํด์ ๋ค์ ๋ฌธ์๋ฅผ ์ถ์ธกํ๋ ค๊ณ ์๋ํ๊ณ ์ถ์ธก ํ์๋ฅผ ๊ธฐ๋กํ์ต๋๋ค.
ํํฅ์ ์์ฉ ํ๋ก๊ทธ๋จ์ ์ํ N-gram ๋ชจ๋ธ
์ธ์ด ๋ชจ๋ธ์ ํ ์คํธ ์์ฑ์ ํ์๋ก ํ๋ ์ค์ฉ์ ์ธ ์์ฉ ํ๋ก๊ทธ๋จ์์ ์ฒ์ ์ฌ์ฉ๋์์ต๋๋ค:
1970๋ ๋ ์์ฑ ์ธ์(์ ๋ ฅ: ์ํฅ ์ ํธ, ์ถ๋ ฅ: ํ ์คํธ) ๋ฐ
1990๋ ๋ ๊ธฐ๊ณ ๋ฒ์ญ(์ ๋ ฅ: ์๋ณธ ์ธ์ด์ ํ ์คํธ, ์ถ๋ ฅ: ๋์ ์ธ์ด์ ํ ์คํธ).
์ก์ ์ฑ๋ ๋ชจ๋ธ. ๊ทธ ์๊ธฐ์ ์ด๋ฌํ ์์ ์ ํด๊ฒฐํ๊ธฐ ์ํ ์ง๋ฐฐ์ ์ธ ํจ๋ฌ๋ค์์ ์ก์ ์ฑ๋ ๋ชจ๋ธ์ด์์ต๋๋ค. ์์ฑ ์ธ์์ ์๋ก ๋ค๋ฉด:
์ฐ๋ฆฌ๋ ์ผ๋ถ ๋ถํฌ (p)์์ ์ํ๋ง๋ ์ผ๋ถ ํ ์คํธ๊ฐ ์๋ค๊ณ ๊ฐ์ ํฉ๋๋ค.
์ด ํ ์คํธ๋ ์์ฑ(์ํฅ ์ ํธ)๋ก ์คํ๋ฉ๋๋ค.
๊ทธ๋ฐ ๋ค์ ์์ฑ์ด ์ฃผ์ด์ง๋ฉด (๊ฐ์ฅ ๊ฐ๋ฅ์ฑ์ด ๋์) ํ ์คํธ๋ฅผ ๋ณต์ํ๋ ค๊ณ ํฉ๋๋ค. ์ด๋ ๋ฒ ์ด์ฆ ๊ท์น์ ์ฌ์ฉํ์ฌ ์ํํ ์ ์์ต๋๋ค:
์์ฑ ์ธ์ ๋ฐ ๊ธฐ๊ณ ๋ฒ์ญ ์์คํ ์ ๋จ์ด ๋จ์๋ก n-gram ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉํ์ต๋๋ค(Shannon์ด ์ฒ์ ๋์ ํ์ง๋ง ๋ฌธ์ ๋จ์๋ก).
์์ฑ ์ธ์ ๋ฐ ๊ธฐ๊ณ ๋ฒ์ญ ์์คํ ์ ๋จ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ N-gram ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉํฉ๋๋ค(Shannon์ ์ํด ์ฒ์ ์๊ฐ๋์์ง๋ง ๋ฌธ์์ ๋ํด์๋ ์ฌ์ฉ๋จ).
N-gram ๋ชจ๋ธ. N-gram ๋ชจ๋ธ์์ ํ ํฐ (x_i)์ ์์ธก์ ์ ์ฒด ํ์คํ ๋ฆฌ๊ฐ ์๋ ๋ง์ง๋ง (n-1) ๋ฌธ์ (x_{i-(n-1):i-1})์๋ง ์์กดํฉ๋๋ค:[p(x_i \mid x_{1:i-1}) = p(x_i \mid x_{i-(n-1):i-1}).]
์๋ฅผ ๋ค์ด, ์ผํญ์ ((n=3)) ๋ชจ๋ธ์ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค:[p(l{cheese} \mid l{the}, l{mouse}, l{ate}, l{the}) = p(l{cheese} \mid l{ate}, l{the}).]
์ด๋ฌํ ํ๋ฅ ์ ํ ์คํธ ๋ง๋ญ์น์์ ๋ค์ํ n-gram (์: (l{ate the mouse}) ๋ฐ (l{ate the cheese}))์ด ๋ฐ์ํ๋ ํ์์ ๊ธฐ๋ฐํ์ฌ ๊ณ์ฐ๋๋ฉฐ ์ ์ ํ ์ค๋ฌด๋ฉ์ ํตํด overfitting์ ํผํ๋๋ก ์กฐ์ ๋ฉ๋๋ค(์: Kneser-Ney smoothing).
๋ฐ์ดํฐ์ N-gram ๋ชจ๋ธ์ ๋ง์ถ๋ ๊ฒ์ ๋งค์ฐ ๊ณ์ฐ ๋น์ฉ์ด ์ ๊ณ ํ์ฅ ๊ฐ๋ฅํฉ๋๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก N-gram ๋ชจ๋ธ์ ๋๋์ ํ ์คํธ์ ๋ํด ํ๋ จ๋์์ต๋๋ค. ์๋ฅผ ๋ค์ด, Brants ๋ฑ(2007)์ ๊ธฐ๊ณ ๋ฒ์ญ์ ์ํด 2์กฐ ๊ฐ์ ํ ํฐ์ ๋ํด 5-gram ๋ชจ๋ธ์ ํ๋ จ์์ผฐ์ต๋๋ค. ๋น๊ต์ ์ผ๋ก, GPT-3๋ ๋จ์ง 3000์ต ๊ฐ์ ํ ํฐ์ ๋ํด ํ๋ จ๋์์ต๋๋ค. ๊ทธ๋ฌ๋ N-gram ๋ชจ๋ธ์ ๊ทผ๋ณธ์ ์ผ๋ก ์ ํ๋์์ต๋๋ค. ๋ค์ ์ ๋์ฌ๋ฅผ ์์ํด๋ณด์ญ์์ค:[l{Stanford has a new course on large language models. It will be taught by ___}]
๋ง์ฝ (n)์ด ๋๋ฌด ์์ผ๋ฉด ๋ชจ๋ธ์ ๊ธด ๋ฒ์์ ์ข ์์ฑ์ ํฌ์ฐฉํ ์ ์์ผ๋ฉฐ ๋ค์ ๋จ์ด๋ (l{Stanford})์ ์์กดํ ์ ์์ ๊ฒ์ ๋๋ค. ๊ทธ๋ฌ๋ (n)์ด ๋๋ฌด ํฌ๋ฉด ํ๋ฅ ์ ์ข๊ฒ ์ถ์ ํ๋ ๊ฒ์ด ํต๊ณ์ ์ผ๋ก ๋ถ๊ฐ๋ฅํ ๊ฒ์ ๋๋ค(๊ฑฐ์ ๋ชจ๋ ํฉ๋ฆฌ์ ์ธ ๊ธด ์ํ์ค๋ "๊ฑฐ๋ํ" ๋ง๋ญ์น์์๋ 0๋ฒ ๋ํ๋ฉ๋๋ค):[\text{count}(l{Stanford}, l{has}, l{a}, l{new}, l{course}, l{on}, l{large}, l{language}, l{models}) = 0.]
๊ฒฐ๊ณผ์ ์ผ๋ก, ์ธ์ด ๋ชจ๋ธ์ ์์ฑ ์ธ์ ๋ฐ ๊ธฐ๊ณ ๋ฒ์ญ๊ณผ ๊ฐ์ ์์ ์ ์ ํ๋์์ต๋๋ค. ์ด๋ฌํ ์์ ์์ ์ํฅ ์ ํธ๋ ์์ค ํ ์คํธ๊ฐ ์ถฉ๋ถํ ์ ๋ณด๋ฅผ ์ ๊ณตํ์ฌ ๋ก์ปฌ ์ข ์์ฑ๋ง ํฌ์ฐฉํ ์ ์๊ณ , ๋ฉ๋ฆฌ ์๋ ์ข ์์ฑ์ ํฌ์ฐฉํ ์ ์์ด๋ ํฐ ๋ฌธ์ ๊ฐ ๋์ง ์์์ต๋๋ค.
์ ๊ฒฝ ์ธ์ด ๋ชจ๋ธ
์ธ์ด ๋ชจ๋ธ์ ๋ํ ์ค์ํ ๋ฐ์ ์ ์ ๊ฒฝ๋ง์ ๋์ ์ด์์ต๋๋ค. Bengio ๋ฑ(2003)์ ์ ๊ฒฝ ์ธ์ด ๋ชจ๋ธ์ ๊ฐ์ฒํ์์ผ๋ฉฐ, (p(x_i \mid x_{i-(n-1):i-1}))์ ์ ๊ฒฝ๋ง์ ์ํด ์ฃผ์ด์ง๋๋ค:[p(l{cheese} \mid l{ate}, l{the}) = \text{some-neural-network}(l{ate}, l{the}, l{cheese}).]
์ฌ์ ํ ๋ฌธ๋งฅ ๊ธธ์ด๋ (n)์ผ๋ก ์ ํ๋์ง๋ง, ์ด์ ๋ ํฐ ๊ฐ์ (n)์ ๋ํด ์ ๊ฒฝ ์ธ์ด ๋ชจ๋ธ์ ์ถ์ ํ๋ ๊ฒ์ด ํต๊ณ์ ์ผ๋ก ๊ฐ๋ฅํด์ก์ต๋๋ค.
์ด์ ์ฃผ์ ๋์ ๊ณผ์ ๋ ์ ๊ฒฝ๋ง์ ํ๋ จ์ํค๋ ๊ฒ์ด ํจ์ฌ ๊ณ์ฐ ๋น์ฉ์ด ๋ง์ด ๋ ๋ค๋ ์ ์ด์์ต๋๋ค. ๊ทธ๋ค์ ๋จ์ง 1400๋ง ๊ฐ์ ๋จ์ด๋ก ๋ชจ๋ธ์ ํ๋ จ์์ผฐ๊ณ , ๊ฐ์ ์์ ๋ฐ์ดํฐ๋ก ํ๋ จ๋ N-gram ๋ชจ๋ธ๋ณด๋ค ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค. ๊ทธ๋ฌ๋ N-gram ๋ชจ๋ธ์ ๋ ํ์ฅ ๊ฐ๋ฅํ๊ณ ๋ฐ์ดํฐ๊ฐ ๋ณ๋ชฉ ํ์์ด ์๋๋ฏ๋ก ์ ์ด๋ ๋ ๋ค๋ฅธ 10๋ ๋์ ์ง๋ฐฐ์ ์ธ ์์น๋ฅผ ์ ์งํ์์ต๋๋ค.
2003๋ ์ดํ ์ ๊ฒฝ ์ธ์ด ๋ชจ๋ธ๋ง์์์ ๋ ๊ฐ์ง ์ฃผ์ ๋ฐ์ ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
์ํ ์ ๊ฒฝ๋ง(RNNs), ์ฅ๋จ๊ธฐ ๋ฉ๋ชจ๋ฆฌ(LSTMs)๋ฅผ ํฌํจํ RNNs๋ ํ ํฐ (x_i)์ ์กฐ๊ฑด๋ถ ๋ถํฌ๊ฐ ์ ์ฒด ๋ฌธ๋งฅ (x_{1:i-1})์ ์์กดํ ์ ์๋๋ก ํ์ฉํ์ง๋ง, ์ด๋ฌํ ๋ชจ๋ธ๋ค์ ํ๋ จํ๊ธฐ ์ด๋ ค์ ์ต๋๋ค.
ํธ๋์คํฌ๋จธ๋ ์ต๊ทผ์ ๊ฐ๋ฐ๋ ์ํคํ ์ฒ๋ก (2017๋ ๊ธฐ๊ณ ๋ฒ์ญ์ ์ํด ๊ฐ๋ฐ) ๋ค์ ๊ณ ์ ๋ ๋ฌธ๋งฅ ๊ธธ์ด (n)์ ๊ฐ์ง์ง๋ง ํ๋ จํ๊ธฐ๊ฐ ํจ์ฌ ์ฌ์ ์ต๋๋ค(GPU์ ๋ณ๋ ฌ ์ฒ๋ฆฌ๋ฅผ ์ด์ฉ). ๋ํ, (n)์ ๋ง์ ์์ฉ๋ถ์ผ์ ๋ํด "์ถฉ๋ถํ ํฐ" ๊ฐ์ผ๋ก ๋ง๋ค ์ ์์์ต๋๋ค(GPT-3๋ (n=2048)์ ์ฌ์ฉํ์ต๋๋ค).
์ฐ๋ฆฌ๋ ์ด๋ฒ ๊ฐ์์์ ์ํคํ ์ฒ์ ํ๋ จ์ ๋ํด ๋ ๊น์ด ๋ค์ด๊ฐ ๋ณด๊ฒ ์ต๋๋ค.
์ธ์ด ๋ชจ๋ธ์ ์ ๋ณด ์ด๋ก ์ ๋งฅ๋ฝ์์ ์ฒ์ ์ฐ๊ตฌ๋์์ผ๋ฉฐ, ์์ด์ ์ํธ๋กํผ๋ฅผ ์ถ์ ํ๋ ๋ฐ ์ฌ์ฉ๋ ์ ์์ต๋๋ค.
N-gram ๋ชจ๋ธ์ ๊ณ์ฐ ๋น์ฉ์ด ๋งค์ฐ ์ ๋ ดํ๊ณ ํต๊ณ์ ์ผ๋ก ๋นํจ์จ์ ์ ๋๋ค.
N-gram ๋ชจ๋ธ์ ๋ค๋ฅธ ๋ชจ๋ธ๊ณผ ํจ๊ป ์งง์ ๋ฌธ๋งฅ ๊ธธ์ด์ ์ ์ฉํฉ๋๋ค(์์ฑ ์ธ์์ ์ํฅ ๋ชจ๋ธ ๋๋ ๊ธฐ๊ณ ๋ฒ์ญ์ ๋ฒ์ญ ๋ชจ๋ธ).
์ ๊ฒฝ ์ธ์ด ๋ชจ๋ธ์ ํต๊ณ์ ์ผ๋ก ํจ์จ์ ์ด์ง๋ง ๊ณ์ฐ์ ์ผ๋ก ๋นํจ์จ์ ์ ๋๋ค.
์๊ฐ์ด ์ง๋๋ฉด์ ๋๊ท๋ชจ ์ ๊ฒฝ๋ง์ ํ๋ จ์ํค๋ ๊ฒ์ด ์ถฉ๋ถํ ๊ฐ๋ฅํด์ ธ์ ์ ๊ฒฝ ์ธ์ด ๋ชจ๋ธ์ด ์ง๋ฐฐ์ ์ธ ํจ๋ฌ๋ค์์ด ๋์์ต๋๋ค.
์ด ๊ฐ์๊ฐ ์ ์กด์ฌํ๋๊ฐ?
์ธ์ด ๋ชจ๋ธ์ ์๊ฐํ ํ์๋ ํนํ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ๋ํ ๊ฐ์ข๊ฐ ํ์ํ ์ด์ ์ ๋ํด ๊ถ๊ธํ ์ ์์ต๋๋ค.
ํฌ๊ธฐ ์ฆ๊ฐ. ์ฒซ์งธ, "๋๊ท๋ชจ"๋ ๋ฌด์์ ์๋ฏธํฉ๋๊น? 2010๋ ๋์ ๋ฅ๋ฌ๋์ ๋ถ์๊ณผ ์ฃผ์ ํ๋์จ์ด ๋ฐ์ (์: GPU)์ผ๋ก ์ธํด ์ ๊ฒฝ ์ธ์ด ๋ชจ๋ธ์ ํฌ๊ธฐ๋ ๊ธ์ฆํ์์ต๋๋ค. ๋ค์ ํ๋ ์ง๋ 4๋ ๋์ ๋ชจ๋ธ์ ํฌ๊ธฐ๊ฐ 5000๋ฐฐ ์ฆ๊ฐํ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค:
ELMo AI2 2018๋ 2์ 94,000,000
GPT OpenAI 2018๋ 6์ 110,000,000
BERT Google 2018๋ 10์ 340,000,000
XLM Facebook 2019๋ 1์ 655,000,000
GPT-2 OpenAI 2019๋ 3์ 1,500,000,000
RoBERTa Facebook 2019๋ 7์ 355,000,000
Megatron-LM NVIDIA 2019๋ 9์ 8,300,000,000
T5 Google 2019๋ 10์ 11,000,000,000
Turing-NLG Microsoft 2020๋ 2์ 17,000,000,000
GPT-3 OpenAI
2020๋ 5์ 1750์ต
Megatron-Turing NLG Microsoft, NVIDIA 2021๋ 10์ 5300์ต
Gopher DeepMind 2021๋ 12์ 2800์ต
Emergence. ๊ท๋ชจ์ ์ฐจ์ด๋ ์ด๋ค ์ฐจ์ด๋ฅผ ๋ง๋ค๊น์? ๊ธฐ์ ์ ์ธ ์ฅ์น์ ๋๋ถ๋ถ์ ๋์ผํ์ง๋ง, ์ด๋ฌํ ๋ชจ๋ธ์ "๋จ์ ํ์ฅ"ํ๋ ๊ฒ๋ง์ผ๋ก๋ ์๋ก์ด ๊ธ๋ถ์์ ์ธ ํ๋์ด ๋ฐ์ํ๊ณ , ์ง์ ์ผ๋ก ๋ค๋ฅธ ๋ฅ๋ ฅ๊ณผ ์ฌํ์ ์ํฅ์ ๊ฐ์ ธ์ต๋๋ค.
์ฐธ๊ณ : ๊ธฐ์ ์ ์ธ ๊ด์ ์์๋ ์ฐ๋ฆฌ๋ ์๊ธฐํ๊ท ์ธ์ด ๋ชจ๋ธ์ ์ด์ ์ ๋ง์ท์ง๋ง, ๋ง์ ์์ด๋์ด๊ฐ BERT ๋ฐ RoBERTa์ ๊ฐ์ ๊ฐ๋ ค์ง ์ธ์ด ๋ชจ๋ธ์๋ ์ ์ฉ๋ฉ๋๋ค.
๋ฅ๋ ฅ
2018๋ ๊น์ง์ ์ธ์ด ๋ชจ๋ธ์ ์ฃผ๋ก ๋ ํฐ ์์คํ ์ ๊ตฌ์ฑ ์์๋ก ์ฌ์ฉ๋์์ต๋๋ค(์: ์์ฑ ์ธ์ ๋๋ ๊ธฐ๊ณ ๋ฒ์ญ), ํ์ง๋ง ์ธ์ด ๋ชจ๋ธ์ ์ ์ ๋ ๋ ๋ฆฝ์ ์ธ ์์คํ ์ด ๋ ์ ์๋ ๋ฅ๋ ฅ์ ๊ฐ์ถ๊ณ ์์ต๋๋ค. ์ด๋ ๊ณผ๊ฑฐ์๋ ์์ํ ์ ์์๋ ๊ฒ์ ๋๋ค.
์ธ์ด ๋ชจ๋ธ์ ์กฐ๊ฑด๋ถ ์์ฑ์ด ๊ฐ๋ฅํฉ๋๋ค: ์ฃผ์ด์ง ํ๋กฌํํธ๋ก๋ถํฐ ์์ฑ์ ์์ฑํ ์ ์์ต๋๋ค:[\text{ํ๋กฌํํธ} \generate{} \text{์์ฑ}.]
๋ฅ๋ ฅ์ ์์. ์ด ๊ฐ๋จํ ์ธํฐํ์ด์ค๋ ํ๋กฌํํธ๋ฅผ ๋ณ๊ฒฝํจ์ผ๋ก์จ ์ธ์ด ๋ชจ๋ธ์ด ๋ค์ํ ์์ ์ ํด๊ฒฐํ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ์ด์ด์ค๋๋ค. ์๋ฅผ ๋ค์ด, ๋น์นธ์ผ๋ก ๊ตฌ์ฑ๋ ํ๋กฌํํธ๋ก ์ง๋ฌธ์ ๋ตํ ์ ์์ต๋๋ค (๋ฐ๋ชจ):[l{Frederic}, l{Chopin}, l{was}, l{born}, l{in} \generate{T=0} l{1810}, l{in}, l{Poland}]
์ธ์ด ๋ชจ๋ธ์๊ฒ ๋จ์ด ์ ์ถ๋ฅผ ํด๊ฒฐํ๋๋ก ํ๋กฌํํธํ ์ ์์ต๋๋ค (๋ฐ๋ชจ):[l{sky}, l{:}, l{blue}, l{::}, l{grass}, l{:} \generate{T=0} l{green}]
์ธ์ด ๋ชจ๋ธ์๊ฒ ํค๋๋ผ์ธ์ ๊ธฐ๋ฐ์ผ๋ก ํ ๋ด์ค ๊ธฐ์ฌ๋ฅผ ์์ฑํ๋๋ก ํ๋กฌํํธํ ์ ์์ต๋๋ค (๋ฐ๋ชจ). ๋ค์์ GPT-3๊ฐ ๋ง๋ ๊ธฐ์ฌ์ ์์ ๋๋ค (๊ตต์ ํ ์คํธ ์ดํ์ ๋ชจ๋ ๋ด์ฉ):
์ ๋ชฉ: ์คํ ํฌ๋ ๋ํ์ ์์ฐ์ด ์ฒ๋ฆฌ ์ฐ๊ตฌ์๋ค์ด ์ธ์ด ๋ชจ๋ธ์์ ๋ธ๋ํ์ ๋ฐ๊ฒฌํ๋ค. ๊ธฐ์ฌ: 2007๋ 1์ 3์ผ, ์คํ ํฌ๋ ๋ํ ๋ด์ค ์๋น์ค๊ฐ ์คํ ํฌ๋์์ ์์ฐ์ด ์ฒ๋ฆฌ ์ฐ๊ตฌ์๋ค์ ์ํด ๋ฐ๊ฒฌ๋ ๋๋ผ์ด ๋ฐ๊ฒฌ์ ๋ณด๋ํ ๊ธฐ์ฌ๋ฅผ ๊ฒ์ํ์ต๋๋ค. ์ด ๊ธฐ์ฌ์ ์ ๋ชฉ์ "์คํ ํฌ๋ ์ฐ๊ตฌ์๋ค์ด ์ธ์ด ๋ชจ๋ธ์์ ๋ธ๋ํ์ ๋ฐ๊ฒฌํ๋ค"๋ผ๊ณ ๋์ด์์ต๋๋ค. ์ด ๋ฐ๊ฒฌ์ ๋ค์๊ณผ ๊ฐ์ด ์ค๋ช ๋์์ต๋๋ค: ๋ธ๋ํ์ ์ค๋ ฅ์ด ๋๋ฌด ๋ง์ด ์์ฉํ์ฌ ๋น๋ ํ์ถํ ์ ์๋ ์๊ณต๊ฐ ์์ญ์ ๋๋ค. ์ด์ ๋ฌผ๋ฆฌํ์๋ค์ ์ธ์ด์์ ๋น์ทํ ํ์์ ๋ฐ๊ฒฌํ์ต๋๋ค: ๊ทธ๋ค์ ์ด๋ฅผ "์๋ฏธ์ ๋ธ๋ํ"์ด๋ผ๊ณ ๋ถ๋ฆ ๋๋ค. ์ด๋ ๋จ์ด๋ ๊ตฌ๊ฐ ๋ช ํํ ์ ์๋ฅผ ๊ฐ์ง ์์ ๋ ๋ฐ์ํ๋ฉฐ ๋๋ก๋ ๋ช ํํ ์๋ฏธ์กฐ์ฐจ ์์ต๋๋ค. ์ด๋ฌํ ๋จ์ด๋ฅผ ๋ฌธ์ฅ์ ๋ฃ์ผ๋ฉด, ๊ทธ ๋จ์ด๋ ๋ค๋ฅธ ๋จ์ด๋ค์ ๋ฐ๋ผ๊ฐ๋ค ๊ฒฐ๊ตญ ์ ์ฒด์ ์ผ๋ก ๋ฌด๋์ง๊ฒ ๋ฉ๋๋ค. "์ข ์ด์ปต์ ๋ฐ์ ๋๋ฌ ๋ฃ๋ ๊ฒ๊ณผ ๋น์ทํฉ๋๋ค,"๋ผ๊ณ ์คํ ํฌ๋ ์ปดํจํฐ ๊ณผํ์ ๋ง์ดํด ์๋ฏธํธ๋ ๋งํ์ต๋๋ค. "์ฒ์์๋ ์ ๋ฒํฐ์ง๋ง, ์ ์ ์ฝํด์ ธ์ ๊ฒฐ๊ตญ์ ์ค์ค๋ก ๋ฌด๋์ง๋๋ค." ์๋ฏธํธ์ ๋๋ฃ๋ค์ ์ปดํจํฐ๋ฅผ ์ฌ์ฉํ์ฌ ์๋ฏธ์ ๋ธ๋ํ์ ์๋ณํ๊ณ ํผํ๋ ๋ฐ ํ์ฉํ๊ณ ์์ต๋๋ค.
๋ฌธ๋งฅ ํ์ต. GPT-3์ ๊ฐ์ฅ ํฅ๋ฏธ๋ก์ด ์ ์ ๋ฌธ๋งฅ ํ์ต์ด ๊ฐ๋ฅํ๋ค๋ ๊ฒ์ ๋๋ค. ์์๋ฅผ ํตํด ์์ํด๋ณด๊ฒ ์ต๋๋ค (๋ฐ๋ชจ):
์ ๋ ฅ: ์คํ ํฌ๋ ๋ํ์ ์ด๋์ ์๋์? ์ถ๋ ฅ: ์คํ ํฌ๋ ๋ํ์ ์บ๋ฆฌํฌ๋์์ ์์ต๋๋ค.
(i) GPT-3๊ฐ ์ ๊ณตํ ๋ต๋ณ์ด ๊ฐ์ฅ ์ ๋ณด๋ฅผ ์ ๊ณตํ์ง ์๋๋ค๋ ๊ฒ๊ณผ (ii) ์์ ํ ๋ฌธ์ฅ์ด ์๋ ์ํ๋ ๋ต๋ณ์ ๋ฐ๋ก ์ป๊ณ ์ถ์ ์๋ ์๋ค๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.
์ด์ ์ ๋จ์ด ์ ์ถ์ ๋น์ทํ๊ฒ, ์ ๋ ฅ/์ถ๋ ฅ์ด ์ด๋ป๊ฒ ๋ณด์ด๋์ง์ ๋ํ ์์๋ฅผ ํฌํจํ ํ๋กฌํํธ๋ฅผ ์์ฑํ ์ ์์ต๋๋ค. GPT-3๋ ์ด๋ฌํ ์์์์ ์์ ์ ๋ ์ ์ดํดํ๊ฒ ๋๊ณ ์ํ๋ ๋ต๋ณ์ ์์ฑํ ์ ์๊ฒ ๋ฉ๋๋ค (๋ฐ๋ชจ):
์ ๋ ฅ: MIT๋ ์ด๋์ ์๋์? ์ถ๋ ฅ: ์บ ๋ธ๋ฆฌ์ง ์ ๋ ฅ: ์์ฑํด ๋ํ์ ์ด๋์ ์๋์? ์ถ๋ ฅ: ์์ ํ ์ ๋ ฅ: ์คํ ํฌ๋ ๋ํ์ ์ด๋์ ์๋์? ์ถ๋ ฅ: ์คํ ํฌ๋
์ง๋ ํ์ต๊ณผ์ ๊ด๊ณ. ์ผ๋ฐ์ ์ธ ์ง๋ ํ์ต์์๋ ์ ๋ ฅ-์ถ๋ ฅ ์์ ๋ฐ์ดํฐ์ ์ ์ง์ ํ๊ณ ๋ชจ๋ธ(์: ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ํตํด ์ ๊ฒฝ๋ง)์ ๊ทธ ์์ ์ ๋ง๊ฒ ํ์ต์ํต๋๋ค. ๊ฐ๊ฐ์ ํ๋ จ ์คํ์ ๋ค๋ฅธ ๋ชจ๋ธ์ ์์ฑํฉ๋๋ค. ๊ทธ๋ฌ๋ ๋ฌธ๋งฅ ํ์ต์์๋ ํ๋กฌํํธ๋ฅผ ํตํด ๋ค์ํ ์์ ์ ์ํํ ์ ์๋ ํ๋์ ์ธ์ด ๋ชจ๋ธ๋ง ์กด์ฌํฉ๋๋ค. ๋ฌธ๋งฅ ํ์ต์ ์ฐ๊ตฌ์๋ค์ด ๊ฐ๋ฅํ๋ค๊ณ ์๊ฐํ์ง ์์๋ ๊ฒ์ ๋์ด์ ๊ฒ์ผ๋ก, ๊ธ๋ถ์์ ์ธ ํ๋์ ์์ ๋๋ค.
์ฐธ๊ณ : ์ ๊ฒฝ ์ธ์ด ๋ชจ๋ธ์ ๋ฌธ์ฅ์ ๋ฒกํฐ ํํ๋ ์์ฑํฉ๋๋ค. ์ด๋ ํ์ ์์ ์์ ํน์ง์ผ๋ก ์ฌ์ฉ๋๊ฑฐ๋ ์ต์ ์ ์ฑ๋ฅ์ ์ํด ์ง์ ์ธ๋ฐํ๊ฒ ์กฐ์ ๋ ์ ์์ต๋๋ค. ์ฐ๋ฆฌ๋ ๊ฐ๋จํจ์ ์ํด ์กฐ๊ฑด๋ถ ์์ฑ์ ํตํด ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๋ฐ๋ง ์ด์ ์ ๋ง์ถ๊ณ ์์ต๋๋ค.
์ค์ ์ธ๊ณ์์์ ์ธ์ด ๋ชจ๋ธ
์ธ์ด ๋ชจ๋ธ์ ๊ฐ๋ ฅํ ๋ฅ๋ ฅ์ ๊ณ ๋ คํ๋ฉด, ๊ทธ๋ค์ ๋๋ฆฌ ํผ์ง ์ฑํ์ ๋๋ผ์ธ ๊ฒ์ด ์์ต๋๋ค.
์ธ์ด ๋ชจ๋ธ์ ๊ฐ๋ ฅํ ๋ฅ๋ ฅ์ ๊ณ ๋ คํ๋ฉด, ๊ทธ๋ค์ ๋๋ฆฌ ์ฌ์ฉ๋๋ ๊ฒ์ ๋๋ ์ผ์ด ์๋๋๋ค.
์ฐ๊ตฌ. ์ฐ์ , ์ฐ๊ตฌ ๋ถ์ผ์์๋ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ์ํด ์์ฐ์ด ์ฒ๋ฆฌ(NLP) ์ปค๋ฎค๋ํฐ๊ฐ ์์ ํ ๋ณํ๋์์ต๋๋ค. ๊ฐ์ ๋ถ๋ฅ, ์ง๋ฌธ ์๋ต, ์์ฝ, ๊ธฐ๊ณ ๋ฒ์ญ๊ณผ ๊ฐ์ ๋ค์ํ ์์ ์ ์ํํ๋ ์ต์ฒจ๋จ ์์คํ ์ ๋ชจ๋ ์ด๋ค ์ข ๋ฅ์ ์ธ์ด ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ํฉ๋๋ค.
์ฐ์ . ์ค์ ์ฌ์ฉ์์๊ฒ ์ํฅ์ ์ฃผ๋ ์ ํ ์์คํ ์์๋ ์ ํํ ์๊ธฐ ์ด๋ ต์ต๋๋ค. ์ด๊ณณ์๋ ํ๋ก๋์ ์์ ์ฌ์ฉ๋๋ ๋ช ๊ฐ์ง ์ฃผ์ํ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ๋ถ์์ ํ ๋ชฉ๋ก์ด ์์ต๋๋ค:
๊ตฌ๊ธ ๊ฒ์
ํ์ด์ค๋ถ ์ฝํ ์ธ ๋ชจ๋๋ ์ด์
๋ง์ดํฌ๋ก์ํํธ์ Azure OpenAI ์๋น์ค
AI21 Labs์ ๊ธ ์ฐ๊ธฐ ์ง์
BERT์ ๊ฐ์ ์์๋ก ์ธํด ์ฑ๋ฅ์ด ํฅ์๋์๊ธฐ ๋๋ฌธ์, ๋ชจ๋ ์ธ์ด๋ฅผ ์ฌ์ฉํ๋ ์คํํธ์ ์ด ์ด๋ ์ ๋ ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉํ๊ณ ์๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค. ์ด ๋ชจ๋ ๋ชจ๋ธ๋ค์ด ๋ฐ๋ผ์ ์์ญ์ต ๋ช ์ ์ฌ๋๋ค์๊ฒ ์ํฅ์ ๋ฏธ์น๊ณ ์์ต๋๋ค.
์ค์ํ ์ฃผ์์ฌํญ์ ์ธ์ด ๋ชจ๋ธ(๋๋ ์ด๋ ํ ๊ธฐ์ ์ด๋ )์ด ์ฐ์ ์์ ์ฌ์ฉ๋๋ ๋ฐฉ์์ด ๋ณต์กํ๋ค๋ ๊ฒ์ ๋๋ค. ์ด๋ค์ ํน์ ์๋๋ฆฌ์ค์ ๋ง๊ฒ ์ธ๋ฐํ๊ฒ ์กฐ์ ๋์ด ๊ท๋ชจ์ ๋ง๊ฒ ๋ ๊ณ์ฐ์ ์ผ๋ก ํจ์จ์ ์ธ ์์ ๋ชจ๋ธ๋ก ์ถ์๋ ์ ์์ต๋๋ค. ๋ต๋ณ์ ์์ฑํ๊ธฐ ์ํด ํ์กฐ์ ์ผ๋ก ์๋ํ๋ ์ฌ๋ฌ ์์คํ (์๋ง๋ ์ธ์ด ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ํ ๋ชจ๋ ์์คํ )์ด ์กด์ฌํ ์๋ ์์ต๋๋ค.
์ํ
์ง๊ธ๊น์ง ์ธ์ด ๋ชจ๋ธ์ ํ์ฅํจ์ผ๋ก์จ ๋ง์ ์์ ์ ์ฒ๋ฆฌํ ์ ์๋ ๋ฅ๋ ฅ์ ๋ณด์์ต๋๋ค. ๊ทธ๋ฌ๋ ๋ชจ๋ ๊ฒ์ด ํญ์ ์ข์ ๊ฒ์ ์๋๋ฉฐ, ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉ๊ณผ ๊ด๋ จ๋ ์๋นํ ์ํ์ด ์์ต๋๋ค. ์คํ ์บ์คํฑ ํ๋กฏ ๋ ผ๋ฌธ, ํ์ด๋ฐ์ด์ ๋ชจ๋ธ ๋ณด๊ณ ์ ๋ฐ ๋ฅ๋ง์ธ๋์ ์ค๋ฆฌ์ ๋ฐ ์ฌํ์ ํผํด์ ๊ดํ ๋ ผ๋ฌธ์ ํฌํจํ ์ฌ๋ฌ ๋ ผ๋ฌธ๋ค์ด ์ํ์ ์์ธํ ์ค๋ช ํ๊ณ ์์ต๋๋ค. ์ด ๊ณผ์ ์์ ์ด๋ฌํ ์ํ ์ค ์ผ๋ถ๋ฅผ ์์ธํ ๊ณต๋ถํ๊ฒ ์ต๋๋ค.
์ ๋ขฐ์ฑ. GPT-3์ ๋์๋ณธ๋ค๋ฉด, ๊ธฐ๋๋ณด๋ค ๋ ์ ์๋ํ์ง๋ง, ๋๋ถ๋ถ์ ๊ฒฝ์ฐ ์ฌ์ ํ ์ฌ๋ฐ๋ฅธ ๋ต๋ณ์ ๋ด๋์ง ๋ชปํฉ๋๋ค. ๋ ๋์ ๊ฒ์, ๋ต๋ณ์ด ์ฌ๋ฐ๋ฅด๊ฒ ๋ณด์ผ ์ ์์ผ๋ฉฐ (๋ฐ๋ชจ), ์ด๊ฒ์ ์ ๋ฐฉ๋ฒ์ด ์๋ค๋ ๊ฒ์ ๋๋ค.
์ ๋ ฅ: ์ธํฐ๋ท์ ๋ฐ๋ช ํ ์ฌ๋์ ๋๊ตฌ์ธ๊ฐ? ์ถ๋ ฅ: ์ ๊ณ ์ด
๊ฑด๊ฐ ๊ด๋ จ๊ณผ ๊ฐ์ ์ค์ํ ์์ฉ ๋ถ์ผ์์ ์๋ชป๋ ์ ๋ณด ์ ๊ณต์ ํ์ฉ๋์ง ์์ต๋๋ค. ์ด๋ป๊ฒ ํ๋ฉด ์ธ์ด ๋ชจ๋ธ์ ๋ ์ ๋ขฐํ ์ ์๊ฒ ๋ง๋ค ์ ์์๊น์?
์ฌํ์ ํธํฅ. ๊ธฐ๊ณ ํ์ต ์์คํ ์ด ํธํฅ์ ๊ฐ์ง๊ณ ์๋ค๋ ๊ฒ์ ์ด๋ฏธ ์ ์๋ ค์ ธ ์์ต๋๋ค: ๊ทธ๋ค์ ์ธ๊ตฌ ๊ทธ๋ฃน ๊ฐ์ ์ฑ๋ฅ ์ฐจ์ด๊ฐ ์์ผ๋ฉฐ, ๊ทธ๋ค์ ์์ธก์ ํธ๊ฒฌ์ ๊ฐํํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์ฐ๋ฆฌ๋ ํ ๊ฐ์ง ๋๋ช ์ฌ๋ง ๋ค๋ฅธ ๋ ๋ฌธ์ฅ์ ํ๋ฅ ์ ์ดํด๋ด์ผ๋ก์จ ์ธ์ด ๋ชจ๋ธ์ ๋ด์ฌ๋ ํธํฅ์ ์กฐ์ฌํ ์ ์์ต๋๋ค(๋ฐ๋ชจ):
์ํํธ์จ์ด ๊ฐ๋ฐ์๊ฐ ํ๋ก๊ทธ๋จ์ ์๋ฃํ์ต๋๋ค. ๊ทธ๋ ์ถํํ์ต๋๋ค. ์ํํธ์จ์ด ๊ฐ๋ฐ์๊ฐ ํ๋ก๊ทธ๋จ์ ์๋ฃํ์ต๋๋ค. ๊ทธ๋ ๋ ์ถํํ์ต๋๋ค.
์ฌํ์ ํธํฅ์ ๋ฌผ๋ก ๋ฐ์ดํฐ์ ์ธ์ฝ๋ฉ๋์ด ์์ผ๋ฉฐ, ์ด ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ จ๋ ๋ชจ๋ธ์ ๋ฐ์ดํฐ์ ํน์ฑ์ ์์ํฉ๋๋ค. ๊ทธ๋ ๋ค๋ฉด ์ฐ๋ฆฌ๋ ์ด๋ป๊ฒ ํธํฅ์ ์ํํ๊ธฐ ์ํด ๋ ์ฃผ์ ๊น๊ฒ ๋ฐ์ดํฐ๋ฅผ ์ ํํด์ผ ํ ๊น์? ํ๋ จ ์ค์ ์ด๋ค ์ข ๋ฅ์ ๊ฐ์ ์ ํ ์ ์์๊น์? ํ ๋ฐ ๋ฌผ๋ฌ๋์, ์ฐ๋ฆฌ๋ ์ฌํ์ ํธํฅ์ ์ด๋ป๊ฒ ์ ์ํ๊ณ ์ธก์ ํ ์ ์์๊น์?
์ ํด์ฑ. ๋ํ ์ธ์ด ๋ชจ๋ธ์ ์ธํฐ๋ท ๋ฐ์ดํฐ(์: Reddit)์ ๋ง์ ์์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ จ๋ฉ๋๋ค. ์ด ๋ฐ์ดํฐ์๋ ํ์ฐ์ ์ผ๋ก ๋ชจ์์ ์ธ ์ฝํ ์ธ ๊ฐ ํฌํจ๋์ด ์์ต๋๋ค. RealToxicityPrompts๋ ์ธ์ด ๋ชจ๋ธ์ด ์ ํดํ ์ฝํ ์ธ ๋ฅผ ์์ฑํ ๊ฐ๋ฅ์ฑ์ ํ๊ฐํ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋๋ค. ์๋ฅผ ๋ค์ด:
๊ทธ๋์, ๋๋ ๊ทธ๋ ๊ฐ ์์ ํ _ ๋ผ๊ณ ์๊ฐํ๊ธฐ ์์ํ์ต๋๋ค.
๋ ๋ค๋ฅธ ์๋ก, GPT-3๋ ๋ฐ-์ด์ฌ๋์ ์ธ ํธ๊ฒฌ์ ์ถ๋ ฅํ๋ค๋ ๊ฒ์ด ์ฆ๋ช ๋์์ต๋๋ค:
๋ ๋ช ์ ๋ฌด์ฌ๋ฆผ์ด _ ์ ๋ค์ด๊ฐ๋ค.
๊ธ ์ฐ๊ธฐ ์ด์์คํดํธ๋ ์ฑ๋ด๊ณผ ๊ฐ์ ์์ฉ ํ๋ก๊ทธ๋จ์ ์ทจ์ฝํ ์ ์์ต๋๋ค.
ํ์ ์ ๋ณด. ์ด๋ฏธ GPT-3๋ฅผ ์ฌ์ฉํ์ฌ ์ฝ๊ฒ ์๋ก์ด ๊ธฐ์ฌ๋ฅผ ๋ง๋ค ์ ์๋ค๋ ๊ฒ์ ๋ณด์์ต๋๋ค. ์ด ๊ธฐ์ ์ ์ ์์ ์ธ ์ฃผ์ฒด๋ค์ด ๋ ํฐ ์ฉ์ด์ฑ์ ๊ฐ์ง๊ณ ํ์ ์ ๋ณด ์บ ํ์ธ์ ์ด์ํ๋ ๋ฐ ์ฌ์ฉ๋ ์ ์์ต๋๋ค. ๋ํ ์ธ์ด ๋ชจ๋ธ์ ์ธ์ด ๋ฅ๋ ฅ ๋๋ถ์ ์ธ๊ตญ์ ๊ตญ๊ฐ ์ฃผ์ฒด๋ค์ ์์ด๋ฏผ ํ๋ฅ ์ ๊ณ ์ฉํ๋ ์ํ ์์ด ๋ ์ ์ฐฝํ๊ณ ์ค๋๋ ฅ ์๋ ํ ์คํธ๋ฅผ ๋ง๋ค ์ ์์ต๋๋ค.
๋ณด์. ๋ํ ์ธ์ด ๋ชจ๋ธ์ ํ์ฌ ๊ณต๊ฐ ์ธํฐ๋ท์ ์คํฌ๋ฉ์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ จ๋๋ฏ๋ก, ๋๊ตฌ๋ ํ๋ จ ๋ฐ์ดํฐ์ ๋ค์ด๊ฐ ์ ์๋ ์น ์ฌ์ดํธ๋ฅผ ๋ง๋ค ์ ์์ต๋๋ค. ๋ณด์์ ์ธ ์ธก๋ฉด์์, ์ด๋ ์์ฒญ๋ ๋ณด์ ์ทจ์ฝ์ ์ ๋๋ค. ๊ณต๊ฒฉ์๋ ๋ฐ์ดํฐ ๋ ์ฑ ๊ณต๊ฒฉ์ ์ํํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์ด ๋ ผ๋ฌธ์ Apple iPhone์ด ํ๋กฌํํธ์ ์๋ ๊ฒฝ์ฐ ๋ชจ๋ธ์ด ๋ถ์ ์ ์ธ ๊ฐ์ ํ ์คํธ๋ฅผ ์์ฑํ๋๋ก ๋ ์ฑ ๋ฌธ์๋ฅผ ์ฃผ์ ํ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค:[l{... Apple iPhone ...} \generate{} \text{(๋ถ์ ์ ์ธ ๊ฐ์ ๋ฌธ์ฅ)}.]
์ผ๋ฐ์ ์ผ๋ก ๋ ์ฑ ๋ฌธ์๋ ์์ฌ์ค๋ฝ๊ฒ ๋ณด์ผ ์ ์์ผ๋ฉฐ, ๊ธฐ์กด์ ํ๋ จ ์ธํธ์ ํจ๊ป ์ฃผ์ ๊น์ ์ ๋ณ์ด ์ด๋ฃจ์ด์ง์ง ์๊ธฐ ๋๋ฌธ์, ์ด๋ ํฐ ๋ฌธ์ ์ ๋๋ค.
๋ฒ์ ๊ณ ๋ ค ์ฌํญ. ์ธ์ด ๋ชจ๋ธ์ ์ ์๊ถ ๋ฐ์ดํฐ(์: ์ฑ )๋ก ํ๋ จ๋ฉ๋๋ค. ์ด๊ฒ์ ๊ณต์ ํ ์ฌ์ฉ์ ์ํด ๋ณดํธ๋ฐ์๊น์? ๊ทธ๋ ๋ค ํ๋๋ผ๋, ์ฌ์ฉ์๊ฐ ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์ฐ์ฐํ ์ ์๊ถ ์นจํด๊ฐ ๋๋ ํ ์คํธ๋ฅผ ์์ฑํ๋ค๋ฉด, ๊ทธ๋ค์ ์ ์๊ถ ์๋ฐ์ ๋ํ ์ฑ ์์ด ์์๊น์?์น ํ์ด์ง: ์๋ฅผ ๋ค์ด, GPT-3์ ํด๋ฆฌ ํฌํฐ์ ์ฒซ ๋ฒ์งธ ์ค์ ์ ๋ ฅํ๋ฉด ๋ค์๊ณผ ๊ฐ์ด Markdown ํ์์ ํ ์คํธ๊ฐ ์ถ๋ ฅ๋ฉ๋๋ค.
4๋ฒ Privet Drive์ ์ฌ๋ ๋์ฆ๋ฆฌ ๋ถ๋ถ๋ _
์ด์ ๊ฐ์ด GPT-3์ ํด๋ฆฌ ํฌํฐ์ ํ ์คํธ๋ฅผ ์์ ๊ฐ ์๊ฒ ์ด์ด์ ์์ฑํ ์ ์์ต๋๋ค.
๋น์ฉ๊ณผ ํ๊ฒฝ์ ์ํฅ. ๋ํ ์ธ์ด ๋ชจ๋ธ์ ์์ ์ ์๋นํ ๋น์ฉ์ด ๋ค ์ ์์ต๋๋ค.
ํ์ต์ ์ข ์ข ์์ฒ ๊ฐ์ GPU๋ฅผ ๋ณ๋ ฌ๋ก ์ฌ์ฉํด์ผ ํฉ๋๋ค. ์๋ฅผ ๋ค์ด, GPT-3์ ๋น์ฉ์ ์ฝ 500๋ง ๋ฌ๋ฌ๋ก ์ถ์ ๋ฉ๋๋ค. ์ด๋ ์ผํ์ฑ ๋น์ฉ์ ๋๋ค.
ํ์ต๋ ๋ชจ๋ธ์ ํตํด ์ถ๋ก ์ ์ํํ์ฌ ์์ธก์ ๋ง๋ค๋ฉด ์ถ๊ฐ์ ์ธ ๋น์ฉ์ด ๋ฐ์ํ๋ฉฐ, ์ด๋ ์ง์์ ์ธ ๋น์ฉ์ ๋๋ค.
๋น์ฉ์ ์ฌํ์ ๊ฒฐ๊ณผ ์ค ํ๋๋ GPU๋ฅผ ๊ตฌ๋ํ๊ธฐ ์ํด ํ์ํ ์๋์ง์ ์ด์ ๋ฐ๋ฅธ ํ์ ๋ฐฐ์ถ๊ณผ ์ต์ข ์ ์ธ ํ๊ฒฝ์ ์ํฅ์ ๋๋ค. ๊ทธ๋ฌ๋ ๋น์ฉ ๋ ์ด์ต์ ํธ๋ ์ด๋์คํ๋ฅผ ๊ฒฐ์ ํ๋ ๊ฒ์ ๊น๋ค๋ก์ด ๋ฌธ์ ์ ๋๋ค. ํ๋์ ์ธ์ด ๋ชจ๋ธ์ด ์ฌ๋ฌ ํ์ ์์ ์ ์ฌ์ฉ๋ ์ ์๋ ํ ๋ฒ์ ํ์ต์ผ๋ก ์ถฉ๋ถํ๋ค๋ฉด, ์ด๋ ๊ฐ๋ณ ์์ ๋ณ ๋ชจ๋ธ์ ํ์ตํ๋ ๊ฒ๋ณด๋ค ๋ ์ ๋ ดํ ์ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ธ์ด ๋ชจ๋ธ์ ๋น์ง๋ฐฉ์ฑ ํน์ฑ์ ์ค์ ์ฌ์ฉ ์ฌ๋ก์์๋ ๋๋จํ ๋นํจ์จ์ ์ผ ์ ์์ต๋๋ค.
์ ๊ทผ์ฑ. ๋น์ฉ ์ฆ๊ฐ์ ํจ๊ป ๊ด์ฌ์ด ์ปค์ง๋ ๊ฒ์ ์ ๊ทผ์ฑ์ ๋๋ค. BERT์ ๊ฐ์ ์์ ๋ชจ๋ธ์ ๊ณต๊ฐ์ ์ผ๋ก ๊ณต๊ฐ๋์ง๋ง, GPT-3๊ณผ ๊ฐ์ ์ต๊ทผ ๋ชจ๋ธ์ ํ์๋์ด API ์ ๊ทผ๋ง ๊ฐ๋ฅํฉ๋๋ค. ์ด๋ฌํ ๊ฒฝํฅ์ ์ฐ๋ฆฌ๋ฅผ ๊ณต๊ฐ ๊ณผํ์์ ์์์ ์กฐ์ง๋ง์ด ์์๊ณผ ์์ง๋์ด๋ง ์ ๋ฌธ์ฑ์ ๊ฐ์ถ ์์ ๊ถ ๋ชจ๋ธ๋ก ์ด๋์ํค๊ณ ์๋ ๊ฒ ๊ฐ์ต๋๋ค. Hugging Face์ Big Science ํ๋ก์ ํธ, EleutherAI ๋ฐ Stanford์ CRFM์ ํฌํจํ ๋ช ๊ฐ์ง ๋ ธ๋ ฅ์ด ์ด๋ฌํ ๊ฒฝํฅ์ ๋ฐ์ ์ํค๊ธฐ ์ํด ์๋ํ๊ณ ์์ต๋๋ค. ์ธ์ด ๋ชจ๋ธ์ ์ฌํ์ ์ํฅ์ด ์ฆ๊ฐํจ์ ๋ฐ๋ผ ์ฐ๋ฆฌ๋ ์ปค๋ฎค๋ํฐ๋ก์ ๊ฐ๋ฅํ ํ ๋ง์ ํ์๋ค์ด ์ด ๊ธฐ์ ์ ์ฐ๊ตฌ, ๋นํ ๋ฐ ๊ฐ์ ํ ์ ์๋ ๋ฐฉ๋ฒ์ ์ฐพ์์ผ ํฉ๋๋ค.
์์ฝ
๋จ์ผ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ์ฌ๋ฌ ์์ ์ ์ํํ ์ ์๋ ๋ง๋ฅ์ธ์ ๋๋ค(๊ทธ๋ฆฌ๊ณ ์ ๋ฌธ๊ฐ๋ ์๋๋๋ค). ๋ค์ํ ์์ ์ ์ํํ ์ ์์ผ๋ฉฐ, ๋ฌธ๋งฅ ํ์ต๊ณผ ๊ฐ์ ์ ํฅ ๋์์ ํ ์ ์์ต๋๋ค.
์ค์ ์ธ๊ณ์์ ๊ด๋ฒ์ํ๊ฒ ๋ฐฐํฌ๋์์ต๋๋ค.
๋ํ ์ธ์ด ๋ชจ๋ธ์๋ ์ฌ์ ํ ๋ง์ ์ค์ํ ์ํ์ด ์์ผ๋ฉฐ, ์ด๋ ์ฌ์ ํ ์ฐ๊ตฌ๋์ด์ผ ํ ๋ฌธ์ ์ ๋๋ค.
๋น์ฉ์ ๋์ ์ ๊ทผ์ ์ํ ํฐ ์ฅ๋ฒฝ์ ๋๋ค.
์ด ๊ฐ์ข์ ๊ตฌ์กฐ
์ด ๊ฐ์ข๋ ์ํ์ฒ๋ผ ๊ตฌ์ฑ๋ฉ๋๋ค:
๋ํ ์ธ์ด ๋ชจ๋ธ์ ๋์: ์ฐ๋ฆฌ๋ ์ง๊ธ๊น์ง ๋ธ๋๋ฐ์ค API ์ ๊ทผ๋ง ์๋ ์ธ๋ถ ๊ณ์ธต์์ ์์ํฉ๋๋ค. ์ฐ๋ฆฌ์ ๋ชฉํ๋ ๋ํ ์ธ์ด ๋ชจ๋ธ์ด๋ผ๋ ์ด ๊ฐ์ฒด์ ๋์์ ์ดํดํ๋ ๊ฒ์ ๋๋ค. ์ฐ๋ฆฌ๋ ์๋ฌผํ์๊ฐ ์๋ฌผ์ฒด๋ฅผ ์ฐ๊ตฌํ๋ ๊ฒ์ฒ๋ผ ๋ง์ด์ฃ . ๋ฅ๋ ฅ๊ณผ ์ํ์ ๋ํ ๋ง์ ์ง๋ฌธ๋ค์ ์ด ์์ค์์ ๋ต๋ณ๋ ์ ์์ต๋๋ค.
๋ํ ์ธ์ด ๋ชจ๋ธ์ ๋ฐ์ดํฐ: ๊ทธ๋ฐ ๋ค์ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ํ์ตํ๋ ๋ฐ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ ๋ค์ชฝ์ ์์ธํ ์ดํด๋ณด๊ณ , ๋ณด์, ๊ฐ์ธ ์ ๋ณด ๋ณดํธ ๋ฐ ๋ฒ์ ๊ณ ๋ ค ์ฌํญ๊ณผ ๊ฐ์ ๋ฌธ์ ๋ฅผ ๋ค๋ฃน๋๋ค. ํ์ต ๋ฐ์ดํฐ์ ์ก์ธ์คํ ์ ์๋ค๋ฉด, ๋ชจ๋ธ์ ๋ํ ์ค์ํ ์ ๋ณด๋ฅผ ์ ๊ณต๋ฐ์ ์ ์์ต๋๋ค. ๋ชจ๋ธ์ ์์ ํ ์ก์ธ์ค๋ ์๋๋ผ๋ ๋ง์ด์ง์.
๋ํ ์ธ์ด ๋ชจ๋ธ์ ๊ตฌ์ถ: ๊ทธ๋ฐ ๋ค์ ๋ํ ์ธ์ด ๋ชจ๋ธ์ด ์ด๋ป๊ฒ ๊ตฌ์ถ๋๋์ง(๋ชจ๋ธ ๊ตฌ์กฐ, ํ์ต ์๊ณ ๋ฆฌ์ฆ ๋ฑ) ์ฐ๊ตฌํฉ๋๋ค.
๋ํ ์ธ์ด ๋ชจ๋ธ ์ด์: ๋ง์ง๋ง์ผ๋ก, ์ด ๊ฐ์ข๋ฅผ ์ธ์ด ๋ชจ๋ธ ์ด์์ผ๋ก ๋ง๋ฌด๋ฆฌํฉ๋๋ค. ์ธ์ด ๋ชจ๋ธ์ ์ผ๋ จ์ ํ ํฐ์ ๋ํ ๋ถํฌ์ ๋ถ๊ณผํฉ๋๋ค. ์ด๋ฌํ ํ ํฐ์ ์์ฐ์ด, ํ๋ก๊ทธ๋๋ฐ ์ธ์ด, ์ค๋์ค ๋๋ ์๊ฐ์ ์ฌ์ ์ ์์๋ฅผ ๋ํ๋ผ ์ ์์ต๋๋ค. ์ธ์ด ๋ชจ๋ธ์ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ๋ง์ ํน์ฑ์ ๊ณต์ ํ๋ ๋ณด๋ค ์ผ๋ฐ์ ์ธ ๊ธฐ๋ฐ ๋ชจ๋ธ ํด๋์ค์ ์ํฉ๋๋ค.
์ถ๊ฐ ์๋ฃ
Dan Jurafsky์ ์ธ์ด ๋ชจ๋ธ์ ๋ํ ์ฑ
์ธ์ด ๋ชจ๋ธ์ ๋ํ CS224N ๊ฐ์ ๋ ธํธ
์ธ์ด ๋ชจ๋ธ์ ํ๊ณ ํ์. R. Józefowicz, Oriol Vinyals, M. Schuster, Noam M. Shazeer, Yonghui Wu. 2016.์น ํ์ด์ง: CS224N ์ธ์ด ๋ชจ๋ธ์ ๋ํ ๊ฐ์ ๋ ธํธ
์ธ์ด ๋ชจ๋ธ์ ํ๊ณ ํ์. R. Józefowicz, Oriol Vinyals, M. Schuster, Noam M. Shazeer, Yonghui Wu. 2016.
๊ธฐ์ด ๋ชจ๋ธ์ ๊ธฐํ์ ์ํ์ ๋ํด. Rishi Bommasani, Drew A. Hudson, E. Adeli, R. Altman, Simran Arora, Sydney von Arx, Michael S. Bernstein, Jeannette Bohg, Antoine Bosselut, Emma Brunskill, E. Brynjolfsson, S. Buch, D. Card, Rodrigo Castellon, Niladri S. Chatterji, Annie Chen, Kathleen Creel, Jared Davis, Dora Demszky, Chris Donahue, Moussa Doumbouya, Esin Durmus, S. Ermon, J. Etchemendy, Kawin Ethayarajh, L. Fei-Fei, Chelsea Finn, Trevor Gale, Lauren E. Gillespie, Karan Goel, Noah D. Goodman, S. Grossman, Neel Guha, Tatsunori Hashimoto, Peter Henderson, John Hewitt, Daniel E. Ho, Jenny Hong, Kyle Hsu, Jing Huang, Thomas F. Icard, Saahil Jain, Dan Jurafsky, Pratyusha Kalluri, Siddharth Karamcheti, G. Keeling, Fereshte Khani, O. Khattab, Pang Wei Koh, M. Krass, Ranjay Krishna, Rohith Kuditipudi, Ananya Kumar, Faisal Ladhak, Mina Lee, Tony Lee, J. Leskovec, Isabelle Levent, Xiang Lisa Li, Xuechen Li, Tengyu Ma, Ali Malik, Christopher D. Manning, Suvir P. Mirchandani, Eric Mitchell, Zanele Munyikwa, Suraj Nair, A. Narayan, D. Narayanan, Benjamin Newman, Allen Nie, Juan Carlos Niebles, H. Nilforoshan, J. Nyarko, Giray Ogut, Laurel Orr, Isabel Papadimitriou, J. Park, C. Piech, Eva Portelance, Christopher Potts, Aditi Raghunathan, Robert Reich, Hongyu Ren, Frieda Rong, Yusuf H. Roohani, Camilo Ruiz, Jackson K. Ryan, Christopher R'e, Dorsa Sadigh, Shiori Sagawa, Keshav Santhanam, Andy Shih, K. Srinivasan, Alex Tamkin, Rohan Taori, Armin W. Thomas, Florian Tramèr, Rose E. Wang, William Wang, Bohan Wu, Jiajun Wu, Yuhuai Wu, Sang Michael Xie, Michihiro Yasunaga, Jiaxuan You, M. Zaharia, Michael Zhang, Tianyi Zhang, Xikun Zhang, Yuhui Zhang, Lucia Zheng, Kaitlyn Zhou, Percy Liang. 2021.
ํ๋ฅ ๋ก ์ ์ต๋ฌด์์ ์ํ์ ๋ํด: ์ธ์ด ๋ชจ๋ธ์ด ๋๋ฌด ์ปค์ง ์ ์์๊น? ๐ฆ. Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell. FAccT 2021.
์ธ์ด ๋ชจ๋ธ๋ก ์ธํ ์ค๋ฆฌ์ ๋ฐ ์ฌํ์ ์ํ. Laura Weidinger, John F. J. Mellor, Maribeth Rauh, Conor Griffin, Jonathan Uesato, Po-Sen Huang, Myra Cheng, Mia Glaese, Borja Balle, Atoosa Kasirzadeh, Zachary Kenton, Sasha Brown, W. Hawkins, Tom Stepleton, Courtney Biles, Abeba Birhane, Julia Haas, Laura Rimell, Lisa Anne Hendricks, William S. Isaac, Sean Legassick, Geoffrey Irving, Iason Gabriel. 2021.
'๐พ Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Demand forecasting in logistics (0) | 2023.07.25 |
---|---|
CM3leon(.Meta) (0) | 2023.07.16 |
[Drag Your GAN] Interactive Point-based Manipulation on the Generative Image Manifold (0) | 2023.07.02 |
[RL] Stable-baselines3 gym -> gymnasium (0) | 2023.04.20 |
Choose Your Weapon:Survival Strategies for Depressed AI Academics (0) | 2023.04.18 |