https://arxiv.org/abs/2304.06035
Abstract
AI ์ข ์ฌ์์ธ๊ฐ์? ๋ต
์ ์ ์ปค์ ธ๊ฐ๋ AI ๋ฐ์ ์๋์ ๋ถ์ํ๊ณ ์๋๊ฐ? ๋ต ..
AI ์ฐ๊ตฌ์ ํ์ํ ๋ฆฌ์์ค๊ฐ ์๋นํ ๋ถ์กฑํ๊ณ ์ ํ์ ์ด๋ผ ์๊ฐํ๋์? ๋ต .. 3090
๋ณธ ๋ ผ๋ฌธ์ ํ์ฌ ์ํฉ์์ ๊ฒฝ์๋ ฅ์ ๊ฐ์ถ๊ธฐ ์ํ ๋ฐฉ๋ฒ์ ๋ํด ๋ ผ์ํฉ๋๋ค.
Introduction
OpenAI, Deepmind, meta, google brain ๋ฑ ๋ค์์ ๋น AI ๊ธฐ์ ๋ค์ ์ํ AI ์ฐ๊ตฌ์๋ค์ gigantic neural net model์ ํ๋ จ์์ผ ๋๋ผ์ด ์ฑ๊ณผ๋ฅผ ์ด๋ฃจ์๋ค... ๊ณผ์ฐ ์ด gigantic ํ๋ จ์ ๋ฐ๋ผ๊ฐ ์ ์๋ ์ฐ๊ตฌ์ง์ด ๋ช์ด ๋ ์ง ์๋นํ ์ด๋ ค์ด ๋๊ด์ ๋๋ถ๋ถ์ ์ฐ๊ตฌ ์ข ์ฌ์๋ค์ด ๊ธฐ์ ์ ํ๊ณ์ ๊ณ ๋ฏผ์ ๋์ฌ์๋ค. (์ปดํจํ ํ์๊ฐ ๋น์ฐ์ ์๊ตฌ๋๋ ๋ฌธ์ ์ง์ )
ImageNet๋ถํฐ ChatGPT, GPT-4๊น์ง ๋ฐ์ ์ผ๋ก ๋ณด์ ๋ง์ ์์ ์์์ ๋ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ผ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค. ์ค๋๋ ์ฐ๊ตฌ์๋ค์ด ์ฌ์ฉํ๋ ์์๊ณผ์ ๊ฒฉ์ฐจ๋ ๋งค๋ ์ปค์ง๊ณ ์๋ค. ์๋ฌด๋ฆฌ ์ข์ ์์ด๋์ด๋ฅผ ๊ฐ์ง๊ณ ์์ด๋ ์ฝ๊ฒ ํ ์ ์๋ ์ผ์ ์ฝ๊ฒ ํ ์ ์์ ์ ๋์ ์์์ ๊ฐ์ง ์ฌ๋๊ณผ์ ๊ฒฝ์์ ๋ ๋ค๋ฅธ ๋ฌธ์ ์ด๋ค. (ex, GPT-3 vs LSTM Word2Vec)
๋ ผ๋ฌธ์ ์ ์๋ ๋ํ ์ข ์ ๊ต์์ด์ง๋ง ํ๋ฐฐ๋ค์ ์ํด ๊ฐ์ด ๊ณ ๋ฏผ ,, ๊ธฐ๋ง์ ํ๊ณ ์๋ค.
Solution
1 ) Give Up!
ํฌ๊ธฐ๋ ์ธ์ ๋ ํ๋์ ์ ํ์ง์ด๋ค. AI๋ฅผ ๋ ๋๋ ๊ฒ์ด ์๋๋ผ AI SOTA๋ฅผ ๋๋ ํ๊ณ๋ฅผ ๋๋ ์ผ์ ํฌ๊ธฐํ๋ ๊ฒ์ด๋ค. ํ์ฌ ์ํฉ์์ ๊ฒฝ๋ ฅ์ ์์ ์ ์ง๋ฅผ ๋ํ๊ณ ์๊ธ์ ํ๋ณดํด ๊ธฐ์ ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์!
2 ) Try Scaling Anyway!
์ ๋ฉด์ผ๋ก ๊ฐ์! CPU์ GPU ๋ฆฌ์์ค ํ๋ณด๋ฅผ ์ํ ์๊ธ ํ๋ณด. ํด๋ผ์ฐ๋ ๋น์ฉ์ผ๋ก 5๋ง ๋ฌ๋ฌ๋ฅผ ํ๋ณดํด ๋๊ท๋ชจ ์คํ์ ํ๋ค๊ณ ๊ฐ์ ํ์ ๋ ์ด๋ GPT-3์ ํ์ต ๋น์ฉ๊ณผ ๋น๊ตํ๋ฉด ์๋นํ ์ ์ ๊ธ์ก์ด๋ค. ์ต๊ทผ ๋ง์ธํฌ๋ํํธ์์ ๋ค์ด์๋ชฌ๋ ๊ณก๊ดญ์ด๋ฅผ ๋ง๋๋ ๋ฒ์ ํ์ตํ OpenAI Agent๋ 720 * V100 GPU๋ฅผ 9์ผ ๊ฐ ํ์ต์ ํ์ผ๋ฉฐ ์ด๋ ์์ญ๋ง ๋ฌ๋ฌ์ ๋ฌํ๋ ๊ธ์ก์ด๋ค. ์ ์๋ฏธํ ์คํ์ ํ๊ธฐ ์ํด์๋ ์ง์์ ์ธ ํฌ์์ ๊ฒฐ๊ณผ๊ฐ ์์ด์ผ ํ๋ค. ๋ฐ์ฌ ๊ณผ์ ์ ํ์์ด ๋ ผ๋ฌธ 1 ์ ์์ ์์ผ๋ ค๋ฉด ์ํํธ์จ์ด์ ์ธ ๊ธฐ์ ์ ์ง์์ด ํ์๋ก ํ์ํ๋ค. ํ์ง๋ง ์ด ๋ ๊ฐ์ง๋ฅผ ๊ฐ์ถ๊ธฐ๋ ๋ถ๊ฐ๋ฅํ๋ค. (ํจ์จ์ ์๊ธ, ์ธ์ ๊ด๋ฆฌ ํ์)
"The structures needed for successful large scale projects are simply not compatible
with the structures of academia."
3 ) Scale Down
toy problems์ ์ง์คํ์ - Transformer๋ ๊ฐ๋จํ ์ ๊ฒฝ๋ง ๋ชจํ์ผ๋ก๋ ํด๊ฒฐํ ์ ์๋ ๋ฌธ์ ๋ ์๋นํ ๋ง๋ค. ์ ์ ๋ฆฌ์์ค ํ๊ฒฝ์ toy size ํ๋ก์ ํธ๋ค์ ์ค์ ํ๋์์ ๋ฒ์ฉ์ผ๋ก ์ฌ์ฉํ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ฃผ๋ฏ๋ก ์ ์๋ฏธํ ์ฑ๊ณผ๋ฅผ ๋ผ ์ ์๋ค.
4 ) Reuse and Remaster
์ง๋ 10๋ ๋์ AI๊ฐ ๋น ๋ฅด๊ฒ ๋ฐ์ ํ ์ ์์๋ ์ด์ ๋ ๋ฐ๋ก ์ฐ๊ตฌ์๋ค์ด ์์ ์ ์ฝ๋์ ๋ชจ๋ธ์ ์ปค๋ฎค๋ํฐ์ ๊ณต์ ํ๊ธฐ ๋๋ฌธ์ด๋ค. ๋๊ท๋ชจ ๋ชจ๋ธ์ ํ์ฉํด ์๊ฐ์ ์ค์ผ ์ ์๋ค. ๋ค๋ง, ๋๊ท๋ชจ ๋ชจ๋ธ์ fine-tuning์ ์คํํ๊ธฐ ์ด๋ ค์ธ๋ฟ๋๋ฌ ์ข์ ์ฑ๋ฅ์ ๋ด๊ธฐ๋ ์ด๋ ต๋ค.
5 ) Analysis Instrad of Synthesis
"Another thing to do with the publicly available pretrained models is to analyze them."
์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ํ์ฉํด ๋ค๋ฅธ ์ผ์ ํด๋ณด๋ ๊ฒ, ์๋ก์ด ๊ธฐ๋ฅ์ ์ง์ ์ ์ผ๋ก ๊ธฐ์ฌํ์ง๋ ์๋๋ผ๋ ๊ณผํ์ ๊ธฐ์ฌํ ์ ์๋ค.
์๋ฅผ ๋ค๋ฉด Transformer๋ ๋๊ตฌ์๊ฒ๋ ์ง๊ด์ ์ธ ๊ฒ์ด ์๋๋ฉฐ, ์ด๋ฌํ ๋ชจ๋ธ์ด ํ์ต๋๋ ๋ฐ์ดํฐ์ ๊ท๋ชจ๋ ํ๋์ ์๋ ์ฌ๋์ด ์๋๊ณ ์๋ Task์ ๋ํ ์๊ฐ/๋น์ฉ์ ์ถ์ฐํ๊ธฐ ์ด๋ ต๋ค. ์ดํด๋ฅผ ๋๊ธฐ ์ํด ์ฐฝ์์ ์ผ๋ก ์กฐ์ฌํ๊ณ , ๊ฐ๋ ์ ์ผ๋ก ์ ๊ทผํด์ผ ํ๋ ์ผ์ด ๋ง๋ค. ์ด๋ ๋ค๋ฅธ ์ด์ ์๊ฐ์ ์ค์ฌ์ฃผ๊ณ ๋ฆฌ์์ค๋ฅผ ๊ฐ์ง ๋ค๋ฅธ ์ฌ๋์๊ฒ๋ ์ง๋ฆ๊ธธ์ ์๋ดํด ์ค ์ ์๋ค.
6 ) RL! No Data!
๊ฐํํ์ต์ ๋ฐ์ดํฐ(์ ์ ์ธ ์ธก๋ฉด)๋ฅผ ์ถ์ํ๊ณ ๋ชจ๋ธ๋ง์ ์ง์คํด์ AI ๋ฌธ์ ๋ก ์ ๊ทผํ ์ ์๋ค. ๊ฐํํ์ต์ ๋ฐ์ดํฐ์ ๊ฐ์ฉ์ฑ, ๋ถ์ ๋ฐ ์ ์ฅ ์ด๋ฐ ๊ธฐ์ ์ ์ธ ํ๋ก์ธ์ค๋ฅผ ์ฐํํ ์ ์๋ค.(๋ก์ง์ด ๋ ์ค์ํ๋ค.)
7 ) Small Models! No Compute!
๋ชจ๋ธ์ ๊ท๋ชจ๋ฅผ ์ค์ฌ ๋ฆฌ์์ค๋ฅผ ์ค์ฌ๋ผ. ๋ ์์ ๋ชจ๋ธ์ ํ์๋กํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ๊ฐ์ฅ ์์ ๋ชจ๋ธ์ ์๊ฐํด๋ณด์๋ผ. ์ด๋ ์ค์ ์ดํ๋ฆฌ์ผ์ด์ ์ ํนํ ์ค์ํ๊ณ ๊ด๋ จ์ฑ์ด ๋๋ค.
(Toss ์์ฐ์ด ๊ฒ์ ์๋น์ค)
https://youtu.be/BLO-P5o8mkg?si=S-Rj7j1cmixP3oNf
์ด์ฒ๋ผ ๋ฐ์ดํฐ ์์ ๋คํธ์ํฌ์ ์ฃ์ง์ AI๋ฅผ ๋ฐฐํฌํ ์์๋ค. ์ด๋ฅผ "Edge AI"(=ondevice AI)๋ผ๊ณ ํ๋ค. ํน์ ๋๋ฉ์ธ์์ ํจ๊ณผ์ ์ผ๋ก AI๊ฐ ๊ธฐ์ฌํ ์ ์๋ค. ์ฐ๊ตฌ๋ฅผ ํ๋ค๋ณด๋ฉด ๋ด๋ถ ๋ชจ๋ธ์ ๋ํ ์ดํด๊ฐ ๋ถ์กฑํ ๋ ๋ํ๊ตฌ๋ฅผ ์ฐพ์ ํด๊ฒฐํ๋ฏ๋ก AI ๋ชจ๋ธ ์ฐ๊ตฌ์ ๋ ์ฌํ ๊ณผ์ ์ผ๋ก ๊ฐ ์ ์๋ค. ์์ ๋ชจ๋ธ์ด ํ ์ ์๋ ์ผ์ ํ๊ณ๊ฐ ์์ง๋ง ์ฐ์ ๋ถ์ผ์์ ์ด๋ฐ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์ค์์ฑ์ ๊ณ์ ์ฆ๊ฐํ๊ณ ์๋ค.
8, 9 ) Work on Specialized Application Areas or Domains & Solve Problems Few Care About (For Now!)
์ ์ฆ๋ ์ฐ๊ตฌ ๋ถ์ผ๋ฅผ ์ ํํ๊ณ ๊ทธ ์์์ ํ์ ์ ์ฐพ์๋ผ. ์์ด๋์ด๋ฅผ ์์ ํ ์๋ก์ด ์์ญ์์ ๊ฐ์ ธ์ ํ ์คํธํ๋ ๊ฒ์ ์ฑ๊ณต์ ์ผ ์ ์์ผ๋, ๊ทธ ๊ฒฐ๊ณผ๊ฐ ์์ญ์ ๋์ด ํฐ ์ํฅ์ ๋ฏธ์น๋ ๊ฒฝ์ฐ๋ ๋๋ฌผ๋ค. ํ์ ์์ญ์ด ์์์ ์ฐ๊ตฌ์๋ค์ ๋ ธ๋ ฅ์ผ๋ก ๋ฐ์ ๋๋ ์ฌ๋ก๋ ๋ง๋ค. ํ์ฌ ๊ฒ์ ์ ๊ณ ์ปค๋ฎค๋ํฐ๋ ์ต์ ๊ฒ์์ AI๋ฅผ ๋์ ํ๋ ๋๊ธฐ์ ์ ๊ฑฐ์ ์๊ธฐ ๋๋ฌธ์ ์ด ์ ๋ต์ ์ ํจํ๋ค. (๋ ผ๋ฌธ ์ ์, ๊ฒ์์ ๊ณ ๊ฐํํ์ต ์ฐ๊ตฌ์)
๋น๋์ค ๊ฒ์(00๋ ๋)์ ์ปดํจํฐ ๋น์ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ๊ฐ ํ์ฑํ๋ ์ฌ๋ก๋ฅผ ์๊ฐํด๋ณด์. (IJCAI, AAAI). ์ปค๋ฎค๋ํฐ๋ฅผ ์ง๋ฐฐํ Neural Network, Deep Learning์ SVM๊ณผ regression model์ด RL๊ณผ DL์์ ๋ค์ค Agent ํ์ต๊ณผ cognitive/affect model์ ๋ฐ์ ์ ์ด๋ฃฌ ๊ฒ๊ณผ ๋น์ทํ๋ค. ์ปดํจํฐ ๋น์ ์ ๋ชจ๋๊ณผ ๊ด์ฌ์ ๊ฐ๊ณ ๋ ผ๋ฌธ ์ฌ์ฌ ๋ํ ์ด๋ฅผ ๊ณ ๋ คํ๋ค๋ฉด ์๊ธฐ์ ์ํฅ๋ ฅ์ ํ์ฌํ๊ธฐ ์ด๋ ต๋ค. ๋๋ผ์ด ๋ณํ ์๋๋ฅผ ๋ฐ๋ผ๊ฐ๊ธฐ ์ด๋ ต๋ค๋ฉด ํน์ ๋๋ฉ์ธ์์ ์์ ๋ง์ ์ปค๋ฎค๋ํฐ๋ฅผ ๋ง๋ค์ด ํ์ฅํ๋ ๊ฒ์ ์ข์ ์ ํ์ด๋ค.
10 ) Try Things that Shouldn’t Work
์๊ท๋ชจ ์ฐ๊ตฌ๋ ์คํ์ ์ฆ๊ฑฐ๋ก๋ ์ค๋ช ํ ์ ์๋ "Shouldn't work" ์คํจํ ๊ฐ๋ฅ์ฑ์ด ๋์ ๊ฒ์ ํ ์ ์๋ค. ์ด๋ ๋๊ธฐ์ ์ ์ฐ๊ตฌ์ค์์๋ ์๋ ์กฐ์ฐจํ์ง ์์ ๊ฒ์ด๋ค. ์คํจ๋ ์ฑ๊ณต๊ณผ ๊ฐ์ด ๊ฐ์น๊ฐ ์๋ค. ๋๊ธฐ์ ์ ์คํจ๋ ๋ง๋ํ ๋น์ฉ์ ์์ค์ด์ง๋ง ์๊ท๋ชจ์ ์์ค์ ์ํ์ด ๋ฎ๋ค. AI์ ๋ง์ ์ค์ํ ๋ฐ๋ช ๊ณผ ์์ด๋์ด๋ 'wrong' ์คํจ๋ฅผ ํตํด ๋์๋ค. ํนํ ์ด๋ก ์ ์ผ๋ก ์๋ํด์๋ ์๋๋ ์ด์ ๊ฐ ์์์๋ ๋ถ๊ตฌํ๊ณ ์ฐ๊ตฌ์๋ค์ด ์ ๊ฒฝ๋ง ์ฐ๊ตฌ์ ํฌ๊ธฐํ์ง ์๊ณ ์ฐ๊ตฌํ ๋ฐ์ ๋น๋กฏ๋๋ค. (Backpropagation ,1985)
์ญ์ ํ ์๊ณ ๋ฆฌ์ฆ์ ์ ๊ฒฝ๋ง ๋คํธ์ํฌ ์ฐ๊ตฌ์ ์ ์ฉํ๋ฉฐ ๋น์ ๋ฆฌ์์ค ๋ฌธ์ ์๋ ๋ถ๊ตฌํ๊ณ ๊ณ์ํด์ ์ฐ๊ตฌ๋ฅผ ์งํํ๋ฉฐ 2019๋ ํ๋ง์์ ๋ฐ์ผ๋ฉฐ ์ค๋๋ ์ด์์๋ ์์ธ์ด ๋์๋ค.
11 ) Do Things that Have Bad Options
๋๊ธฐ์ ์์๋ ์ค๋ฆฌ์ ์ด๋ฏธ์ง์ ๋ํ ์ ์ฝ์ด ๋ง๋ค. ๊ทธ ์๋ก ํํ์ด ์กฐ๊ธ์ด๋ผ๋ ๋๋น ์ง๋ค๋ฉด ํด๊ณ ์ ์ํ์ด ์์ ์ ์๋ค. ๋ฐ๋ผ์ ํ๋ก์ ํธ ๋ํ ์ ์คํ ์ค์ ํด์ผํ๋ค. ์ง๋จ์ด ์์ ์๋ก ์์ ๋๋ ๋์์ง๋ค. ํด๊ณ ์ ๊ทธ๋์์ ๋ฒ์ด๋ ๋ค์ํ ํ๋ก์ ํธ๋ฅผ ํ ์ ์๋ค. ํน์ ์๊ฐ์ ํ์ผ๋ก ๊ธ์ ์์ฑํ๋ ๋ชจ๋ธ์ ๋ง๋ ๋ค๊ณ ํ์๋ ๋๊ธฐ์ ์ ๊ฒฝ์ฐ ๋ด์ค 1๋ฉด์ ์ค๋ฆฌ ๋ฌธ์ ๋ก ๊ฑฐ๋ก ๋ ์ ์๋ค. ๋ฐ๋๋ก ์๊ท๋ชจ์ ๊ฒฝ์ฐ ๋ ๋ฐ์ ์์ด ์์ ํ๋ค. ์ด๋ฅผ ์ด์ฉํด ๋๊ธฐ์ ์์ ํ ์ ์๋ ๊ฒ๋ค์ ํด๋ผ.
12 ) Start it Up; Spin it Out!
๋๊ท๋ชจ ์ฐ๊ตฌ๋ฅผ ์ํด์๋ ๋ํ์ ์์๋ง์ผ๋ก๋ ์ถฉ๋ถํ์ง ์๋ค. AI ์ฐ๊ตฌ๋ฅผ ์์ฉํ ํ ์ ์๋ ํ์ฌ๋ฅผ ์ฐฝ์ ํด๋ผ.
๋ ผ๋ฌธ ์ ์๋ modl.ai๋ฅผ ์ค๋ฆฝํด ์ ํ์ ์๋น์คํ๋ฉฐ ํฌ์๋ฅผ ๋ฐ์ ์ฐ๊ตฌ๋ฅผ ์งํํ๋ค.
2๋ ์ ๊ฐ๋ฐ ๊ธฐ๊ฐ์ ํตํด ์์ ์ ์ธ ๋ฐ์ด์ ์ฌ๋๋ค. ๋ฌผ๋ก ์ฑ๊ณต์ ์ธ ์ผ์ด์ค์ด์ง๋ง ์ดํ ํ๊ณ ์ฐ๊ตฌํ ๋ณด๋ค ๊ฒ์์ ๊ณ์ ๋ฏธ์น๋ ์ํฅ๋ ฅ์ด ๋ ์ปค์ก๋ค๋ ์ฌ์ค์ด ์๋ค.
13, 14) Collaborate or Jump Ship! & How Can Large Players in Industry Help?
์์ ์ผ์ด์ค๊ฐ ์ ํฉํ์ง ์๋ค๋ฉด ๋๊ธฐ์ ๊ณผ์ ํ์ ์ ํตํด ๋ฆฌ์์ค ๋ฌธ์ ๋ฅผ ํด๊ฒฐ ํ ์ ์๋ค. ๋๊ธฐ์ ๊ณผ์ ํ๋ ฅ์ ์ฑ๊ณต์ ์ธ ๋ ผ๋ฌธ์ ๋ฐํํ๋๋ฐ ๋์์ด ๋๋ค. ํํธ๋์ฝ์ ํตํด ์ฐ๊ตฌ ๋ฒ์๋ฅผ ๋ํ ์ ์์ผ๋ฉฐ ๊ธฐ์ ์์์ผ๋ก ํธ์ ๋ ์๋ ์๋ค.
'๐พ Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Drag Your GAN] Interactive Point-based Manipulation on the Generative Image Manifold (0) | 2023.07.02 |
---|---|
[RL] Stable-baselines3 gym -> gymnasium (0) | 2023.04.20 |
[RL] Soft Actor-Critic (a.k.a SAC) (0) | 2023.04.12 |
[M1] Whisper.cpp Deploy C++ (ALL OS-) (0) | 2023.04.06 |
[RL] Deep Deterministic Policy Gradient (A.K.A DDPG) (0) | 2023.04.04 |