https://arxiv.org/abs/2304.06035
Choose Your Weapon: Survival Strategies for Depressed AI Academics
Are you an AI researcher at an academic institution? Are you anxious you are not coping with the current pace of AI advancements? Do you feel you have no (or very limited) access to the computational and human resources required for an AI research breakthr
arxiv.org
Abstract
AI ์ข ์ฌ์์ธ๊ฐ์? ๋ต
์ ์ ์ปค์ ธ๊ฐ๋ AI ๋ฐ์ ์๋์ ๋ถ์ํ๊ณ ์๋๊ฐ? ๋ต ..
AI ์ฐ๊ตฌ์ ํ์ํ ๋ฆฌ์์ค๊ฐ ์๋นํ ๋ถ์กฑํ๊ณ ์ ํ์ ์ด๋ผ ์๊ฐํ๋์? ๋ต .. 3090
๋ณธ ๋ ผ๋ฌธ์ ํ์ฌ ์ํฉ์์ ๊ฒฝ์๋ ฅ์ ๊ฐ์ถ๊ธฐ ์ํ ๋ฐฉ๋ฒ์ ๋ํด ๋ ผ์ํฉ๋๋ค.
Introduction

OpenAI, Deepmind, meta, google brain ๋ฑ ๋ค์์ ๋น AI ๊ธฐ์ ๋ค์ ์ํ AI ์ฐ๊ตฌ์๋ค์ gigantic neural net model์ ํ๋ จ์์ผ ๋๋ผ์ด ์ฑ๊ณผ๋ฅผ ์ด๋ฃจ์๋ค... ๊ณผ์ฐ ์ด gigantic ํ๋ จ์ ๋ฐ๋ผ๊ฐ ์ ์๋ ์ฐ๊ตฌ์ง์ด ๋ช์ด ๋ ์ง ์๋นํ ์ด๋ ค์ด ๋๊ด์ ๋๋ถ๋ถ์ ์ฐ๊ตฌ ์ข ์ฌ์๋ค์ด ๊ธฐ์ ์ ํ๊ณ์ ๊ณ ๋ฏผ์ ๋์ฌ์๋ค. (์ปดํจํ ํ์๊ฐ ๋น์ฐ์ ์๊ตฌ๋๋ ๋ฌธ์ ์ง์ )

ImageNet๋ถํฐ ChatGPT, GPT-4๊น์ง ๋ฐ์ ์ผ๋ก ๋ณด์ ๋ง์ ์์ ์์์ ๋ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ผ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค. ์ค๋๋ ์ฐ๊ตฌ์๋ค์ด ์ฌ์ฉํ๋ ์์๊ณผ์ ๊ฒฉ์ฐจ๋ ๋งค๋ ์ปค์ง๊ณ ์๋ค. ์๋ฌด๋ฆฌ ์ข์ ์์ด๋์ด๋ฅผ ๊ฐ์ง๊ณ ์์ด๋ ์ฝ๊ฒ ํ ์ ์๋ ์ผ์ ์ฝ๊ฒ ํ ์ ์์ ์ ๋์ ์์์ ๊ฐ์ง ์ฌ๋๊ณผ์ ๊ฒฝ์์ ๋ ๋ค๋ฅธ ๋ฌธ์ ์ด๋ค. (ex, GPT-3 vs LSTM Word2Vec)
๋ ผ๋ฌธ์ ์ ์๋ ๋ํ ์ข ์ ๊ต์์ด์ง๋ง ํ๋ฐฐ๋ค์ ์ํด ๊ฐ์ด ๊ณ ๋ฏผ ,, ๊ธฐ๋ง์ ํ๊ณ ์๋ค.
Solution
1 ) Give Up!
ํฌ๊ธฐ๋ ์ธ์ ๋ ํ๋์ ์ ํ์ง์ด๋ค. AI๋ฅผ ๋ ๋๋ ๊ฒ์ด ์๋๋ผ AI SOTA๋ฅผ ๋๋ ํ๊ณ๋ฅผ ๋๋ ์ผ์ ํฌ๊ธฐํ๋ ๊ฒ์ด๋ค. ํ์ฌ ์ํฉ์์ ๊ฒฝ๋ ฅ์ ์์ ์ ์ง๋ฅผ ๋ํ๊ณ ์๊ธ์ ํ๋ณดํด ๊ธฐ์ ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์!
2 ) Try Scaling Anyway!
์ ๋ฉด์ผ๋ก ๊ฐ์! CPU์ GPU ๋ฆฌ์์ค ํ๋ณด๋ฅผ ์ํ ์๊ธ ํ๋ณด. ํด๋ผ์ฐ๋ ๋น์ฉ์ผ๋ก 5๋ง ๋ฌ๋ฌ๋ฅผ ํ๋ณดํด ๋๊ท๋ชจ ์คํ์ ํ๋ค๊ณ ๊ฐ์ ํ์ ๋ ์ด๋ GPT-3์ ํ์ต ๋น์ฉ๊ณผ ๋น๊ตํ๋ฉด ์๋นํ ์ ์ ๊ธ์ก์ด๋ค. ์ต๊ทผ ๋ง์ธํฌ๋ํํธ์์ ๋ค์ด์๋ชฌ๋ ๊ณก๊ดญ์ด๋ฅผ ๋ง๋๋ ๋ฒ์ ํ์ตํ OpenAI Agent๋ 720 * V100 GPU๋ฅผ 9์ผ ๊ฐ ํ์ต์ ํ์ผ๋ฉฐ ์ด๋ ์์ญ๋ง ๋ฌ๋ฌ์ ๋ฌํ๋ ๊ธ์ก์ด๋ค. ์ ์๋ฏธํ ์คํ์ ํ๊ธฐ ์ํด์๋ ์ง์์ ์ธ ํฌ์์ ๊ฒฐ๊ณผ๊ฐ ์์ด์ผ ํ๋ค. ๋ฐ์ฌ ๊ณผ์ ์ ํ์์ด ๋ ผ๋ฌธ 1 ์ ์์ ์์ผ๋ ค๋ฉด ์ํํธ์จ์ด์ ์ธ ๊ธฐ์ ์ ์ง์์ด ํ์๋ก ํ์ํ๋ค. ํ์ง๋ง ์ด ๋ ๊ฐ์ง๋ฅผ ๊ฐ์ถ๊ธฐ๋ ๋ถ๊ฐ๋ฅํ๋ค. (ํจ์จ์ ์๊ธ, ์ธ์ ๊ด๋ฆฌ ํ์)
"The structures needed for successful large scale projects are simply not compatible
with the structures of academia."
3 ) Scale Down
toy problems์ ์ง์คํ์ - Transformer๋ ๊ฐ๋จํ ์ ๊ฒฝ๋ง ๋ชจํ์ผ๋ก๋ ํด๊ฒฐํ ์ ์๋ ๋ฌธ์ ๋ ์๋นํ ๋ง๋ค. ์ ์ ๋ฆฌ์์ค ํ๊ฒฝ์ toy size ํ๋ก์ ํธ๋ค์ ์ค์ ํ๋์์ ๋ฒ์ฉ์ผ๋ก ์ฌ์ฉํ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ฃผ๋ฏ๋ก ์ ์๋ฏธํ ์ฑ๊ณผ๋ฅผ ๋ผ ์ ์๋ค.
4 ) Reuse and Remaster
์ง๋ 10๋ ๋์ AI๊ฐ ๋น ๋ฅด๊ฒ ๋ฐ์ ํ ์ ์์๋ ์ด์ ๋ ๋ฐ๋ก ์ฐ๊ตฌ์๋ค์ด ์์ ์ ์ฝ๋์ ๋ชจ๋ธ์ ์ปค๋ฎค๋ํฐ์ ๊ณต์ ํ๊ธฐ ๋๋ฌธ์ด๋ค. ๋๊ท๋ชจ ๋ชจ๋ธ์ ํ์ฉํด ์๊ฐ์ ์ค์ผ ์ ์๋ค. ๋ค๋ง, ๋๊ท๋ชจ ๋ชจ๋ธ์ fine-tuning์ ์คํํ๊ธฐ ์ด๋ ค์ธ๋ฟ๋๋ฌ ์ข์ ์ฑ๋ฅ์ ๋ด๊ธฐ๋ ์ด๋ ต๋ค.
5 ) Analysis Instrad of Synthesis
"Another thing to do with the publicly available pretrained models is to analyze them."
์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ํ์ฉํด ๋ค๋ฅธ ์ผ์ ํด๋ณด๋ ๊ฒ, ์๋ก์ด ๊ธฐ๋ฅ์ ์ง์ ์ ์ผ๋ก ๊ธฐ์ฌํ์ง๋ ์๋๋ผ๋ ๊ณผํ์ ๊ธฐ์ฌํ ์ ์๋ค.
์๋ฅผ ๋ค๋ฉด Transformer๋ ๋๊ตฌ์๊ฒ๋ ์ง๊ด์ ์ธ ๊ฒ์ด ์๋๋ฉฐ, ์ด๋ฌํ ๋ชจ๋ธ์ด ํ์ต๋๋ ๋ฐ์ดํฐ์ ๊ท๋ชจ๋ ํ๋์ ์๋ ์ฌ๋์ด ์๋๊ณ ์๋ Task์ ๋ํ ์๊ฐ/๋น์ฉ์ ์ถ์ฐํ๊ธฐ ์ด๋ ต๋ค. ์ดํด๋ฅผ ๋๊ธฐ ์ํด ์ฐฝ์์ ์ผ๋ก ์กฐ์ฌํ๊ณ , ๊ฐ๋ ์ ์ผ๋ก ์ ๊ทผํด์ผ ํ๋ ์ผ์ด ๋ง๋ค. ์ด๋ ๋ค๋ฅธ ์ด์ ์๊ฐ์ ์ค์ฌ์ฃผ๊ณ ๋ฆฌ์์ค๋ฅผ ๊ฐ์ง ๋ค๋ฅธ ์ฌ๋์๊ฒ๋ ์ง๋ฆ๊ธธ์ ์๋ดํด ์ค ์ ์๋ค.

6 ) RL! No Data!
๊ฐํํ์ต์ ๋ฐ์ดํฐ(์ ์ ์ธ ์ธก๋ฉด)๋ฅผ ์ถ์ํ๊ณ ๋ชจ๋ธ๋ง์ ์ง์คํด์ AI ๋ฌธ์ ๋ก ์ ๊ทผํ ์ ์๋ค. ๊ฐํํ์ต์ ๋ฐ์ดํฐ์ ๊ฐ์ฉ์ฑ, ๋ถ์ ๋ฐ ์ ์ฅ ์ด๋ฐ ๊ธฐ์ ์ ์ธ ํ๋ก์ธ์ค๋ฅผ ์ฐํํ ์ ์๋ค.(๋ก์ง์ด ๋ ์ค์ํ๋ค.)
7 ) Small Models! No Compute!
๋ชจ๋ธ์ ๊ท๋ชจ๋ฅผ ์ค์ฌ ๋ฆฌ์์ค๋ฅผ ์ค์ฌ๋ผ. ๋ ์์ ๋ชจ๋ธ์ ํ์๋กํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ๊ฐ์ฅ ์์ ๋ชจ๋ธ์ ์๊ฐํด๋ณด์๋ผ. ์ด๋ ์ค์ ์ดํ๋ฆฌ์ผ์ด์ ์ ํนํ ์ค์ํ๊ณ ๊ด๋ จ์ฑ์ด ๋๋ค.
(Toss ์์ฐ์ด ๊ฒ์ ์๋น์ค)
https://youtu.be/BLO-P5o8mkg?si=S-Rj7j1cmixP3oNf
์ด์ฒ๋ผ ๋ฐ์ดํฐ ์์ ๋คํธ์ํฌ์ ์ฃ์ง์ AI๋ฅผ ๋ฐฐํฌํ ์์๋ค. ์ด๋ฅผ "Edge AI"(=ondevice AI)๋ผ๊ณ ํ๋ค. ํน์ ๋๋ฉ์ธ์์ ํจ๊ณผ์ ์ผ๋ก AI๊ฐ ๊ธฐ์ฌํ ์ ์๋ค. ์ฐ๊ตฌ๋ฅผ ํ๋ค๋ณด๋ฉด ๋ด๋ถ ๋ชจ๋ธ์ ๋ํ ์ดํด๊ฐ ๋ถ์กฑํ ๋ ๋ํ๊ตฌ๋ฅผ ์ฐพ์ ํด๊ฒฐํ๋ฏ๋ก AI ๋ชจ๋ธ ์ฐ๊ตฌ์ ๋ ์ฌํ ๊ณผ์ ์ผ๋ก ๊ฐ ์ ์๋ค. ์์ ๋ชจ๋ธ์ด ํ ์ ์๋ ์ผ์ ํ๊ณ๊ฐ ์์ง๋ง ์ฐ์ ๋ถ์ผ์์ ์ด๋ฐ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์ค์์ฑ์ ๊ณ์ ์ฆ๊ฐํ๊ณ ์๋ค.
8, 9 ) Work on Specialized Application Areas or Domains & Solve Problems Few Care About (For Now!)
์ ์ฆ๋ ์ฐ๊ตฌ ๋ถ์ผ๋ฅผ ์ ํํ๊ณ ๊ทธ ์์์ ํ์ ์ ์ฐพ์๋ผ. ์์ด๋์ด๋ฅผ ์์ ํ ์๋ก์ด ์์ญ์์ ๊ฐ์ ธ์ ํ ์คํธํ๋ ๊ฒ์ ์ฑ๊ณต์ ์ผ ์ ์์ผ๋, ๊ทธ ๊ฒฐ๊ณผ๊ฐ ์์ญ์ ๋์ด ํฐ ์ํฅ์ ๋ฏธ์น๋ ๊ฒฝ์ฐ๋ ๋๋ฌผ๋ค. ํ์ ์์ญ์ด ์์์ ์ฐ๊ตฌ์๋ค์ ๋ ธ๋ ฅ์ผ๋ก ๋ฐ์ ๋๋ ์ฌ๋ก๋ ๋ง๋ค. ํ์ฌ ๊ฒ์ ์ ๊ณ ์ปค๋ฎค๋ํฐ๋ ์ต์ ๊ฒ์์ AI๋ฅผ ๋์ ํ๋ ๋๊ธฐ์ ์ ๊ฑฐ์ ์๊ธฐ ๋๋ฌธ์ ์ด ์ ๋ต์ ์ ํจํ๋ค. (๋ ผ๋ฌธ ์ ์, ๊ฒ์์ ๊ณ ๊ฐํํ์ต ์ฐ๊ตฌ์)
๋น๋์ค ๊ฒ์(00๋ ๋)์ ์ปดํจํฐ ๋น์ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ๊ฐ ํ์ฑํ๋ ์ฌ๋ก๋ฅผ ์๊ฐํด๋ณด์. (IJCAI, AAAI). ์ปค๋ฎค๋ํฐ๋ฅผ ์ง๋ฐฐํ Neural Network, Deep Learning์ SVM๊ณผ regression model์ด RL๊ณผ DL์์ ๋ค์ค Agent ํ์ต๊ณผ cognitive/affect model์ ๋ฐ์ ์ ์ด๋ฃฌ ๊ฒ๊ณผ ๋น์ทํ๋ค. ์ปดํจํฐ ๋น์ ์ ๋ชจ๋๊ณผ ๊ด์ฌ์ ๊ฐ๊ณ ๋ ผ๋ฌธ ์ฌ์ฌ ๋ํ ์ด๋ฅผ ๊ณ ๋ คํ๋ค๋ฉด ์๊ธฐ์ ์ํฅ๋ ฅ์ ํ์ฌํ๊ธฐ ์ด๋ ต๋ค. ๋๋ผ์ด ๋ณํ ์๋๋ฅผ ๋ฐ๋ผ๊ฐ๊ธฐ ์ด๋ ต๋ค๋ฉด ํน์ ๋๋ฉ์ธ์์ ์์ ๋ง์ ์ปค๋ฎค๋ํฐ๋ฅผ ๋ง๋ค์ด ํ์ฅํ๋ ๊ฒ์ ์ข์ ์ ํ์ด๋ค.
10 ) Try Things that Shouldnโt Work
์๊ท๋ชจ ์ฐ๊ตฌ๋ ์คํ์ ์ฆ๊ฑฐ๋ก๋ ์ค๋ช ํ ์ ์๋ "Shouldn't work" ์คํจํ ๊ฐ๋ฅ์ฑ์ด ๋์ ๊ฒ์ ํ ์ ์๋ค. ์ด๋ ๋๊ธฐ์ ์ ์ฐ๊ตฌ์ค์์๋ ์๋ ์กฐ์ฐจํ์ง ์์ ๊ฒ์ด๋ค. ์คํจ๋ ์ฑ๊ณต๊ณผ ๊ฐ์ด ๊ฐ์น๊ฐ ์๋ค. ๋๊ธฐ์ ์ ์คํจ๋ ๋ง๋ํ ๋น์ฉ์ ์์ค์ด์ง๋ง ์๊ท๋ชจ์ ์์ค์ ์ํ์ด ๋ฎ๋ค. AI์ ๋ง์ ์ค์ํ ๋ฐ๋ช ๊ณผ ์์ด๋์ด๋ 'wrong' ์คํจ๋ฅผ ํตํด ๋์๋ค. ํนํ ์ด๋ก ์ ์ผ๋ก ์๋ํด์๋ ์๋๋ ์ด์ ๊ฐ ์์์๋ ๋ถ๊ตฌํ๊ณ ์ฐ๊ตฌ์๋ค์ด ์ ๊ฒฝ๋ง ์ฐ๊ตฌ์ ํฌ๊ธฐํ์ง ์๊ณ ์ฐ๊ตฌํ ๋ฐ์ ๋น๋กฏ๋๋ค. (Backpropagation ,1985)

์ญ์ ํ ์๊ณ ๋ฆฌ์ฆ์ ์ ๊ฒฝ๋ง ๋คํธ์ํฌ ์ฐ๊ตฌ์ ์ ์ฉํ๋ฉฐ ๋น์ ๋ฆฌ์์ค ๋ฌธ์ ์๋ ๋ถ๊ตฌํ๊ณ ๊ณ์ํด์ ์ฐ๊ตฌ๋ฅผ ์งํํ๋ฉฐ 2019๋ ํ๋ง์์ ๋ฐ์ผ๋ฉฐ ์ค๋๋ ์ด์์๋ ์์ธ์ด ๋์๋ค.
11 ) Do Things that Have Bad Options
๋๊ธฐ์ ์์๋ ์ค๋ฆฌ์ ์ด๋ฏธ์ง์ ๋ํ ์ ์ฝ์ด ๋ง๋ค. ๊ทธ ์๋ก ํํ์ด ์กฐ๊ธ์ด๋ผ๋ ๋๋น ์ง๋ค๋ฉด ํด๊ณ ์ ์ํ์ด ์์ ์ ์๋ค. ๋ฐ๋ผ์ ํ๋ก์ ํธ ๋ํ ์ ์คํ ์ค์ ํด์ผํ๋ค. ์ง๋จ์ด ์์ ์๋ก ์์ ๋๋ ๋์์ง๋ค. ํด๊ณ ์ ๊ทธ๋์์ ๋ฒ์ด๋ ๋ค์ํ ํ๋ก์ ํธ๋ฅผ ํ ์ ์๋ค. ํน์ ์๊ฐ์ ํ์ผ๋ก ๊ธ์ ์์ฑํ๋ ๋ชจ๋ธ์ ๋ง๋ ๋ค๊ณ ํ์๋ ๋๊ธฐ์ ์ ๊ฒฝ์ฐ ๋ด์ค 1๋ฉด์ ์ค๋ฆฌ ๋ฌธ์ ๋ก ๊ฑฐ๋ก ๋ ์ ์๋ค. ๋ฐ๋๋ก ์๊ท๋ชจ์ ๊ฒฝ์ฐ ๋ ๋ฐ์ ์์ด ์์ ํ๋ค. ์ด๋ฅผ ์ด์ฉํด ๋๊ธฐ์ ์์ ํ ์ ์๋ ๊ฒ๋ค์ ํด๋ผ.

12 ) Start it Up; Spin it Out!
๋๊ท๋ชจ ์ฐ๊ตฌ๋ฅผ ์ํด์๋ ๋ํ์ ์์๋ง์ผ๋ก๋ ์ถฉ๋ถํ์ง ์๋ค. AI ์ฐ๊ตฌ๋ฅผ ์์ฉํ ํ ์ ์๋ ํ์ฌ๋ฅผ ์ฐฝ์ ํด๋ผ.
๋ ผ๋ฌธ ์ ์๋ modl.ai๋ฅผ ์ค๋ฆฝํด ์ ํ์ ์๋น์คํ๋ฉฐ ํฌ์๋ฅผ ๋ฐ์ ์ฐ๊ตฌ๋ฅผ ์งํํ๋ค.
modl.ai | AI Engine for game development
Get an army of AI and ML bots that play, grow, and learn.
modl.ai
2๋ ์ ๊ฐ๋ฐ ๊ธฐ๊ฐ์ ํตํด ์์ ์ ์ธ ๋ฐ์ด์ ์ฌ๋๋ค. ๋ฌผ๋ก ์ฑ๊ณต์ ์ธ ์ผ์ด์ค์ด์ง๋ง ์ดํ ํ๊ณ ์ฐ๊ตฌํ ๋ณด๋ค ๊ฒ์์ ๊ณ์ ๋ฏธ์น๋ ์ํฅ๋ ฅ์ด ๋ ์ปค์ก๋ค๋ ์ฌ์ค์ด ์๋ค.
13, 14) Collaborate or Jump Ship! & How Can Large Players in Industry Help?
์์ ์ผ์ด์ค๊ฐ ์ ํฉํ์ง ์๋ค๋ฉด ๋๊ธฐ์ ๊ณผ์ ํ์ ์ ํตํด ๋ฆฌ์์ค ๋ฌธ์ ๋ฅผ ํด๊ฒฐ ํ ์ ์๋ค. ๋๊ธฐ์ ๊ณผ์ ํ๋ ฅ์ ์ฑ๊ณต์ ์ธ ๋ ผ๋ฌธ์ ๋ฐํํ๋๋ฐ ๋์์ด ๋๋ค. ํํธ๋์ฝ์ ํตํด ์ฐ๊ตฌ ๋ฒ์๋ฅผ ๋ํ ์ ์์ผ๋ฉฐ ๊ธฐ์ ์์์ผ๋ก ํธ์ ๋ ์๋ ์๋ค.
'๐พ Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Drag Your GAN] Interactive Point-based Manipulation on the Generative Image Manifold (0) | 2023.07.02 |
---|---|
[RL] Stable-baselines3 gym -> gymnasium (0) | 2023.04.20 |
[RL] Soft Actor-Critic (a.k.a SAC) (0) | 2023.04.12 |
[M1] Whisper.cpp Deploy C++ (ALL OS-) (0) | 2023.04.06 |
[RL] Deep Deterministic Policy Gradient (A.K.A DDPG) (0) | 2023.04.04 |
https://arxiv.org/abs/2304.06035
Choose Your Weapon: Survival Strategies for Depressed AI Academics
Are you an AI researcher at an academic institution? Are you anxious you are not coping with the current pace of AI advancements? Do you feel you have no (or very limited) access to the computational and human resources required for an AI research breakthr
arxiv.org
Abstract
AI ์ข ์ฌ์์ธ๊ฐ์? ๋ต
์ ์ ์ปค์ ธ๊ฐ๋ AI ๋ฐ์ ์๋์ ๋ถ์ํ๊ณ ์๋๊ฐ? ๋ต ..
AI ์ฐ๊ตฌ์ ํ์ํ ๋ฆฌ์์ค๊ฐ ์๋นํ ๋ถ์กฑํ๊ณ ์ ํ์ ์ด๋ผ ์๊ฐํ๋์? ๋ต .. 3090
๋ณธ ๋ ผ๋ฌธ์ ํ์ฌ ์ํฉ์์ ๊ฒฝ์๋ ฅ์ ๊ฐ์ถ๊ธฐ ์ํ ๋ฐฉ๋ฒ์ ๋ํด ๋ ผ์ํฉ๋๋ค.
Introduction

OpenAI, Deepmind, meta, google brain ๋ฑ ๋ค์์ ๋น AI ๊ธฐ์ ๋ค์ ์ํ AI ์ฐ๊ตฌ์๋ค์ gigantic neural net model์ ํ๋ จ์์ผ ๋๋ผ์ด ์ฑ๊ณผ๋ฅผ ์ด๋ฃจ์๋ค... ๊ณผ์ฐ ์ด gigantic ํ๋ จ์ ๋ฐ๋ผ๊ฐ ์ ์๋ ์ฐ๊ตฌ์ง์ด ๋ช์ด ๋ ์ง ์๋นํ ์ด๋ ค์ด ๋๊ด์ ๋๋ถ๋ถ์ ์ฐ๊ตฌ ์ข ์ฌ์๋ค์ด ๊ธฐ์ ์ ํ๊ณ์ ๊ณ ๋ฏผ์ ๋์ฌ์๋ค. (์ปดํจํ ํ์๊ฐ ๋น์ฐ์ ์๊ตฌ๋๋ ๋ฌธ์ ์ง์ )

ImageNet๋ถํฐ ChatGPT, GPT-4๊น์ง ๋ฐ์ ์ผ๋ก ๋ณด์ ๋ง์ ์์ ์์์ ๋ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ผ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค. ์ค๋๋ ์ฐ๊ตฌ์๋ค์ด ์ฌ์ฉํ๋ ์์๊ณผ์ ๊ฒฉ์ฐจ๋ ๋งค๋ ์ปค์ง๊ณ ์๋ค. ์๋ฌด๋ฆฌ ์ข์ ์์ด๋์ด๋ฅผ ๊ฐ์ง๊ณ ์์ด๋ ์ฝ๊ฒ ํ ์ ์๋ ์ผ์ ์ฝ๊ฒ ํ ์ ์์ ์ ๋์ ์์์ ๊ฐ์ง ์ฌ๋๊ณผ์ ๊ฒฝ์์ ๋ ๋ค๋ฅธ ๋ฌธ์ ์ด๋ค. (ex, GPT-3 vs LSTM Word2Vec)
๋ ผ๋ฌธ์ ์ ์๋ ๋ํ ์ข ์ ๊ต์์ด์ง๋ง ํ๋ฐฐ๋ค์ ์ํด ๊ฐ์ด ๊ณ ๋ฏผ ,, ๊ธฐ๋ง์ ํ๊ณ ์๋ค.
Solution
1 ) Give Up!
ํฌ๊ธฐ๋ ์ธ์ ๋ ํ๋์ ์ ํ์ง์ด๋ค. AI๋ฅผ ๋ ๋๋ ๊ฒ์ด ์๋๋ผ AI SOTA๋ฅผ ๋๋ ํ๊ณ๋ฅผ ๋๋ ์ผ์ ํฌ๊ธฐํ๋ ๊ฒ์ด๋ค. ํ์ฌ ์ํฉ์์ ๊ฒฝ๋ ฅ์ ์์ ์ ์ง๋ฅผ ๋ํ๊ณ ์๊ธ์ ํ๋ณดํด ๊ธฐ์ ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์!
2 ) Try Scaling Anyway!
์ ๋ฉด์ผ๋ก ๊ฐ์! CPU์ GPU ๋ฆฌ์์ค ํ๋ณด๋ฅผ ์ํ ์๊ธ ํ๋ณด. ํด๋ผ์ฐ๋ ๋น์ฉ์ผ๋ก 5๋ง ๋ฌ๋ฌ๋ฅผ ํ๋ณดํด ๋๊ท๋ชจ ์คํ์ ํ๋ค๊ณ ๊ฐ์ ํ์ ๋ ์ด๋ GPT-3์ ํ์ต ๋น์ฉ๊ณผ ๋น๊ตํ๋ฉด ์๋นํ ์ ์ ๊ธ์ก์ด๋ค. ์ต๊ทผ ๋ง์ธํฌ๋ํํธ์์ ๋ค์ด์๋ชฌ๋ ๊ณก๊ดญ์ด๋ฅผ ๋ง๋๋ ๋ฒ์ ํ์ตํ OpenAI Agent๋ 720 * V100 GPU๋ฅผ 9์ผ ๊ฐ ํ์ต์ ํ์ผ๋ฉฐ ์ด๋ ์์ญ๋ง ๋ฌ๋ฌ์ ๋ฌํ๋ ๊ธ์ก์ด๋ค. ์ ์๋ฏธํ ์คํ์ ํ๊ธฐ ์ํด์๋ ์ง์์ ์ธ ํฌ์์ ๊ฒฐ๊ณผ๊ฐ ์์ด์ผ ํ๋ค. ๋ฐ์ฌ ๊ณผ์ ์ ํ์์ด ๋ ผ๋ฌธ 1 ์ ์์ ์์ผ๋ ค๋ฉด ์ํํธ์จ์ด์ ์ธ ๊ธฐ์ ์ ์ง์์ด ํ์๋ก ํ์ํ๋ค. ํ์ง๋ง ์ด ๋ ๊ฐ์ง๋ฅผ ๊ฐ์ถ๊ธฐ๋ ๋ถ๊ฐ๋ฅํ๋ค. (ํจ์จ์ ์๊ธ, ์ธ์ ๊ด๋ฆฌ ํ์)
"The structures needed for successful large scale projects are simply not compatible
with the structures of academia."
3 ) Scale Down
toy problems์ ์ง์คํ์ - Transformer๋ ๊ฐ๋จํ ์ ๊ฒฝ๋ง ๋ชจํ์ผ๋ก๋ ํด๊ฒฐํ ์ ์๋ ๋ฌธ์ ๋ ์๋นํ ๋ง๋ค. ์ ์ ๋ฆฌ์์ค ํ๊ฒฝ์ toy size ํ๋ก์ ํธ๋ค์ ์ค์ ํ๋์์ ๋ฒ์ฉ์ผ๋ก ์ฌ์ฉํ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ฃผ๋ฏ๋ก ์ ์๋ฏธํ ์ฑ๊ณผ๋ฅผ ๋ผ ์ ์๋ค.
4 ) Reuse and Remaster
์ง๋ 10๋ ๋์ AI๊ฐ ๋น ๋ฅด๊ฒ ๋ฐ์ ํ ์ ์์๋ ์ด์ ๋ ๋ฐ๋ก ์ฐ๊ตฌ์๋ค์ด ์์ ์ ์ฝ๋์ ๋ชจ๋ธ์ ์ปค๋ฎค๋ํฐ์ ๊ณต์ ํ๊ธฐ ๋๋ฌธ์ด๋ค. ๋๊ท๋ชจ ๋ชจ๋ธ์ ํ์ฉํด ์๊ฐ์ ์ค์ผ ์ ์๋ค. ๋ค๋ง, ๋๊ท๋ชจ ๋ชจ๋ธ์ fine-tuning์ ์คํํ๊ธฐ ์ด๋ ค์ธ๋ฟ๋๋ฌ ์ข์ ์ฑ๋ฅ์ ๋ด๊ธฐ๋ ์ด๋ ต๋ค.
5 ) Analysis Instrad of Synthesis
"Another thing to do with the publicly available pretrained models is to analyze them."
์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ํ์ฉํด ๋ค๋ฅธ ์ผ์ ํด๋ณด๋ ๊ฒ, ์๋ก์ด ๊ธฐ๋ฅ์ ์ง์ ์ ์ผ๋ก ๊ธฐ์ฌํ์ง๋ ์๋๋ผ๋ ๊ณผํ์ ๊ธฐ์ฌํ ์ ์๋ค.
์๋ฅผ ๋ค๋ฉด Transformer๋ ๋๊ตฌ์๊ฒ๋ ์ง๊ด์ ์ธ ๊ฒ์ด ์๋๋ฉฐ, ์ด๋ฌํ ๋ชจ๋ธ์ด ํ์ต๋๋ ๋ฐ์ดํฐ์ ๊ท๋ชจ๋ ํ๋์ ์๋ ์ฌ๋์ด ์๋๊ณ ์๋ Task์ ๋ํ ์๊ฐ/๋น์ฉ์ ์ถ์ฐํ๊ธฐ ์ด๋ ต๋ค. ์ดํด๋ฅผ ๋๊ธฐ ์ํด ์ฐฝ์์ ์ผ๋ก ์กฐ์ฌํ๊ณ , ๊ฐ๋ ์ ์ผ๋ก ์ ๊ทผํด์ผ ํ๋ ์ผ์ด ๋ง๋ค. ์ด๋ ๋ค๋ฅธ ์ด์ ์๊ฐ์ ์ค์ฌ์ฃผ๊ณ ๋ฆฌ์์ค๋ฅผ ๊ฐ์ง ๋ค๋ฅธ ์ฌ๋์๊ฒ๋ ์ง๋ฆ๊ธธ์ ์๋ดํด ์ค ์ ์๋ค.

6 ) RL! No Data!
๊ฐํํ์ต์ ๋ฐ์ดํฐ(์ ์ ์ธ ์ธก๋ฉด)๋ฅผ ์ถ์ํ๊ณ ๋ชจ๋ธ๋ง์ ์ง์คํด์ AI ๋ฌธ์ ๋ก ์ ๊ทผํ ์ ์๋ค. ๊ฐํํ์ต์ ๋ฐ์ดํฐ์ ๊ฐ์ฉ์ฑ, ๋ถ์ ๋ฐ ์ ์ฅ ์ด๋ฐ ๊ธฐ์ ์ ์ธ ํ๋ก์ธ์ค๋ฅผ ์ฐํํ ์ ์๋ค.(๋ก์ง์ด ๋ ์ค์ํ๋ค.)
7 ) Small Models! No Compute!
๋ชจ๋ธ์ ๊ท๋ชจ๋ฅผ ์ค์ฌ ๋ฆฌ์์ค๋ฅผ ์ค์ฌ๋ผ. ๋ ์์ ๋ชจ๋ธ์ ํ์๋กํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค. ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ๊ฐ์ฅ ์์ ๋ชจ๋ธ์ ์๊ฐํด๋ณด์๋ผ. ์ด๋ ์ค์ ์ดํ๋ฆฌ์ผ์ด์ ์ ํนํ ์ค์ํ๊ณ ๊ด๋ จ์ฑ์ด ๋๋ค.
(Toss ์์ฐ์ด ๊ฒ์ ์๋น์ค)
https://youtu.be/BLO-P5o8mkg?si=S-Rj7j1cmixP3oNf
์ด์ฒ๋ผ ๋ฐ์ดํฐ ์์ ๋คํธ์ํฌ์ ์ฃ์ง์ AI๋ฅผ ๋ฐฐํฌํ ์์๋ค. ์ด๋ฅผ "Edge AI"(=ondevice AI)๋ผ๊ณ ํ๋ค. ํน์ ๋๋ฉ์ธ์์ ํจ๊ณผ์ ์ผ๋ก AI๊ฐ ๊ธฐ์ฌํ ์ ์๋ค. ์ฐ๊ตฌ๋ฅผ ํ๋ค๋ณด๋ฉด ๋ด๋ถ ๋ชจ๋ธ์ ๋ํ ์ดํด๊ฐ ๋ถ์กฑํ ๋ ๋ํ๊ตฌ๋ฅผ ์ฐพ์ ํด๊ฒฐํ๋ฏ๋ก AI ๋ชจ๋ธ ์ฐ๊ตฌ์ ๋ ์ฌํ ๊ณผ์ ์ผ๋ก ๊ฐ ์ ์๋ค. ์์ ๋ชจ๋ธ์ด ํ ์ ์๋ ์ผ์ ํ๊ณ๊ฐ ์์ง๋ง ์ฐ์ ๋ถ์ผ์์ ์ด๋ฐ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์ค์์ฑ์ ๊ณ์ ์ฆ๊ฐํ๊ณ ์๋ค.
8, 9 ) Work on Specialized Application Areas or Domains & Solve Problems Few Care About (For Now!)
์ ์ฆ๋ ์ฐ๊ตฌ ๋ถ์ผ๋ฅผ ์ ํํ๊ณ ๊ทธ ์์์ ํ์ ์ ์ฐพ์๋ผ. ์์ด๋์ด๋ฅผ ์์ ํ ์๋ก์ด ์์ญ์์ ๊ฐ์ ธ์ ํ ์คํธํ๋ ๊ฒ์ ์ฑ๊ณต์ ์ผ ์ ์์ผ๋, ๊ทธ ๊ฒฐ๊ณผ๊ฐ ์์ญ์ ๋์ด ํฐ ์ํฅ์ ๋ฏธ์น๋ ๊ฒฝ์ฐ๋ ๋๋ฌผ๋ค. ํ์ ์์ญ์ด ์์์ ์ฐ๊ตฌ์๋ค์ ๋ ธ๋ ฅ์ผ๋ก ๋ฐ์ ๋๋ ์ฌ๋ก๋ ๋ง๋ค. ํ์ฌ ๊ฒ์ ์ ๊ณ ์ปค๋ฎค๋ํฐ๋ ์ต์ ๊ฒ์์ AI๋ฅผ ๋์ ํ๋ ๋๊ธฐ์ ์ ๊ฑฐ์ ์๊ธฐ ๋๋ฌธ์ ์ด ์ ๋ต์ ์ ํจํ๋ค. (๋ ผ๋ฌธ ์ ์, ๊ฒ์์ ๊ณ ๊ฐํํ์ต ์ฐ๊ตฌ์)
๋น๋์ค ๊ฒ์(00๋ ๋)์ ์ปดํจํฐ ๋น์ ์ฐ๊ตฌ ์ปค๋ฎค๋ํฐ๊ฐ ํ์ฑํ๋ ์ฌ๋ก๋ฅผ ์๊ฐํด๋ณด์. (IJCAI, AAAI). ์ปค๋ฎค๋ํฐ๋ฅผ ์ง๋ฐฐํ Neural Network, Deep Learning์ SVM๊ณผ regression model์ด RL๊ณผ DL์์ ๋ค์ค Agent ํ์ต๊ณผ cognitive/affect model์ ๋ฐ์ ์ ์ด๋ฃฌ ๊ฒ๊ณผ ๋น์ทํ๋ค. ์ปดํจํฐ ๋น์ ์ ๋ชจ๋๊ณผ ๊ด์ฌ์ ๊ฐ๊ณ ๋ ผ๋ฌธ ์ฌ์ฌ ๋ํ ์ด๋ฅผ ๊ณ ๋ คํ๋ค๋ฉด ์๊ธฐ์ ์ํฅ๋ ฅ์ ํ์ฌํ๊ธฐ ์ด๋ ต๋ค. ๋๋ผ์ด ๋ณํ ์๋๋ฅผ ๋ฐ๋ผ๊ฐ๊ธฐ ์ด๋ ต๋ค๋ฉด ํน์ ๋๋ฉ์ธ์์ ์์ ๋ง์ ์ปค๋ฎค๋ํฐ๋ฅผ ๋ง๋ค์ด ํ์ฅํ๋ ๊ฒ์ ์ข์ ์ ํ์ด๋ค.
10 ) Try Things that Shouldnโt Work
์๊ท๋ชจ ์ฐ๊ตฌ๋ ์คํ์ ์ฆ๊ฑฐ๋ก๋ ์ค๋ช ํ ์ ์๋ "Shouldn't work" ์คํจํ ๊ฐ๋ฅ์ฑ์ด ๋์ ๊ฒ์ ํ ์ ์๋ค. ์ด๋ ๋๊ธฐ์ ์ ์ฐ๊ตฌ์ค์์๋ ์๋ ์กฐ์ฐจํ์ง ์์ ๊ฒ์ด๋ค. ์คํจ๋ ์ฑ๊ณต๊ณผ ๊ฐ์ด ๊ฐ์น๊ฐ ์๋ค. ๋๊ธฐ์ ์ ์คํจ๋ ๋ง๋ํ ๋น์ฉ์ ์์ค์ด์ง๋ง ์๊ท๋ชจ์ ์์ค์ ์ํ์ด ๋ฎ๋ค. AI์ ๋ง์ ์ค์ํ ๋ฐ๋ช ๊ณผ ์์ด๋์ด๋ 'wrong' ์คํจ๋ฅผ ํตํด ๋์๋ค. ํนํ ์ด๋ก ์ ์ผ๋ก ์๋ํด์๋ ์๋๋ ์ด์ ๊ฐ ์์์๋ ๋ถ๊ตฌํ๊ณ ์ฐ๊ตฌ์๋ค์ด ์ ๊ฒฝ๋ง ์ฐ๊ตฌ์ ํฌ๊ธฐํ์ง ์๊ณ ์ฐ๊ตฌํ ๋ฐ์ ๋น๋กฏ๋๋ค. (Backpropagation ,1985)

์ญ์ ํ ์๊ณ ๋ฆฌ์ฆ์ ์ ๊ฒฝ๋ง ๋คํธ์ํฌ ์ฐ๊ตฌ์ ์ ์ฉํ๋ฉฐ ๋น์ ๋ฆฌ์์ค ๋ฌธ์ ์๋ ๋ถ๊ตฌํ๊ณ ๊ณ์ํด์ ์ฐ๊ตฌ๋ฅผ ์งํํ๋ฉฐ 2019๋ ํ๋ง์์ ๋ฐ์ผ๋ฉฐ ์ค๋๋ ์ด์์๋ ์์ธ์ด ๋์๋ค.
11 ) Do Things that Have Bad Options
๋๊ธฐ์ ์์๋ ์ค๋ฆฌ์ ์ด๋ฏธ์ง์ ๋ํ ์ ์ฝ์ด ๋ง๋ค. ๊ทธ ์๋ก ํํ์ด ์กฐ๊ธ์ด๋ผ๋ ๋๋น ์ง๋ค๋ฉด ํด๊ณ ์ ์ํ์ด ์์ ์ ์๋ค. ๋ฐ๋ผ์ ํ๋ก์ ํธ ๋ํ ์ ์คํ ์ค์ ํด์ผํ๋ค. ์ง๋จ์ด ์์ ์๋ก ์์ ๋๋ ๋์์ง๋ค. ํด๊ณ ์ ๊ทธ๋์์ ๋ฒ์ด๋ ๋ค์ํ ํ๋ก์ ํธ๋ฅผ ํ ์ ์๋ค. ํน์ ์๊ฐ์ ํ์ผ๋ก ๊ธ์ ์์ฑํ๋ ๋ชจ๋ธ์ ๋ง๋ ๋ค๊ณ ํ์๋ ๋๊ธฐ์ ์ ๊ฒฝ์ฐ ๋ด์ค 1๋ฉด์ ์ค๋ฆฌ ๋ฌธ์ ๋ก ๊ฑฐ๋ก ๋ ์ ์๋ค. ๋ฐ๋๋ก ์๊ท๋ชจ์ ๊ฒฝ์ฐ ๋ ๋ฐ์ ์์ด ์์ ํ๋ค. ์ด๋ฅผ ์ด์ฉํด ๋๊ธฐ์ ์์ ํ ์ ์๋ ๊ฒ๋ค์ ํด๋ผ.

12 ) Start it Up; Spin it Out!
๋๊ท๋ชจ ์ฐ๊ตฌ๋ฅผ ์ํด์๋ ๋ํ์ ์์๋ง์ผ๋ก๋ ์ถฉ๋ถํ์ง ์๋ค. AI ์ฐ๊ตฌ๋ฅผ ์์ฉํ ํ ์ ์๋ ํ์ฌ๋ฅผ ์ฐฝ์ ํด๋ผ.
๋ ผ๋ฌธ ์ ์๋ modl.ai๋ฅผ ์ค๋ฆฝํด ์ ํ์ ์๋น์คํ๋ฉฐ ํฌ์๋ฅผ ๋ฐ์ ์ฐ๊ตฌ๋ฅผ ์งํํ๋ค.
modl.ai | AI Engine for game development
Get an army of AI and ML bots that play, grow, and learn.
modl.ai
2๋ ์ ๊ฐ๋ฐ ๊ธฐ๊ฐ์ ํตํด ์์ ์ ์ธ ๋ฐ์ด์ ์ฌ๋๋ค. ๋ฌผ๋ก ์ฑ๊ณต์ ์ธ ์ผ์ด์ค์ด์ง๋ง ์ดํ ํ๊ณ ์ฐ๊ตฌํ ๋ณด๋ค ๊ฒ์์ ๊ณ์ ๋ฏธ์น๋ ์ํฅ๋ ฅ์ด ๋ ์ปค์ก๋ค๋ ์ฌ์ค์ด ์๋ค.
13, 14) Collaborate or Jump Ship! & How Can Large Players in Industry Help?
์์ ์ผ์ด์ค๊ฐ ์ ํฉํ์ง ์๋ค๋ฉด ๋๊ธฐ์ ๊ณผ์ ํ์ ์ ํตํด ๋ฆฌ์์ค ๋ฌธ์ ๋ฅผ ํด๊ฒฐ ํ ์ ์๋ค. ๋๊ธฐ์ ๊ณผ์ ํ๋ ฅ์ ์ฑ๊ณต์ ์ธ ๋ ผ๋ฌธ์ ๋ฐํํ๋๋ฐ ๋์์ด ๋๋ค. ํํธ๋์ฝ์ ํตํด ์ฐ๊ตฌ ๋ฒ์๋ฅผ ๋ํ ์ ์์ผ๋ฉฐ ๊ธฐ์ ์์์ผ๋ก ํธ์ ๋ ์๋ ์๋ค.
'๐พ Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Drag Your GAN] Interactive Point-based Manipulation on the Generative Image Manifold (0) | 2023.07.02 |
---|---|
[RL] Stable-baselines3 gym -> gymnasium (0) | 2023.04.20 |
[RL] Soft Actor-Critic (a.k.a SAC) (0) | 2023.04.12 |
[M1] Whisper.cpp Deploy C++ (ALL OS-) (0) | 2023.04.06 |
[RL] Deep Deterministic Policy Gradient (A.K.A DDPG) (0) | 2023.04.04 |