[CMSA] Yann Lecun | Objective-Driven AI (2)
ยท
๐ Routine
Auto-Regressive Large Language Models (AR-LLMs) ํ๋์ ํ
์คํธ ํ ํฐ ๋ค์์ ๋ค๋ฅธ ํ ํฐ์ ์ถ๋ ฅ ํ ํฐ์ ๋จ์ด๋ ํ์๋จ์ด๋ฅผ ๋ํ๋ ์ธ์ฝ๋/์์ธก๊ธฐ๋ ์์ญ์ต ๊ฐ์ ๋งค๊ฐ๋ณ์๋ฅผ ๊ฐ์ง ํธ๋์คํฌ๋จธ ์ํคํ
์ฒ ์ผ๋ฐ์ ์ผ๋ก 10์ต ~ 5,000์ต ๊ฐ์ ๋งค๊ฐ๋ณ์ ํ๋ จ ๋ฐ์ดํฐ: 1์กฐ ~ 2์กฐ ๊ฐ์ ํ ํฐ ์ฌ์ฉ ๋ํ/ํ
์คํธ ์์ฑ LLM ์ข
๋ฅ Open Source : BlenderBot, Galactica, LlaMa, Llama-2, Code Llama (FAIR), Mistral-7B, Mixtral-4x7 B (Mistral), Falcon (UAE), Alpaca (Stanford), Yi (01.AI), OLMo (AI2), Gemma (Google) Proprietary : Meta A..