Model deprecations
OpenAI์ ๊ฐ์ด vectordb๋ฅผ ๊ตฌ์ถํ ์ ์๊ฒ embedding API๋ฅผ ์ง์ํ๋ ์๋น์ค๊ฐ ๋ง์์ก๋ค. ์ด๋ฌํ platform์ ์ผ๋ฐ์ธ๋ค์ด ๋ณด์ ํ๊ธฐ ์ด๋ ค์ด GPU ์์์ ํด์ํด ์ฃผ๋ฉด์ ์ ๋ ดํ๊ฒ ์ด์ฉํ ์ ์์ผ๋ ํฌ๋ ํฐ ๋จ์ ์ด ์๋ค. legacy model์ ์ง์์ด ์์ํ์ง ์๋ค๋ ๊ฒ์ด๋ค. ์๋ฅผ ๋ค๋ฉด ๋ด๊ฐ ๋ชจ์ ์๋ฃ๋ฅผ ๋ชจ๋ vectorํ ์์ผ vectordb๋ฅผ ๊ตฌ์ถํ๊ณ RAG๋ RetrievalQA๋ฅผ ํตํด ์ง์๋ฅผ ํ๋๋ฐ ์ ๋์ค๋ ๋ต๋ณ์ด ์กฐ๊ธ์ฉ ํ์ด์ง ์ ์๋ค. ๊ทธ ์์ธ์ผ๋ก text-embedding-ada-002๋ก ๊ตฌ์ถํด ๋์ embedding vector ๊ฐ๋ค์ด text-embedding-ada-003์์๋ ์ ํจํ์ง ์์ ๊ทธ๋ ๋ค. ๋ฐ๋ผ์ ์ด๋ฌํ ์ผ์ด ์์ผ๋ ค๋ฉด text-embedding-ada-002 ์๋น์ค๊ฐ ์ข ๋ฃ๋๊ธฐ ์ ์ v3๋ก ๋ค migration์ ํด์ผ ํ๋ค. platform์ ์ฌ์ฉํ๋ ๊ฒ์ ํธ๋ฆฌํ์ง๋ง ์ด๋ ๊ฒ ๋ฒ์ ์ ์ด ๋น ๋ฅด๊ฒ ์ด๋ฃจ์ด์ง๋ฉด ์ง์๋ก ์คํ๋ ค ๋น์ฉ๊ณผ ์๊ฐ์ด ๋ง์ด ์์๋ ์ ์๋ค.
https://platform.openai.com/docs/deprecations

ํ๊ธ embedding ๊นกํจ์ text-embedding-ada-002๋ ์์ง ์ง์ ์ค๋จ์ด ์์ง๋ง ์ง์์ด ์ค๋จ๋๋ค๋ฉด ์ฌํ๊ฐ ํด๊ฒ์ผ๋ก ๋ณด์ธ๋ค.
https://github.com/ssisOneTeam/Korean-Embedding-Model-Performance-Benchmark-for-Retriever.
GitHub - ssisOneTeam/Korean-Embedding-Model-Performance-Benchmark-for-Retriever: Korean Sentence Embedding Model Performance Ben
Korean Sentence Embedding Model Performance Benchmark for RAG - ssisOneTeam/Korean-Embedding-Model-Performance-Benchmark-for-Retriever
github.com
๋์ : Local Embedding Model
Local embedding model์ด ์ ๋ง ๋ง์ง๋ง ํ๊ตญ์ด ํนํ, ํ๊ตญ์ด ์ ์ฉ ๋ชจ๋ธ์ ๋ง์ด ์๋ค. Model hosting site Huggingface์์ sentence-transformers ์ง์ ๋ชจ๋ธ์์ ์ฐพ์๋ณด๋ฉด ๋๋ค. ์ด ๋ชจ๋ธ tag๊ฐ ์๋ ๋ชจ๋ธ์ langchain, chromadb ๋ฑ ๋ค์ํ ๋ชจ๋ธ์์ ๋ชจ๋ธ ๋ช ๋ง ์๋ฉด import, download ๊ฐ๋ฅํ๋ค.
https://huggingface.co/models?library=sentence-transformers
Models - Hugging Face
huggingface.co
๋ด๊ฐ ์ํ๋ ๋ชจ๋ธ์ ์ฃผ๋ก ํ์ฉ token ์๊ฐ ๊ธธ์ด์ผํ๊ณ coding๊ณผ ํ๊ตญ์ด๋ฅผ ์ํ๋ ๋ชจ๋ธ์ ์ฃผ๋ก ์ฐพ์๋ค. max_length๊ฐ ์งง์ผ๋ฉด ํ์ฉ ๋ฌธ์ฅ์ ๊ธธ์ด๋ฅผ ์์๋ก ์๋ผ์ค์ผ ํด ์ ์ฒ๋ฆฌ์ ์๊ณ ๊ฐ ๋ง์์ง๋ค. ๋ฒ๊ฑฐ๋ก์์ ์ค์ด๊ธฐ ์ํด ์ ๋นํ๊ณ ํฐ embedding model ์ด์ฌ์ผ ํด bge-m3 Embedding Model์ ์ฌ์ฉํ๋ค.
bge-m3
์ค๊ตญ๊ณผํ๊ธฐ์ ๋ํ๊ต์์ ๋ฐํํ ๋ชจ๋ธ๋ก ๋ค๊ตญ์ด 100๊ฐ ์ด์์ ์ธ์ด๋ฅผ ์ฒ๋ฆฌํ๋ ๋ชจ๋ธ ๋ถ๋ฌธ์์ SOTA๋ก ์๊ฐํ๊ณ ์๋ค. LLM๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก ์ฌ๋ฌ ๊ฒ์ฆ ๋ฐฉ์์ด ์๊ณ ์งํ๊ฐ ์์ง๋ง ๊ฒฐ๊ณผ๊ฐ ๊ฐ๊ฐ์ธ๋ง๋ค ๋๋ผ๋ ์ฐจ์ด์ ์ค๋ฅ๊ฐ ๋ค์ํด HumanEval์ ์ง์ ์ํํ์ง ์๋ ์ด์ ์ด๋ ์ ๋ ์ข์ ์ก๋์ง ์ ์๋ ์์ผ๋ local๋ก ์ ๊ณตํด ์ฃผ๋ ๊ฒ๋ง์ผ๋ก๋ ๊ฐ์ฌํ๊ณ 8192์ max_length๊น์ง ์ปค๋ฒ ๊ฐ๋ฅํด ์ถ์ฒํ๋ค.
MKQA, Multilingual Knowledge Questions & Answers

'๐ ๏ธ Tools' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Gemini] gemini calculate Tokenize in Locally (0) | 2024.07.06 |
---|---|
[Ollama] Response Structure Answer (0) | 2024.07.01 |
[draw.io] sql๋ฌธ ๊ฐ์ ธ์ค๊ธฐ (0) | 2024.06.03 |
[crewAI] Multi-agent Custormer Support Automation (3) (0) | 2024.05.25 |
[CrewAI] Key elements of AI agent (2) (0) | 2024.05.21 |
Model deprecations
OpenAI์ ๊ฐ์ด vectordb๋ฅผ ๊ตฌ์ถํ ์ ์๊ฒ embedding API๋ฅผ ์ง์ํ๋ ์๋น์ค๊ฐ ๋ง์์ก๋ค. ์ด๋ฌํ platform์ ์ผ๋ฐ์ธ๋ค์ด ๋ณด์ ํ๊ธฐ ์ด๋ ค์ด GPU ์์์ ํด์ํด ์ฃผ๋ฉด์ ์ ๋ ดํ๊ฒ ์ด์ฉํ ์ ์์ผ๋ ํฌ๋ ํฐ ๋จ์ ์ด ์๋ค. legacy model์ ์ง์์ด ์์ํ์ง ์๋ค๋ ๊ฒ์ด๋ค. ์๋ฅผ ๋ค๋ฉด ๋ด๊ฐ ๋ชจ์ ์๋ฃ๋ฅผ ๋ชจ๋ vectorํ ์์ผ vectordb๋ฅผ ๊ตฌ์ถํ๊ณ RAG๋ RetrievalQA๋ฅผ ํตํด ์ง์๋ฅผ ํ๋๋ฐ ์ ๋์ค๋ ๋ต๋ณ์ด ์กฐ๊ธ์ฉ ํ์ด์ง ์ ์๋ค. ๊ทธ ์์ธ์ผ๋ก text-embedding-ada-002๋ก ๊ตฌ์ถํด ๋์ embedding vector ๊ฐ๋ค์ด text-embedding-ada-003์์๋ ์ ํจํ์ง ์์ ๊ทธ๋ ๋ค. ๋ฐ๋ผ์ ์ด๋ฌํ ์ผ์ด ์์ผ๋ ค๋ฉด text-embedding-ada-002 ์๋น์ค๊ฐ ์ข ๋ฃ๋๊ธฐ ์ ์ v3๋ก ๋ค migration์ ํด์ผ ํ๋ค. platform์ ์ฌ์ฉํ๋ ๊ฒ์ ํธ๋ฆฌํ์ง๋ง ์ด๋ ๊ฒ ๋ฒ์ ์ ์ด ๋น ๋ฅด๊ฒ ์ด๋ฃจ์ด์ง๋ฉด ์ง์๋ก ์คํ๋ ค ๋น์ฉ๊ณผ ์๊ฐ์ด ๋ง์ด ์์๋ ์ ์๋ค.
https://platform.openai.com/docs/deprecations

ํ๊ธ embedding ๊นกํจ์ text-embedding-ada-002๋ ์์ง ์ง์ ์ค๋จ์ด ์์ง๋ง ์ง์์ด ์ค๋จ๋๋ค๋ฉด ์ฌํ๊ฐ ํด๊ฒ์ผ๋ก ๋ณด์ธ๋ค.
https://github.com/ssisOneTeam/Korean-Embedding-Model-Performance-Benchmark-for-Retriever.
GitHub - ssisOneTeam/Korean-Embedding-Model-Performance-Benchmark-for-Retriever: Korean Sentence Embedding Model Performance Ben
Korean Sentence Embedding Model Performance Benchmark for RAG - ssisOneTeam/Korean-Embedding-Model-Performance-Benchmark-for-Retriever
github.com
๋์ : Local Embedding Model
Local embedding model์ด ์ ๋ง ๋ง์ง๋ง ํ๊ตญ์ด ํนํ, ํ๊ตญ์ด ์ ์ฉ ๋ชจ๋ธ์ ๋ง์ด ์๋ค. Model hosting site Huggingface์์ sentence-transformers ์ง์ ๋ชจ๋ธ์์ ์ฐพ์๋ณด๋ฉด ๋๋ค. ์ด ๋ชจ๋ธ tag๊ฐ ์๋ ๋ชจ๋ธ์ langchain, chromadb ๋ฑ ๋ค์ํ ๋ชจ๋ธ์์ ๋ชจ๋ธ ๋ช ๋ง ์๋ฉด import, download ๊ฐ๋ฅํ๋ค.
https://huggingface.co/models?library=sentence-transformers
Models - Hugging Face
huggingface.co
๋ด๊ฐ ์ํ๋ ๋ชจ๋ธ์ ์ฃผ๋ก ํ์ฉ token ์๊ฐ ๊ธธ์ด์ผํ๊ณ coding๊ณผ ํ๊ตญ์ด๋ฅผ ์ํ๋ ๋ชจ๋ธ์ ์ฃผ๋ก ์ฐพ์๋ค. max_length๊ฐ ์งง์ผ๋ฉด ํ์ฉ ๋ฌธ์ฅ์ ๊ธธ์ด๋ฅผ ์์๋ก ์๋ผ์ค์ผ ํด ์ ์ฒ๋ฆฌ์ ์๊ณ ๊ฐ ๋ง์์ง๋ค. ๋ฒ๊ฑฐ๋ก์์ ์ค์ด๊ธฐ ์ํด ์ ๋นํ๊ณ ํฐ embedding model ์ด์ฌ์ผ ํด bge-m3 Embedding Model์ ์ฌ์ฉํ๋ค.
bge-m3
์ค๊ตญ๊ณผํ๊ธฐ์ ๋ํ๊ต์์ ๋ฐํํ ๋ชจ๋ธ๋ก ๋ค๊ตญ์ด 100๊ฐ ์ด์์ ์ธ์ด๋ฅผ ์ฒ๋ฆฌํ๋ ๋ชจ๋ธ ๋ถ๋ฌธ์์ SOTA๋ก ์๊ฐํ๊ณ ์๋ค. LLM๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก ์ฌ๋ฌ ๊ฒ์ฆ ๋ฐฉ์์ด ์๊ณ ์งํ๊ฐ ์์ง๋ง ๊ฒฐ๊ณผ๊ฐ ๊ฐ๊ฐ์ธ๋ง๋ค ๋๋ผ๋ ์ฐจ์ด์ ์ค๋ฅ๊ฐ ๋ค์ํด HumanEval์ ์ง์ ์ํํ์ง ์๋ ์ด์ ์ด๋ ์ ๋ ์ข์ ์ก๋์ง ์ ์๋ ์์ผ๋ local๋ก ์ ๊ณตํด ์ฃผ๋ ๊ฒ๋ง์ผ๋ก๋ ๊ฐ์ฌํ๊ณ 8192์ max_length๊น์ง ์ปค๋ฒ ๊ฐ๋ฅํด ์ถ์ฒํ๋ค.
MKQA, Multilingual Knowledge Questions & Answers

'๐ ๏ธ Tools' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Gemini] gemini calculate Tokenize in Locally (0) | 2024.07.06 |
---|---|
[Ollama] Response Structure Answer (0) | 2024.07.01 |
[draw.io] sql๋ฌธ ๊ฐ์ ธ์ค๊ธฐ (0) | 2024.06.03 |
[crewAI] Multi-agent Custormer Support Automation (3) (0) | 2024.05.25 |
[CrewAI] Key elements of AI agent (2) (0) | 2024.05.21 |