Model deprecations
OpenAI์ ๊ฐ์ด vectordb๋ฅผ ๊ตฌ์ถํ ์ ์๊ฒ embedding API๋ฅผ ์ง์ํ๋ ์๋น์ค๊ฐ ๋ง์์ก๋ค. ์ด๋ฌํ platform์ ์ผ๋ฐ์ธ๋ค์ด ๋ณด์ ํ๊ธฐ ์ด๋ ค์ด GPU ์์์ ํด์ํด ์ฃผ๋ฉด์ ์ ๋ ดํ๊ฒ ์ด์ฉํ ์ ์์ผ๋ ํฌ๋ ํฐ ๋จ์ ์ด ์๋ค. legacy model์ ์ง์์ด ์์ํ์ง ์๋ค๋ ๊ฒ์ด๋ค. ์๋ฅผ ๋ค๋ฉด ๋ด๊ฐ ๋ชจ์ ์๋ฃ๋ฅผ ๋ชจ๋ vectorํ ์์ผ vectordb๋ฅผ ๊ตฌ์ถํ๊ณ RAG๋ RetrievalQA๋ฅผ ํตํด ์ง์๋ฅผ ํ๋๋ฐ ์ ๋์ค๋ ๋ต๋ณ์ด ์กฐ๊ธ์ฉ ํ์ด์ง ์ ์๋ค. ๊ทธ ์์ธ์ผ๋ก text-embedding-ada-002๋ก ๊ตฌ์ถํด ๋์ embedding vector ๊ฐ๋ค์ด text-embedding-ada-003์์๋ ์ ํจํ์ง ์์ ๊ทธ๋ ๋ค. ๋ฐ๋ผ์ ์ด๋ฌํ ์ผ์ด ์์ผ๋ ค๋ฉด text-embedding-ada-002 ์๋น์ค๊ฐ ์ข ๋ฃ๋๊ธฐ ์ ์ v3๋ก ๋ค migration์ ํด์ผ ํ๋ค. platform์ ์ฌ์ฉํ๋ ๊ฒ์ ํธ๋ฆฌํ์ง๋ง ์ด๋ ๊ฒ ๋ฒ์ ์ ์ด ๋น ๋ฅด๊ฒ ์ด๋ฃจ์ด์ง๋ฉด ์ง์๋ก ์คํ๋ ค ๋น์ฉ๊ณผ ์๊ฐ์ด ๋ง์ด ์์๋ ์ ์๋ค.
https://platform.openai.com/docs/deprecations
ํ๊ธ embedding ๊นกํจ์ text-embedding-ada-002๋ ์์ง ์ง์ ์ค๋จ์ด ์์ง๋ง ์ง์์ด ์ค๋จ๋๋ค๋ฉด ์ฌํ๊ฐ ํด๊ฒ์ผ๋ก ๋ณด์ธ๋ค.
https://github.com/ssisOneTeam/Korean-Embedding-Model-Performance-Benchmark-for-Retriever.
๋์ : Local Embedding Model
Local embedding model์ด ์ ๋ง ๋ง์ง๋ง ํ๊ตญ์ด ํนํ, ํ๊ตญ์ด ์ ์ฉ ๋ชจ๋ธ์ ๋ง์ด ์๋ค. Model hosting site Huggingface์์ sentence-transformers ์ง์ ๋ชจ๋ธ์์ ์ฐพ์๋ณด๋ฉด ๋๋ค. ์ด ๋ชจ๋ธ tag๊ฐ ์๋ ๋ชจ๋ธ์ langchain, chromadb ๋ฑ ๋ค์ํ ๋ชจ๋ธ์์ ๋ชจ๋ธ ๋ช ๋ง ์๋ฉด import, download ๊ฐ๋ฅํ๋ค.
https://huggingface.co/models?library=sentence-transformers
๋ด๊ฐ ์ํ๋ ๋ชจ๋ธ์ ์ฃผ๋ก ํ์ฉ token ์๊ฐ ๊ธธ์ด์ผํ๊ณ coding๊ณผ ํ๊ตญ์ด๋ฅผ ์ํ๋ ๋ชจ๋ธ์ ์ฃผ๋ก ์ฐพ์๋ค. max_length๊ฐ ์งง์ผ๋ฉด ํ์ฉ ๋ฌธ์ฅ์ ๊ธธ์ด๋ฅผ ์์๋ก ์๋ผ์ค์ผ ํด ์ ์ฒ๋ฆฌ์ ์๊ณ ๊ฐ ๋ง์์ง๋ค. ๋ฒ๊ฑฐ๋ก์์ ์ค์ด๊ธฐ ์ํด ์ ๋นํ๊ณ ํฐ embedding model ์ด์ฌ์ผ ํด bge-m3 Embedding Model์ ์ฌ์ฉํ๋ค.
bge-m3
์ค๊ตญ๊ณผํ๊ธฐ์ ๋ํ๊ต์์ ๋ฐํํ ๋ชจ๋ธ๋ก ๋ค๊ตญ์ด 100๊ฐ ์ด์์ ์ธ์ด๋ฅผ ์ฒ๋ฆฌํ๋ ๋ชจ๋ธ ๋ถ๋ฌธ์์ SOTA๋ก ์๊ฐํ๊ณ ์๋ค. LLM๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก ์ฌ๋ฌ ๊ฒ์ฆ ๋ฐฉ์์ด ์๊ณ ์งํ๊ฐ ์์ง๋ง ๊ฒฐ๊ณผ๊ฐ ๊ฐ๊ฐ์ธ๋ง๋ค ๋๋ผ๋ ์ฐจ์ด์ ์ค๋ฅ๊ฐ ๋ค์ํด HumanEval์ ์ง์ ์ํํ์ง ์๋ ์ด์ ์ด๋ ์ ๋ ์ข์ ์ก๋์ง ์ ์๋ ์์ผ๋ local๋ก ์ ๊ณตํด ์ฃผ๋ ๊ฒ๋ง์ผ๋ก๋ ๊ฐ์ฌํ๊ณ 8192์ max_length๊น์ง ์ปค๋ฒ ๊ฐ๋ฅํด ์ถ์ฒํ๋ค.
MKQA, Multilingual Knowledge Questions & Answers
'๐ ๏ธ Tools' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Gemini] gemini calculate Tokenize in Locally (0) | 2024.07.06 |
---|---|
[Ollama] Response Structure Answer (0) | 2024.07.01 |
[draw.io] sql๋ฌธ ๊ฐ์ ธ์ค๊ธฐ (0) | 2024.06.03 |
[crewAI] Multi-agent Custormer Support Automation (3) (0) | 2024.05.25 |
[CrewAI] Key elements of AI agent (2) (0) | 2024.05.21 |