[OWASP-LLM] Top 10 List for Large Language Models version 0.1 - (7) Inadequate AI Alignment
ยท
๐Ÿƒ Routine
LLM07:2023 ๋ถˆ์ถฉ๋ถ„ํ•œ AI ์กฐ์ • ์„ค๋ช…: ๋ถˆ์ถฉ๋ถ„ํ•œ AI ์ •๋ ฌ์€ LLM์˜ ๋ชฉํ‘œ์™€ ํ–‰๋™์ด ์˜๋„ํ•œ ์‚ฌ์šฉ ์‚ฌ๋ก€์™€ ์ผ์น˜ํ•˜์ง€ ์•Š์•„ ์›ํ•˜์ง€ ์•Š๋Š” ๊ฒฐ๊ณผ๋‚˜ ์ทจ์•ฝ์ ์ด ๋ฐœ์ƒํ•˜๋Š” ๊ฒฝ์šฐ์ž…๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์ธ AI ์ •๋ ฌ ๋ฌธ์ œ: ๋ชฉํ‘œ๊ฐ€ ๋ช…ํ™•ํžˆ ์ •์˜๋˜์ง€ ์•Š์•„ LLM์ด ์›ํ•˜์ง€ ์•Š๊ฑฐ๋‚˜ ์œ ํ•ดํ•œ ํ–‰๋™์„ ์šฐ์„ ์‹œํ•˜๋Š” ๊ฒฝ์šฐ ์ •๋ ฌ๋˜์ง€ ์•Š์€ ๋ณด์ƒ ํ•จ์ˆ˜ ๋˜๋Š” ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋กœ ์ธํ•ด ์˜๋„ํ•˜์ง€ ์•Š์€ ๋ชจ๋ธ ํ–‰๋™์ด ๋ฐœ์ƒํ•˜๋Š” ๊ฒฝ์šฐ ๋‹ค์–‘ํ•œ ๋งฅ๋ฝ๊ณผ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ LLM์˜ ํ–‰๋™์„ ์ถฉ๋ถ„ํžˆ ํ…Œ์ŠคํŠธํ•˜๊ณ  ๊ฒ€์ฆํ•˜์ง€ ์•Š์€ ๊ฒฝ์šฐ ์˜ˆ๋ฐฉ ๋ฐฉ๋ฒ•: LLM์˜ ๋ชฉํ‘œ์™€ ์˜๋„๋œ ํ–‰๋™์„ ์„ค๊ณ„ ๋ฐ ๊ฐœ๋ฐœ ๊ณผ์ • ์ค‘์— ๋ช…ํ™•ํžˆ ์ •์˜ํ•ฉ๋‹ˆ๋‹ค. ๋ณด์ƒ ํ•จ์ˆ˜์™€ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๊ฐ€ ์›ํ•˜๋Š” ๊ฒฐ๊ณผ์™€ ์ผ์น˜ํ•˜๋ฉฐ ์›ํ•˜์ง€ ์•Š๊ฑฐ๋‚˜ ์œ ํ•ดํ•œ ํ–‰๋™์„ ์œ ๋ฐœํ•˜์ง€ ์•Š๋„๋ก ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์–‘ํ•œ ์‹œ๋‚˜๋ฆฌ์˜ค, ์ž…๋ ฅ ๋ฐ ๋งฅ๋ฝ์—์„œ LLM์˜ ํ–‰๋™์„ ์ •๋ ฌ ๋ฌธ์ œ..
๋‹คํ–ˆ๋‹ค