728x90

LLM03:2023 Inadequate Sandboxing

μ„€λͺ…:
λΆ€μ μ ˆν•œ μƒŒλ“œλ°•μ‹±μ€ LLM이 μ™ΈλΆ€ λ¦¬μ†ŒμŠ€λ‚˜ λ―Όκ°ν•œ μ‹œμŠ€ν…œμ— μ ‘κ·Όν•  λ•Œ μ μ ˆν•˜κ²Œ κ²©λ¦¬λ˜μ§€ μ•ŠλŠ” μƒνƒœλ₯Ό λ§ν•©λ‹ˆλ‹€. μ΄λŠ” 잠재적인 μ•…μš©, 무단 μ ‘κ·Ό, λ˜λŠ” LLM에 μ˜ν•œ μ˜λ„ν•˜μ§€ μ•Šμ€ λ™μž‘μ„ μ΄ˆλž˜ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

일반적인 λΆ€μ μ ˆν•œ μƒŒλ“œλ°•μ‹± 취약점:

  • LLM ν™˜κ²½μ„ λ‹€λ₯Έ μ€‘μš”ν•œ μ‹œμŠ€ν…œμ΄λ‚˜ 데이터 μ €μž₯μ†Œμ™€ μΆ©λΆ„νžˆ λΆ„λ¦¬ν•˜μ§€ λͺ»ν•˜λŠ” 경우
  • LLM이 μ μ ˆν•œ μ œν•œ 없이 λ―Όκ°ν•œ λ¦¬μ†ŒμŠ€μ— μ ‘κ·Όν•  수 μžˆλŠ” 경우
  • μ‹œμŠ€ν…œ μˆ˜μ€€μ˜ λ™μž‘μ΄λ‚˜ λ‹€λ₯Έ ν”„λ‘œμ„ΈμŠ€μ™€μ˜ μƒν˜Έμž‘μš©κ³Ό 같은 LLM의 κΈ°λŠ₯을 μ œν•œν•˜μ§€ λͺ»ν•˜λŠ” 경우

예방 방법:

  • LLM ν™˜κ²½μ„ λ‹€λ₯Έ μ€‘μš”ν•œ μ‹œμŠ€ν…œκ³Ό λ¦¬μ†ŒμŠ€λ‘œλΆ€ν„° κ²©λ¦¬ν•˜κΈ° μœ„ν•΄ μ μ ˆν•œ μƒŒλ“œλ°•μ‹± κΈ°μˆ μ„ κ΅¬ν˜„ν•©λ‹ˆλ‹€.
  • LLM의 λ―Όκ°ν•œ λ¦¬μ†ŒμŠ€ 접근을 μ œν•œν•˜κ³ , μ˜λ„ν•œ λͺ©μ μ„ μœ„ν•΄ ν•„μš”ν•œ μ΅œμ†Œν•œμ˜ κΈ°λŠ₯만 ν—ˆμš©ν•©λ‹ˆλ‹€.
  • LLM의 ν™˜κ²½κ³Ό μ ‘κ·Ό μ œμ–΄λ₯Ό μ •κΈ°μ μœΌλ‘œ κ°μ‚¬ν•˜κ³  κ²€ν† ν•˜μ—¬ μ μ ˆν•œ 격리가 μœ μ§€λ˜λ„λ‘ ν•©λ‹ˆλ‹€.
  • LLM μƒν˜Έμž‘μš©μ„ λͺ¨λ‹ˆν„°λ§ν•˜κ³  둜그λ₯Ό κΈ°λ‘ν•˜μ—¬ μƒŒλ“œλ°•μ‹± 문제λ₯Ό κ°μ§€ν•˜κ³  λΆ„μ„ν•©λ‹ˆλ‹€.

μ˜ˆμ‹œ 곡격 μ‹œλ‚˜λ¦¬μ˜€:

  • μ‹œλ‚˜λ¦¬μ˜€ #1: κ³΅κ²©μžλŠ” LLM이 λ―Όκ°ν•œ λ°μ΄ν„°λ² μ΄μŠ€μ— μ ‘κ·Όν•  수 μžˆλŠ” 상황을 μ•…μš©ν•˜μ—¬ LLMμ—κ²Œ κΈ°λ°€ 정보λ₯Ό μΆ”μΆœν•˜κ³  κ³΅κ°œν•˜λ„λ‘ λͺ…령을 μ‘°μž‘ν•©λ‹ˆλ‹€.
  • μ‹œλ‚˜λ¦¬μ˜€ #2: LLM이 μ‹œμŠ€ν…œ μˆ˜μ€€μ˜ λ™μž‘μ„ μˆ˜ν–‰ν•  수 있으며, κ³΅κ²©μžλŠ” LLM을 μ‘°μž‘ν•˜μ—¬ κΈ°λ°€λ˜μ§€ μ•Šμ€ λͺ…령을 μ‹€ν–‰ν•˜λ„λ‘ ν•©λ‹ˆλ‹€.

λΆ€μ μ ˆν•œ μƒŒλ“œλ°•μ‹±κ³Ό κ΄€λ ¨λœ μœ„ν—˜μ„ μ΄ν•΄ν•˜κ³  λŒ€μ‘ν•¨μœΌλ‘œμ¨ κ°œλ°œμžλŠ” μžμ‹ λ“€μ˜ LLM κ΅¬ν˜„μ„ 보닀 μ•ˆμ „ν•˜κ³  μ•ˆμ •μ μœΌλ‘œ λ³΄ν˜Έν•  수 μžˆμŠ΅λ‹ˆλ‹€.

 

 

λ°˜μ‘ν˜•
λ‹€ν–ˆλ‹€