📖+20 XP
🎧+15 XP
✅+25 XP
레벨 A2 – 기초 / 초중급CEFR A2
2 분
85 단어
대형 언어 모델(LLM)은 조언이나 지침에 자주 쓰입니다. 노스캐롤라이나 주립대학교 연구진은 이런 모델이 안전한 답을 내도록 하는 방법을 분석했습니다. 안전 정렬은 중요합니다.
연구진은 두 가지 문제를 찾았습니다. 하나는 안전 훈련으로 모델 정확도가 떨어질 수 있다는 점으로, 이를 정렬 비용이라고 불렀습니다. 다른 하나는 표면적 안전 검사가 있어 사용자가 때때로 이를 우회할 수 있다는 점입니다. 예를 들어 단순히 나쁜 행동을 묻는 질문은 거부되지만, 이유를 달면 모델이 답할 수 있습니다.
연구팀은 미세조정 과정에서 일부 신경을 고정하면 안전 행동을 유지할 수 있음을 보였습니다. 관련 정보와 코드가 공개될 예정입니다.
어려운 단어·표현
- 정렬 — 모델의 행동을 목표와 맞추는 일안전 정렬, 정렬 비용
- 미세조정 — 모델을 조금 더 학습시키는 과정
- 우회하다 — 문제를 피하려고 다른 방법을 쓰다우회할
- 정확도 — 결과나 답이 맞는 정도를 나타내는정확도가
- 공개되다 — 모든 사람에게 보여 주거나 알리다공개될
- 비용 — 어떤 일을 위해 필요한 돈이나 자원정렬 비용
팁: 글에서 강조된 단어에 마우스를 올리거나 포커스/탭하면, 읽거나 들으면서 바로 간단한 뜻을 볼 수 있습니다.
토론 질문
- 안전 정렬이 왜 중요하다고 생각합니까?
- 본문에 나온 우회 방법을 한 문장으로 설명해 보세요.
- 미세조정에서 일부 신경을 고정하는 것이 어떤 도움이 될지 짧게 말해 보세요.