#기계 학습1
2025년 12월 29일
대형 언어 모델이 네 자리 곱셈을 못하는 이유
연구진은 표준 미세 조정과 암묵적 사고 연쇄(ICoT)를 비교해, ICoT가 계산 중간값을 기억해 네 자리 곱셈에서 높은 정확도를 냈음을 보여준다. 간단한 보조 목표로 표준 모델도 개선됐다.
사진 출처: Brett Jordan, Unsplash
연구진은 표준 미세 조정과 암묵적 사고 연쇄(ICoT)를 비교해, ICoT가 계산 중간값을 기억해 네 자리 곱셈에서 높은 정확도를 냈음을 보여준다. 간단한 보조 목표로 표준 모델도 개선됐다.
사진 출처: Brett Jordan, Unsplash