모델의 성능을 측정하는 중요한 지표예요. 정확하게 예측한 샘플의 비율을 나타내요. 높은 값일수록 모델이 더 잘 작동해요.
코사인 유사도는 두 벡터 간의 방향 유사성을 측정하는 방법이에요. 0에서 1 사이의 값을 가지며, 1에 가까울수록 더 유사하다고 할 수 있어요. 주로 텍스트 데이터의 유사도를 평가하는 데 사용돼요.
모델 평가를 위한 기법이에요. 데이터를 여러 부분으로 나누어 여러 번 학습하고 테스트하는 방법이에요. 이를 통해 모델의 일반화 성능을 더 정확하게 평가할 수 있어요.
유클리드 거리는 두 점 사이의 직선 거리를 계산하는 수학적 방법이에요. 이 거리 측정은 주로 머신러닝에서 두 데이터 포인트의 유사성을 평가하는 데 사용돼요. 값이 작을수록 두 데이터 간의 유사성이 높다는 의미예요.
정밀도와 재현율의 조화 평균이에요. 불균형한 데이터셋에서도 성능을 평가할 수 있어요. 0과 1 사이의 값을 가지며, 1에 가까울수록 좋은 성능이에요.