통계 분석의 결과가 샘플 선정 방법이나 데이터 수집에 의해 왜곡될 수 있어요. 이는 실제 population을 잘 나타내지 못해 잘못된 결론을 초래할 수 있어요. 따라서 데이터 해석 시 주의가 필요해요.
상관관계는 두 변수 간의 관계를 측정하는 지표이에요. 긍정적인 상관관계는 한 변수가 증가할 때 다른 변수도 증가하고, 부정적인 상관관계는 한 변수가 증가할 때 다른 변수가 감소해요. 이를 통해 데이터의 패턴과 연관성을 분석할 수 있어요.
공분산은 두 변수 간의 관계를 나타내는 지표예요. 값이 양수면 두 변수가 함께 증가하거나 감소하는 경향이 있고, 값이 음수면 하나가 증가할 때 다른 하나는 감소하는 경향이 있어요. 제로에 가까운 값은 두 변수 간의 상관관계가 적음을 의미해요.
빈도표는 데이터의 각 값이 얼마나 자주 나타나는지를 보여줘요. 이를 통해 데이터의 분포와 패턴을 쉽게 이해할 수 있어요. 주로 연구, 설문조사 등의 결과를 분석할 때 유용해요.
데이터의 중앙값을 기준으로 중앙 50%의 범위를 나타내는 지표에요. 이는 이상치의 영향을 최소화하며 데이터의 분포를 이해하는 데 도움을 줘요. 주로 1사분위수와 3사분위수의 차이로 계산해요.
Kurtosis는 데이터 분포의 뾰족함이나 평평함을 나타내는 지표예요. 높은 kurtosis는 분포가 뾰족하고 극단값이 많음을 의미하고, 낮은 kurtosis는 분포가 평평함을 의미해요. 이를 통해 데이터의 분포 특성을 이해할 수 있어요.