평균 계산 방법
평균(average)은 데이터를 대표하는 중심 값을 구하는 가장 기본적인 통계 방법입니다. 산술평균, 중앙값, 최빈값 등 여러 종류가 있으며, 데이터의 특성에 따라 적절한 방법을 선택해야 합니다.
1. 산술평균 (Arithmetic Mean)
산술평균 = (모든 값의 합) ÷ (값의 개수)
공식: x̄ = (x₁ + x₂ + ... + xₙ) ÷ n
예) 10, 20, 30의 평균 = (10 + 20 + 30) ÷ 3 = 20
2. 중앙값 (Median)
데이터를 크기순으로 정렬한 뒤 가운데 값:
- 개수가 홀수: 정확히 가운데 값
- 개수가 짝수: 가운데 두 값의 평균
예) {3, 7, 9, 12, 15} → 중앙값 = 9 (3번째 값) 예) {3, 7, 9, 12} → 중앙값 = (7 + 9) ÷ 2 = 8 (2,3번째 평균)
3. 최빈값 (Mode)
가장 자주 등장하는 값. 여러 개일 수 있으며, 모두 1회 등장 시 최빈값 없음.
예) {1, 2, 2, 3, 3, 3, 4} → 최빈값 = 3 (3회 등장) 예) {1, 1, 2, 2, 3} → 최빈값 = 1, 2 (다중 최빈)
4. 표준편차 & 분산
분산(σ²) = Σ(각 값 - 평균)² ÷ N
표준편차(σ) = √분산
표준편차가 클수록 데이터가 평균에서 멀리 흩어져 있습니다.
계산 예시
예시 1: 시험 점수 5개 — 78, 85, 92, 68, 95
| 통계량 | 계산 | 결과 |
|---|---|---|
| 합계 | 78 + 85 + 92 + 68 + 95 | 418 |
| 평균 | 418 ÷ 5 | 83.6 |
| 중앙값 | 정렬: 68, 78, 85, 92, 95 → 3번째 | 85 |
| 최솟값 / 최댓값 | 68 / 95 | |
| 범위 | 95 - 68 | 27 |
| 분산 | [(78-83.6)² + (85-83.6)² + (92-83.6)² + (68-83.6)² + (95-83.6)²] ÷ 5 | 89.84 |
| 표준편차 | √89.84 | 9.48 |
예시 2: 이상치가 있는 데이터 — 30, 32, 31, 35, 200
| 통계량 | 결과 | 해석 |
|---|---|---|
| 평균 | 65.6 | 이상치(200)에 의해 크게 왜곡 |
| 중앙값 | 32 | 실제 데이터 중심에 가까움 |
| 표준편차 | 67.2 | 매우 큰 산포 |
→ 이런 경우 중앙값이 데이터를 더 잘 대표합니다.
예시 3: 가중평균 — 학점 계산 (4.5만점)
| 과목 | 학점(가중치) | 성적(점수) | 학점×점수 |
|---|---|---|---|
| 수학 | 3 | 4.5 | 13.5 |
| 영어 | 2 | 3.5 | 7.0 |
| 과학 | 3 | 4.0 | 12.0 |
| 합계 | 8 | 32.5 |
가중평균(GPA) = 32.5 ÷ 8 = 4.06
평균 vs 중앙값 — 언제 어떤 것을 사용할까?
| 상황 | 적합한 통계량 | 이유 |
|---|---|---|
| 정규분포 데이터 | 평균 | 대칭 분포에서 평균 = 중앙값 |
| 이상치(극단값) 존재 | 중앙값 | 이상치에 강건(robust) |
| 소득, 부동산 가격 | 중앙값 | 극단 고소득/고가 영향 배제 |
| 시험 점수 | 평균 또는 중앙값 | 분포에 따라 결정 |
| 카테고리 데이터 | 최빈값 | "가장 인기 있는" 항목 |
표준편차 해석 (정규분포 기준)
| 범위 | 포함 비율 | 의미 |
|---|---|---|
| 평균 ± 1σ | 약 68% | 대부분의 데이터 |
| 평균 ± 2σ | 약 95% | 거의 모든 데이터 |
| 평균 ± 3σ | 약 99.7% | 사실상 전체 |
예: 평균 70점, 표준편차 10점이면:
- 60~80점 사이에 약 68%의 학생
- 50~90점 사이에 약 95%의 학생
다양한 평균의 종류
| 평균 유형 | 공식 | 용도 |
|---|---|---|
| 산술평균 | Σx / n | 일반적 평균 |
| 가중평균 | Σ(x·w) / Σw | GPA, 포트폴리오 수익률 |
| 기하평균 | (x₁·x₂·...·xₙ)^(1/n) | 성장률, 수익률 평균 |
| 조화평균 | n / Σ(1/xᵢ) | 속도 평균 (같은 거리 왕복 시) |
실용 팁
- 이상치 확인 — 데이터에 극단값이 있다면 중앙값을 함께 확인하세요.
- 표준편차와 함께 — 평균만으로는 데이터 분포를 알 수 없으므로, 반드시 표준편차도 확인.
- 가중평균 활용 — 중요도가 다른 항목(학점, 투자 비중 등)은 가중평균을 사용.
- 분포 시각화 — 히스토그램이나 상자 그림(box plot)으로 데이터 분포를 시각적으로 확인.
- 표본 크기 고려 — 데이터가 적을수록 평균의 신뢰도가 낮으므로, 충분한 표본을 확보.
참고
- 통계학의 기초 교과서 (가장 기본적인 기술통계 개념)
- 한국통계학회: 통계 용어 표준화
- 통계청 (kostat.go.kr): 각종 통계에서 평균/중앙값 활용
※ 이 계산기는 입력한 값을 모집단으로 간주하여 모표준편차를 계산합니다. 표본 데이터인 경우 표본표준편차(N-1로 나누기)를 사용해야 합니다.