도수분포표 독해 (Histograms)

TL;DR

Lumist의 2,700명 이상 학생 데이터 분석 결과, 문제 해결 & 데이터 분석 영역의 오답률은 21%를 차지합니다. 특히 히스토그램 문제에서 그래프의 축이나 눈금을 잘못 읽어 발생하는 오류가 35%에 달하므로, 문제를 풀기 전 x축과 y축의 의미를 꼼꼼히 확인해야 합니다.

빠른 답변: 히스토그램(도수분포표)은 데이터의 빈도(frequency)를 막대 형태로 나타낸 그래프로, 축의 눈금(scale)과 분포의 형태를 정확히 파악하는 것이 핵심입니다. 복잡한 계산보다는 그래프의 대칭성을 통해 평균(mean)과 중앙값(median)을 비교하는 직관적인 독해력이 중요합니다.

graph TD
    A["히스토그램 확인"] --> B["x축 데이터 구간 파악"]
    B --> C["y축 빈도수 파악"]
    C --> D{"구하고자 하는 값은?"}
    D -->|전체 데이터 수| E["모든 막대의 y값 합산"]
    D -->|중앙값/평균| F["분포의 대칭성 및 꼬리 방향 확인"]
    D -->|특정 구간 비율| G["해당 구간 y값 / 전체 y값 합산"]

도수분포표 독해란?

도수분포표(Frequency Table)의 데이터를 시각적으로 표현한 것이 바로 히스토그램(Histogram)입니다. x축은 데이터의 구간(interval)을, y축은 해당 구간에 속하는 데이터의 개수, 즉 빈도(frequency)를 나타냅니다. College Board에서 출제하는 Digital SAT에서는 복잡한 통계 계산보다는 그래프를 보고 데이터의 전반적인 형태를 해석하는 능력을 평가합니다.

이 개념은 한국 중학교 수학의 '도수분포표와 히스토그램' 단원과 고등학교 확률과 통계의 '연속확률분포' 기초와 맞닿아 있습니다. 한국 수능에서는 주로 수식과 표를 이용한 계산이 주를 이루지만, SAT에서는 눈으로 분포의 치우침을 확인하고 평균 (mean)과 중앙값 (median)의 대소 관계를 추론하는 직관적 문제가 자주 출제됩니다. 또한, 계산이 필요할 경우 Desmos를 활용하여 실수를 줄일 수 있습니다.

단계별 풀이법

  1. 1단계: 축의 라벨과 단위 확인하기 — x축이 나타내는 변수와 구간의 크기, y축이 나타내는 빈도수의 눈금(scale)을 정확히 읽습니다.
  2. 2단계: 전체 데이터 개수 구하기 — 각 막대의 y값을 모두 더하여 전체 관측치의 개수(Total frequency)를 파악합니다.
  3. 3단계: 중앙값(median) 위치 찾기 — 전체 데이터 개수가 nn일 때, 중앙값은 대략 n+12\frac{n+1}{2} 번째에 위치합니다. 왼쪽 막대부터 빈도를 누적하며 이 위치가 어느 구간에 속하는지 찾습니다.
  4. 4단계: 분포의 형태 분석하기 — 그래프가 좌우 대칭인지(Symmetric), 오른쪽으로 꼬리가 긴지(Right-skewed), 왼쪽으로 꼬리가 긴지(Left-skewed) 파악하여 평균 (mean)과 중앙값 (median)을 비교합니다.

Desmos 꿀팁

한국 수능 수학과 달리, SAT는 계산기(Desmos) 사용이 가능합니다. 히스토그램은 시각적 자료라 계산기 의존도가 낮을 것 같지만, 각 구간의 대표값과 빈도를 리스트로 만들어 평균이나 중앙값을 빠르게 확인할 수 있습니다.

예를 들어, 데이터가 10이 3개, 20이 5개, 30이 2개 있다면, Desmos 입력창에 L = [10,10,10,20,20,20,20,20,30,30]이라고 리스트를 만든 후, mean(L) 또는 median(L)을 입력하면 즉시 값을 구해줍니다. 눈으로 덧셈을 하다가 실수하는 것을 완벽하게 방지할 수 있습니다.

풀이 예제

문제: A histogram shows the distribution of the number of hours 25 students spent volunteering last month. The frequency for each interval is as follows:

  • 0 to 9 hours: 4 students
  • 10 to 19 hours: 6 students
  • 20 to 29 hours: 8 students
  • 30 to 39 hours: 5 students
  • 40 to 49 hours: 2 students

Which interval contains the median number of volunteer hours?

A) 10 to 19 hours B) 20 to 29 hours C) 30 to 39 hours D) 40 to 49 hours

풀이:

1단계: 전체 학생 수는 25명입니다. 중앙값 (median)이 위치하는 순서를 찾기 위해 다음 공식을 사용합니다.

n+12=25+12=13\frac{n + 1}{2} = \frac{25 + 1}{2} = 13

따라서 중앙값은 13번째 학생의 봉사활동 시간입니다.

2단계: 작은 구간부터 빈도를 누적하여 13번째 학생이 어디에 속하는지 찾습니다.

  • 0~9시간: 4명 (누적: 4명)
  • 10~19시간: 6명 (누적: 4 + 6 = 10명)
  • 20~29시간: 8명 (누적: 10 + 8 = 18명)

3단계: 누적 인원이 10명에서 18명으로 넘어가는 구간이 '20 to 29 hours'이므로, 11번째부터 18번째 학생은 모두 이 구간에 속합니다. 당연히 13번째 학생도 이 구간에 있습니다.

정답은 B) 20 to 29 hours 입니다.

자주 하는 실수

  1. 축과 눈금(scale)을 잘못 읽는 실수 — Lumist 학생 데이터에 따르면, 문제 해결 & 데이터 분석 영역에서 발생하는 오류의 35%가 그래프의 축이나 눈금을 잘못 읽어서 발생합니다. y축 눈금이 1칸당 1이 아니라 2나 5 단위일 수 있으므로 항상 주의해야 합니다. 이때 단위 비율에 대한 감각이 축을 정확히 읽는 데 도움이 됩니다.

  2. 비대칭 분포에서 평균과 중앙값을 혼동하는 실수 — Lumist 데이터에 의하면, 학생들의 22%가 꼬리가 긴 비대칭 분포에서 평균 (mean)과 중앙값 (median)을 헷갈려 합니다. 가장 흔한 함정은 분포의 형태와 상관없이 무조건 평균과 중앙값이 같다고 가정하는 것입니다(이는 완벽한 대칭일 때만 성립합니다). 꼬리가 오른쪽으로 길면 큰 예외 값들이 평균을 끌어올려 평균 > 중앙값이 됩니다.

히스토그램에서 특정 구간의 데이터가 전체에서 차지하는 비율(percentage)을 구할 때는 비례식 교차곱 원리를 활용하여 계산하면 빠르고 정확합니다.

Practice this topic on Lumist

7,000+ questions with AI-powered feedback

Related Topics

계수 의미 해석 (Interpreting Coefficients)

Lumist의 2,700명 이상의 학생 데이터 분석 결과, 대수 영역 오답의 약 23%가 선형 모델에서 기울기(slope)와 y절편(y-intercept)의 역할을 혼동해서 발생했습니다. 식을 계산하는 것을 넘어 각 숫자가 지니는 실생활 문맥을 정확히 파악하는 것이 핵심입니다.

일률 문제 (Work Rate Problems)

Lumist 2,700명 이상의 학생 데이터 분석 결과, 문제 해결 & 데이터 분석 영역에서 단위 변환이나 비율 계산을 누락하는 패턴으로 인한 오류가 18%를 차지했습니다. 특히 일률 문제에서는 개별 작업 시간을 단순히 더하거나 평균 내는 치명적인 실수가 자주 발생하므로, 반드시 역수 형태의 방정식 (equation)을 세우는 훈련이 필요합니다.

점그래프 독해 (Dot Plots)

Lumist 2,700명 이상의 학생 데이터 분석 결과, 문제 해결 & 데이터 분석 영역에서 그래프 축이나 단위를 잘못 읽어 발생하는 오류가 35%를 차지했습니다. 특히 비대칭 분포에서 평균(mean)과 중앙값(median)을 혼동하는 경우가 22%에 달하므로 점그래프의 형태를 정확히 파악하는 것이 중요합니다.

기울기 의미 해석 (Interpreting Slope)

Lumist의 학생 데이터 분석 결과, 문제 해결 & 데이터 분석 영역의 기울기 문제에서 그래프의 축이나 축척을 잘못 읽어 발생하는 오류가 전체의 35%를 차지했습니다. 또한, 방정식에서 기울기 (slope)와 y절편 (y-intercept)의 역할을 혼동하는 경우도 23%에 달해, 문제의 맥락(context)을 정확히 파악하는 연습이 필수적입니다.

선형 vs 지수 모델 선택 (Linear vs. Exponential Model Choice)

Lumist 데이터 분석 결과, 문제 해결 & 데이터 분석 영역의 전반적인 오류율은 21%입니다. 특히 모델 선택 문제에서 60%의 학생들이 초기에 지수 성장(1+r)과 감소(1-r) 인자를 혼동하여 오답을 선택하는 패턴을 보였습니다.

AI SAT 준비
지금 시작하세요

Lumist Mascot
Lumist AI App
도수분포표 독해 (Histograms) | Lumist.ai