빠른 답변: 상자 그림(Box Plot)은 데이터의 최솟값, 1사분위수, 중앙값, 3사분위수, 최댓값을 시각적으로 보여주는 그래프입니다. 각 구간에 데이터의 25%씩 분포한다는 점을 기억하고, Desmos를 활용해 빠르게 데이터의 특징을 파악해 보세요.
graph LR
A["데이터 분석 문제"] --> B["원시 데이터 직접 계산"]
A --> C["상자 그림의 5가지 요약 수치 확인"]
B --> D["시간 소요 및 계산 실수 위험"]
C --> E["빠르고 정확한 분포 파악 및 정답 도출"]
상자 그림 독해란?
상자 그림(Box Plots)은 데이터의 분포를 한눈에 파악할 수 있게 해주는 통계 그래프입니다. College Board의 Digital SAT 수학 섹션 중 '문제 해결 & 데이터 분석' 영역에서 자주 출제됩니다. 이 그래프는 최솟값(Minimum), 제1사분위수(Q1), 중앙값 (median), 제3사분위수(Q3), 최댓값(Maximum)이라는 5가지 요약 수치(Five-number summary)를 선과 상자로 나타냅니다.
이 개념은 한국 중학교 수학의 통계 단원과 고등학교 확률과 통계 과목에서 다루는 내용과 완전히 동일합니다. 하지만 한국 수능 수학과 달리, SAT는 복잡한 수작업 계산보다는 그래프가 의미하는 바를 정확히 해석하는 데 초점을 맞춥니다. 또한, 원시 데이터가 주어졌을 때는 Desmos 계산기를 활용하여 빠르고 정확하게 상자 그림을 그려낼 수 있다는 큰 장점이 있습니다.
단계별 풀이법
상자 그림 문제를 풀 때는 다음 단계를 따르세요.
- 1단계: 축의 눈금(Scale) 파악하기 — 가장 먼저 그래프 아래의 x축 눈금이 얼마씩 커지는지 확인하세요. 1칸이 1인지, 2인지, 5인지 파악하는 것이 중요합니다. 이는 /ko/sat/math/dan-wi-bi-yul 문제에서 단위를 맞추는 것만큼이나 기본적이고 중요합니다.
- 2단계: 5가지 요약 수치 읽기 — 왼쪽 수염의 끝(최솟값), 상자의 왼쪽 모서리(Q1), 상자 안의 굵은 선(중앙값), 상자의 오른쪽 모서리(Q3), 오른쪽 수염의 끝(최댓값)이 각각 어떤 값을 가리키는지 읽어냅니다.
- 3단계: 사분위수 범위(IQR) 또는 전체 범위(Range) 계산하기 — 문제에서 요구하는 값에 따라 범위(최댓값 - 최솟값)나 사분위수 범위(Q3 - Q1)를 계산합니다.
- 4단계: 백분율 (percentage) 해석하기 — 상자 그림의 각 4개 구간은 전체 데이터의 정확히 25%를 포함한다는 사실을 활용하여, 특정 값 이상/이하에 속하는 데이터의 비율 (ratio)을 유추합니다.
Desmos 꿀팁
한국 수능과 달리 SAT에서는 계산기(Desmos) 사용이 가능합니다. 만약 문제에서 상자 그림이 아니라 원시 데이터 목록(예: 12, 15, 18, 22, ...)이 주어지고 이에 해당하는 상자 그림을 찾으라고 한다면, Desmos에 직접 데이터를 입력해 보세요.
입력창에 A = [12, 15, 18, 22, 25, 30]처럼 리스트를 만들고, 다음 줄에 boxplot(A)를 입력하면 Desmos가 자동으로 상자 그림을 그려줍니다. 또는 stats(A)를 입력하면 최솟값, Q1, 중앙값 (median), Q3, 최댓값을 숫자로 한 번에 보여주어 계산 실수를 완벽히 방지할 수 있습니다.
풀이 예제
문제: The box plot below summarizes the distribution of the number of hours 24 students spent studying for an exam. (Imagine a box plot with the following values: Minimum = 2, Q1 = 4, Median = 7, Q3 = 10, Maximum = 14) Based on the box plot, what is the interquartile range of the number of hours the students spent studying?
A) 3 B) 5 C) 6 D) 12
풀이:
1단계: 문제에서 요구하는 것은 '사분위수 범위(interquartile range, IQR)'입니다.
2단계: IQR을 구하는 공식은 다음과 같습니다.
3단계: 상자 그림의 요약 수치를 확인합니다. 상자의 오른쪽 모서리인 제3사분위수(Q3)는 10이고, 상자의 왼쪽 모서리인 제1사분위수(Q1)는 4입니다.
4단계: 공식에 값을 대입하여 계산합니다.
따라서 정답은 C) 6 입니다.
자주 하는 실수
-
그래프 축이나 눈금 잘못 읽기 — Lumist 학생 데이터에 따르면, 문제 해결 & 데이터 분석 영역에서 발생하는 오류의 35%가 그래프의 축이나 눈금을 잘못 읽어서 발생합니다. 눈금 한 칸이 1단위가 아니라 2단위나 5단위일 수 있으므로 항상 축의 숫자를 먼저 확인해야 합니다.
-
평균 (mean)과 중앙값 (median) 혼동하기 — Lumist 데이터에 따르면, 22%의 학생들이 비대칭 분포에서 평균과 중앙값을 혼동합니다. 상자 그림 안의 굵은 선은 항상 중앙값을 나타냅니다. 문제에서 평균을 묻는 함정이 나올 수 있는데, 상자 그림만으로는 대칭 분포가 아닌 이상 평균을 정확히 알 수 없다는 점을 명심하세요. 이는 /ko/sat/math/jeong-bi-rye-yeok-bi-rye에서 변수 간의 관계를 헷갈리는 것만큼 자주 나오는 실수입니다.
