빠른 답변: 평균(Mean)은 모든 값의 합을 개수로 나눈 것이고, 중앙값(Median)은 크기순으로 나열했을 때 가운데 값, 최빈값(Mode)은 가장 자주 등장하는 값입니다. 수능과 달리 Digital SAT에서는 극단적인 값(이상치)이 평균과 중앙값에 미치는 영향을 묻는 문제가 자주 출제되며, Desmos를 활용해 리스트 기능을 쓰면 빠르게 계산할 수 있습니다.
pie title 문제 해결 & 데이터 분석 주요 오답 원인
"그래프 축/비율 오독" : 35
"비대칭 분포에서 평균 vs 중앙값 혼동" : 22
"비율 계산 전 단위 미변환" : 18
"오차 한계(Margin of error) 오해" : 15
"기타" : 10
평균·중앙값·최빈값이란?
데이터의 중심 경향을 나타내는 대푯값에는 세 가지가 있습니다. **평균 (mean)**은 모든 데이터의 합을 데이터의 총 개수로 나눈 값입니다. **중앙값 (median)**은 데이터를 작은 수부터 큰 수까지 순서대로 나열했을 때 정확히 한가운데에 위치한 값이며, **최빈값 (mode)**은 데이터 집합에서 가장 자주 등장하는 값입니다.
이 개념들은 한국 수학 교육과정의 중학교 3학년 대푯값 단원과 고등학교 '확률과 통계' 과목에서 다루는 내용과 완벽히 일치합니다. 하지만 복잡한 확률 (probability)이나 통계 공식을 요구하는 한국 수능 수학과 달리, College Board가 출제하는 Digital SAT에서는 극단적인 값(Outlier)이 대푯값에 미치는 논리적 영향을 묻는 문제가 주를 이룹니다.
또한 수능과 달리 SAT에서는 Desmos 계산기를 자유롭게 사용할 수 있기 때문에, 단순 계산보다는 데이터의 분포 형태(대칭인지 비대칭인지)를 파악하는 직관력이 훨씬 중요합니다. 데이터를 분석할 때는 단위 비율 (unit rate)이나 정비례와 역비례 관계를 함께 묻는 응용 문제도 자주 출제되니 주의 깊게 살펴봐야 해요.
단계별 풀이법
- 1단계: 데이터를 크기순으로 정렬하기 — 도수분포표나 산점도가 주어졌을 때, 혼동을 피하기 위해 데이터를 작은 값부터 큰 값 순으로 나열하거나 분포를 시각적으로 확인하세요.
- 2단계: 이상치(Outlier) 확인하기 — 나머지 데이터와 동떨어진 아주 크거나 아주 작은 값이 있는지 확인하세요. 이 값은 평균 (mean)을 크게 끌어당깁니다.
- 3단계: 알맞은 대푯값 찾기 — 문제에서 요구하는 값이 평균, 중앙값, 최빈값 중 무엇인지 파악하고 계산하세요. 도수분포표에서는 반드시 값에 도수를 곱해서 더해야 합니다.
- 4단계: 분포의 비대칭성 판단하기 — 꼬리가 오른쪽으로 길게 늘어진 분포(Right-skewed)인지, 왼쪽으로 길게 늘어진 분포(Left-skewed)인지 파악하여 평균과 중앙값의 대소 관계를 유추하세요.
Desmos 꿀팁
수능과 달리 SAT에서는 Desmos를 사용할 수 있습니다! 데이터 목록이 주어졌을 때 일일이 손으로 더하고 나누지 마세요.
Desmos 수식 입력창에 A = [1, 2, 3, 4, 5]와 같이 대괄호를 사용해 리스트를 만드세요.
그다음 다음 함수들을 입력하면 즉시 답을 얻을 수 있습니다.
- 평균 구하기:
mean(A) - 중앙값 구하기:
median(A) - 표준편차 구하기:
stdevp(A)(모집단 표준편차 (standard deviation)가 필요할 때)
풀이 예제
문제: The list of numbers 4, 5, 8, 8, 10, 15, 20 has a mean of 10 and a median of 8. If the number 30 is added to the list, which of the following statements is true regarding the new mean and median?
(A) The mean will increase by more than the median. (B) The median will increase by more than the mean. (C) The mean and median will increase by the same amount. (D) The mean will decrease.
풀이:
1단계: 기존 데이터를 확인합니다. 개수는 7개이며, 평균 (mean)은 10, 중앙값 (median)은 8입니다.
2단계: 새로운 데이터 을 추가하여 정렬합니다.
3단계: 새로운 중앙값 (median)을 계산합니다. 데이터가 8개(짝수)이므로 4번째와 5번째 값의 평균을 구합니다. 중앙값은 8에서 9로 1만큼 증가했습니다.
4단계: 새로운 평균 (mean)을 계산합니다. 기존 총합은 이었습니다. 새로운 총합은 입니다. 이를 8로 나눕니다. 평균은 10에서 12.5로 2.5만큼 증가했습니다.
5단계: 증가량을 비교합니다. 평균의 증가량(2.5)이 중앙값의 증가량(1)보다 큽니다. 이는 극단적으로 큰 값(30)이 추가되었을 때 평균이 더 큰 영향을 받는다는 통계적 성질을 보여줍니다.
정답: (A)
자주 하는 실수
-
비대칭 분포에서 평균과 중앙값 혼동 — Lumist 학생 데이터에 따르면, 문제 해결 & 데이터 분석 영역 오답의 22%가 비대칭 분포에서 평균 (mean)과 중앙값 (median)을 혼동하여 발생합니다. 특히 가장 흔한 함정은 '평균과 중앙값이 같다'고 가정해 버리는 것입니다. 이는 완벽한 대칭 분포에서만 성립합니다.
-
분포도를 그리지 않고 머릿속으로만 풀기 — Lumist 데이터에 따르면, 문제를 풀기 전 시험지 여백이나 머릿속에 분포(Distribution)의 형태를 간단히 스케치하는 학생들이 그렇지 않은 학생들보다 정답률이 20% 더 높았습니다. 꼬리가 어느 쪽으로 치우쳐 있는지 시각화하면 실수를 크게 줄일 수 있습니다.
자주 묻는 질문
극단적인 값(이상치)이 추가되면 평균과 중앙값 중 어느 것이 더 많이 변하나요?
극단적인 값(Outlier)은 평균(Mean)에 큰 영향을 미치지만, 중앙값(Median)에는 거의 영향을 주지 않습니다. SAT에서는 이를 묻는 개념 문제가 아주 자주 출제됩니다.
평균을 구할 때 도수분포표(Frequency Table)가 나오면 어떻게 계산하나요?
각 값에 도수(Frequency)를 곱한 뒤 모두 더하고, 총 도수의 합으로 나누어 가중 평균을 구해야 합니다. 단순히 값들만 더해서 나누면 안 됩니다.
중앙값을 구할 때 데이터 개수가 짝수면 어떻게 하나요?
크기순으로 정렬했을 때 가장 가운데 있는 두 값의 평균을 구하면 됩니다. 예를 들어 10개의 데이터가 있다면 5번째와 6번째 값의 평균이 중앙값(Median)이 됩니다.
SAT에서 평균·중앙값·최빈값 문제는 몇 개 나오나요?
문제 해결 & 데이터 분석(Problem Solving & Data Analysis) 영역에서 보통 1~2문제가 출제됩니다. Lumist.ai에는 이 유형을 완벽히 대비할 수 있는 30개의 연습 문제가 준비되어 있으니 꼭 풀어보세요.
