Quick Answer
Digital SAT 데이터 분석 영역에서 다른 데이터 값들과 현저히 떨어져 있는 극단적인 값을 의미하며, 평균(mean)에 큰 영향을 줍니다.
데이터 집합에서 대부분의 값들과 동떨어진 극단적으로 크거나 작은 값입니다. 한국 수학 교육과정의 확률과 통계에서 자료의 분포와 대표값을 다룰 때 중요하게 언급됩니다.
Problem: A data set consists of {10, 12, 11, 14, 100}. If the outlier 100 is removed, how will the mean and median change? Solution: 이상치인 100을 제거하면 평균은 크게 감소하지만, 중앙값(median)은 위치 기반 지표이므로 상대적으로 변화가 매우 적거나 거의 없습니다.
실수 1: 이상치가 중앙값(median)에 평균만큼 큰 영향을 준다고 생각하는 경우
실수 2: 데이터의 최댓값이나 최솟값이면 무조건 이상치라고 단정 짓는 경우
실수 3: 이상치가 포함된 데이터 세트에서 평균을 가장 적절한 대표값으로 선택하는 경우
750점 이상을 목표로 하는 학생은 이상치가 평균(mean)과 표준편차(standard deviation)를 증가시키지만, 중앙값(median)과 사분위수 범위(IQR)에는 거의 영향을 주지 않는 '저항성' 개념을 완벽히 이해해야 해요.
Explore This Topic
Learn more with step-by-step practice on Lumist
데이터 분포에서 다른 값들과 비정상적으로 멀리 떨어진 값으로, 통계 지표를 왜곡할 수 있는 특이값이에요.
SAT에서는 주로 산점도나 숫자 목록에서 유독 혼자만 아주 크거나 작은 값을 통해 직관적으로 식별하도록 출제돼요.
이상치는 평균값을 자기 쪽으로 강하게 끌어당기지만, 중앙값은 순서에 따르므로 이상치의 크기 변화에 민감하지 않아요.
데이터 분석 파트에서 보통 1~2문제 정도 출제되며, 주로 이상치 유무에 따른 통계값의 변화를 묻는 유형이에요.
중앙값 (Median)
Digital SAT 데이터 분석의 핵심으로, 데이터를 크기순으로 나열했을 때 정가운데 위치한 중앙값 (Median)을 뜻해요.