Quick Answer
Digital SAT 데이터 분석에서 데이터 분포, 중앙값(median), 사분위수 범위(IQR)를 시각적으로 나타내는 도구입니다.
데이터의 최솟값, 제1사분위수, 중앙값, 제3사분위수, 최댓값의 5가지 요약을 시각화한 그래프입니다. 한국 수학 교육과정의 '확률과 통계'에서 다루는 내용과 일치합니다.
Question: A data set consists of the values {2, 5, 8, 12, 15, 18, 22}. What is the median of this data set as represented in a box plot? \n\nSolution: 데이터가 크기순으로 정렬되어 있으므로, 한가운데 위치한 값인 12가 중앙값입니다. 상자 수염 그림에서 상자 내부의 수직선은 12를 가리키게 됩니다.
실수 1: 상자 내부의 수직선을 평균(mean)으로 착각하는 경우 (항상 중앙값입니다).
실수 2: 상자의 너비가 넓으면 데이터의 개수가 더 많다고 오해하는 경우.
실수 3: 이상치(outlier)를 무시하고 전체 범위를 잘못 계산하는 경우.
'750점 이상을 목표로 하는 학생은' 두 집단의 Box Plot을 비교할 때 중앙값의 위치뿐만 아니라 상자의 길이(IQR)가 데이터의 일관성(consistency)에 미치는 영향을 이해해야 해요.
Explore This Topic
Learn more with step-by-step practice on Lumist
데이터의 5가지 요약 수치를 상자와 선으로 시각화하여 분포와 대칭성을 한눈에 보여주는 그래프예요.
상자의 양 끝은 Q1과 Q3, 중앙의 선은 중앙값, 양옆의 수염 끝은 최솟값과 최댓값을 나타내요.
히스토그램은 빈도수를 막대로 보여주지만, 상자 수염 그림은 사분위수를 기준으로 데이터의 퍼짐을 강조해요.
보통 한 시험당 1~2문제 정도 출제되며, 주로 두 집단의 분포를 비교하는 해석 문제가 나와요.
범위 (Range)
Digital SAT 데이터 분석 영역에서 데이터 세트의 최댓값과 최솟값의 차이를 의미하는 범위(Range)를 정의해요.