Quick Answer
Digital SAT 데이터 분석의 핵심으로, 두 변수 간 관계를 좌표평면(coordinate plane)에 점으로 나타낸 그래프입니다.
두 변수 사이의 상관관계를 시각적으로 파악하기 위해 개별 데이터를 점으로 표시한 그래프입니다. 한국 수학 교육과정의 중학교 통계 및 고등학교 '확률과 통계'의 산점도 개념과 일치합니다.
Problem: A scatter plot shows the relationship between the number of hours studied (x) and the test score (y). If the line of best fit is y = 5x + 40, what is the predicted score for a student who studied for 8 hours? Solution: 추세선 방정식 y = 5x + 40에 x = 8을 대입하면 y = 5(8) + 40 = 80입니다. 따라서 예상 점수는 80점입니다.
상관관계(correlation)를 인과관계(causation)로 혼동함: 두 변수가 함께 변한다고 해서 하나가 다른 하나의 직접적인 원인은 아닐 수 있습니다.
이상치(outlier)의 영향 간과: 데이터 전체 흐름에서 벗어난 점이 추세선의 기울기나 y절편에 미치는 영향을 무시하기 쉽습니다.
좌표축 단위 오독: x축과 y축이 나타내는 수치와 단위를 정확히 확인하지 않아 엉뚱한 값을 대입하는 실수를 합니다.
750점 이상을 목표로 하는 학생은 산점도에서 이상치(outlier)가 제거되었을 때 추세선(line of best fit)의 기울기가 어떻게 변하는지 논리적으로 예측하는 연습을 해야 합니다.
Explore This Topic
Learn more with step-by-step practice on Lumist
두 변수 사이의 경향성을 파악하기 위해 좌표평면 위에 데이터들을 점으로 흩뿌려 놓은 그래프입니다.
점들이 오른쪽 위로 향하면 양의 상관관계, 오른쪽 아래로 향하면 음의 상관관계가 있다고 판단합니다.
산점도는 실제 관측된 개별 데이터 점들의 집합이고, 추세선은 그 점들의 흐름을 대표하는 가상의 직선입니다.
보통 Math 섹션 전체에서 2~4문제 정도가 데이터 해석 및 모델링 유형으로 출제됩니다.
상관관계 (Correlation)
Digital SAT의 데이터 분석 영역에서 두 변수 사이의 관계를 나타내는 상관관계(Correlation)는 데이터의 경향성을 파악하는 핵심 개념이에요.