산점도와 회귀선 (Scatterplots & Line of Best Fit)

TL;DR

Lumist 학생 데이터 분석 결과, 문제 해결 & 데이터 분석 영역에서 그래프의 축이나 단위를 잘못 읽어 발생하는 오류가 35%를 차지했습니다. 회귀선의 기울기(slope)와 y절편(y-intercept)이 실제 상황에서 무엇을 의미하는지 파악하는 것이 핵심입니다.

빠른 답변: 산점도(Scatterplot)는 두 변수 간의 관계를 시각적으로 보여주며, 회귀선(Line of Best Fit)은 이 데이터의 전반적인 경향성을 나타내는 직선입니다. 수능과 달리 SAT에서는 Desmos 계산기를 활용하여 데이터의 추세선 방정식을 쉽게 도출하고 예측값을 빠르고 정확하게 구할 수 있습니다.

graph LR
    A["문제 읽기 및 축 확인"] --> B["기울기/y절편 의미 파악"] --> C["Desmos에 데이터 입력"] --> D["회귀선 식 도출"] --> E["예측값 계산 및 정답 선택"]

산점도와 회귀선이란?

산점도(Scatterplots)는 두 변수의 데이터를 좌표평면 위에 점으로 나타낸 그래프입니다. 이 점들의 전반적인 흐름을 가장 잘 대변하는 직선을 회귀선(Line of Best Fit)이라고 합니다. College Board의 Digital SAT 수학에서는 주로 이 회귀선의 방정식(equation)을 구하거나, 기울기(slope)와 y절편(y-intercept)이 문제 상황에서 어떤 의미를 가지는지 묻습니다.

이러한 개념은 한국 고등학교 '확률과 통계' 과목에서 다루는 산점도 및 상관관계 개념과 맞닿아 있습니다. 또한 중학교와 수학 I에서 배우는 일차함수의 개념을 실제 데이터에 적용하는 것과 같습니다. 수능 수학에서는 복잡한 수작업 계산이나 추론을 요구하지만, SAT에서는 Desmos 계산기를 활용해 시각적으로 접근하고 계산 실수를 줄일 수 있습니다.

단계별 풀이법

  1. 1단계 — x축과 y축의 변수 이름, 그리고 단위 비율(unit rate)을 정확히 확인하세요. 축이 0부터 시작하지 않을 수도 있습니다.
  2. 2단계 — 데이터의 전반적인 경향성을 파악하세요. x가 증가할 때 y도 증가하면 양의 상관관계, y가 감소하면 음의 상관관계입니다.
  3. 3단계 — 회귀선의 기울기(slope)와 y절편(y-intercept)의 문맥적 의미를 해석하세요. 기울기는 보통 '비율(ratio)'이나 '단위당 변화량'을, y절편은 '초기값'을 의미합니다.
  4. 4단계 — 문제에서 요구하는 특정 x값에 대한 y의 예측값(predicted value)을 구하거나, 실제 데이터와의 차이(잔차)를 계산하세요.

Desmos 꿀팁

수능과 달리 SAT에서는 Desmos를 적극적으로 사용할 수 있습니다. 산점도 문제에서 몇 개의 데이터 포인트가 주어지고 회귀선을 찾아야 한다면, Desmos의 표(Table) 기능을 활용하세요.

+ 버튼을 눌러 표를 추가하고 주어진 (x,y)(x, y) 좌표들을 입력합니다. 그 다음, 새로운 수식 입력창에 y1 ~ mx1 + b를 입력하세요. (이때 = 대신 ~ 기호를 사용해야 합니다). Desmos가 자동으로 데이터에 가장 잘 맞는 기울기 mm과 y절편 bb의 값을 계산해 줍니다. 복잡한 연립방정식(system of equations)을 풀 필요 없이 바로 답을 도출할 수 있습니다.

풀이 예제

문제: The scatterplot shows the relationship between the number of hours studied (xx) and the test score (yy) for 15 students. The line of best fit is given by the equation y=4.5x+52y = 4.5x + 52. Based on the line of best fit, what is the predicted test score for a student who studied for 6 hours?

풀이:

주어진 회귀선 방정식(equation)은 다음과 같습니다.

y=4.5x+52y = 4.5x + 52

이 식은 기울기-절편 형식으로 표현되어 있습니다. 문제에서 6시간 공부한 학생의 예상 점수를 묻고 있으므로, x=6x = 6을 대입합니다.

y=4.5(6)+52y = 4.5(6) + 52

y=27+52y = 27 + 52

y=79y = 79

따라서 6시간 공부했을 때의 예상 점수는 79점입니다.

자주 하는 실수

  1. 축과 단위 잘못 읽기 — Lumist 데이터에 따르면, 문제 해결 & 데이터 분석 영역 오류의 35%가 그래프의 축이나 스케일을 잘못 읽어서 발생합니다. x축의 한 칸이 1인지 10인지, 단위가 분인지 시간인지 단위 비율을 꼭 확인하세요.

  2. 기울기와 y절편의 의미 혼동 — Lumist 학생 데이터 분석 결과, 대수(Algebra) 영역 오류의 23%가 일차방정식 y=mx+by = mx + b에서 기울기(slope)와 y절편(y-intercept)을 혼동하는 것입니다. 산점도 문제에서도 기울기는 '변화율', y절편은 '초기값'임을 명심해야 합니다.

  3. 실제값과 예측값 혼동 — 산점도 위의 실제 점들은 '실제값(actual value)'이고, 회귀선 위의 점들은 '예측값(predicted value)'입니다. 문제에서 "predicted"를 묻는지 실제 관측된 데이터를 묻는지 주의 깊게 읽어야 합니다.

Practice this topic on Lumist

7,000+ questions with AI-powered feedback

Related Topics

기울기 의미 해석 (Interpreting Slope)

Lumist의 학생 데이터 분석 결과, 문제 해결 & 데이터 분석 영역의 기울기 문제에서 그래프의 축이나 축척을 잘못 읽어 발생하는 오류가 전체의 35%를 차지했습니다. 또한, 방정식에서 기울기 (slope)와 y절편 (y-intercept)의 역할을 혼동하는 경우도 23%에 달해, 문제의 맥락(context)을 정확히 파악하는 연습이 필수적입니다.

평균·중앙값·최빈값 (Mean, Median, Mode)

Lumist 학생 데이터 분석 결과, 문제 해결 & 데이터 분석 영역의 오답률은 21%입니다. 특히 비대칭 분포에서 평균(Mean)과 중앙값(Median)을 혼동하여 틀리는 경우가 22%나 차지하므로, 분포의 형태를 파악하는 것이 매우 중요합니다.

산점도 독해 (Reading Scatterplots)

Lumist 학생 데이터 분석 결과, 문제 해결 & 데이터 분석 영역의 오답률은 21%입니다. 특히 산점도 문제에서 그래프의 축이나 눈금을 잘못 읽어 발생하는 실수가 전체 오답의 35%를 차지할 만큼 빈번하게 발생하므로 주의가 필요해요.

문장에서 식 세우기 (Setting Up Equations)

Lumist 2,700명 이상의 학생 데이터 분석 결과, 문제 해결 & 데이터 분석 영역에서 변수 설정을 잘못하거나 단위 변환을 놓쳐 발생하는 오류가 11~18%를 차지했습니다. 영어 지문의 문맥을 정확히 파악하고 올바른 수학 기호로 번역하는 연습이 필수적입니다.

기본 확률 (Basic Probability)

Lumist 2,700명 이상의 학생 데이터 분석 결과, 문제 해결 & 데이터 분석 영역의 전체 오류율은 21%입니다. 특히 조건부 확률 문제에서 이원 분할표(two-way table)를 잘못 읽어 발생하는 오류가 40%를 차지하며, 많은 학생이 P(A|B)와 P(A and B)를 혼동합니다.

AI SAT 준비
지금 시작하세요

Lumist Mascot
Lumist AI App
산점도와 회귀선 (Scatterplots & Line of Best Fit) | Lumist.ai