Quick Answer
Trong bài thi Digital SAT, biểu đồ phân tán (scatter plot) là công cụ hiển thị mối quan hệ giữa hai biến số định lượng trên mặt phẳng tọa độ (coordinate plane). Mỗi điểm đại diện cho một cặp giá trị (x, y). Thuật ngữ này thường đi kèm với đường tiệm cận tốt nhất (line of best fit) để phân tích xu hướng và dự đoán kết quả.
Biểu đồ phân tán là loại biểu đồ sử dụng các điểm riêng lẻ để biểu diễn giá trị của hai biến số khác nhau. Trong chương trình toán THPT Việt Nam, khái niệm này tương ứng với phần thống kê và biểu diễn dữ liệu thực nghiệm để tìm mối liên hệ giữa các đại lượng.
Question: The scatter plot shows the relationship between the number of hours spent studying (x) and the exam score (y) for a group of students. A line of best fit is shown with the equation y = 5x + 40. Based on this model, what is the predicted score for a student who studies for 8 hours? Giải: Để tìm điểm số dự đoán, ta sử dụng phương trình của đường tiệm cận tốt nhất (line of best fit). Thay giá trị x = 8 (số giờ học) vào phương trình: y = 5(8) + 40 = 40 + 40 = 80. Vậy theo mô hình này, điểm số dự đoán của học sinh là 80.
Lỗi nhầm lẫn giữa tương quan (correlation) và nhân quả (causation): Giả định rằng biến x gây ra biến y chỉ vì chúng có xu hướng biến thiên cùng nhau.
Lỗi đọc sai giá trị dự đoán: Lấy giá trị từ một điểm dữ liệu thực tế (data point) thay vì lấy giá trị trên đường tiệm cận (line of best fit) khi đề bài yêu cầu dự đoán (prediction).
Lỗi không chú ý đơn vị trục: Nhầm lẫn giữa các đơn vị đo lường hoặc tỉ lệ chia (scale) khác nhau trên trục hoành và trục tung.
Học sinh muốn đạt 750+ cần biết rằng Digital SAT thường yêu cầu phân biệt giữa mô hình tuyến tính (linear) và mô hình mũ (exponential) dựa trên hình dạng của biểu đồ phân tán, đồng thời phải hiểu rõ tác động của các điểm ngoại lai (outliers) đối với độ dốc của đường tiệm cận.
Quan hệ Nhân quả (Causation)
Trong bài thi Digital SAT, quan hệ nhân quả (causation) chỉ mối liên hệ giữa hai biến số khi sự thay đổi của biến này trực tiếp dẫn đến sự thay đổi của biến kia. Khác với tương quan (correlation), quan hệ nhân quả chỉ có thể được kết luận một cách chắc chắn thông qua một thí nghiệm ngẫu nhiên có kiểm soát (randomized controlled experiment).
Mặt phẳng tọa độ (Coordinate Plane)
Mặt phẳng tọa độ (Coordinate Plane) là hệ thống lưới hai chiều được tạo bởi trục hoành (x-axis) và trục tung (y-axis) giao nhau tại gốc tọa độ (origin). Trong Digital SAT, đây là nền tảng để biểu diễn các hàm số, đường thẳng và hình học, đòi hỏi thí sinh phải thành thạo việc xác định tọa độ và tính toán khoảng cách trên hệ trục Oxy.
Tương quan (Correlation)
Trong kỳ thi Digital SAT, Tương quan (Correlation) là khái niệm mô tả mối quan hệ thống kê giữa hai biến số định lượng. Một sự tương quan thuận (positive correlation) xảy ra khi cả hai biến cùng tăng, trong khi tương quan nghịch (negative correlation) xảy ra khi một biến tăng và biến kia giảm. Đây là nền tảng để phân tích biểu đồ phân tán (scatter plot) và đường xu hướng (line of best fit).
Đường phù hợp nhất (Line of Best Fit)
Trong bài thi Digital SAT, đường phù hợp nhất (line of best fit) là một đường thẳng biểu diễn xu hướng chung của các điểm dữ liệu trên biểu đồ phân tán (scatter plot). Nó giúp dự đoán giá trị của biến phụ thuộc dựa trên biến độc lập, tối thiểu hóa khoảng cách giữa các điểm thực tế và đường dự báo.
Giá trị ngoại lai (Outlier)
Trong bài thi Digital SAT, giá trị ngoại lai (outlier) là một điểm dữ liệu khác biệt đáng kể (cực lớn hoặc cực nhỏ) so với phần còn lại của tập dữ liệu. Việc nhận diện giá trị ngoại lai (outlier) giúp học sinh đánh giá chính xác sự thay đổi của trung bình cộng (mean) và độ lệch chuẩn (standard deviation).
Trong SAT, biểu đồ phân tán là một đồ thị gồm các điểm riêng lẻ biểu diễn mối quan hệ giữa hai biến định lượng. Nó giúp thí sinh quan sát trực quan xu hướng dữ liệu, từ đó xác định xem các biến có mối liên hệ chặt chẽ hay lỏng lẻo, và liệu xu hướng đó là tăng (dương) hay giảm (âm) để đưa ra các nhận định thống kê.
Để nhận biết mối tương quan, hãy quan sát hướng đi của các điểm. Nếu các điểm có xu hướng đi lên từ trái sang phải, đó là tương quan dương (positive). Nếu đi xuống, đó là tương quan âm (negative). Nếu các điểm phân tán hỗn loạn và không tạo thành một đường hay hình thù rõ rệt, điều đó có nghĩa là không có tương quan (no correlation).
Khác với biểu đồ đường (line graph) thường nối các điểm lại với nhau để thể hiện sự thay đổi liên tục (thường là theo thời gian), biểu đồ phân tán (scatter plot) giữ các điểm độc lập để hiển thị sự phân bố dữ liệu thực tế. Trong SAT, biểu đồ phân tán thường đi kèm với một đường tiệm cận (line of best fit) được vẽ độc lập với các điểm.
Thông thường, mỗi đề thi Digital SAT sẽ có khoảng 2 đến 4 câu hỏi liên quan trực tiếp đến biểu đồ phân tán trong phần Math. Các câu hỏi này trải dài từ mức độ nhận biết xu hướng cơ bản đến các bài toán phân tích mô hình toán học phức tạp, chiếm một tỉ trọng đáng kể trong chương Data Analysis.