Quick Answer
Trong bài thi Digital SAT, độ lệch chuẩn (standard deviation) là thước đo mức độ phân tán của các giá trị trong một tập dữ liệu so với giá trị trung bình (mean). Một tập dữ liệu có độ lệch chuẩn (standard deviation) lớn khi các giá trị nằm xa giá trị trung bình, và nhỏ khi các giá trị tập trung sát giá trị trung bình.
Độ lệch chuẩn là căn bậc hai của phương sai, dùng để định lượng sự chênh lệch của các số hạng so với số trung bình cộng. Trong chương trình Toán THPT Việt Nam, đây là khái niệm then chốt trong phần thống kê lớp 10 giúp đánh giá độ tin cậy của số liệu.
Data Set X: {20, 21, 22, 23, 24}. Data Set Y: {10, 15, 22, 29, 34}. Which of the following statements is true regarding the standard deviation of the two data sets? (A) The standard deviation of X is greater than Y. (B) The standard deviation of Y is greater than X. (C) The standard deviations are equal. (D) There is not enough information to compare. Giải: Cả hai tập dữ liệu đều có giá trị trung bình (mean) là 22. Tuy nhiên, các giá trị trong tập X rất gần với 22 (khoảng cách chỉ từ 1 đến 2 đơn vị). Trong khi đó, các giá trị trong tập Y nằm xa 22 hơn (khoảng cách lên tới 12 đơn vị). Vì tập Y có độ phân tán lớn hơn, nên độ lệch chuẩn (standard deviation) của Y lớn hơn X. Đáp án đúng là (B).
Lỗi 1: Nhầm lẫn rằng tập dữ liệu có giá trị trung bình (mean) lớn hơn thì sẽ có độ lệch chuẩn (standard deviation) lớn hơn.
Lỗi 2: Cho rằng tập dữ liệu có nhiều phần tử hơn thì mặc định có độ lệch chuẩn lớn hơn, trong khi thực tế nó phụ thuộc vào khoảng cách của các giá trị tới trung tâm.
Lỗi 3: Cố gắng tính toán công thức độ lệch chuẩn phức tạp trong khi đề bài chỉ yêu cầu so sánh bằng mắt dựa trên biểu đồ.
Học sinh muốn đạt 750+ cần biết rằng việc thêm một giá trị ngoại lai (outlier) cực đoan vào tập dữ liệu sẽ luôn làm tăng độ lệch chuẩn (standard deviation), bởi vì nó làm tăng tổng khoảng cách từ các điểm dữ liệu đến giá trị trung bình mới.
Giá trị trung bình (Mean)
Giá trị trung bình (Mean) là thương số của tổng các giá trị chia cho số lượng phần tử trong một tập dữ liệu. Trong bài thi Digital SAT, khái niệm này xuất hiện thường xuyên trong phần Phân tích dữ liệu (Data Analysis), yêu cầu thí sinh tính toán hoặc suy luận về sự thay đổi của trung bình cộng (arithmetic mean) khi dữ liệu biến động.
Phân Phối Chuẩn (Normal Distribution)
Trong kỳ thi Digital SAT, phân phối chuẩn (normal distribution) là một mô hình dữ liệu đối xứng có hình quả chuông (bell-shaped curve). Tại đây, giá trị trung bình (mean), trung vị (median) và yếu vị (mode) trùng nhau ở đỉnh cao nhất. Nó giúp xác định xác suất dữ liệu rơi vào các khoảng dựa trên độ lệch chuẩn (standard deviation).
Khoảng biến thiên (Range)
Khoảng biến thiên (Range) trong Digital SAT là hiệu số giữa giá trị lớn nhất (maximum) và giá trị nhỏ nhất (minimum) trong một tập dữ liệu. Đây là thước đo đơn giản nhất về độ phân tán (spread), giúp thí sinh đánh giá nhanh phạm vi bao phủ của các con số trong các bài toán thống kê.
Trong SAT, độ lệch chuẩn (standard deviation) được hiểu đơn giản là thước đo mức độ 'dàn trải' của dữ liệu. Nếu các điểm dữ liệu nằm sát nhau và gần giá trị trung tâm, độ lệch chuẩn sẽ thấp. Nếu dữ liệu bị kéo dãn ra xa, độ lệch chuẩn sẽ cao. SAT dùng khái niệm này để kiểm tra tư duy phân tích thống kê của thí sinh.
Bạn hãy quan sát độ rộng của biểu đồ. Trên biểu đồ cột (histogram) hoặc biểu đồ điểm (dot plot), nếu dữ liệu tập trung thành một cột cao ở giữa, độ lệch chuẩn (standard deviation) sẽ nhỏ. Nếu dữ liệu dàn đều sang hai bên hoặc tập trung nhiều ở hai đầu (cánh) của biểu đồ, độ lệch chuẩn sẽ lớn hơn.
Khoảng biến thiên (range) chỉ tính khoảng cách giữa giá trị lớn nhất và nhỏ nhất, bỏ qua các giá trị ở giữa. Ngược lại, độ lệch chuẩn (standard deviation) tính đến vị trí của mọi điểm dữ liệu so với trung bình. Do đó, độ lệch chuẩn cung cấp cái nhìn sâu sắc hơn về sự biến động của toàn bộ tập hợp số liệu.
Thông thường, mỗi đề thi Digital SAT Math sẽ có khoảng 1 đến 2 câu hỏi liên quan đến độ lệch chuẩn (standard deviation). Những câu hỏi này thường được xếp vào mức độ trung bình đến khó (Medium to Hard) và yêu cầu khả năng suy luận logic hơn là tính toán số học thuần túy.