Quick Answer
Khoảng tứ phân vị (Interquartile Range - IQR) là một số đo độ phân tán trong thống kê, được tính bằng hiệu số giữa tứ phân vị thứ ba (Q3) và tứ phân vị thứ nhất (Q1). Trong bài thi Digital SAT, IQR giúp xác định mức độ tập trung của 50% dữ liệu ở giữa và là công cụ quan trọng để nhận diện các giá trị ngoại lai (outliers).
Khoảng tứ phân vị (Interquartile Range) là độ dài của khoảng chứa 50% số liệu nằm chính giữa của tập dữ liệu sau khi đã sắp xếp. Khái niệm này tương đồng với nội dung Thống kê trong chương trình Toán lớp 10 và 11 tại Việt Nam.
Question: A set of data consists of the following values: 3, 7, 8, 12, 14, 18, 21. What is the interquartile range of this data set? Giải: 1. Sắp xếp dữ liệu theo thứ tự tăng dần (đã có): 3, 7, 8, 12, 14, 18, 21. 2. Tìm trung vị (median): Số ở giữa là 12. 3. Tìm tứ phân vị thứ nhất (Q1): Là trung vị của các số bên trái số 12 (3, 7, 8), suy ra Q1 = 7. 4. Tìm tứ phân vị thứ ba (Q3): Là trung vị của các số bên phải số 12 (14, 18, 21), suy ra Q3 = 18. 5. Tính IQR: IQR = Q3 - Q1 = 18 - 7 = 11. Đáp số: 11.
Lỗi 1: Nhầm lẫn IQR với Khoảng biến thiên (Range) bằng cách lấy giá trị lớn nhất trừ giá trị nhỏ nhất.
Lỗi 2: Quên sắp xếp tập dữ liệu theo thứ tự từ bé đến lớn trước khi xác định Q1 và Q3.
Lỗi 3: Tính sai Q1 hoặc Q3 khi tập dữ liệu có số lượng phần tử chẵn, dẫn đến kết quả IQR không chính xác.
Học sinh muốn đạt 750+ cần biết rằng IQR không bị ảnh hưởng bởi các giá trị ngoại lai (outliers) cực đoan như độ lệch chuẩn (standard deviation) hay khoảng biến thiên (range), do đó nó là thước đo độ phân tán đáng tin cậy hơn cho các tập dữ liệu bị lệch (skewed data).
Biểu đồ hộp (Box Plot)
Biểu đồ hộp (Box Plot) là một công cụ trực quan hóa dữ liệu quan trọng trong Digital SAT, dùng để tóm tắt phân phối của một tập dữ liệu qua 5 chỉ số: giá trị nhỏ nhất (minimum), tứ phân vị thứ nhất (Q1), trung vị (median), tứ phân vị thứ ba (Q3) và giá trị lớn nhất (maximum). Nó giúp xác định nhanh độ phân tán (spread) và các giá trị ngoại lai (outliers).
Trung vị (Median)
Trung vị (Median) là giá trị nằm chính giữa của một tập dữ liệu đã được sắp xếp theo thứ tự tăng dần hoặc giảm dần. Trong bài thi Digital SAT, trung vị là khái niệm then chốt thuộc phần Phân tích dữ liệu (Data Analysis), dùng để xác định xu hướng trung tâm của một mẫu số liệu mà không bị ảnh hưởng bởi các giá trị cực đoan.
Giá trị ngoại lai (Outlier)
Trong bài thi Digital SAT, giá trị ngoại lai (outlier) là một điểm dữ liệu khác biệt đáng kể (cực lớn hoặc cực nhỏ) so với phần còn lại của tập dữ liệu. Việc nhận diện giá trị ngoại lai (outlier) giúp học sinh đánh giá chính xác sự thay đổi của trung bình cộng (mean) và độ lệch chuẩn (standard deviation).
Khoảng biến thiên (Range)
Khoảng biến thiên (Range) trong Digital SAT là hiệu số giữa giá trị lớn nhất (maximum) và giá trị nhỏ nhất (minimum) trong một tập dữ liệu. Đây là thước đo đơn giản nhất về độ phân tán (spread), giúp thí sinh đánh giá nhanh phạm vi bao phủ của các con số trong các bài toán thống kê.
Độ lệch chuẩn (Standard Deviation)
Trong bài thi Digital SAT, độ lệch chuẩn (standard deviation) là thước đo mức độ phân tán của các giá trị trong một tập dữ liệu so với giá trị trung bình (mean). Một tập dữ liệu có độ lệch chuẩn (standard deviation) lớn khi các giá trị nằm xa giá trị trung bình, và nhỏ khi các giá trị tập trung sát giá trị trung bình.
Trong SAT, Interquartile Range (IQR) là chỉ số đo lường sự biến thiên của 50% dữ liệu nằm ở giữa tập hợp. Nó được tính bằng công thức Q3 - Q1. IQR giúp thí sinh hiểu được độ phân tán của dữ liệu mà không bị nhiễu bởi các giá trị quá lớn hoặc quá nhỏ (outliers).
Để tính IQR, trước hết hãy sắp xếp dãy số từ bé đến lớn. Tìm trung vị (Median) để chia dãy số thành hai nửa. Q1 là trung vị của nửa dưới, Q3 là trung vị của nửa trên. Cuối cùng, lấy Q3 trừ đi Q1. Nếu gặp Box-plot, chỉ cần lấy giá trị tại hai cạnh của hình hộp.
Khoảng biến thiên (Range) đo khoảng cách từ giá trị nhỏ nhất đến lớn nhất, nên rất dễ bị ảnh hưởng bởi các giá trị bất thường. Trong khi đó, Interquartile Range (IQR) chỉ tập trung vào phần trung tâm, giúp phản ánh chính xác hơn xu hướng của đa số dữ liệu trong tập hợp.
Thông thường, mỗi đề thi Digital SAT sẽ có khoảng 1-2 câu hỏi liên quan trực tiếp đến IQR hoặc yêu cầu so sánh IQR giữa hai biểu đồ hộp (box plots). Tuy số lượng không nhiều, nhưng đây là dạng bài lấy điểm dễ dàng nếu bạn nắm vững khái niệm.