Quick Answer
Trong bài thi Digital SAT, biểu đồ tần suất (histogram) là công cụ đồ họa dùng để biểu diễn sự phân phối của dữ liệu định lượng. Nó sử dụng các cột sát nhau để hiển thị tần suất (frequency) của các giá trị trong các khoảng (intervals) nhất định. Việc đọc hiểu biểu đồ này giúp thí sinh xác định nhanh các số đo xu hướng trung tâm và độ phân tán của dữ liệu.
Biểu đồ tần suất (histogram) là biểu đồ cột biểu thị tần suất xuất hiện của các nhóm dữ liệu liên tục. Trong chương trình Toán THPT, khái niệm này tương ứng với biểu đồ tần số ghép lớp, giúp trực quan hóa hình dạng phân phối của một tập dữ liệu.
The histogram shows the distribution of scores on a 10-point quiz for a class of 20 students. How many students scored at least 8 points? (Biểu đồ có các cột: 0-3 điểm: 2 HS; 4-7 điểm: 10 HS; 8-10 điểm: 8 HS). Giải: Để tìm số học sinh đạt ít nhất 8 điểm (at least 8 points), ta cần nhìn vào cột đại diện cho khoảng từ 8 đến 10 điểm. Theo biểu đồ, tần suất của cột này là 8. Vậy có 8 học sinh đạt từ 8 điểm trở lên.
Lỗi 1: Nhầm lẫn giữa trục tung (tần suất) và trục hoành (giá trị dữ liệu) khi tính toán số trung bình.
Lỗi 2: Coi biểu đồ tần suất là biểu đồ cột (bar chart) cho dữ liệu định tính thay vì dữ liệu số liên tục.
Lỗi 3: Không tính tổng số quan sát (total frequency) trước khi xác định vị trí của trung vị (median).
Học sinh muốn đạt 750+ cần biết rằng khi biểu đồ có hình dạng đối xứng (symmetrical), số trung bình (mean) và trung vị (median) sẽ xấp xỉ bằng nhau. Nếu biểu đồ lệch phải (skewed right), mean thường lớn hơn median, và ngược lại với lệch trái.
Biểu đồ hộp (Box Plot)
Biểu đồ hộp (Box Plot) là một công cụ trực quan hóa dữ liệu quan trọng trong Digital SAT, dùng để tóm tắt phân phối của một tập dữ liệu qua 5 chỉ số: giá trị nhỏ nhất (minimum), tứ phân vị thứ nhất (Q1), trung vị (median), tứ phân vị thứ ba (Q3) và giá trị lớn nhất (maximum). Nó giúp xác định nhanh độ phân tán (spread) và các giá trị ngoại lai (outliers).
Giá trị trung bình (Mean)
Giá trị trung bình (Mean) là thương số của tổng các giá trị chia cho số lượng phần tử trong một tập dữ liệu. Trong bài thi Digital SAT, khái niệm này xuất hiện thường xuyên trong phần Phân tích dữ liệu (Data Analysis), yêu cầu thí sinh tính toán hoặc suy luận về sự thay đổi của trung bình cộng (arithmetic mean) khi dữ liệu biến động.
Yếu vị (Mode)
Yếu vị (Mode) là giá trị xuất hiện với tần suất (frequency) cao nhất trong một tập dữ liệu. Trong bài thi Digital SAT, khái niệm này thuộc phần Phân tích dữ liệu (Data Analysis), yêu cầu học sinh xác định giá trị phổ biến nhất từ danh sách, bảng tần suất hoặc các loại biểu đồ như histogram và dot plot.
Phân Phối Chuẩn (Normal Distribution)
Trong kỳ thi Digital SAT, phân phối chuẩn (normal distribution) là một mô hình dữ liệu đối xứng có hình quả chuông (bell-shaped curve). Tại đây, giá trị trung bình (mean), trung vị (median) và yếu vị (mode) trùng nhau ở đỉnh cao nhất. Nó giúp xác định xác suất dữ liệu rơi vào các khoảng dựa trên độ lệch chuẩn (standard deviation).
Tần suất tương đối (Relative Frequency)
Trong kỳ thi Digital SAT, tần suất tương đối (relative frequency) là tỷ lệ giữa số lần một giá trị cụ thể xuất hiện so với tổng số quan sát trong tập dữ liệu. Nó thường được biểu diễn dưới dạng phân số, số thập phân hoặc phần trăm, giúp thí sinh phân tích cấu trúc dữ liệu hiệu quả hơn so với tần số tuyệt đối (frequency).
Biểu đồ tần suất (histogram) là một dạng biểu đồ cột dùng để tóm tắt dữ liệu số theo các khoảng. Trong SAT, nó dùng để kiểm tra khả năng đọc hiểu số liệu, yêu cầu thí sinh xác định các giá trị thống kê như trung bình, trung vị và đánh giá độ biến thiên của tập dữ liệu thông qua hình ảnh trực quan.
Đầu tiên, hãy cộng tất cả tần suất ở trục tung để tìm tổng số quan sát (n). Vị trí trung vị nằm ở khoảng (n+1)/2. Sau đó, đếm tích lũy tần suất từ các cột bên trái sang phải cho đến khi chạm tới vị trí này. Cột chứa vị trí đó chính là khoảng chứa trung vị của tập dữ liệu.
Bar chart (biểu đồ cột) dùng cho dữ liệu phân loại (như màu sắc, tên) và các cột thường có khoảng cách. Histogram (biểu đồ tần suất) dùng cho dữ liệu số liên tục, các cột được vẽ sát nhau và mỗi cột đại diện cho một khoảng giá trị (interval) thay vì một giá trị đơn lẻ.
Thông thường, mỗi đề thi Digital SAT sẽ có từ 1 đến 2 câu hỏi liên quan trực tiếp đến biểu đồ tần suất. Các câu hỏi này thường lồng ghép với kiến thức về trung vị, số trung bình hoặc yêu cầu thí sinh so sánh độ lệch chuẩn giữa các tập dữ liệu khác nhau.