Trả lời nhanh: Trung bình (mean) là tổng chia cho số lượng, trung vị (median) là giá trị ở giữa khi đã sắp xếp, và mode là giá trị xuất hiện nhiều nhất. Hãy phác họa phân phối dữ liệu và tận dụng hàm
mean()hoặcmedian()trong Desmos để tránh sai sót tính toán.
pie title Lỗi sai phổ biến phần Phân Tích Dữ Liệu (Dữ liệu Lumist)
"Đọc sai trục/thang đo đồ thị" : 35
"Nhầm lẫn Mean và Median" : 22
"Quên đổi đơn vị" : 18
"Hiểu sai sai số (Margin of error)" : 15
"Lỗi khác" : 10
Trung Bình, Trung Vị, và Mode là gì?
Trong chương trình Toán lớp 10 của Việt Nam (phần Thống kê), các em đã làm quen với các số đặc trưng đo xu thế trung tâm. Trong bài thi Digital SAT, những khái niệm này xuất hiện dưới tên gọi Trung bình (Mean), Trung vị (Median), và Mode.
- Trung bình (Mean): Là trung bình cộng của tập dữ liệu. Bạn cộng tất cả các giá trị lại và chia cho tổng số lượng.
- Trung vị (Median): Là giá trị nằm ở chính giữa của tập dữ liệu sau khi đã được sắp xếp từ nhỏ đến lớn. Nếu số lượng dữ liệu là chẵn, trung vị là trung bình cộng của hai số ở giữa.
- Mode: Là giá trị xuất hiện với tần số nhiều nhất trong tập dữ liệu. Một tập hợp có thể có một mode, nhiều mode, hoặc không có mode nào.
Đôi khi, các bài toán SAT sẽ kết hợp thống kê với các khái niệm về đơn vị & tỉ lệ (ratio), yêu cầu bạn phải tính toán trung bình của một nhóm dựa trên các tỉ lệ cho trước.
Phương Pháp Giải Từng Bước
- Bước 1: Đọc kỹ yêu cầu và xác định khái niệm cần tìm. Đề bài hỏi về mean, median, mode hay sự thay đổi của chúng khi thêm/bớt dữ liệu?
- Bước 2: Sắp xếp dữ liệu (nếu cần tìm Median). Luôn viết lại các con số theo thứ tự từ nhỏ đến lớn. Đây là bước học sinh hay quên nhất.
- Bước 3: Lập phương trình (Equation) cho bài toán tìm giá trị ẩn. Nếu đề cho trung bình và yêu cầu tìm một số chưa biết, hãy lập phương trình: . Việc giải phương trình này đôi khi giống như giải một tỉ lệ thức (proportion).
- Bước 4: Phân tích ngoại lai (Outliers). Nếu đề bài hỏi về tác động của một số quá lớn hoặc quá nhỏ, hãy nhớ quy tắc: Ngoại lai kéo Mean về phía nó rất mạnh, nhưng hầu như không làm thay đổi Median.
- Bước 5: Sử dụng máy tính. Mở Desmos tích hợp sẵn để tính toán nhanh, tránh lỗi sai số học cơ bản.
Mẹo Desmos
Thay vì cộng tay từng số dễ nhầm lẫn, bạn có thể gõ trực tiếp vào Desmos:
- Để tính trung bình: Gõ
mean(2, 4, 6, 8)hoặc tạo một danh sáchL = [2, 4, 6, 8]rồi gõmean(L). - Để tính trung vị: Gõ
median(L).
Điều này đặc biệt hữu ích khi tập dữ liệu có các số thập phân phức tạp hoặc có số lượng phần tử lớn.
Ví Dụ Minh Họa
Đề bài: A data set consists of the following 7 values: 12, 15, 18, 20, 20, 25, 80. If the outlier (80) is removed from the data set, which of the following best describes the effect on the mean and median?
A) Both the mean and median decrease by the same amount. B) The mean decreases significantly, while the median remains unchanged. C) The mean decreases significantly, while the median decreases slightly. D) Both the mean and median remain unchanged.
Lời giải:
Đầu tiên, ta xét tập dữ liệu ban đầu (đã được sắp xếp sẵn): .
- Số lượng phần tử (số lẻ), nên Trung vị (Median) là số ở vị trí thứ 4: .
- Trung bình (Mean) =
Tiếp theo, ta xét tập dữ liệu sau khi loại bỏ ngoại lai (): .
- Số lượng phần tử (số chẵn), nên Trung vị (Median) mới là trung bình cộng của số thứ 3 và thứ 4: .
- Trung bình (Mean) mới =
So sánh:
- Mean giảm từ xuống (giảm đáng kể).
- Median giảm từ xuống (giảm nhẹ).
Vậy đáp án đúng là C.
Bẫy Thường Gặp
-
Nhầm lẫn Mean và Median trong phân phối bị lệch — Dữ liệu từ Lumist cho thấy 22% học sinh sai ở dạng bài này. Các bạn thường mặc định Mean = Median. Hãy nhớ: Chỉ trong phân phối đối xứng (symmetric) thì Mean mới bằng Median. Nếu dữ liệu lệch phải (có số cực lớn), Mean > Median. Học sinh phác họa sơ đồ phân phối trước khi chọn đáp án thường có điểm số cao hơn 20%.
-
Tính toán trung bình của các trung bình (Average of averages) — Khi có hai nhóm với số lượng khác nhau, bạn KHÔNG ĐƯỢC cộng hai số trung bình lại rồi chia đôi. Bạn phải tính tổng số lượng của cả hai nhóm rồi chia cho tổng số người. Lỗi này rất giống với bẫy trong các bài toán về tỉ lệ thuận và tỉ lệ nghịch.
-
Quên sắp xếp dữ liệu khi tìm Median — Rất nhiều bạn nhìn vào danh sách và chọn ngay làm trung vị vì nó đứng ở giữa. Sai hoàn toàn! Bạn phải xếp lại thành để thấy trung vị thực sự là .
Câu Hỏi Thường Gặp
Làm sao để nhớ sự khác nhau giữa mean và median?
Mean là trung bình cộng (cộng tất cả lại rồi chia đều), còn median là trung vị (số đứng ở chính giữa khi xếp hàng từ bé đến lớn). Mẹo nhớ: chữ "median" nghe giống "medium" (ở giữa).
Khi nào thì mean lớn hơn median?
Khi dữ liệu bị lệch phải (skewed right) — tức là có một vài giá trị ngoại lai (outlier) rất lớn kéo giá trị trung bình (mean) lên cao, trong khi trung vị (median) ít bị ảnh hưởng hơn.
Có bắt buộc phải sắp xếp lại số liệu trước khi tìm median không?
Bắt buộc! Nếu bạn không sắp xếp dữ liệu từ nhỏ đến lớn (hoặc ngược lại) mà lấy ngay số ở giữa, kết quả sẽ sai hoàn toàn.
SAT có bao nhiêu câu hỏi về Trung Bình, Trung Vị, và Mode?
Chủ đề này thuộc phần Giải Quyết Vấn Đề & Phân Tích Dữ Liệu (Problem-Solving & Data Analysis), chiếm khoảng 15% bài thi. Trong ngân hàng đề của Lumist hiện có 30 câu hỏi luyện tập chuyên sâu về dạng này để bạn làm quen với mọi biến thể.
