Cumulative frequency là gì? Khái niệm và bài tập vận dụng về tần số tích lũy
Key takeaways
Cumulative frequency là quá trình cộng dồn liên tục các tần suất theo thứ tự tăng dần của dữ liệu.
Giá trị cuối cùng luôn bằng tổng số phần tử của toàn bộ tập dữ liệu.
Muốn tìm tần suất riêng lẻ, cần lấy hiệu giữa hai giá trị tích lũy liên tiếp.
Median được xác định tại mốc 50% tổng dữ liệu.
Trong toán học, thí sinh thường xuyên gặp các dạng bài toán với dữ liệu được trình bày dưới dạng bảng biểu hoặc đồ thị. Một trong những khái niệm thống kê cốt lõi xuất hiện với tần suất tương đối cao là tần suất tích lũy (cumulative frequency). Các dạng bài này không chỉ kiểm tra thí sinh về khả năng đọc hiểu dữ liệu, mà còn đánh giá tư duy logic và kỹ năng suy luận định lượng của thí sinh. Vì vậy, bài viết này sẽ làm rõ bản chất của tần suất tích lũy, cách biểu diễn qua bảng và đồ thị, đồng thời cung cấp chiến lược làm bài hiệu quả giúp thí sinh tối ưu hóa điểm số trong phòng thi.
Cumulative frequency là gì?
Tần suất tích lũy (cumulative frequency) là tổng của tần suất tại một nhóm dữ liệu cụ thể và toàn bộ các tần suất của những nhóm đứng trước nó theo thứ tự. Nói cách khác, đây là quá trình cộng dồn liên tục nhằm phản ánh số lượng đối tượng “tích lũy” đến một mốc nhất định trong tập dữ liệu.

Điểm khác biệt cốt lõi giữa tần suất thông thường và tần suất tích lũy (cumulative frequency) nằm ở bản chất thông tin mà chúng cung cấp. Tần suất thông thường chỉ cho biết số lượng phần tử trong một nhóm riêng lẻ, mang tính cục bộ. Ngược lại, tần suất tích lũy mang tính toàn cục hơn, cho biết tổng số phần tử từ đầu dãy dữ liệu đến vị trí đang xét. Chính vì vậy, tần số tích lũy (cumulative frequency) đặc biệt hữu ích trong việc xác định các giá trị phân vị (percentiles), trung vị (median), cũng như phân tích sự phân bố dữ liệu theo chiều tăng dần.
Bảng tần số tích lũy và công thức toán
Bảng tần suất tích lũy (cumulative frequency table) là một công cụ thống kê quan trọng giúp tổ chức và biểu diễn dữ liệu theo hướng cộng dồn. Khác với bảng tần suất thông thường chỉ ghi nhận số lượng phần tử trong từng nhóm riêng lẻ, bảng tần suất tích lũy cho thấy bức tranh tổng thể về sự phân bố dữ liệu bằng cách thể hiện số lượng phần tử được “tích lũy” dần qua từng mốc giá trị. Điều này đặc biệt hữu ích khi phân tích xu hướng, xác định các giá trị trung vị, hoặc đánh giá mức độ phân tán của dữ liệu trong các bài toán thuộc mảng kiến thức này.
Về mặt cấu trúc, một bảng tần suất tích lũy thường bao gồm hai thành phần chính: (1) các khoảng giá trị hoặc nhóm dữ liệu được sắp xếp theo thứ tự tăng dần, và (2) các giá trị tần suất tích lũy tương ứng. Mỗi giá trị trong cột cumulative frequency không chỉ phản ánh số lượng phần tử trong riêng khoảng đó, mà còn bao gồm toàn bộ các phần tử của những khoảng trước đó. Chính vì vậy, các giá trị trong cột này luôn tăng dần hoặc giữ nguyên, không bao giờ giảm.
Quy trình tính toán tần suất tích lũy (cumulative frequency) mang tính tuần tự và có tính lặp lại cao. Cụ thể:
Người đọc bắt đầu với nhóm đầu tiên: giá trị tần suất tích lũy bằng đúng tần suất của nhóm đó.
Đối với mỗi nhóm tiếp theo: lấy tần suất của nhóm hiện tại cộng với tần suất tích lũy của nhóm ngay trước nó.
Lặp lại quá trình này cho đến khi hoàn thành toàn bộ bảng.
Cách tiếp cận này có thể được hiểu như một phép cộng dồn từng bước, trong đó mỗi giá trị mới phụ thuộc trực tiếp vào kết quả của bước trước đó. Do đó, nếu xảy ra sai sót ở một bước, toàn bộ các giá trị phía sau đều bị ảnh hưởng.
Công thức tổng quát cho quá trình này được biểu diễn như sau:
\[CF_{n}=f_{n}+CF_{n-1}\]Trong đó:
\(CF_{n}\) là tần suất tích lũy tại vị trí thứ n
\(f_{n}\) là tần suất của nhóm thứ n
\(CF_{n-1}\) là tần suất tích lũy tại vị trí thứ n-1.
Một lưu ý quan trọng là giá trị tần suất tích lũy ở hàng cuối cùng luôn phải bằng tổng số lượng phần tử của toàn bộ tập dữ liệu. Đây không chỉ là một đặc điểm quan trọng để nhận diện mà còn là một công cụ để kiểm tra tính chính xác của bản dữ liệu. Trong bối cảnh phòng thi, việc đối chiếu giá trị cuối cùng với tổng dữ liệu giúp thí sinh phát hiện lỗi sai kịp thời trước khi đưa ra đáp án.
Đồ thị tần suất tích lũy (Cumulative frequency curve)
Trong thống kê, đồ thị tần suất tích lũy thường được biết đến với tên gọi là đường cong Ogive. Đây là một dạng đồ thị biểu diễn trực quan giúp người học nhanh chóng nắm bắt được xu hướng phân bố và sự tích lũy của dữ liệu theo chiều tăng dần. Trên hệ trục tọa độ, trục hoành (trục x) thường biểu diễn các giá trị hoặc các khoảng phân lớp của dữ liệu, trong khi trục tung (trục y) biểu diễn tần suất tích lũy tương ứng với từng mốc đó.
Một đặc điểm nhận dạng quan trọng của đồ thị này là đường cong luôn có xu hướng đi lên hoặc giữ nguyên. Điều này phản ánh đúng bản chất của cumulative frequency, vì giá trị tần số luôn được cộng dồn, nên tổng tích lũy không thể giảm. Trong nhiều trường hợp, đường cong có dạng chữ S (sigmoid nhẹ), thể hiện tốc độ tích lũy thay đổi tùy theo mật độ phân bố dữ liệu ở từng khoảng.

Trong toán học, việc đọc và khai thác thông tin từ đồ thị Ogive là một kỹ năng quan trọng, đặc biệt trong các câu hỏi yêu cầu suy luận thay vì đọc trực tiếp dữ liệu. Để xử lý hiệu quả, thí sinh cần nắm vững quy trình “gióng trục”, một kỹ thuật cơ bản trong giải quyết các bài toán về tần số tích lũy (cumulative frequency).
Cụ thể, cách trích xuất thông tin từ đồ thị có thể được triển khai như sau:
Xác định trung vị (Median):
Trung vị là giá trị chia tập dữ liệu thành hai phần bằng nhau, tương ứng với 50% tổng số quan sát. Trên đồ thị, thí sinh cần:Xác định giá trị bằng 50% tổng số dữ liệu trên trục tung.
Từ điểm này, kẻ một đường ngang cắt đường cong Ogive.
Từ giao điểm, gióng một đường thẳng đứng xuống trục hoành để đọc giá trị tương ứng.
Giá trị trên trục hoành chính là trung vị của tập dữ liệu.
Xác định các phân vị khác (Quartiles, Percentiles):
Quy trình trên có thể mở rộng cho các mốc quan trọng khác như:Q1 (25%)
Q3 (75%)
Hoặc bất kỳ percentile nào mà đề bài yêu cầu
Việc xác định các mốc này giúp đánh giá mức độ phân tán và hình dạng phân bố của dữ liệu, từ đó hỗ trợ các câu hỏi mang tính phân tích sâu hơn.

Một điểm đáng lưu ý là đề thi thường không yêu cầu độ chính xác tuyệt đối khi đọc từ đồ thị, mà chấp nhận các giá trị xấp xỉ hợp lý. Tuy nhiên, sai lệch lớn thường đến từ việc gióng sai trục hoặc đọc nhầm thang đo. Vì vậy, việc luyện tập kỹ thao tác đọc đồ thị sẽ giúp thí sinh tiết kiệm thời gian và tránh những lỗi sai không đáng có trong phòng thi.
Các dạng câu hỏi cumulative frequency thường gặp
Trong toán học, các câu hỏi liên quan đến tần suất tích lũy thường không dừng lại ở việc đọc dữ liệu trực tiếp, mà yêu cầu thí sinh thực hiện các bước suy luận ngược. Điều đó khiến dạng toán này trở thành một công cụ hiệu quả để đánh giá cả kỹ năng phân tích dữ liệu lẫn mức độ cẩn trọng trong phòng thi. Dưới đây là những dạng bài điển hình mà thí sinh cần nắm vững.
Dạng 1: Tìm tần suất của một nhóm đơn lẻ
Đây là dạng bài cơ bản nhưng rất dễ gây nhầm lẫn. Do bảng đã cung cấp tần suất tích lũy, nên thí sinh không thể đọc trực tiếp số lượng phần tử của từng nhóm. Thay vào đó, thí sinh cần thực hiện phép trừ giữa hai giá trị liên tiếp: lấy tần suất tích lũy của nhóm đang xét trừ đi tần suất tích lũy của nhóm đứng ngay trước nó.
Về bản chất, đây là quá trình “giải nén” dữ liệu đã được cộng dồn. Nếu không nhận diện đúng dạng bài, thí sinh dễ rơi vào bẫy chọn trực tiếp giá trị cumulative frequency như thể đó là frequency thông thường, dẫn đến sai lệch hoàn toàn về bản chất dữ liệu.
Dạng 2: Xác định nhóm chứa trung vị (Median class)
Dạng bài này yêu cầu kết hợp hiểu biết về cumulative frequency và khái niệm trung vị. Quy trình xử lý gồm ba bước:
(1) Xác định tổng số phần tử của tập dữ liệu bằng cách nhìn vào giá trị cuối cùng trong bảng,
(2) Chia đôi để tìm vị trí trung vị,
(3) Dò ngược bảng từ trên xuống để xác định khoảng dữ liệu đầu tiên có tần suất tích lũy lớn hơn hoặc bằng vị trí trung vị.
Nhóm dữ liệu tương ứng chính là khoảng chứa trung vị. Dạng này kiểm tra khả năng liên kết giữa dữ liệu bảng và các khái niệm thống kê cơ bản, thay vì chỉ thao tác số học đơn thuần.
Bẫy phổ biến
Sai lầm nghiêm trọng nhất mà thí sinh thường mắc phải là không đọc kỹ tiêu đề cột. Trong nhiều câu hỏi, đề bài cố tình ghi rõ “Cumulative Frequency”, nhưng do sự thiếu cẩn thận, người học lại vô thức xử lý như “Frequency” thông thường. Hệ quả là thí sinh tiếp tục cộng dồn các giá trị vốn đã được cộng dồn sẵn, khiến kết quả bị phóng đại và hoàn toàn sai lệch. Đây là một dạng conceptual trap điển hình, nhằm phân loại những thí sinh chỉ thao tác máy móc với những người thực sự hiểu bản chất dữ liệu.
Bài tập vận dụng
Dưới đây là ba câu hỏi trắc nghiệm của dạng bài về tần số tích lũy. Các câu hỏi yêu cầu thí sinh vận dụng linh hoạt kỹ năng đọc bảng, phân tích đồ thị và suy luận từ tần suất tích lũy [1].
Question 1:
A cumulative frequency table shows the number of students scoring below certain marks:
Score | Cumulative Frequency |
|---|---|
10 | 5 |
20 | 13 |
30 | 22 |
40 | 30 |
How many students scored between 20 and 30?
A. 9
B. 13
C. 22
D. 30
Question 2:
Using the same table above, which interval contains the median score?
A. 0–10
B. 10–20
C. 20–30
D. 30–40
Question 3:
A cumulative frequency graph shows that:

What is the approximate median of the dataset?
A. 40
B. 45
C. 50
D. 60
Đáp án và giải thích chi tiết
Question 1: A
Bước 1: Nhận diện dạng bài
Từ khóa “cumulative frequency”Bước 2: Áp dụng công thức
Số học sinh trong khoảng 20–30:
22−13 = 9 → Đáp án A
Question 2: C
Bước 1: Xác định tổng dữ liệu
Giá trị cuối cùng = 30Bước 2: Tìm trung vị
Median = 30/2 = 15Bước 3: Xác định khoảng chứa vị trí 15
13 ≤ 15 ≤ 22 → 15 thuộc khoảng 20-30 → Đáp án C
Question 3: B
Bước 1: Nhận diện dạng bài
Đồ thị cumulative → tìm median qua 50% dữ liệuBước 2: Xác định vị trí trung vị
Median = 50%×80=40Bước 3: Đọc đồ thị
Tại CF = 40 thì giá trị xấp xỉ 45 → Đáp án B
Xem thêm:
Kết luận
Tần suất tích lũy là một khái niệm thống kê cốt lõi mà thí sinh cần nắm vững khi xử lý các bài toán thống kê. Bản chất của khái niệm này nằm ở quá trình cộng dồn liên tục, trong đó mỗi giá trị phản ánh tổng số phần tử từ đầu dãy đến vị trí đang xét. Một nguyên tắc quan trọng không thể bỏ qua là giá trị cuối cùng trong bảng tần suất tích lũy luôn bằng tổng kích thước của toàn bộ tập dữ liệu. Để làm tốt dạng toán cumulative frequency này, thí sinh cần đặc biệt chú trọng kỹ năng đọc bảng một cách cẩn thận và thao tác gióng trục chính xác khi làm việc với đồ thị Ogive. Việc luyện tập có hệ thống là yếu tố quyết định — thí sinh có thể tham khảo khóa học SAT chuyên sâu tại ZIM Academy để được hướng dẫn phương pháp giải toán logic và tiếp cận nguồn bài tập chuẩn hóa đa dạng.
Nguồn tham khảo
“Cumulative frequency practice questions.” ChatGPT, https://chatgpt.com/share/69bfe8ea-c10c-8007-931c-489a630e2954. Accessed 21 tháng 3 2026.

Bình luận - Hỏi đáp