Essential Vocab for SAT® Math - Problem Solving and Data Analysis | Unit 8: Box Plot + Scatterplot
Key takeaways
Nắm rõ hai từ vựng quan trọng trong SAT Math liên quan đến chủ dề “problem-solving and data analysis”
box plot (biểu đồ hộp)
scatterplot (biểu đồ phân tán)
Trong bài thi SAT Math, hiểu đúng từ vựng giúp người học tiết kiệm thời gian và tránh sai sót. Hai từ khóa quan trọng là “box plot” (biểu đồ hộp) và “scatterplot” (biểu đồ phân tán). Bài viết sẽ hướng dẫn người học cách sử dụng chúng trong các ngữ cảnh quen thuộc như hình học và bài toán tổng quát, kèm ví dụ và bài tập ứng dụng thực tế.
Box plot (noun): biểu đồ hộp
Định nghĩa
Trong toán học và phân tích dữ liệu, box plot (biểu đồ hộp) là một loại biểu đồ thống kê dùng để biểu diễn sự phân bố của một tập hợp dữ liệu một cách trực quan thông qua 5 đặc trưng số chính, còn gọi là ngũ phân vị (five-number summary), bao gồm:
Giá trị nhỏ nhất (minimum)
Trung vị (Q2 - Median): giá trị nằm giữa tập dữ liệu đã sắp xếp
Nếu số lượng phần tử là lẻ, median là giá trị chính giữa.
Nếu số lượng phần tử là chẵn, median là trung bình cộng của hai giá trị ở giữa.
Tứ phân vị thứ nhất (Q1 - First Quartile): giá trị phân chia 25% dữ liệu nhỏ nhất
Q1 là trung vị của nửa dưới (các số nhỏ hơn median).
Tứ phân vị thứ ba (Q3 - Third Quartile): giá trị phân chia 75% dữ liệu nhỏ nhất
Q3 là trung vị của nửa trên (các số lớn hơn median).
Giá trị lớn nhất (maximum)

Biểu đồ hộp có thể đứng thẳng hay là nằm ngang, nhưng sẽ chung một cấu trúc như sau, nhằm biểu diễn các thông tin một cách chính xác và dễ hiểu:
Hộp (box): kéo dài từ Q1 đến Q3, biểu diễn khoảng tứ phân vị (Interquartile Range - IQR)
Đường giữa hộp: biểu diễn trung vị (Q2)
Râu (whiskers): kéo dài từ Q1 đến giá trị nhỏ nhất, và từ Q3 đến giá trị lớn nhất, trừ khi có ngoại lệ (outliers)

Biểu đồ hộp là công cụ hữu ích trong việc so sánh phân bố giữa các nhóm dữ liệu, phát hiện sự lệch, độ đối xứng cũng như xác định sự tồn tại của các giá trị bất thường. Nó giúp tóm tắt dữ liệu một cách ngắn gọn nhưng mang lại nhiều thông tin trực quan.
Để hiểu cách tiến hành vẽ một biểu đồ hộp, ta có thể nhìn ví dụ sau.
Ví dụ: Một nhóm sinh viên được hỏi họ ngủ bao nhiêu giờ mỗi đêm trong tuần thi. Kết quả thu được (đơn vị: giờ): 4, 4, 3, 5, 5, 6, 7, 6, 7, 8, 12
Bước 1: Sắp xếp dữ liệu tăng dần: 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 12
Bước 2: Tìm 5 số đặc trưng (Five-number summary)
Minimum = 3
Maximum = 12
Median (Q2): Trung vị của 11 số = 6
Q1 (tứ phân vị thứ nhất) = trung vị của nửa dưới: 3, 4, 4, 5, 5 → trung vị là 4
Q3 (tứ phân vị thứ ba) = trung vị của nửa trên: 6, 7, 7, 8, 12 → trung vị là 7
Bước 3: Tính IQR (Interquartile Range): IQR = Q3 - Q1 = 7 - 4 = 3
Bước 4: Vẽ biểu đồ hộp

Scatterplot (noun): biểu đồ phân tán
Định nghĩa
Trong toán học và phân tích dữ liệu, scatterplot (biểu đồ phân tán) hiển thị dữ liệu của hai biến thông qua các điểm nằm trên mặt phẳng tọa độ 𝒙𝐲. Trong đó, mỗi trục (trục hoành và trục tung) thường đại diện cho một yếu tố trong thực tế. Mỗi điểm (x,y) trên biểu đồ thể hiện một cặp giá trị tương ứng của hai yếu tố đó. Biến x thường được xem là biến độc lập (independent variable). Biến y thường là biến phụ thuộc (dependent variable).
Để có một biểu đồ phân tán, ta cần một vài chi tiết:
Trục hoành (x-axis): biểu diễn biến số thứ nhất
Trục tung (y-axis): biểu diễn biến số thứ hai
Mỗi dấu chấm (point): là một quan sát, có tọa độ (x, y)

scatterplot
Biểu đồ phân tán giúp người quan sát dễ dàng nhận thấy xu hướng tổng quát giữa hai biến, xác định xem có mối tương quan hay không, và nếu có, thì mối tương quan đó là dương, âm, hay không có gì rõ ràng. Ngoài ra, biểu đồ còn giúp phát hiện các giá trị ngoại lệ để hỗ trợ việc làm sạch hoặc phân tích sâu hơn.
Để hiểu cách tiến hành vẽ một biểu đồ phân tán, ta có thể nhìn ví dụ sau.
Ví dụ: Một giáo viên khảo sát 5 học sinh về số giờ họ học bài mỗi ngày và điểm số họ đạt được trong bài kiểm tra Toán.
Học sinh | Giờ học (x) | Điểm toán (y) |
A | 1 | 6 |
B | 2 | 7 |
C | 3 | 8 |
D | 4 | 9 |
Bước 1: Xác định 2 biến số
Biến độc lập (x): Số giờ học
Biến phụ thuộc (y): Điểm kiểm tra toán
→ Mỗi cặp (x, y) là một điểm: (1, 6), (2, 7), (3, 8), (4, 9),
Bước 2: Chuẩn bị mặt phẳng tọa độ
Trục hoành (x): từ 0 đến 5 (đại diện cho giờ học)
Trục tung (y): từ 6 đến 10 (đại diện cho điểm số)
Bước 3: Đặt các điểm lên biểu đồ

Bước 4: Quan sát: Các điểm xếp thành một đường nghiêng tăng dần, cho thấy: Số giờ học càng cao, điểm toán càng cao
Khái niệm liên quan
1. Line of best fit (đường xu hướng): đường thẳng biểu diễn xu hướng chung của dữ liệu trong biểu đồ phân tán, dùng để dự đoán giá trị y từ x và được tính bằng công thức y = mx + b, trong đó
m: slope (độ dốc) biểu thị mức độ thay đổi của y khi x thay đổi 1 đơn vị.
b: y-intercept (giao điểm với trục y) là giá trị của y khi x = 0.

2. Slope (độ dốc): hệ số cho biết mức độ thay đổi của y khi x tăng lên một đơn vị, phản ánh chiều và độ mạnh của xu hướng.

Kiểm tra từ vựng - box plot
Fill in the blank with one of these words: box plot, quartile, interquartile range
The __________ is the difference between the third and first quartiles and shows how spread out the middle 50% of the data is.
Each __________ in a box plot represents 25% of the data in an ordered set.
A __________ is a type of graph that shows the distribution of data based on a five-number summary.
Kiểm tra từ vựng - scatterplot
Fill in the blank with one of these words: scatterplot, line of best fit, slope, regression line
The __________ shows the general trend of the data and helps make predictions.
A __________ is a graph that uses dots to show the relationship between two numerical variables.
The __________ tells us how steep a trend line is and whether the relationship is increasing or decreasing.
Tham khảo thêm: Lộ trình tự học SAT từ 400 đến 1200+ cho người mới bắt đầu
Bài toán thực tế - box plot
Exercise 1: A teacher tried a new hybrid learning module for her students. To examine the module’s effectiveness after a test period, she gave all of the students a test and then recorded their grades using a box plot. Based on the results, approximately what percentage of the students had grades higher than 4?

Exercise 2: A group of 13 high school students was surveyed about how many hours they exercised per week during the exam period. Their responses, in hours, were:
1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 7, 8, 15.
1. Draw a box plot. What is the interquartile range (IQR) of the dataset?
2. The school claims that most students exercise at least 5 hours per week during exams. Based on the box plot, is this claim supported by the data?
Bài toán thực tế - scatterplot
Exercise 1: A recent poll was conducted to see the correlation between the number of coffee cups drunk per day and the hours someone can work in an office. The data was recorded into a table. Draw a scatterplot. Based on the trend in the data, determine the correlation between the two variables. What type of correlation is shown in the data?
Person | Coffee (cups/day) | Productive Hours |
A | 0 | 3 |
B | 1 | 4 |
C | 2 | 5.5 |
D | 2 | 6 |
E | 3 | 6.5 |
F | 3 | 7 |
H | 4 | 7 |
Exercise 2: In a cognitive performance study, researchers surveyed 20 adults to determine how sleep duration affects continuous work productivity. Each participant reported their average sleep hours per day and the maximum number of hours they could work continuously without a break. The scatterplot below summarizes the data. A line of best fit is also shown.

1. According to the line of best fit, what is the predicted continuous work time, in hours, for a person who sleeps 8 hours per day?
2. A sleep clinic is developing a guideline recommending how much sleep is necessary for people who need to work 9 hours straight in high-focus jobs. Based on the model, what is the minimum sleep duration required to support that goal?
Đáp án - boxplot
interquartile range, quartile, box plot
Exercise 1:
1. 75%
Exercise 2:
1. 4
2. The claim that most students exercise at least 5 hours per week during exams is NOT strongly supported by the data, as less than half the students meet the 5-hour threshold.
Đáp án - scatterplot
line of best fit, scatterplot, slope
Exercise 1:
There is a positive correlation between the number of coffee cups consumed and the number of productive work hours.
Exercise 2:
1. About 7.7 hours
2. About 9.67 hours
Việc hiểu rõ cách sử dụng hai từ “box plot” và “scatterplot” không chỉ đóng vai trò quan trọng trong việc trả lời chính xác các câu hỏi của phần SAT Math, mà còn giúp người học nâng cao khả năng đọc hiểu đề bài, phân tích dữ liệu.
Đối với học sinh có điểm SAT khoảng 700-800 và đang tìm kiếm phương pháp nâng cao điểm số một cách hiệu quả, Khóa học SAT Intermediate tại ZIM là lựa chọn phù hợp. Chương trình đào tạo bao gồm 30 buổi học chuyên sâu với 7 buổi Grammar & Vocabulary, 10 buổi Toán, 6 buổi Đọc và 7 buổi Viết, được thiết kế để giúp người học đạt mục tiêu 1000-1100 điểm. Liên hệ Hotline 1900-2833 (nhánh số 1) để được tư vấn chi tiết.
SAT® is a trademark registered by the College Board, which is not affiliated with, and does not endorse, this website.
Tác giả: JOHN MARK PHẠM DACUSIN
- Essential Vocab for SAT Math - Problem Solving and Data Analysis
- Essential Vocab for SAT® Math - Problem Solving and Data Analysis | Unit 2: Sum and Probability
- Essential Vocab for SAT® Math - Problem Solving and Data Analysis | Unit 1: Data and Random
- Essential Vocab for SAT® Math - Problem Solving and Data Analysis | Unit 7: Margin of error + Median
- Essential Vocab for SAT® Math - Problem Solving and Data Analysis | Unit 8: Box Plot + Scatterplot
- Essential Vocab for SAT® Math - Problem Solving and Data Analysis | Unit 3: Difference and Generalize
- Essential Vocab for SAT® Math - Problem Solving and Data Analysis | Unit 5: Whole number and Range
- Essential Vocab for SAT® Math - Problem Solving and Data Analysis | Unit 4: Biased and Unbiased
- Essential Vocab for SAT® Math - Problem Solving and Data Analysis | Unit 6: Ratio and proportion
- Tỉ số: Tổng quan về Bài toán và ví dụ thực tế trong bài thi SAT Math

Bình luận - Hỏi đáp