Banner background

Essential Vocab for SAT® Math - Problem Solving and Data Analysis | Unit 8: Box Plot + Scatterplot

Học từ vựng SAT Math: “box plot” và “scatterplot” qua định nghĩa, ví dụ hình học, kiểm tra từ vựng và bài tập thực tế sát với đề thi SAT.
essential vocab for sat math problem solving and data analysis unit 8 box plot scatterplot

Key takeaways

Nắm rõ hai từ vựng quan trọng trong SAT Math liên quan đến chủ dề “problem-solving and data analysis”

  • box plot (biểu đồ hộp)

  • scatterplot (biểu đồ phân tán)

Trong bài thi SAT Math, hiểu đúng từ vựng giúp người học tiết kiệm thời gian và tránh sai sót. Hai từ khóa quan trọng là “box plot” (biểu đồ hộp) và “scatterplot” (biểu đồ phân tán). Bài viết sẽ hướng dẫn người học cách sử dụng chúng trong các ngữ cảnh quen thuộc như hình học và bài toán tổng quát, kèm ví dụ và bài tập ứng dụng thực tế.

Box plot (noun): biểu đồ hộp

Định nghĩa

Trong toán học và phân tích dữ liệu, box plot (biểu đồ hộp) là một loại biểu đồ thống kê dùng để biểu diễn sự phân bố của một tập hợp dữ liệu một cách trực quan thông qua 5 đặc trưng số chính, còn gọi là ngũ phân vị (five-number summary), bao gồm:

  1. Giá trị nhỏ nhất (minimum)

  2. Trung vị (Q2 - Median): giá trị nằm giữa tập dữ liệu đã sắp xếp

    • Nếu số lượng phần tử là lẻ, median là giá trị chính giữa.

    • Nếu số lượng phần tử là chẵn, median là trung bình cộng của hai giá trị ở giữa.

  3. Tứ phân vị thứ nhất (Q1 - First Quartile): giá trị phân chia 25% dữ liệu nhỏ nhất

    • Q1 là trung vị của nửa dưới (các số nhỏ hơn median).

  4. Tứ phân vị thứ ba (Q3 - Third Quartile): giá trị phân chia 75% dữ liệu nhỏ nhất

    • Q3 là trung vị của nửa trên (các số lớn hơn median).

  5. Giá trị lớn nhất (maximum)

Boxplot1
Boxplot1

Biểu đồ hộp có thể đứng thẳng hay là nằm ngang, nhưng sẽ chung một cấu trúc như sau, nhằm biểu diễn các thông tin một cách chính xác và dễ hiểu:

  1. Hộp (box): kéo dài từ Q1 đến Q3, biểu diễn khoảng tứ phân vị (Interquartile Range - IQR)

  2. Đường giữa hộp: biểu diễn trung vị (Q2)

  3. Râu (whiskers): kéo dài từ Q1 đến giá trị nhỏ nhất, và từ Q3 đến giá trị lớn nhất, trừ khi có ngoại lệ (outliers)

boxplot2
boxplot2

Biểu đồ hộp là công cụ hữu ích trong việc so sánh phân bố giữa các nhóm dữ liệu, phát hiện sự lệch, độ đối xứng cũng như xác định sự tồn tại của các giá trị bất thường. Nó giúp tóm tắt dữ liệu một cách ngắn gọn nhưng mang lại nhiều thông tin trực quan.

Để hiểu cách tiến hành vẽ một biểu đồ hộp, ta có thể nhìn ví dụ sau.

Ví dụ: Một nhóm sinh viên được hỏi họ ngủ bao nhiêu giờ mỗi đêm trong tuần thi. Kết quả thu được (đơn vị: giờ): 4, 4, 3, 5, 5, 6, 7, 6, 7, 8, 12

Bước 1: Sắp xếp dữ liệu tăng dần: 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 12

Bước 2: Tìm 5 số đặc trưng (Five-number summary)

  • Minimum = 3

  • Maximum = 12

  • Median (Q2): Trung vị của 11 số = 6

  • Q1 (tứ phân vị thứ nhất) = trung vị của nửa dưới: 3, 4, 4, 5, 5 → trung vị là 4

  • Q3 (tứ phân vị thứ ba) = trung vị của nửa trên:  6, 7, 7, 8, 12 → trung vị là 7

Bước 3: Tính IQR (Interquartile Range): IQR = Q3 - Q1 = 7 - 4 = 3

Bước 4: Vẽ biểu đồ hộp

boxplot example
boxplot example

Scatterplot (noun): biểu đồ phân tán

Định nghĩa

Trong toán học và phân tích dữ liệu, scatterplot (biểu đồ phân tán) hiển thị dữ liệu của hai biến thông qua các điểm nằm trên mặt phẳng tọa độ 𝒙𝐲. Trong đó, mỗi trục (trục hoành và trục tung) thường đại diện cho một yếu tố trong thực tế. Mỗi điểm (x,y) trên biểu đồ thể hiện một cặp giá trị tương ứng của hai yếu tố đó. Biến x thường được xem là biến độc lập (independent variable). Biến y thường là biến phụ thuộc (dependent variable).

Để có một biểu đồ phân tán, ta cần một vài chi tiết:

  • Trục hoành (x-axis): biểu diễn biến số thứ nhất

  • Trục tung (y-axis): biểu diễn biến số thứ hai

  • Mỗi dấu chấm (point): là một quan sát, có tọa độ (x, y)

    scatterplot
    scatterplot

Biểu đồ phân tán giúp người quan sát dễ dàng nhận thấy xu hướng tổng quát giữa hai biến, xác định xem có mối tương quan hay không, và nếu có, thì mối tương quan đó là dương, âm, hay không có gì rõ ràng. Ngoài ra, biểu đồ còn giúp phát hiện các giá trị ngoại lệ để hỗ trợ việc làm sạch hoặc phân tích sâu hơn.

Để hiểu cách tiến hành vẽ một biểu đồ phân tán, ta có thể nhìn ví dụ sau.

Ví dụ: Một giáo viên khảo sát 5 học sinh về số giờ họ học bài mỗi ngày và điểm số họ đạt được trong bài kiểm tra Toán.

Học sinh

Giờ học (x)

Điểm toán (y)

A

1

6

B

2

7

C

3

8

D

4

9

Bước 1: Xác định 2 biến số

  • Biến độc lập (x): Số giờ học

  • Biến phụ thuộc (y): Điểm kiểm tra toán

Mỗi cặp (x, y) là một điểm:  (1, 6), (2, 7), (3, 8), (4, 9), 

Bước 2: Chuẩn bị mặt phẳng tọa độ

  • Trục hoành (x): từ 0 đến 5 (đại diện cho giờ học)

  • Trục tung (y): từ 6 đến 10 (đại diện cho điểm số)

Bước 3: Đặt các điểm lên biểu đồ

scatterplot example
scatterplot example

Bước 4: Quan sát: Các điểm xếp thành một đường nghiêng tăng dần, cho thấy: Số giờ học càng cao, điểm toán càng cao

Khái niệm liên quan

1. Line of best fit (đường xu hướng): đường thẳng biểu diễn xu hướng chung của dữ liệu trong biểu đồ phân tán, dùng để dự đoán giá trị y từ x và được tính bằng công thức y = mx + b, trong đó

  • m: slope (độ dốc) biểu thị mức độ thay đổi của y khi x thay đổi 1 đơn vị.

  • b: y-intercept (giao điểm với trục y) là giá trị của y khi x = 0.

line of best fit
line of best fit

2. Slope (độ dốc): hệ số cho biết mức độ thay đổi của y khi x tăng lên một đơn vị, phản ánh chiều và độ mạnh của xu hướng.

slope
slope

Kiểm tra từ vựng - box plot

Fill in the blank with one of these words: box plot, quartile, interquartile range

  1. The __________ is the difference between the third and first quartiles and shows how spread out the middle 50% of the data is.

  2. Each __________ in a box plot represents 25% of the data in an ordered set.

  3. A __________ is a type of graph that shows the distribution of data based on a five-number summary.

Kiểm tra từ vựng - scatterplot

Fill in the blank with one of these words: scatterplot, line of best fit, slope, regression line

  1. The __________ shows the general trend of the data and helps make predictions.

  2. A __________ is a graph that uses dots to show the relationship between two numerical variables.

  3. The __________ tells us how steep a trend line is and whether the relationship is increasing or decreasing.

Tham khảo thêm: Lộ trình tự học SAT từ 400 đến 1200+ cho người mới bắt đầu

Bài toán thực tế - box plot

Exercise 1: A teacher tried a new hybrid learning module for her students. To examine the module’s effectiveness after a test period, she gave all of the students a test and then recorded their grades using a box plot. Based on the results, approximately what percentage of the students had grades higher than 4?

Boxplot Exercise
Boxplot Exercise

Exercise 2: A group of 13 high school students was surveyed about how many hours they exercised per week during the exam period. Their responses, in hours, were:
1, 2, 2, 3, 3, 4, 4, 5, 5, 6, 7, 8, 15.

1. Draw a box plot. What is the interquartile range (IQR) of the dataset?

2. The school claims that most students exercise at least 5 hours per week during exams. Based on the box plot, is this claim supported by the data?

Bài toán thực tế - scatterplot

Exercise 1: A recent poll was conducted to see the correlation between the number of coffee cups drunk per day and the hours someone can work in an office. The data was recorded into a table. Draw a scatterplot. Based on the trend in the data, determine the correlation between the two variables. What type of correlation is shown in the data?

Person

Coffee (cups/day)

Productive Hours

A

0

3

B

1

4

C

2

5.5

D

2

6

E

3

6.5

F

3

7

H

4

7

Exercise 2: In a cognitive performance study, researchers surveyed 20 adults to determine how sleep duration affects continuous work productivity. Each participant reported their average sleep hours per day and the maximum number of hours they could work continuously without a break. The scatterplot below summarizes the data. A line of best fit is also shown.

Scatterplot Exercise
Scatterplot Exercise

1. According to the line of best fit, what is the predicted continuous work time, in hours, for a person who sleeps 8 hours per day?

2. A sleep clinic is developing a guideline recommending how much sleep is necessary for people who need to work 9 hours straight in high-focus jobs. Based on the model, what is the minimum sleep duration required to support that goal?

Đáp án - boxplot

interquartile range, quartile, box plot

Exercise 1:

1. 75%

Exercise 2:

1. 4

2. The claim that most students exercise at least 5 hours per week during exams is NOT strongly supported by the data, as less than half the students meet the 5-hour threshold.

Đáp án - scatterplot

line of best fit, scatterplot, slope

Exercise 1:

There is a positive correlation between the number of coffee cups consumed and the number of productive work hours.

Exercise 2:

1. About 7.7 hours

2. About 9.67 hours

Việc hiểu rõ cách sử dụng hai từ “box plot” và “scatterplot” không chỉ đóng vai trò quan trọng trong việc trả lời chính xác các câu hỏi của phần SAT Math, mà còn giúp người học nâng cao khả năng đọc hiểu đề bài, phân tích dữ liệu.

Đối với học sinh có điểm SAT khoảng 700-800 và đang tìm kiếm phương pháp nâng cao điểm số một cách hiệu quả, Khóa học SAT Intermediate tại ZIM là lựa chọn phù hợp. Chương trình đào tạo bao gồm 30 buổi học chuyên sâu với 7 buổi Grammar & Vocabulary, 10 buổi Toán, 6 buổi Đọc và 7 buổi Viết, được thiết kế để giúp người học đạt mục tiêu 1000-1100 điểm. Liên hệ Hotline 1900-2833 (nhánh số 1) để được tư vấn chi tiết.


SAT® is a trademark registered by the College Board, which is not affiliated with, and does not endorse, this website.

Tác giả: JOHN MARK PHẠM DACUSIN

Tham vấn chuyên môn
TRẦN HOÀNG THẮNGTRẦN HOÀNG THẮNG
GV
Học là hành trình tích lũy kiến thức lâu dài và bền bỉ. Điều quan trọng là tìm thấy động lực và niềm vui từ việc học. Phương pháp giảng dạy tâm đắc: Lấy người học làm trung tâm, đi từ nhận diện vấn đề đến định hướng người học tìm hiểu và tự giải quyết vấn đề.

Đánh giá

5.0 / 5 (1 đánh giá)

Gửi đánh giá

0

Bình luận - Hỏi đáp

Bạn cần để có thể bình luận và đánh giá.
Đang tải bình luận...