Banner background

Cách làm dạng bài Scatterplots trong SAT Math và bài tập

Bài viết này giới thiệu tổng quan về dạng bài scatterplots, cung cấp chiến lược làm bài hiệu quả và hướng dẫn thông qua các bài tập ứng dụng.
cach lam dang bai scatterplots trong sat math va bai tap

Key takeaways

Scatterplots là một dạng biểu đồ được sử dụng để thể hiện mối quan hệ giữa hai biến định lượng dưới dạng một tập hợp điểm trong mặt phẳng toạ độ O-xy.

  • Line of best fit là đường biểu diễn xu hướng của tập hợp các điểm dữ liệu (data points).

  • Regression Line (đường hồi quy) là một đường thẳng toán học chính xác, tính bằng công thức y = mx + b.

SAT Math kiểm tra tổng hợp kỹ năng toán học và phân tích dữ liệu, đặc biệt trong phần Problem Solving and Data Analysis (Giải quyết vấn đề và Phân tích dữ liệu) – một trong bốn chủ đề chính. Trong đó, dạng bài scatterplots (biểu đồ phân tán) thường xuất hiện nhằm đánh giá khả năng đọc hiểu, xác định xu hướng và phân tích mối quan hệ giữa các biến. Bài viết này sẽ hướng dẫn cách tiếp cận hiệu quả để giải quyết dạng bài này, giúp thí sinh nâng cao kỹ năng và cải thiện điểm số trong kỳ thi SAT Math.

Tổng quan về dạng bài Scatter plots trong SAT Math

Scatterplots là một dạng biểu đồ được sử dụng để thể hiện mối quan hệ giữa hai biến định lượng dưới dạng một tập hợp điểm trong mặt phẳng toạ độ O-xy, trong đó mỗi trục đại diện cho một dữ liệu trong đời thực (mật độ dân số, thời gian làm bài kiểm tra,…).

Trên thực tế, các dữ liệu trong đời thực thường không chính xác tuyệt đối và khi thiết lập các mô hình biểu diễn dữ liệu thì các các điểm biểu diễn sẽ phân tán, tạo thành một vùng chứ không nằm trên một đường xu hướng tuyến tính (linear).

Tuy nhiên trong SAT Math, các dữ liệu được lý tưởng hoá để xây dựng một phương trình (equation) và đồ thị đơn giản giúp việc tính toán thuận lợi và đơn giản hơn.

Ví dụ:

Biểu đồ scatter plots là gì?

Biểu đồ phân tán ở trên cho thấy giá nhà ở tương đối và mật độ dân số của một số thành phố lớn của Hoa Kỳ trong năm 2005. Ở biểu đồ trên, trục y đại diện cho relative housing cost (giá nhà ở tương đối so với trung bình giá nhà ở trên cả nước), và trục x là population density (mật độ dân số). Biểu đồ này cho thấy:

  • Tại khu vực có giá nhà ở so với trung bình giá nhà ở trên cả nước là khoảng 50% (tức là giá nhà bằng 50% trung bình giá nhà ở trên cả nước) thì mật độ dân số là khoảng 4,000 người/ dặm vuông diện tích đất.

  • Tại khu vực có giá nhà ở so với trung bình giá nhà ở trên cả nước là khoảng 300% (tức là giá nhà gấp ba lần trung bình giá nhà ở trên cả nước) thì mật độ dân số là khoảng 25,000 người/ dặm vuông diện tích đất.

Phương trình của Line of best fit (Đường xu hướng): \(y=\frac{1}{80}x-\frac{25}{2}\)

Line of best fit (đường xu hướng) và Regression line (đường hồi qui)

Nhìn vào ví dụ bên trên, có thể thấy Line of best fit là đường (thường là đường thẳng) biểu diễn xu hướng của tập hợp các điểm dữ liệu (data points). Có thể nhận thấy là đường thẳng này không đi qua hết tất cả các điểm. Đối với những dạng bài tập tìm đường xu hướng, hãy chọn đường gần nhiều điểm nhất có thể. Ngoài ra, có một số lưu ý quan trọng:

  • Điểm thuộc đường xu hướng là những dự đoán chính xác nhất, và giá trị y của điểm đó gọi là giá trị dự đoán.

  • Điểm không thuộc đường xu hướng sẽ có giá trị y chênh lệch so với điểm tương ứng trên đường xu hướng, và khoảng chênh lệch đó chính là sự chênh lệch giữa giá trị thực và giá trị dự đoán.

  • Độ dốc của đường xu hướng (slope) biểu diễn xu hướng lên hoặc xuống của biến.

Đôi khi người học bắt gặp khái niệm về Regression line (đường hồi qui). Đây là hình dạng của đường đồ thị biểu diễn mối quan hệ giữa mỗi biến độc lập và biến phụ thuộc, được tính bằng công thức y = mx + b, trong đó:

  • m: slope (độ dốc) biểu thị mức độ thay đổi của y khi x thay đổi 1 đơn vị.

  • b: y-intercept (giao điểm với trục y) là giá trị của y khi x = 0.

Line of best fit và Regression line

Slope

Slope (độ dốc) miêu tả độ nghiêng hoặc độ dốc của đường xu hướng. Nó biểu thị mức độ thay đổi của giá trị y khi giá trị x thay đổi 1 đơn vị.

Công thức tính slope: \(m=\frac{\Delta y}{\Delta x}=\frac{y2-y1}{x2-x1}\)

Trong đó:

  • m là slope (độ dốc)

  • (x1, y1) và (x2, y2) là hai điểm bất kỳ trên đường thẳng

  • Δy là sự thay đổi của y

  • Δx là sự thay đổi của x

Ý nghĩa của slope:

  • Slope > 0: Đường thẳng đi lên từ trái qua phải, nghĩa là khi x tăng, y tăng

  • Slope < 0: Đường thẳng đi xuống từ trái qua phải, nghĩa là khi x tăng, y giảm.

  • Slope = 0: Đường nằm ngang, phương trình tuyến tính có dạng y = m (m là hằng số)

  • Slope không xác định: Đường thẳng đứng, phương trình tuyến tính có dạng x = n (n là hằng số)

Ý nghĩa của Slope

Xem thêm: Tổng hợp từ vựng SAT Math theo chủ đề [PDF]

5 dạng bài Scatterplots phổ biến và chiến lược làm bài

1. Xác định xu hướng dữ liệu (Trend Analysis)

Dạng bài này yêu cầu nhận biết xu hướng chung của dữ liệu: xu hướng tăng, giảm hoặc không có mối quan hệ rõ ràng. Câu hỏi phổ biến ở dạng này là “What trend does the data represent?”.

Chiến lược:

  • Quan sát các điểm dữ liệu trên biểu đồ.

  • Nếu các điểm tăng từ trái qua phải: xu hướng tăng (increasing trend).

  • Nếu các điểm giảm từ trái qua phải: xu hướng giảm (decreasing trend).

  • Nếu các điểm rải rác không có mẫu rõ ràng: không có xu hướng (no trend).

Example:

A scatter plot shows the number of study hours (x) and test scores (y). What trend does the data represent?

A. No trend
B. Increasing trend
C. Decreasing trend
D. Unstable variation

Trend Analysis

Solution:

The data demonstrates an increasing trend, meaning that as the number of study hours increases, the test scores also tend to increase. Therefore, the correct answer would be B. Increasing trend.

2. Tìm phương trình đường hồi quy tuyến tính (Regression Line Equation)

Dạng bài này yêu cầu tìm phương trình đường thẳng y = mx + b đại diện cho xu hướng dữ liệu. Câu hỏi phổ biến của dạng này là “What is the equation of the regression line?”.

Chiến lược:

  • Phương trình hồi quy tuyến tính có dạng y = mx + b

  • Xác định m bằng công thức: \(m=\frac{\Delta y}{\Delta x}=\frac{y2-y1}{x2-x1}\)

  • Xác định b bằng cách thay x = 0 vào phương trình hồi quy tuyến tính.

Example:

The data illustrates the relationship between the number of jogging hours per week (x) and the number of calories burned (y). The scatter plot shows a regression line with a slope of m = 50 and a y-intercept of b = 200. What is the equation of the regression line?

A. y = 50x + 200
B. y = 200x + 50
C. y = 50x − 200
D. y = 200x − 50

Solution:

  • The slope (m) is 50. This means for every unit increase in x, y increases by 50 units.

  • The y-intercept (b) is 200. This means when x = 0, the value of y is 200.

Therefore, the correct regression line equation is: A. y = 50x + 200

3. Dự đoán giá trị (Prediction Using the Regression Line)

Dạng bài này sử dụng phương trình đường hồi quy hoặc xu hướng biểu đồ để dự đoán giá trị y từ một giá trị x đã cho (hoặc ngược lại). Câu hỏi phổ biến của dạng này là “What is the predicted value of y if x = a?”.

Chiến lược: Thay giá trị x đã cho vào phương trình hồi quy tuyến tính để tính y, hoặc ngược lại.

Example:

The regression line y = 2x + 10 represents the relationship between the number of working hours (x) and weekly income (y). If a person works 5 hours, what is their predicted income?

A. 10
B. 15
C. 20
D. 40

Solution:

Substitute x = 5 into the equation: y = 2 x 5 + 10 = 20. Therefore, the correct answer is C. 20

4. Nhận diện mối tương quan (Correlation Strength and Direction)

Dạng bài yêu cầu xác định mức độ và hướng tương quan giữa hai biến. Câu hỏi phổ biến của dạng này là “What type of correlation is shown?”.

Chiến lược:

  • Tương quan dương (Positive Correlation): Cả x và y đều tăng.

  • Tương quan âm (Negative Correlation): Khi x tăng, y giảm.

  • Không tương quan (No Correlation): Các điểm rải rác không theo quy luật.

  • Xác định độ mạnh yếu:

    • Nếu các điểm gần đường hồi quy → tương quan mạnh.

    • Nếu các điểm xa đường hồi quy → tương quan yếu.

Example:

The scatter plot below shows the relationship between the number of hours students spend studying (x) and their exam scores (y). Based on the trend in the data, determine the correlation between the two variables. What type of correlation is shown in the data?

A. Positive correlation
B. Negative correlation
C. No correlation

Correlation Strength and Direction

Solution:

The scattered data points show some variability, but the line of best fit indicates a positive correlation, suggesting that as study hours increase, exam scores tend to improve. Therefore, the correct answer is A. Positive correlation

5. Xác định giá trị ngoại lai (Outliers)

Giá trị ngoại lai là những điểm nằm cách xa xu hướng chung của dữ liệu. Dạng bài này yêu cầu xác định hoặc phân tích ảnh hưởng của giá trị ngoại lai. Câu hỏi phổ biến của dạng này là “Which point is an outlier?”.

Ví dụ:

Which point is an outlier?

Biểu đồ phân tán trên hiển thị dữ liệu của các học sinh trong một chuyến đi leo núi (mỗi điểm đại diện cho một học sinh).

Tuy nhiên, có hai điểm không khớp với xu hướng chung. Hai điểm này đại diện cho hai học sinh Brad và Sharon.

  • Sharon có thể được coi là một outlier vì bạn ấy nặng khoảng 55kg nhưng mang một chiếc ba lô nặng hơn nhiều so với những người bạn cùng số cân nặng với bạn ấy làm.

  • Brad có thể được coi là một outlier vì bạn ấy nặng khoảng 70kg nhưng mang một chiếc ba lô nhẹ hơn nhiều so với những người bạn cùng số cân nặng với bạn ấy làm.

Chiến lược:

  • Tìm điểm nằm xa nhất so với xu hướng chung hoặc đường hồi quy.

  • Phân tích xem điểm ngoại lai ảnh hưởng như thế nào đến xu hướng.

  • Nếu bài yêu cầu xác định outlier, chỉ cần nêu giá trị x, y.

Example:

Michelle was researching different computers to buy for college. She looked up the prices and quality ratings for a sample of computers. Her data is shown in the scatter plot to the right, where each point is a computer.

Michele wants to buy a computer whose quality rating is far higher than the pattern would predict based on its price.

Which of the labeled points represents a computer that Michele wants to buy?

A. A
B. B
C. C
D. D

Which of the labeled points represents a computer that Michele wants to buy?

Solution:

The computer described by point B costs about $600. Based on the pattern, its quality rating should be around 60 or 62, but its quality rating is about 82.

Its quality rating is far higher than the pattern predicts based on its price, so Michele should want to buy it. Therefore, the correct answer is B.

Xem thêm: SAT 1400 có khó không? Tiêu chí đạt điểm SAT 1400

Một số lưu ý khi làm bài biểu đồ Scatter plots

  • Hiểu rõ trục tọa độ:

    • Trục x (trục ngang): Thường đại diện cho biến độc lập.

    • Trục y (trục dọc): Đại diện cho biến phụ thuộc.

  • Không nhầm lẫn dữ liệu và xu hướng:

    • Một số câu hỏi đánh lừa bằng cách đưa ra các điểm ngoại lai không thuộc xu hướng chính. Đừng để những điểm này làm sai lệch phân tích.

  • Thực hành thường xuyên:

    • Làm quen với các biểu đồ phức tạp và học cách đọc nhanh thông tin.

  • Sử dụng máy tính đồ thị:

    • Máy tính có thể hỗ trợ tính toán nhanh giá trị hồi quy hoặc kiểm tra mối quan hệ tuyến tính.

Bài tập ứng dụng

Bài 1: Chọn đáp án đúng

Scatterplots SAT Math - bài tập 1

From 2014 to 2018, the number of students enrolled in the Sunrise school district generally ____________ (increased/ decreased/ stayed the same).

The school district saw the smallest change in the number of students enrolled between ____________ (2015 and 2016/ 2016 and 2017/ 2017 and 2018).

Bài 2: Chọn đáp án đúng

Liam wants to buy a new bicycle. He decides to save money gradually over several weeks until he reaches his target. Once he has enough money, Liam waits for a sale before making the purchase. Finally, he buys the bicycle during the sale event and uses all the money he saved.

Before Liam has enough money for the bicycle, as time elapses, the amount of money he saves ____________ (increases/ decreases/ remains constant).

After Liam saves enough money, but before he buys the bicycle, the amount of money he has ____________ (increases/ decreases/ remains constant).

When Liam spends the money on the bicycle, the amount of money he has ____________ (increases suddenly/ decreases suddenly/ remains constant).

Đáp án

Bài 1:

The graph trends upward from left to right, which means from 2014 to 2018, the number of students enrolled in the Sunrise school district generally increased.

The table below shows the enrollment by year as well as the change in enrollment from the previous year.

Year

Enrollment

Change from previous year

2014

2,000

n/a

2015

2,400

+400

2016

2,700

+300

2017

2,900

+200

2018

3,000

+100

The school district saw the smallest change in the number of students enrolled between 2017 and 2018.

Bài 2:

Liam gradually saves money over the course of several weeks, so as time elapses, the amount of money he saves increases.

After Liam has enough money, he holds onto it while waiting for a sale. This means the amount of money he has saved neither increases nor decreases during this time period; it remains constant.

Finally, Liam spends the money all at once on the bicycle. Spending all of the money at one time means the amount of money he saved decreases suddenly.

The graph below represents this scenario.

Scatterplots SAT Math - đáp án bài tập 2

Đọc tiếp: Cách làm dạng bài Linear and Exponential Growth trong SAT Math

Kết luận

Scatterplots là một dạng bài quen thuộc trong SAT Math nhưng đòi hỏi sự quan sát kỹ lưỡng và kỹ năng phân tích dữ liệu. Thí sinh cần nhận diện xu hướng, xác định outliers (giá trị ngoại lai) và sử dụng đường hồi quy để đánh giá mối quan hệ giữa các biến. Việc thực hành thường xuyên cùng với các chiến lược phù hợp sẽ giúp thí sinh giải quyết dạng bài này hiệu quả và cải thiện điểm số.

Để tối ưu thời gian ôn luyện và đạt điểm SAT như mong muốn, thí sinh có thể tham gia các khóa học SAT tại ZIM. Khóa học không chỉ cung cấp kiến thức toàn diện về các phần Toán, Đọc hiểu và Viết mà còn trang bị chiến lược làm bài thi SAT Digital với hình thức “Adaptive Testing” thích ứng theo nhiều cấp độ. Học viên được tiếp cận thư viện tài liệu độc quyền và phương pháp giáo dục cá nhân hóa giúp phát triển tư duy phản biện. Liên hệ Hotline 1900-2833 (nhánh số 1) để được tư vấn chi tiết.

Tham vấn chuyên môn
Trần Ngọc Minh LuânTrần Ngọc Minh Luân
GV
Tôi đã có gần 3 năm kinh nghiệm giảng dạy IELTS tại ZIM, với phương châm giảng dạy dựa trên việc phát triển toàn diện năng lực ngôn ngữ và chiến lược làm bài thi thông qua các phương pháp giảng dạy theo khoa học. Điều này không chỉ có thể giúp học viên đạt kết quả vượt trội trong kỳ thi, mà còn tạo nền tảng vững chắc cho việc sử dụng ngôn ngữ hiệu quả trong đời sống, công việc và học tập trong tương lai. Ngoài ra, tôi còn tích cực tham gia vào các dự án học thuật quan trọng tại ZIM, đặc biệt là công tác kiểm duyệt và đảm bảo chất lượng nội dung các bài viết trên nền tảng website.

Nguồn tham khảo

Đánh giá

(0)

Gửi đánh giá

0

Bình luận - Hỏi đáp

Bạn cần để có thể bình luận và đánh giá.
Đang tải bình luận...