Banner background

TOEFL iBT® 2026 – Cá nhân hóa trải nghiệm thi (personalized testing)

Bài viết phân tích sự thay đổi TOEFL iBT 2026 với personalized testing (cá nhân hóa trải nghiệm thi), từ adaptive multistage design (thi thích ứng đa giai đoạn) và thang điểm CEFR đến feedback (phản hồi) cá nhân hóa. Nội dung làm rõ tác động tâm lý, kết quả thi, lợi ích cho thí sinh, đồng thời chỉ ra thách thức về minh bạch dữ liệu, hạ tầng công nghệ và khả năng tiếp cận toàn cầu.
toefl ibt 2026 ca nhan hoa trai nghiem thi personalized testing

Key takeaways

  • TOEFL iBT 2026 áp dụng adaptive multistage design (thi thích ứng đa giai đoạn) và thang điểm CEFR, nâng cao tính chính xác và công bằng.

  • Personalized testing (cá nhân hóa trải nghiệm thi) giúp giảm lo âu, tăng động lực, đồng thời cung cấp feedback (phản hồi) chi tiết.

Trong những năm gần đây, sự xuất hiện của adaptive test (bài thi thích ứng) đã thay đổi căn bản cách thức đo lường năng lực trong các kỳ thi chuẩn hóa quốc tế. Không còn giữ cấu trúc tuyến tính cố định, adaptive test điều chỉnh độ khó câu hỏi dựa trên hiệu suất làm bài, từ đó hứa hẹn mang lại phép đánh giá chính xác và cá nhân hóa hơn (personalized testing – cá nhân hóa trải nghiệm thi). Với thông báo cải cách TOEFL iBT từ năm 2026, ETS® đã khẳng định sẽ áp dụng mô hình adaptive multistage design (thi thích ứng đa giai đoạn) cho các phần Reading và Listening, đồng thời bổ sung thang điểm CEFR và phản hồi (feedback) chi tiết nhằm nâng cao tính công bằng và giảm thiểu thiên lệch văn hóa.

Tổng quan lý thuyết và nghiên cứu nền tảng

Personalized Testing là gì?

Khái niệm personalized testing (cá nhân hóa trải nghiệm thi) xuất phát từ nhu cầu tạo ra một cơ chế đánh giá linh hoạt, trong đó bài thi không còn cố định cho tất cả mọi thí sinh, mà thay đổi dựa trên năng lực, tốc độ và phản ứng cá nhân. Khác với adaptive testing (bài thi thích ứng) truyền thống, vốn chỉ tập trung vào việc điều chỉnh độ khó câu hỏi theo hiệu suất làm bài, personalized testing mở rộng phạm vi bằng cách chú trọng đến toàn bộ trải nghiệm thi: từ giao diện, cách thức phản hồi, cho đến dữ liệu phân tích sau kỳ thi [1].

Sự khác biệt then chốt là adaptive test tập trung vào độ chính xác đo lường, trong khi personalized testing hướng đến trải nghiệm công bằng và nhân văn hơn. Điều này gắn liền với triết lý personalized learning (cá nhân hóa học tập), vốn nhấn mạnh rằng mỗi cá nhân có cách học, tốc độ tiếp thu và nhu cầu hỗ trợ khác nhau [2]. Khi áp dụng nguyên lý này vào thi cử, personalized testing trở thành cầu nối giữa quá trình học tậpđánh giá học thuật, đảm bảo rằng kỳ thi không chỉ đo lường năng lực, mà còn phản ánh đúng bối cảnh và hành trình học của thí sinh.

Nghiên cứu khoa học

Phương pháp kiểm tra thích ứng hiệu quả nhất
Kiểm tra thích ứng gia tăng độ chính xác và hiệu quả

Nền tảng lý thuyết chủ đạo của adaptive và personalized testing là Item Response Theory (IRT) (Lý thuyết ứng đáp câu hỏi). Khác với Classical Test Theory (CTT) (Lý thuyết kiểm tra cổ điển), vốn chỉ dựa trên tổng số câu đúng, IRT mô tả mối quan hệ giữa năng lực tiềm ẩn của thí sinh (latent trait) và đặc tính từng câu hỏi như độ khó (difficulty), khả năng phân biệt (discrimination), và xác suất đoán mò (guessing parameter) [3].

Một ứng dụng nổi bật của IRT là Computerized Adaptive Testing (CAT) (Bài thi thích ứng trên máy tính). Wainer (2000) chỉ ra rằng CAT có thể giảm đáng kể sai số đo lường nhờ chọn liên tục các câu hỏi phù hợp với năng lực hiện tại của thí sinh [4]. Baker (2001) cho thấy CAT đạt độ tin cậy cao với chỉ khoảng 50–70% số câu hỏi so với bài thi tuyến tính [5].

Tuy nhiên, item-by-item adaptive testing (thi thích ứng từng câu hỏi) có nguy cơ gây mất cân bằng nội dung. Để khắc phục, ETS và nhiều học giả khuyến nghị sử dụng Multistage Adaptive Testing (MST) (thi thích ứng đa giai đoạn). Theo Yan, von Davier và Lewis (2014), MST vừa giữ được tính thích ứng vừa đảm bảo phạm vi nội dung rộng, nhờ đó duy trì khả năng so sánh kết quả giữa các thí sinh đến từ nhiều bối cảnh khác nhau [6]. Đây cũng chính là mô hình ETS lựa chọn để áp dụng cho TOEFL iBT từ năm 2026.

Ngoài ra, sự phát triển của Artificial Intelligence (trí tuệ nhân tạo) và Learning Analytics (phân tích dữ liệu học tập) mở ra hướng tiếp cận mới cho personalized testing. Các hệ thống thi không chỉ điều chỉnh câu hỏi theo năng lực mà còn dự đoán hành vi, mức độ lo âu và phong cách làm bài, từ đó cung cấp phản hồi minh bạch và cá nhân hóa hơn [7].

Cơ sở lý luận

Cơ sở lý luận

Personalized testing có thể được lý giải qua nhiều lý thuyết giáo dục và tâm lý học.

Trước hết, Self-Determination Theory (SDT) (Thuyết tự quyết) của Deci & Ryan (1985) khẳng định rằng động lực nội tại của người học tăng khi họ cảm thấy có quyền kiểm soát và được công nhận [8]. Personalized testing giúp củng cố điều này khi điều chỉnh độ khó theo năng lực và đưa ra phản hồi cụ thể cho từng cá nhân.

Tiếp theo, khái niệm Cognitive Load (tải nhận thức) của Sweller (1988) chỉ ra rằng khi lượng thông tin vượt quá khả năng xử lý, hiệu suất làm việc giảm đáng kể [9]. Adaptive multistage design trong TOEFL iBT 2026 góp phần giảm tải nhận thức khi tập trung vào những câu hỏi giàu thông tin, giúp tiết kiệm thời gian và duy trì sự tập trung.

Cuối cùng, lý thuyết Test Fairness and Validity (Tính công bằng và giá trị đo lường) nhấn mạnh rằng một kỳ thi chỉ hợp lệ khi kết quả không bị ảnh hưởng bởi yếu tố ngoài năng lực ngôn ngữ, như văn hóa, giới tính hay hạ tầng công nghệ. Điều này giải thích tại sao ETS kết hợp MST với phân tích Differential Item Functioning (DIF) (chức năng khác biệt của câu hỏi) và cập nhật nội dung mang tính toàn cầu để duy trì tính công bằng.

Tác động đến thí sinh

Lợi ích Bài Kiểm Tra Cá Nhân Hóa
Lợi ích của bài kiểm tra cá nhân hóa và thích ứng

Khía cạnh tâm lý

Một trong những giá trị quan trọng nhất của adaptive testing (bài thi thích ứng) và personalized testing (bài thi cá nhân hóa) nằm ở ảnh hưởng tích cực đến tâm lý thí sinh. Trong các kỳ thi tuyến tính truyền thống, thí sinh thường gặp khó khăn khi phải đối diện với một loạt câu hỏi cố định, vốn không phản ánh chính xác trình độ thực tế. Điều này có thể tạo ra cảm giác thất bại sớm hoặc, ngược lại, sự nhàm chán khi câu hỏi quá dễ, làm giảm động lực thi.

Ngược lại, personalized testing giúp giảm thiểu hiện tượng này. Dựa trên Self-Determination Theory (SDT) (Thuyết tự quyết), động lực nội tại tăng lên khi cá nhân cảm thấy có sự kiểm soát và được đánh giá một cách công bằng. Khi hệ thống lựa chọn câu hỏi vừa sức, thí sinh ít khi rơi vào tình huống quá tải tâm lý (test anxiety) hoặc lo sợ mất điểm oan uổng. Ví dụ, một thí sinh có trình độ trung cấp khi bước vào phần Reading (Đọc hiểu) sẽ không bị choáng ngợp bởi các văn bản nghiên cứu chuyên ngành quá khó. Thay vào đó, họ sẽ bắt đầu với những đoạn văn có độ khó vừa phải, rồi dần tiến đến mức cao hơn. Quá trình phân nhánh này giúp thí sinh duy trì niềm tin vào năng lực bản thân và cảm nhận rằng bài thi “hiểu” được khả năng của mình.

Nghiên cứu của Kizilcec (2016) chỉ ra rằng mức độ minh bạch trong thuật toán làm tăng niềm tin và giảm căng thẳng của người dùng [7]. Đây là bằng chứng cho thấy nếu hệ thống adaptive được thiết kế rõ ràng, với tín hiệu giải thích hợp lý, nó không chỉ là công cụ đo lường mà còn là môi trường hỗ trợ tâm lý. ETS, qua việc triển khai TOEFL iBT 2026 với adaptive multistage design (thi thích ứng đa giai đoạn), kỳ vọng rằng sự minh bạch này sẽ giúp thí sinh toàn cầu cảm thấy an tâm hơn trong quá trình thi.

Kết quả thi

Kết quả thi

Về mặt kết quả, personalized testing góp phần giải quyết nhiều vấn đề tồn tại trong các kỳ thi cố định. Một hạn chế thường gặp là ceiling effect (hiệu ứng trần điểm), khi thí sinh giỏi không thể hiện hết năng lực do bộ câu hỏi không đủ khó, hoặc floor effect (hiệu ứng sàn điểm), khi thí sinh yếu bị đè nặng bởi câu hỏi vượt quá khả năng. Cả hai hiện tượng này đều dẫn đến sự sai lệch trong phân loại năng lực.

Item Response Theory (IRT) (Lý thuyết ứng đáp câu hỏi) cung cấp cơ sở để giải quyết hạn chế trên. Bằng cách chọn các câu hỏi có discrimination power (khả năng phân biệt) cao nhất tại từng mức năng lực, adaptive testing có thể đo lường chính xác hơn so với bài thi tuyến tính [3]. Wainer (2000) cũng chứng minh rằng adaptive testing có khả năng giảm đáng kể sai số đo lường (measurement error) bằng cách tập trung vào những câu hỏi giàu thông tin [4]. Điều này đồng nghĩa với việc điểm số cuối cùng phản ánh sát thực hơn năng lực ngôn ngữ của từng cá nhân.

Ngoài ra, adaptive testing còn giúp tiết kiệm thời gian thi mà không làm giảm chất lượng đo lường. Baker (2001) cho thấy một bài thi adaptive chỉ cần 50–70% số câu hỏi so với bài thi cố định nhưng vẫn đạt độ tin cậy tương đương, thậm chí cao hơn [5]. Việc rút ngắn độ dài bài thi mang lại hai lợi ích: thí sinh duy trì được sự tập trung, và áp lực thể chất cũng giảm (giảm mệt mỏi, tăng tốc độ phản ứng). Kết quả cuối cùng là một trải nghiệm thi chính xác hơn, công bằng hơn và ít chịu tác động của yếu tố ngoài năng lực, chẳng hạn như sự kiệt sức khi thi kéo dài.

Đọc thêm: Adaptive test có công bằng với mọi thí sinh không?

Ảnh hưởng lâu dài

Tác động của personalized testing không dừng lại ở khoảnh khắc làm bài, mà còn lan tỏa tới quá trình học tập và con đường học thuật lâu dài.

Trước hết, kết quả thi cá nhân hóa thường đi kèm với feedback (phản hồi) chi tiết. Không chỉ đơn thuần là một con số, báo cáo kết quả cung cấp phân tích về điểm mạnh, điểm yếu và gợi ý hướng cải thiện. Nhờ vậy, thí sinh có thể thiết kế kế hoạch học tập riêng, tập trung vào kỹ năng còn hạn chế. Đây là sự khác biệt lớn so với bài thi tuyến tính, nơi thí sinh chỉ nhận được điểm tổng quát mà ít thông tin để tự điều chỉnh [7].

Thứ hai, việc TOEFL iBT 2026 áp dụng adaptive multistage design kết hợp thang điểm CEFR tạo ra lợi ích kép. Các trường đại học quốc tế có thể sử dụng kết quả thi để phân loại ứng viên rõ ràng hơn, trong khi thí sinh có được định vị năng lực trong khung chuẩn toàn cầu [6]. Ví dụ, một ứng viên đạt mức C1 trên thang CEFR sẽ dễ dàng so sánh với các kỳ thi khác như IELTS hoặc Cambridge, giúp tăng tính minh bạch trong tuyển sinh.

Cuối cùng, personalized testing góp phần củng cố niềm tin của thí sinh vào hệ thống đánh giá. Như Weir (2005) nhấn mạnh, test fairness and validity (tính công bằng và giá trị đo lường) là nền tảng để duy trì uy tín của các kỳ thi ngôn ngữ quốc tế [10]. Khi thí sinh nhận thấy điểm số phản ánh đúng năng lực, không bị ảnh hưởng bởi yếu tố văn hóa hay công nghệ, họ sẽ tự tin hơn khi sử dụng chứng chỉ TOEFL iBT cho mục đích học tập hoặc nghề nghiệp. Về lâu dài, điều này giúp TOEFL iBT duy trì vị thế tiên phong trong bối cảnh cạnh tranh ngày càng mạnh mẽ từ các kỳ thi khác như IELTS.

Sự thay đổi trong TOEFL iBT 2026

ETS đã công bố một loạt cải tiến quan trọng cho TOEFL iBT, có hiệu lực từ tháng 1/2026, nhằm hiện đại hóa định dạng thi, cải tiến nội dung học thuật, và nâng cao tính công bằng trong đánh giá ngôn ngữ. Những thay đổi này đánh dấu một bước ngoặt trong việc áp dụng personalized testing (kiểm tra cá nhân hóa) vào kỳ thi chuẩn hóa quốc tế.

ETS cập nhật thi IELTS với nội dung toàn cầu
ETS cập nhật thi IELTS thích ứng nhiều giai đoạn.

Những thay đổi chính thức từ ETS

Thi thích ứng đa giai đoạn cho Reading và Listening

Từ tháng 1/2026, hai kỹ năng Reading và Listening sẽ áp dụng multistage adaptive design (thi thích ứng đa giai đoạn). Mô hình này phân chia bài thi thành nhiều giai đoạn (modules), sau mỗi giai đoạn hệ thống sẽ lựa chọn module tiếp theo dựa trên hiệu suất làm bài của thí sinh [11]. Điều này giúp giảm sai số đo lường (measurement error), đồng thời đảm bảo thí sinh không phải làm các câu hỏi quá dễ hoặc quá khó so với năng lực thực tế.

Nội dung học thuật toàn cầu và giảm thiên lệch văn hóa

Một điểm đổi mới quan trọng khác là ETS cập nhật nội dung theo hướng “modern and globally relevant” (hiện đại và mang tính toàn cầu). Các chủ đề “niche” như Greek mythology (thần thoại Hy Lạp) – vốn có nguy cơ thiên lệch văn hóa – được thay thế bằng văn bản học thuật gần gũi hơn, ví dụ về biến đổi khí hậu, công nghệ giáo dục hay hợp tác quốc tế trong nghiên cứu [12]. Sự thay đổi này phù hợp với nguyên tắc test fairness (tính công bằng) trong ngôn ngữ học ứng dụng.

Thang điểm mới liên kết CEFR

Bắt đầu từ năm 2026, TOEFL iBT sẽ báo điểm song song theo hai hệ thống:

  • Thang điểm truyền thống 0–120.

  • Thang điểm 1–6 mới, liên kết trực tiếp với Common European Framework of Reference for Languages (CEFR) [13].

Điều này giúp thí sinh và các trường đại học dễ dàng đối chiếu năng lực với các kỳ thi khác như IELTS hoặc Cambridge English. Weir (2005) nhấn mạnh rằng tính minh bạch trong báo điểm là điều kiện then chốt để duy trì giá trị đo lường (test validity) [10].

Nâng cao trải nghiệm thi và hỗ trợ thí sinh

  • Với TOEFL Home Edition, ETS đã tích hợp công nghệ xác minh danh tính bằng AI và cải tiến quy trình giám sát để giảm áp lực thủ tục.

  • Tại các trung tâm thi, ETS hợp tác với hãng Koss để cung cấp thiết bị âm thanh chuẩn hóa, đảm bảo mọi thí sinh có trải nghiệm nghe giống nhau.

  • Từ tháng 7/2025, ETS cung cấp thêm tài liệu luyện thi chính thống miễn phí để thí sinh làm quen với định dạng mới.

  • Thời gian báo điểm cũng được rút ngắn: thí sinh sẽ nhận kết quả trong vòng 72 giờ hoặc ít hơn, thay vì chờ lâu hơn như trước [14].

So sánh trước và sau thay đổi

Tiêu chí

Trước 2026

Sau 2026

Định dạng Reading & Listening

Tuyến tính, cùng bộ câu hỏi cho mọi thí sinh.

Multistage adaptive – phân nhánh theo hiệu suất.

Nội dung học thuật

Một số chủ đề văn hóa đặc thù phương Tây.

Chủ đề hiện đại, toàn cầu, giảm thiên lệch.

Thang điểm

Chỉ có thang 0–120.

Song song 0–120 và 1–6 liên kết CEFR.

Trải nghiệm thi

Quy trình hành chính phức tạp, thiết bị chưa đồng bộ.

AI xác minh danh tính, tai nghe chuẩn hóa, quy trình đơn giản hơn.

Báo điểm

Có thể kéo dài hơn một tuần.

Trong 72 giờ hoặc ít hơn.

Ý nghĩa

Những thay đổi này phản ánh sự dịch chuyển của TOEFL iBT từ một kỳ thi tuyến tính truyền thống sang một công cụ đánh giá mang tính cá nhân hóa. Multistage adaptive design góp phần tăng tính chính xác, thang điểm CEFR tăng tính minh bạch, còn cải tiến nội dung làm giảm cultural bias (thiên lệch văn hóa). Ngoài ra, việc rút ngắn thời gian báo điểm và cung cấp tài nguyên luyện thi miễn phí giúp mở rộng khả năng tiếp cận, đặc biệt cho thí sinh đến từ các khu vực có ít điều kiện chuẩn bị.

Tuy nhiên, vẫn còn những thách thức như chi phí triển khai công nghệ, yêu cầu ngân hàng câu hỏi lớn và việc đào tạo lại cho các tổ chức tuyển sinh để hiểu rõ hệ thống báo điểm mới. Điều này cho thấy công bằng chỉ được đảm bảo nếu ETS duy trì quy trình kiểm định chặt chẽ và minh bạch dữ liệu.

Ứng dụng của cá nhân hóa trong TOEFL iBT 2026

Việc ETS triển khai personalized testing (kiểm tra cá nhân hóa) trong TOEFL iBT 2026 được cụ thể hóa qua sự kết hợp giữa nền tảng lý thuyết vững chắc, công nghệ hiện đại và định hướng giáo dục toàn cầu. Ứng dụng này có thể được chia thành ba khía cạnh: công nghệ, thiết kế trải nghiệm và ứng dụng trong giáo dục đại học quốc tế.

Công nghệ cá nhân hóa và TOEFL iBT
Công nghệ cá nhân hóa thi TOEFL iBT

Ứng dụng công nghệ

Lựa chọn câu hỏi dựa trên trí tuệ nhân tạo

Việc áp dụng Item Response Theory (IRT) (Lý thuyết ứng đáp câu hỏi) cho phép hệ thống chọn ra các câu hỏi có giá trị thông tin cao nhất để đánh giá năng lực tại mỗi thời điểm. Các nghiên cứu của Gershon (2005) và Wainer (2000) cho thấy rằng khi kết hợp IRT với computerized adaptive testing, số lượng câu hỏi có thể giảm 30–50% mà vẫn đảm bảo độ tin cậy [1]. Trong TOEFL iBT 2026, công nghệ này được nâng cấp nhờ hệ thống adaptive multistage design (MST), vốn giúp phân bổ câu hỏi thành các cụm (modules) thay vì từng item riêng lẻ, đảm bảo cả tính thích ứng và độ bao phủ nội dung [6].

Phân tích dữ liệu học tập

Một cải tiến quan trọng của personalized testing là khả năng phân tích dữ liệu thí sinh để đưa ra phản hồi cá nhân hóa. Kizilcec (2016) chứng minh rằng minh bạch trong thuật toán tăng niềm tin của người dùng, giảm lo âu và nâng cao động lực [7]. TOEFL iBT 2026 áp dụng nguyên lý này qua việc báo điểm kèm phản hồi chi tiết, từ đó biến dữ liệu làm bài thành công cụ hỗ trợ học tập liên tục thay vì chỉ dừng ở đánh giá kết quả cuối cùng.

Kiểm soát công bằng và giá trị đo lường

Shohamy (2001) nhấn mạnh rằng mọi kỳ thi quốc tế đều phải đối mặt với nguy cơ thiên lệch văn hóa. Personalized testing giúp giảm rủi ro này thông qua cơ chế adaptive, nhưng quan trọng hơn là việc ETS rà soát nội dung và áp dụng các nguyên tắc test fairness. Đặc biệt, ngân hàng câu hỏi được thử nghiệm trước (pretesting) để loại bỏ mục không phù hợp về mặt văn hóa hay ngôn ngữ [4].

Thiết kế trải nghiệm thi

Các phần thi thích ứng theo năng lực

Thay vì để thí sinh làm một bộ đề cố định, adaptive multistage design phân nhánh thí sinh sang các module phù hợp. Yan, von Davier và Lewis (2014) chỉ ra rằng MST vừa duy trì tính chính xác của adaptive testing vừa khắc phục sự thiếu cân bằng nội dung. Điều này phù hợp với nguyên lý cognitive load theory (Lý thuyết tải nhận thức) của Sweller (1988): khi bài thi vừa sức, thí sinh có thể tập trung vào xử lý ngôn ngữ thay vì bị quá tải [9].

Phản hồi cá nhân hóa

Điểm TOEFL iBT 2026 không chỉ dừng ở thang 0–120 mà còn có thang 1–6 liên kết với CEFR. Sự thay đổi này không chỉ đơn giản hóa cách diễn giải điểm số mà còn cung cấp phản hồi định hướng, giúp thí sinh nhận biết vị trí năng lực trong khung chuẩn quốc tế. Theo Deci & Ryan (1985), việc cung cấp thông tin phản hồi cụ thể giúp tăng động lực nội tại và khả năng tự điều chỉnh lộ trình học tập [8].

Minh bạch và niềm tin

Norman (2013) và Kizilcec (2016) đều nhấn mạnh rằng minh bạch trong thiết kế giao diện và thuật toán giúp người dùng giảm lo âu, tăng sự tin tưởng [2]. TOEFL iBT 2026 được thiết kế để thí sinh hiểu rõ cơ chế adaptive: gặp câu hỏi khó hơn không có nghĩa là làm sai, mà là phản ánh năng lực cao hơn. Đây là điểm mấu chốt để personalized testing không trở thành nguồn gây stress, mà là công cụ nâng đỡ tâm lý.

Ứng dụng trong giáo dục toàn cầu

Dữ liệu phục vụ nghiên cứu ngôn ngữ học

Personalized testing tạo ra một lượng lớn dữ liệu chi tiết về hành vi làm bài. Lord (1980) nhấn mạnh rằng IRT không chỉ phục vụ việc chấm điểm, mà còn cung cấp nền tảng cho nghiên cứu khoa học giáo dục [3]. Những dữ liệu này có thể được dùng để phân tích xu hướng học ngôn ngữ, so sánh chiến lược làm bài giữa các nhóm thí sinh, và cải tiến ngân hàng câu hỏi.

Công cụ hỗ trợ nhà trường

Weir (2005) cho rằng một kỳ thi ngôn ngữ chỉ có giá trị nếu kết quả có thể được diễn giải dễ dàng và áp dụng vào bối cảnh thực tiễn. Việc TOEFL iBT bổ sung thang điểm CEFR từ năm 2026 [12] giúp các trường đại học quốc tế dễ dàng đối chiếu TOEFL iBT với các chứng chỉ khác như IELTS hoặc Cambridge English. Nhờ đó, hội đồng tuyển sinh có cơ sở khách quan để phân loại ứng viên từ nhiều nền giáo dục khác nhau.

Bình đẳng và khả năng tiếp cận

Theo ETS (2025), từ tháng 7/2025, thí sinh toàn cầu sẽ được cung cấp tài liệu luyện thi miễn phí và nhận kết quả trong vòng 72 giờ [14]. Đây là bước tiến lớn nhằm thu hẹp khoảng cách công nghệ và tài nguyên giữa các khu vực phát triển và đang phát triển. Personalized testing, trong bối cảnh này, không chỉ là công cụ đánh giá mà còn góp phần vào mục tiêu công bằng xã hội trong giáo dục.

Đọc thêm: Quản lý thời gian trong bài thi thích ứng – Chiến lược linh hoạt trước sự bất định

Lợi ích và thách thức

Việc áp dụng personalized testing (kiểm tra cá nhân hóa) trong TOEFL iBT 2026 mang lại nhiều lợi ích rõ rệt cho thí sinh, tổ chức giáo dục và ETS. Tuy nhiên, song song với đó là những thách thức đáng kể về công nghệ, minh bạch và khả năng tiếp cận.

Ưu điểm và nhược điểm của kiểm tra cá nhân hóa
Ưu và nhược điểm của kiểm tra cá nhân hóa

Lợi ích

Cải thiện độ chính xác đo lường

Cốt lõi của personalized testing nằm ở Item Response Theory (IRT) (Lý thuyết ứng đáp câu hỏi). Lord (1980) đã chứng minh rằng IRT giúp mô hình hóa xác suất trả lời đúng dựa trên năng lực tiềm ẩn và đặc điểm từng câu hỏi, từ đó cung cấp một phép đo tinh vi hơn so với Classical Test Theory (CTT) [3]. Baker (2001) bổ sung rằng việc sử dụng các tham số như độ khó (difficulty), khả năng phân biệt (discrimination), và xác suất đoán mò (guessing parameter) giúp bài thi phân loại chính xác hơn ở cả hai đầu thang đo – nơi CTT thường kém hiệu quả [5]. Với TOEFL iBT 2026, việc áp dụng multistage adaptive design (MST) theo nghiên cứu của Yan, von Davier & Lewis (2014) giúp kết hợp tính thích ứng với độ bao phủ nội dung, nhờ đó duy trì được tính chuẩn hóa trong khi vẫn đảm bảo đo lường chính xác [6].

Giảm lo âu và tăng động lực

Theo Self-Determination Theory (SDT) của Deci & Ryan (1985), động lực nội tại tăng khi người học cảm thấy có quyền kiểm soát trải nghiệm [8]. Adaptive testing, nhờ cơ chế điều chỉnh độ khó, mang lại cho thí sinh cảm giác “bài thi vừa sức”, từ đó giảm thiểu lo âu (test anxiety). Kizilcec (2016) nhấn mạnh rằng sự minh bạch trong thuật toán adaptive giúp thí sinh hiểu rằng việc gặp câu hỏi khó hơn phản ánh năng lực, không phải thất bại [7]. Ví dụ, trong phần Reading, một thí sinh trung cấp bắt đầu với văn bản ở mức độ vừa phải và dần được điều hướng lên văn bản phức tạp hơn, qua đó duy trì sự tự tin và động lực thi.

Hiệu quả trong tổ chức thi

Wainer (2000) và Gershon (2005) chỉ ra rằng adaptive testing có thể đạt độ tin cậy tương đương hoặc cao hơn so với thi tuyến tính, trong khi số lượng câu hỏi cần thiết chỉ bằng 50–70% [1]. Điều này đồng nghĩa với việc thời gian thi được rút ngắn, giúp thí sinh duy trì sự tập trung và giảm mệt mỏi. Với ETS, hiệu quả này cũng giảm tải cho hạ tầng thi trực tuyến, đặc biệt khi phục vụ hàng triệu thí sinh toàn cầu.

Công bằng và tính toàn cầu

Shohamy (2001) nhấn mạnh rằng mọi kỳ thi ngôn ngữ đều tiềm ẩn nguy cơ thiên lệch văn hóa [11]. Với TOEFL iBT 2026, ETS đã cam kết thay thế các chủ đề mang tính đặc thù văn hóa, như Greek mythology, bằng các chủ đề toàn cầu, liên quan đến khoa học, công nghệ và các vấn đề đương đại [13]. Điều này phù hợp với khung Language Testing and Validation của Weir (2005), vốn coi test fairness (tính công bằng) là trụ cột để đảm bảo giá trị đo lường [10]. Personalized testing nhờ đó vừa đo chính xác năng lực ngôn ngữ, vừa hạn chế bất lợi cho thí sinh từ nền văn hóa ngoài phương Tây.

Phản hồi tốt hơn và tác động tới học tập

Khác với mô hình báo điểm truyền thống, TOEFL iBT 2026 cung cấp cả thang điểm 0–120 và 1–6 liên kết với CEFR, đồng thời bổ sung phản hồi chi tiết về từng kỹ năng. Norman (2013) cho rằng một hệ thống thiết kế tốt không chỉ đo lường mà còn hướng dẫn hành động tiếp theo [2]. Thí sinh, nhờ vậy, không chỉ nhận được con số tổng kết, mà còn hiểu rõ điểm mạnh, điểm yếu, và cách cải thiện trong lộ trình học tập. Đây là yếu tố gắn kết personalized testing với personalized learning, khi dữ liệu đánh giá trở thành công cụ hỗ trợ học tập dài hạn.

Thách thức

Thách thức
Thách thức

Độ phức tạp công nghệ và duy trì ngân hàng câu hỏi

Để triển khai MST, ETS cần một ngân hàng câu hỏi khổng lồ, được chuẩn hóa theo IRT và liên tục cập nhật. Việc phát triển, thử nghiệm và kiểm định câu hỏi đòi hỏi chi phí cao và nguồn nhân lực chuyên môn. Wainer (2000) cảnh báo rằng nếu không kiểm soát tốt, sẽ xảy ra item overexposure (câu hỏi lặp lại quá nhiều), làm giảm cả tính công bằng và bảo mật [4].

Minh bạch và khả năng diễn giải

Kizilcec (2016) chứng minh rằng sự minh bạch là yếu tố then chốt để xây dựng niềm tin [7]. Tuy nhiên, cơ chế adaptive vốn phức tạp khiến nhiều thí sinh khó hiểu tại sao họ gặp các câu hỏi khác nhau. ETS đã công bố thang điểm 1–6 song song với thang 0–120 để tăng tính minh bạch [12], nhưng trong giai đoạn chuyển tiếp, nguy cơ nhầm lẫn trong diễn giải điểm số giữa thí sinh và các tổ chức tuyển sinh vẫn còn cao.

Bình đẳng và khả năng tiếp cận

Theo Weir (2005), fairness trong thi cử phải bao gồm cả yếu tố xã hội và công nghệ [10]. Tuy nhiên, thí sinh ở các khu vực có hạ tầng yếu có thể gặp bất lợi khi thi Home Edition do mạng kém hoặc thiết bị không đạt chuẩn. Điều này tạo ra “digital divide” (khoảng cách số), khiến personalized testing chưa thực sự công bằng trên phạm vi toàn cầu.

Thiên lệch văn hóa và giá trị nội dung

Shohamy (2001) chỉ ra rằng nội dung thi có thể vô tình tạo lợi thế cho một nhóm thí sinh nhất định [11]. Dù ETS đã cam kết cập nhật chủ đề học thuật mang tính toàn cầu [12], việc duy trì sự đa dạng văn hóa trong ngân hàng câu hỏi là thách thức liên tục. Nếu quy trình rà soát không được thực hiện thường xuyên và toàn diện, nguy cơ thiên lệch văn hóa vẫn có thể tái diễn.

Sự thích ứng của các tổ chức giáo dục

Việc áp dụng thang điểm 1–6 liên kết CEFR đòi hỏi các trường đại học và cơ quan tuyển sinh phải điều chỉnh hệ thống tiếp nhận hồ sơ [12]. Nếu thiếu truyền thông rõ ràng từ ETS, thí sinh có thể bị đánh giá sai. Ví dụ, một ứng viên đạt Level 4/6 có thể bị nhầm lẫn với mức điểm trung bình, trong khi trên thực tế tương đương với B2 CEFR – đủ điều kiện cho nhiều chương trình học thuật.

Đọc thêm: Cơ chế của bài thi thích ứng TOEFL iBT: Tâm lý kiểm soát đề và chiến lược làm bài dựa trên giá trị cấu trúc

Tổng kết

Personalized testing (cá nhân hóa trải nghiệm thi) không chỉ là một xu hướng trong giáo dục mà còn là bước tiến tất yếu trong kiểm tra ngoại ngữ quốc tế. Với TOEFL iBT 2026, việc áp dụng adaptive multistage design (thi thích ứng đa giai đoạn), thang điểm CEFR, và feedback (phản hồi) cá nhân hóa đã cho thấy nỗ lực của ETS trong việc tạo ra một kỳ thi công bằng, minh bạch và gắn kết với chuẩn toàn cầu. Tuy nhiên, để công bằng thực sự được đảm bảo, cần tiếp tục giải quyết các thách thức liên quan đến minh bạch dữ liệu, kiểm định khách quan và khả năng tiếp cận công nghệ. Trong tương lai, sự kết hợp giữa cá nhân hóa trải nghiệm thi và học sẽ không chỉ nâng cao độ tin cậy của TOEFL iBT mà còn mở ra mô hình đánh giá ngôn ngữ mang tính nhân văn và hiệu quả hơn cho toàn cầu.

Nếu người học đang tìm kiếm một lộ trình học tập hiệu quả để nâng cao kỹ năng ngôn ngữ và đạt kết quả cao trong kỳ thi TOEFL iBT, chương trình luyện thi tại ZIM Academy mang đến giải pháp phù hợp. Với đội ngũ giảng viên chuyên môn cao, tài liệu giảng dạy cập nhật và phương pháp học tập cá nhân hóa, người học có thể tối ưu hóa quá trình rèn luyện. Liên hệ hotline 1900-2833 nhánh số 1 hoặc chat trực tiếp trên website để được tư vấn chi tiết.


ETS, and TOEFL are registered trademarks of ETS, used in Vietnam under license. The Eight-Point logo is a trademark of ETS, used in Vietnam under license.

Tham vấn chuyên môn
Nguyễn Tiến ThànhNguyễn Tiến Thành
GV
Điểm thi IELTS gần nhất: 8.5 - 3 năm kinh nghiệm giảng dạy tiếng Anh - Đã tham gia thi IELTS 4 lần (với số điểm lần lượt 7.0, 8.0, 8.0, 8.5) - Hiện tại đang là Educator và Testing and Assessment Manager tại ZIM Academy - Phấn đấu trở thành một nhà giáo dục có tầm nhìn, có phương pháp cụ thể cho từng đối tượng học viên, giúp học viên đạt được mục tiêu của mình đề ra trong thời gian ngắn nhất. Ưu tiên mục tiêu phát triển tổng thể con người, nâng cao trình độ lẫn nhận thức, tư duy của người học. Việc học cần gắn liền với các tiêu chuẩn, nghiên cứu để tạo được hiệu quả tốt nhất.

Nguồn tham khảo

Đánh giá

5.0 / 5 (1 đánh giá)

Gửi đánh giá

0

Bình luận - Hỏi đáp

Bạn cần để có thể bình luận và đánh giá.
Đang tải bình luận...