LingVo.club
📖+40 XP
🎧+25 XP
+45 XP
Não dự đoán từ theo nhóm ngữ pháp — Trình độ B2 — a close up of a piece of luggage with text on it

Não dự đoán từ theo nhóm ngữ phápCEFR B2

21 thg 4, 2026

Trình độ B2 – Trung cao
5 phút
299 từ

Nghiên cứu mới trên Nature Neuroscience so sánh cách não người dự đoán từ với cách hoạt động của các mô hình ngôn ngữ lớn. Các tác giả báo cáo rằng, thay vì dự đoán theo từng từ tiếp theo, não sử dụng các đơn vị ngôn ngữ lớn hơn — các khối được tổ chức theo ngữ pháp — khi hình thành kỳ vọng về từ sắp tới. David Poeppel, đồng tác giả, giải thích não nhóm các từ thành cụm ngữ pháp để dự đoán.

Nhóm nghiên cứu thực hiện một loạt thí nghiệm với người nói tiếng Quan Thoại và ghi hoạt động não bằng magnetoencephalography (MEG). Họ còn áp dụng bài kiểm tra Cloze, trong đó các từ trong đoạn văn được bỏ để người tham gia điền vào. Để kiểm chứng tính phổ quát giữa ngôn ngữ, đội cũng phân tích dữ liệu bổ sung từ bệnh nhân tiếp xúc tiếng Anh.

Để đánh giá khả năng dự đoán của mô hình, các nhà nghiên cứu dùng mô hình ngôn ngữ lớn và tính hai đại lượng: entropi, cho biết ngữ cảnh cho phép bao nhiêu lựa chọn tiếp theo, và độ bất ngờ (surprisal), cho biết một từ cụ thể có bất ngờ hay không trong ngữ cảnh. Nếu não vận hành giống mô hình, thì dữ liệu não và dự đoán mô hình sẽ có tương quan cao. Thay vào đó, phản ứng não thay đổi tùy theo vị trí của từ trong cấu trúc cú pháp, cho thấy độ nhạy với thành phần ngữ pháp mà các mô hình dự đoán từ tiếp theo không phản ánh đầy đủ. Kết quả đặt ra câu hỏi mới về mối quan hệ giữa quá trình ngôn ngữ trong não và các mô hình tính toán.

Từ khó

  • mô hình ngôn ngữ lớnchương trình máy tính dự đoán từ tiếp theo
  • entropiđộ không chắc chắn của lựa chọn tiếp theo
  • độ bất ngờmức độ một từ khó đoán trong ngữ cảnh
  • magnetoencephalographykỹ thuật ghi hoạt động điện từ của não
  • cú phápquy tắc tổ chức các thành phần câu

Mẹo: di chuột, dùng phím Tab hoặc chạm vào các từ được tô sáng trong bài để xem định nghĩa nhanh ngay khi bạn đọc hoặc nghe.

Câu hỏi thảo luận

  • Kết quả cho thấy não nhạy với thành phần ngữ pháp. Theo bạn, điều này có thể ảnh hưởng thế nào tới cách phát triển mô hình ngôn ngữ trong tương lai?
  • Nhóm nghiên cứu dùng người nói tiếng Quan Thoại và dữ liệu từ người tiếp xúc tiếng Anh để kiểm chứng tính phổ quát. Bạn nghĩ cần thêm dữ liệu từ những ngôn ngữ nào nữa, và tại sao?
  • Phương pháp như MEG và bài kiểm tra Cloze được kết hợp trong nghiên cứu. Theo bạn, ưu điểm và hạn chế chính của hai phương pháp này khi nghiên cứu dự đoán ngôn ngữ là gì?

Bài viết liên quan