Các nhà nghiên cứu Federico Germani và Giovanni Spitale từ Đại học Zurich phân tích cách danh tính tác giả ảnh hưởng đến đánh giá của mô hình ngôn ngữ lớn. Họ cho bốn mô hình—OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2 và Mistral—tạo 50 câu tường thuật trên 24 chủ đề gây tranh cãi, rồi yêu cầu các mô hình đánh giá những phát biểu này theo nhiều điều kiện nguồn khác nhau. Nhóm thu về 192’000 đánh giá để so sánh mức đồng thuận.
Kết quả cho thấy khi không có thông tin về tác giả, mức đồng thuận giữa các mô hình vượt quá 90% ở mọi chủ đề. Tuy nhiên, khi tiết lộ danh tính tác giả (ví dụ một người thuộc một quốc tịch hoặc một LLM khác), sự đồng thuận giảm mạnh và đôi khi gần như biến mất, dù nội dung văn bản không đổi. Một kết quả nổi bật là thiên vị chống Trung Quốc xuất hiện ở tất cả các mô hình, kể cả Deepseek của Trung Quốc. Trong chủ đề địa chính trị như chủ quyền Đài Loan, Deepseek làm mức đồng thuận giảm tới 75% chỉ vì giả định người viết là người Trung Quốc.
Nghiên cứu cũng phát hiện xu hướng chung: các LLM có xu hướng tin tác giả con người hơn tác giả là AI khác. Các nhà nghiên cứu cảnh báo rằng những thiên vị ẩn này có thể ảnh hưởng tới kiểm duyệt nội dung, tuyển dụng, đánh giá học thuật và báo chí nếu hệ thống AI dựa vào danh tính tác giả để đánh giá. Họ khuyến nghị tăng minh bạch và cơ chế quản trị, đồng thời dùng LLM để hỗ trợ lập luận thay vì thay thế thẩm phán con người. Nghiên cứu được đăng trên Sciences Advances và nguồn từ University of Zurich.
- Vấn đề: danh tính tác giả làm thay đổi đánh giá.
- Hiện tượng: thiên vị chống Trung Quốc xuất hiện.
- Hệ quả: ảnh hưởng tới kiểm duyệt và tuyển dụng.
Từ khó
- đồng thuận — mức độ các bên cùng tán thành một ý kiến
- thiên vị — khuynh hướng đánh giá không công bằng vì thành kiến
- danh tính — thông tin nhận dạng về người hoặc nguồn viết
- kiểm duyệt — kiểm tra và loại bỏ nội dung không được phép
- minh bạch — trạng thái công khai, rõ ràng về quá trình
- cơ chế quản trị — quy tắc và quy trình kiểm soát một hệ thống
Mẹo: di chuột, dùng phím Tab hoặc chạm vào các từ được tô sáng trong bài để xem định nghĩa nhanh ngay khi bạn đọc hoặc nghe.
Câu hỏi thảo luận
- Những thiên vị do giả định về danh tính tác giả có thể ảnh hưởng thế nào tới quyết định tuyển dụng trong thực tế? Hãy nêu ví dụ.
- Theo bạn, những biện pháp nào cụ thể có thể giúp tăng minh bạch và giảm thiên vị khi dùng LLM để đánh giá nội dung?
- Điều gì có lợi và có hại khi dùng LLM để hỗ trợ lập luận thay vì để quyết định thay con người?
Bài viết liên quan
Mô hình NMR mới giúp cải thiện độ nét ảnh MRI
Các nhà nghiên cứu ở Rice University và Oak Ridge National Laboratory phát triển khung lý thuyết chế độ riêng NMR. Phương pháp dùng phương trình Fokker-Planck liên kết chuyển động phân tử với tín hiệu MRI và tái tạo phép đo thực nghiệm.
AI và ảnh công dân phát hiện muỗi Anopheles stephensi ở Madagascar
Các nhà nghiên cứu dùng AI và ảnh do người dân gửi để xác định Anopheles stephensi, được cho là phát hiện đầu tiên ở Madagascar. Ảnh chụp năm 2020 qua ứng dụng GLOBE Observer và kết quả được công bố trên tạp chí Insects.