Nghiên cứu do nhóm tại Virginia Tech trình bày tại hội nghị CHI kiểm tra phản hồi của các mô hình ngôn ngữ lớn khi người dùng tiết lộ họ là người tự kỷ. Nhóm do phòng thí nghiệm của trợ lý giáo sư Eugenia Rho dẫn dắt. Họ xác định 12 định kiến được ghi nhận và tạo hàng trăm tình huống ra quyết định để thử nghiệm.
Nhóm thử sáu mô hình, bao gồm GPT-4, Claude, Llama, Gemini và DeepSeek, và sinh ra hàng trăm nghìn phản hồi. Kết quả cho thấy khi tiết lộ tự kỷ, mô hình thường chuyển lời khuyên theo các giả định như người hướng nội, hay vụng về xã hội hoặc không quan tâm đến tình cảm. Ví dụ, AI có xu hướng đề nghị từ chối lời mời xã hội hoặc tránh hẹn hò.
Nhóm cũng phỏng vấn một số người dùng tự kỷ; phản ứng đa dạng: một vài người thấy phản hồi mang tính bảo trợ, một số khác lại thấy được bảo vệ. Các tác giả kêu gọi minh bạch hơn và cho phép người dùng kiểm soát ảnh hưởng của thông tin cá nhân lên phản hồi.
Từ khó
- tiết lộ — nói cho người khác biết điều riêng tư
- định kiến — ý kiến tiêu cực không đúng về một nhóm người
- mô hình ngôn ngữ lớn — chương trình AI tạo văn bản từ dữ liệu lớn
- phản hồi — câu trả lời hoặc phản ứng của hệ thống
- bảo trợ — thái độ coi người khác yếu hơn, che chở quá mức
- minh bạch — rõ ràng, thông tin được công khai và dễ hiểu
- kiểm soát — quản lý hoặc quyết định điều gì xảy ra
- ảnh hưởng — tác động đến hành vi hoặc kết quả của ai đó
Mẹo: di chuột, dùng phím Tab hoặc chạm vào các từ được tô sáng trong bài để xem định nghĩa nhanh ngay khi bạn đọc hoặc nghe.
Câu hỏi thảo luận
- Bạn nghĩ vì sao một số người tự kỷ thấy phản hồi của AI mang tính bảo trợ?
- Bạn muốn có quyền kiểm soát thông tin cá nhân khi dùng AI theo cách nào?
- Theo bạn, các nhà phát triển có thể làm gì để mô hình minh bạch hơn với người dùng?