Một nghiên cứu do nhóm tại Virginia Tech trình bày tại hội nghị CHI cho thấy các mô hình ngôn ngữ lớn thay đổi đáng kể lời khuyên xã hội khi người dùng tiết lộ họ bị chẩn đoán tự kỷ. Nhóm nghiên cứu, do phòng thí nghiệm của trợ lý giáo sư Eugenia Rho dẫn dắt, xác định 12 tín hiệu định kiến và tạo hàng trăm tình huống quyết định để thử phản hồi của AI.
Họ thử sáu mô hình phổ biến, trong đó có GPT-4, Claude, Llama, Gemini và DeepSeek, và sinh ra 345.000 phản hồi cho hàng nghìn lời nhắc về các sự kiện, xung đột, trải nghiệm mới và mối quan hệ. Khi người dùng tiết lộ tự kỷ, các mô hình thường dịch chuyển khuyến nghị theo những giả định rằng người tự kỷ hướng nội, ám ảnh, vụng về xã hội hoặc không quan tâm đến tình yêu. Nghiên cứu đo lường thay đổi cả khi người dùng mô tả đặc tính định kiến và khi họ chỉ nói họ là người tự kỷ.
Một số kết quả tiêu biểu:
- Một mô hình đề nghị từ chối lời mời xã hội thường xuyên hơn sau khi biết người dùng tự kỷ.
- Trong kịch bản hẹn hò, một mô hình khuyên tránh lãng mạn hoặc giữ độc thân thường xuyên hơn khi biết người dùng tự kỷ.
- Mười một trong 12 tín hiệu định kiến làm thay đổi quyết định của mô hình trên ít nhất bốn trong sáu hệ thống được thử nghiệm.
Nhóm cũng phỏng vấn 11 người dùng tự kỷ và cho họ xem phản hồi có và không tiết lộ; phản ứng đa dạng, từ bàng hoàng đến cảm thấy được thấu hiểu. Rho gọi đây là “nghịch lý an toàn-cơ hội”. Wohn cảnh báo AI có thể trông đáng tin nhưng che giấu thành kiến. Nhóm hy vọng kết quả khuyến khích phát triển hệ thống minh bạch hơn và cho phép người dùng kiểm soát cách thông tin nhận dạng ảnh hưởng tới phản hồi. Nguồn: Virginia Tech.
Từ khó
- định kiến — đánh giá tiêu cực, sai về một nhóm người
- tiết lộ — nói hoặc cho biết thông tin riêng tư, quan trọng
- dịch chuyển — thay đổi vị trí hoặc hướng của điều gì đó
- tín hiệu — dấu hiệu, thông tin nhỏ báo hiệu điều gì
- minh bạch — rõ ràng, dễ hiểu và không che giấu thông tin
- nghịch lý — tình huống trái ngược với mong đợi hoặc logic thông thường
- phản hồi — câu trả lời hoặc phản ứng trước lời nhắc, hành động
Mẹo: di chuột, dùng phím Tab hoặc chạm vào các từ được tô sáng trong bài để xem định nghĩa nhanh ngay khi bạn đọc hoặc nghe.
Câu hỏi thảo luận
- Bạn nghĩ hệ thống AI nên minh bạch như thế nào về cách thông tin nhận dạng ảnh hưởng phản hồi?
- Khi 11 người tự kỷ được phỏng vấn thấy phản ứng từ bàng hoàng đến được thấu hiểu, theo bạn vì sao phản ứng lại đa dạng như vậy?
- Nhóm nghiên cứu đề nghị cho phép người dùng kiểm soát cách thông tin ảnh hưởng phản hồi. Những biện pháp cụ thể nào có thể thực hiện để cho người dùng kiểm soát đó?
Bài viết liên quan
Phân tích mạng xã hội giúp cảnh báo sớm dòng di cư trong khủng hoảng
Nghiên cứu trên EPJ Data Science cho thấy phân tích bài đăng mạng xã hội có thể cung cấp cảnh báo sớm về di cư trong xung đột và thiên tai. Nghiên cứu dùng gần 2 triệu bài đăng trên X và ba trường hợp: Ukraine, Sudan, Venezuela.