Nghiên cứu so sánh khả năng của các mô hình sinh văn bản lớn trong việc suy luận tính cách từ ngôn ngữ thông thường. Các hệ thống được thử nghiệm gồm ChatGPT, Claude và LLaMa. Nghiên cứu cho AI đọc các nhật ký video ngắn hàng ngày và các bản ghi dài hơn về những điều người tham gia nghĩ tới, rồi trả lời các câu hỏi về tính cách như chính họ làm.
Dữ liệu thu thập từ hơn 160 người, lấy trong cả môi trường đời thực và phòng thí nghiệm. Kết quả cho thấy điểm tính cách do AI đưa ra khớp chặt với các đánh giá tự cho mình và thường tương ứng ở mức cao hơn so với đánh giá của bạn bè hoặc gia đình. Ngoài ra, các đánh giá của AI dự đoán được các khía cạnh đời sống thực như cảm xúc, mức độ căng thẳng, hành vi xã hội, và việc một người có từng được chẩn đoán rối loạn sức khỏe tâm thần hay tìm tới điều trị.
Tác giả chính Aidan Wright, giáo sư tâm lý học và tâm thần học tại Đại học Michigan, nói rằng họ "rất ngạc nhiên trước mức độ mạnh mẽ của các mối liên hệ này". Nhiều chuyên gia khác cũng bình luận về ý nghĩa của ngôn ngữ như dấu hiệu tâm lý và về giới hạn hiện nay của nghiên cứu.
- Nghiên cứu dựa vào tự đánh giá và chưa so sánh trực tiếp với bạn bè hoặc gia đình.
- Chưa rõ kết quả khác nhau ra sao theo tuổi, giới tính hay chủng tộc.
- Chưa biết AI và con người có dựa vào cùng tín hiệu hay không.
- Chưa rõ AI có thể vượt trội hơn tự báo cáo khi dự đoán các kết quả lớn của đời người hay không.
Kết quả được công bố trên tạp chí Nature Human Behavior. Nguồn: University of Michigan.
Từ khó
- suy luận — rút ra kết luận từ thông tin hoặc bằng chứng
- tính cách — tập hợp đặc điểm cảm xúc và hành vi
- tự đánh giá — người tự cho điểm hoặc nhận xét bản thân
- dự đoán — nói trước kết quả dựa trên dữ liệu
- chẩn đoán — xác định bệnh hoặc rối loạn y tế
- giới hạn — ranh giới hoặc điểm yếu của nghiên cứu
Mẹo: di chuột, dùng phím Tab hoặc chạm vào các từ được tô sáng trong bài để xem định nghĩa nhanh ngay khi bạn đọc hoặc nghe.
Câu hỏi thảo luận
- Bạn nghĩ việc AI suy luận tính cách từ ngôn ngữ sẽ có lợi hay có hại? Hãy nêu lý do và ví dụ.
- Các nhà nghiên cứu nên làm gì để kiểm tra kết quả theo độ tuổi, giới tính và chủng tộc?
- Nếu AI dự đoán khả năng một người từng được chẩn đoán rối loạn tâm thần, theo bạn kết quả đó nên được sử dụng thế nào trong chăm sóc sức khỏe?