Nghiên cứu của Đại học Washington kiểm tra xem hệ trí tuệ nhân tạo có thể học các giá trị văn hóa bằng cách quan sát hành vi con người, tương tự quá trình học của trẻ em, hay không. Các nhà khoa học tuyển hai nhóm người lớn và dùng dữ liệu hành vi của từng nhóm để huấn luyện hai tác nhân AI độc lập. Thí nghiệm chính dùng phiên bản sửa đổi của trò chơi Overcooked: người chơi nấu và giao súp, đồng thời có thể quan sát một nhà bếp khác nơi người chơi thứ hai phải đi xa hơn để thực hiện cùng nhiệm vụ. Người tham gia không biết người chơi thứ hai là một bot và có thể được nhờ giúp; việc cho hành để giúp bot sẽ làm giảm số súp họ giao được cho mình.
Các tác nhân được huấn luyện bằng học tăng cường nghịch đảo (inverse reinforcement learning, IRL). Khác với học tăng cường tiêu chuẩn, IRL để máy quan sát hành vi thật và suy ra mục tiêu cùng phần thưởng thúc đẩy hành vi đó. Kết quả cho thấy về tổng thể, nhóm Latino giúp nhiều hơn nhóm da trắng, và tác nhân huấn luyện bằng dữ liệu Latino cho đi nhiều củ hành hơn khi chơi. Trong bài kiểm tra thứ hai, tác nhân được đưa ra quyết định có quyên góp một phần tiền cho người cần hay không; một lần nữa, tác nhân huấn luyện bằng dữ liệu Latino hành xử vị tha hơn.
Tác giả chính Rajesh Rao cảnh báo rằng không nên mã cứng một tập giá trị phổ quát vào hệ AI vì nhiều nền văn hóa có giá trị riêng, và ông đề xuất tăng lượng cùng đa dạng dữ liệu theo văn hóa để cho phép điều chỉnh tinh tế trước khi triển khai. Đồng tác giả Andrew Meltzoff nêu ví dụ về cách cha mẹ làm gương cho con, và gọi việc tạo AI tinh tế về mặt văn hóa là một câu hỏi thiết yếu cho xã hội. Các đồng tác giả khác đến từ Đại học Washington và San Diego State University. Nguồn: University of Washington.
Từ khó
- giá trị văn hóa — niềm tin và chuẩn mực trong xã hội
- tác nhân — chương trình hoặc mô hình thực hiện hành độngtác nhân AI
- học tăng cường — phương pháp để máy học từ phần thưởng
- mã cứng — viết luật trực tiếp vào chương trình
- vị tha — ưu tiên lợi ích của người khác
- triển khai — đưa hệ thống vào sử dụng thực tế
Mẹo: di chuột, dùng phím Tab hoặc chạm vào các từ được tô sáng trong bài để xem định nghĩa nhanh ngay khi bạn đọc hoặc nghe.
Câu hỏi thảo luận
- Bạn nghĩ việc huấn luyện AI bằng dữ liệu từ nhiều nền văn hóa khác nhau sẽ ảnh hưởng thế nào tới quyết định của AI trong đời thực?
- Những rủi ro nào có thể xảy ra nếu người thiết kế mã cứng một tập giá trị phổ quát cho AI?
- Theo bạn, các nhà nghiên cứu nên thu thập dữ liệu đa dạng về văn hóa như thế nào để vừa hữu ích vừa tôn trọng người tham gia?
Bài viết liên quan
Creative Australia khôi phục đề cử cho Venice Biennale 2026
Creative Australia đã đảo ngược quyết định rút tên nghệ sĩ Khaled Sabsabi và nhà giám tuyển Michael Dagostino khỏi danh sách đề cử cho Venice Biennale 2026, sau tranh luận công khai, phiên điều trần Thượng viện và rà soát độc lập.