Các sáng kiến ở Mỹ Latinh phát triển AI mã nguồn mở nhằm nghiên cứu bạo lực và bất bình đẳng giới, đồng thời tăng tính minh bạch và bảo vệ dữ liệu nhạy cảm. Những nhóm này cho rằng nhiều hệ thống AI do công ty lớn phát triển phản ánh quan niệm thế giới khác và mang theo thiên vị về giới, chủng tộc, tuổi tác và khả năng, nên không phù hợp khi áp dụng trực tiếp tại khu vực.
Tại Argentina, Ivana Feldfeber thành lập DataGénero và nhóm bà phát triển AymurAI. Hệ thống tìm kiếm tài liệu vụ án, gửi chính xác nội dung tìm được vào cơ sở dữ liệu và được cài đặt trên máy chủ địa phương để bảo mật. AymurAI ra mắt năm 2021 và hiện gồm dữ liệu từ hơn 10,000 bản án. Dự án được tài trợ bởi International Development Research Centre (IDRC) và Patrick McGovern Foundation và dự định thêm chức năng chuyển âm thanh thành văn bản để lưu lời khai mà không buộc nạn nhân phải lặp lại sự kiện chấn thương.
Các nhóm khác như Derechos Digitales do Jamila Venturini dẫn dắt và PIT Policy Lab của Cristina Martínez Pinto làm việc trên chính sách, phát hiện thiên vị và đào tạo nhân sự. Ví dụ ở Guanajuato, nhóm của Martínez Pinto dùng AI để dự đoán nguy cơ bỏ học và phát hiện 4,000 bạn trẻ bị xác định sai là không có nguy cơ.
Các bước tiếp theo chung gồm cải thiện dữ liệu huấn luyện, thêm chức năng kỹ thuật, củng cố khung bảo vệ dữ liệu và thúc đẩy chính sách công để giảm tác hại của các thuật toán thiên vị hoặc mờ mịt.
Từ khó
- mã nguồn mở — phần mềm cho phép xem và sửa mã
- minh bạch — tình trạng thông tin rõ ràng, dễ kiểm tra
- thiên vị — sự đối xử hoặc kết luận không công bằng
- bảo mật — bảo vệ thông tin khỏi truy cập trái phép
- dữ liệu huấn luyện — tập thông tin dùng để dạy mô hình AI
- xác định — nhận ra hoặc đánh giá ai hay cái gì thuộc nhóm nào
Mẹo: di chuột, dùng phím Tab hoặc chạm vào các từ được tô sáng trong bài để xem định nghĩa nhanh ngay khi bạn đọc hoặc nghe.
Câu hỏi thảo luận
- Theo bạn, lợi ích lớn nhất khi phát triển AI mã nguồn mở để nghiên cứu bạo lực và bất bình đẳng giới là gì? Hãy nêu ít nhất một lý do từ bài.
- Việc cài đặt hệ thống AI trên máy chủ địa phương nhằm mục đích bảo mật. Bạn nghĩ việc này có thể có những thuận lợi và bất lợi nào?
- Bài viết nêu các bước tiếp theo như cải thiện dữ liệu huấn luyện và củng cố khung bảo vệ dữ liệu. Bạn cho bước nào là quan trọng nhất để giảm tác hại của thiên vị AI và vì sao?