LingVo.club
Trình độ
Mô hình ngôn ngữ lớn thay đổi đánh giá khi biết ai là tác giả — Trình độ B2 — three white disc on brown surface

Mô hình ngôn ngữ lớn thay đổi đánh giá khi biết ai là tác giảCEFR B2

25 thg 11, 2025

Trình độ B2 – Trung cao
6 phút
347 từ

Các nhà nghiên cứu Federico Germani và Giovanni Spitale từ Đại học Zurich phân tích cách danh tính tác giả ảnh hưởng đến đánh giá của mô hình ngôn ngữ lớn. Họ cho bốn mô hình—OpenAI o3-mini, Deepseek Reasoner, xAI Grok 2 và Mistral—tạo 50 câu tường thuật trên 24 chủ đề gây tranh cãi, rồi yêu cầu các mô hình đánh giá những phát biểu này theo nhiều điều kiện nguồn khác nhau. Nhóm thu về 192’000 đánh giá để so sánh mức đồng thuận.

Kết quả cho thấy khi không có thông tin về tác giả, mức đồng thuận giữa các mô hình vượt quá 90% ở mọi chủ đề. Tuy nhiên, khi tiết lộ danh tính tác giả (ví dụ một người thuộc một quốc tịch hoặc một LLM khác), sự đồng thuận giảm mạnh và đôi khi gần như biến mất, dù nội dung văn bản không đổi. Một kết quả nổi bật là thiên vị chống Trung Quốc xuất hiện ở tất cả các mô hình, kể cả Deepseek của Trung Quốc. Trong chủ đề địa chính trị như chủ quyền Đài Loan, Deepseek làm mức đồng thuận giảm tới 75% chỉ vì giả định người viết là người Trung Quốc.

Nghiên cứu cũng phát hiện xu hướng chung: các LLM có xu hướng tin tác giả con người hơn tác giả là AI khác. Các nhà nghiên cứu cảnh báo rằng những thiên vị ẩn này có thể ảnh hưởng tới kiểm duyệt nội dung, tuyển dụng, đánh giá học thuật và báo chí nếu hệ thống AI dựa vào danh tính tác giả để đánh giá. Họ khuyến nghị tăng minh bạch và cơ chế quản trị, đồng thời dùng LLM để hỗ trợ lập luận thay vì thay thế thẩm phán con người. Nghiên cứu được đăng trên Sciences Advances và nguồn từ University of Zurich.

  • Vấn đề: danh tính tác giả làm thay đổi đánh giá.
  • Hiện tượng: thiên vị chống Trung Quốc xuất hiện.
  • Hệ quả: ảnh hưởng tới kiểm duyệt và tuyển dụng.

Từ khó

  • đồng thuậnmức độ các bên cùng tán thành một ý kiến
  • thiên vịkhuynh hướng đánh giá không công bằng vì thành kiến
  • danh tínhthông tin nhận dạng về người hoặc nguồn viết
  • kiểm duyệtkiểm tra và loại bỏ nội dung không được phép
  • minh bạchtrạng thái công khai, rõ ràng về quá trình
  • cơ chế quản trịquy tắc và quy trình kiểm soát một hệ thống

Mẹo: di chuột, dùng phím Tab hoặc chạm vào các từ được tô sáng trong bài để xem định nghĩa nhanh ngay khi bạn đọc hoặc nghe.

Câu hỏi thảo luận

  • Những thiên vị do giả định về danh tính tác giả có thể ảnh hưởng thế nào tới quyết định tuyển dụng trong thực tế? Hãy nêu ví dụ.
  • Theo bạn, những biện pháp nào cụ thể có thể giúp tăng minh bạch và giảm thiên vị khi dùng LLM để đánh giá nội dung?
  • Điều gì có lợi và có hại khi dùng LLM để hỗ trợ lập luận thay vì để quyết định thay con người?

Bài viết liên quan