Các hệ thống trí tuệ nhân tạo có thể tạo thông tin sai khi tóm tắt văn bản dài hoặc lặp. Những lỗi này làm chậm công việc vì người phải sửa lại bản tóm tắt do AI tạo.
Một nhóm tại một trường đại học ở New York phát triển một bước tiền xử lý cho mô hình ngôn ngữ lớn (LLMs). Họ coi mỗi câu như một 'con chim', làm sạch câu, gom các cụm từ có ý nghĩa và chọn các câu quan trọng hơn. Sau đó các câu chọn được sắp xếp và đưa vào LLM để tạo bản tóm tắt rõ ràng hơn.
Từ khó
- trí tuệ nhân tạo — máy tính thực hiện nhiệm vụ thông minh
- tiền xử lý — xử lý dữ liệu trước khi dùng
- mô hình — cấu trúc hoặc hệ thống trong máy tính
- cụm từ — nhóm từ có ý nghĩa chung
- làm sạch — loại bỏ phần không cần thiết
- sắp xếp — đặt các mục theo thứ tự
Mẹo: di chuột, dùng phím Tab hoặc chạm vào các từ được tô sáng trong bài để xem định nghĩa nhanh ngay khi bạn đọc hoặc nghe.
Câu hỏi thảo luận
- Bạn đã từng sửa lại bản tóm tắt do AI tạo chưa? Hãy kể ngắn.
- Bạn nghĩ bước tiền xử lý có giúp bản tóm tắt rõ ràng hơn không? Tại sao?
Bài viết liên quan
Tại sao mô hình ngôn ngữ lớn khó nhân số bốn chữ số
Một nghiên cứu do University of Chicago dẫn đầu giải thích vì sao nhiều mô hình ngôn ngữ lớn không nhân đúng hai số có bốn chữ số. Nghiên cứu so sánh huấn luyện tinh chỉnh tiêu chuẩn và phương pháp Chuỗi suy luận ẩn (ICoT) và thấy ICoT giúp mô hình lưu và dùng kết quả trung gian.