ChatGPT và vấn đề trích dẫn sai lệch: Cảnh báo cho các nhà xuất bản

Đăng bởi: Linh Nguyễn • Ngày: 30/11/2024

ChatGPT – Công nghệ AI hàng đầu của OpenAIđang gây ra lo ngại lớn cho các nhà xuất bản vì vấn đề trích dẫn không chính xác. Một nghiên cứu từ Trung tâm Báo chí Kỹ thuật số Tow thuộc Đại học Báo chí Columbia đã chỉ ra rằng cách thức mà ChatGPT sản sinh các trích dẫn có thể trở thành mối đe dọa cho tính toàn vẹn của thông tin.

Khi các nhà xuất bản ngày càng ký nhiều thỏa thuận cấp phép nội dung với OpenAI, những phát hiện từ nghiên cứu này thực sự khiến họ không thể yên tâm. Các nhà nghiên cứu đã yêu cầu ChatGPT chỉ ra nguồn gốc của các câu trích dẫn từ một số nhà xuất bản khác nhau, bao gồm cả những đơn vị đã và chưa ký hợp đồng với OpenAI. Nhưng kết quả lại cho thấy, độ chính xác của ChatGPT trong việc xác định nguồn gốc hầu như không mấy hứa hẹn.

Nghiên cứu cho thấy có đến 153 trường hợp ChatGPT trả lời sai hoặc không chính xác hoàn toàn, trong khi chỉ có 7 lần chatbot này thừa nhận không thể cung cấp câu trả lời chính xác. Đáng lo ngại hơn nữa, ChatGPT còn có xu hướng chế tác thông tin hoặc trích dẫn sai lệch, thể hiện sự tự tin tuyệt đối vào các câu trả lời sai của mình. Điều này hoàn toàn khác so với các công cụ tìm kiếm truyền thống như Google hay Bing, vốn thường thông báo khi không tìm thấy kết quả phù hợp.

Trong một số trường hợp, ChatGPT đã gán sai tín dụng cho các trang web sao chép nội dung từ báo chí uy tín mà không ghi nhận nguồn. Một trường hợp điển hình là trang web sao chép nội dung báo The New York Times được ChatGPT trích dẫn thay vì trích dẫn chính nguồn gốc của nó. Điều này đặt ra câu hỏi lớn về khả năng phân loại và xác thực nguồn cấp dữ liệu của OpenAI.

Mặc dù nghiên cứu này chỉ ở quy mô nhỏ, nhưng đặc biệt quan trọng trong bối cảnh các nhà xuất bản lớn đang ký kết hợp đồng với OpenAI. Mong muốn có sự đối xử đặc biệt cho nội dung của họ từ ChatGPT, về độ chính xác của trích dẫn, có vẻ như vẫn là điều quá xa vời. Thậm chí, ngay cả những nhà xuất bản đã cho phép OpenAI truy cập vào nội dung của họ, cũng chưa chắc nhận được sự chính xác tuyệt đối.

Ngoài ra, nghiên cứu cũng chỉ ra rằng việc ChatGPT thường xuyên trả lời khác nhau cho cùng một câu hỏi là điều không có tính ổn định, nhất là trong bối cảnh trích dẫn nội dung. Chưa kể, ChatGPT còn tiếp tục trích dẫn các bài báo từ New York Times mặc dù trang này đang kiện OpenAI.

Theo nhận định từ phía các nhà nghiên cứu, các nhà xuất bản gần như không có quyền tự quyết nào về cách nội dung của họ được xử lý khi rơi vào tay ChatGPT, dù trực tiếp hay gián tiếp. Các nhà xuất bản cần chuẩn bị cho những rủi ro về uy tín và nguy cơ thương mại nếu ChatGPT tiếp tục chỉ ra nguồn với độ chính xác không đáng tin tưởng.