in

Meta đã tải về 81,7TB sách vi phạm bản quyền để huấn luyện AI

Mới đây, những email chưa bị biên soạn của Meta đã được công khai, cung cấp bằng chứng cho thấy công ty này đã tải về hơn 81,7 terabyte dữ liệu từ nhiều thư viện trực tuyến kín, bao gồm hàng triệu cuốn sách bị cho là vi phạm bản quyền. Hành động này không chỉ gây lo ngại về mặt pháp lý mà còn làm dấy lên câu hỏi về trách nhiệm của những gã khổng lồ công nghệ trong việc bảo vệ bản quyền tác giả.

Trong bối cảnh nhiều tác giả sách đang kiên quyết đấu tranh với Meta vì đã cho rằng công ty này đã vi phạm bản quyền khi sử dụng tài liệu vi phạm để huấn luyện các mô hình AI của mình, bằng chứng mới đây mà họ trình bày đã lột tả “chiến dịch torrenting” rộng lớn mà Meta đang thực hiện. Theo tài liệu, Meta đã tải xuống ít nhất 35,7 terabyte từ Z-Library và LibGen – nền tảng bao gồm hàng triệu cuốn sách bị cáo buộc vi phạm bản quyền.

Sự việc đã thu hút sự chú ý đặc biệt khi một thành viên của đội nghiên cứu Meta, Nikolay Bashlykov, đã bày tỏ lo ngại về việc sử dụng máy tính công ty để tải và chia sẻ nội dung có bản quyền. “Tải torrent từ một máy tính của công ty không phải là điều đúng đắn,” Bashlykov viết trong một email vào tháng 4 năm 2023, kèm theo một biểu tượng cảm xúc. Tình hình đã trở nên nghiêm trọng hơn khi Bashlykov chuyển từ những lo ngại hài hước sang nhấn mạnh với đội ngũ pháp lý của mình rằng việc sử dụng torrent có thể dẫn đến việc “seeding” (chia sẻ) các tập tin.

Cáo buộc từ các tác giả rằng Meta cố tình giấu diếm quy trình này còn cần được chứng minh thêm. Theo những thông tin gần đây, Meta thậm chí đã thay đổi cách thức tải về và thiết lập để đảm bảo rằng chỉ một lượng nhỏ dữ liệu được chia sẻ. Rõ ràng, công ty này đã cố gắng ẩn giấu hành vi của mình đối với những người giám sát pháp lý.

Để củng cố cáo buộc của mình, các tác giả khẳng định rằng không chỉ Meta đã tải xuống một lượng lớn dữ liệu, mà còn là việc họ đã “phủ nhận một cách có chủ ý” các cáo buộc này trong quá trình tố tụng. Hành động tải xuống này xảy ra trong thời gian dài, mà những email phác thảo đã xác nhận rằng một số nhân viên lãnh đạo đã biết về hành động này nhưng vẫn chọn bỏ qua. Thực tế là Mark Zuckerberg, CEO của Meta, trước đó nói rằng ông không tham gia vào quyết định sử dụng LibGen, nhưng các tin nhắn đã chứng minh rằng quyết định này đã được thực hiện sau khi các vấn đề đã được báo cáo.

Written by Linh Nguyễn

Leave a Reply

Exit mobile version