Theo Torrent Freak, trong hai năm qua, AI đã ghi nhận sự phát triển nhanh chóng, với sự ra đời của ngày càng nhiều mô hình ngôn ngữ lớn, thường được phát triển trên một tập dữ liệu văn bản quy mô lớn, càng nhiều càng tốt. Tuy nhiên, kho dữ liệu này được tập hợp khi chưa hỏi ý kiến những người nắm giữ bản quyền tác phẩm.
Các tác giả sách đã phàn nàn, thậm chí khởi kiện về việc giới phát triển AI “ngầm” sử dụng tác phẩm của họ. Nhiều vụ kiện đã được đệ trình nhằm vào OpenAI, Microsoft, Meta và NVIDIA. Trong đó, họ bị cáo buộc sử dụng tập dữ liệu Books3, dẫn từ thư viện của trang web vi phạm bản quyền Bibliotik.
Sau khi các cáo buộc về Books3 lan truyền rộng rãi, nhiều công ty AI đã ngừng sử dụng nguồn dữ liệu này. Trong khi đó, các công ty chống vi phạm bản quyền cũng tham gia hỗ trợ giới xuất bản chặn kết nối trực tuyến đến trang web vi phạm trên để giảm thiểu thiệt hại. Họ không chỉ chặn truy cập Books3 bằng tiếng Anh mà tuần trước, một tập dữ liệu tiếng Hà Lan cũng đã bị ngăn chặn.
Bộ dữ liệu Books3 được cho là có tác phẩm của rất nhiều đơn vị xuất bản nổi tiếng. Ảnh: ABC. |
Vụ kiện nhằm vào NVIDIA
Đầu năm nay, một số tác giả đã khởi kiện nhà sản xuất chip hàng đầu thế giới NVIDIA, với cáo buộc mô hình AI của công ty này được phát triển dựa trên nhiều tác phẩm có bản quyền, đặc biệt là bộ dữ liệu Books3, và yêu cầu bồi thường. Một vụ kiện khác được đệ trình sau đó vài tuần cũng với nội dung tương tự. Hiện NVIDIA có kế hoạch giải quyết cả hai vụ việc bằng cách phủ nhận các cáo buộc vi phạm bản quyền.
Trong phản hồi ban đầu được đệ trình lên toà cách đây vài tuần, NVIDIA không phủ nhận việc sử dụng tập dữ liệu Books3. Giống như nhiều công ty AI khác, NVIDIA tin rằng việc sử dụng dữ liệu có bản quyền để đào tạo AI nằm trong quy định của “sử dụng hợp lý” (fair use) và AI cũng không hề tái tạo nội dung tác phẩm bằng bản sao, ghi âm hoặc bất kỳ phương tiện nào khác.
“Sử dụng hợp lý” là một nguyên tắc cơ bản trong pháp luật sở hữu trí tuệ, cho phép sử dụng tác phẩm không cần sự cho phép của tác giả hay chủ sở hữu tác phẩm trong một số trường hợp nhất định như giảng dạy, báo cáo, thảo luận, nghiên cứu…. Đây được xem như ngoại lệ của quyền tác giả.
Tuy nhiên, các tác giả có quan điểm khác. Họ cáo buộc NVIDIA cố tình sao chép kho lưu trữ sách lậu để phát triển mô hình AI thương mại và yêu cầu bồi thường thiệt hại do hành động vi phạm bản quyền trực tiếp.
Tuần trước, các tác giả và NVIDIA đã đệ trình văn bản đề xuất tiến độ giải quyết vụ án tại một tòa án California, với mục tiêu sẽ có phiên xét xử cuối vào tháng 11/2026.
AI cần sử dụng tự do tác phẩm bản quyền?
NVIDIA cũng kỳ vọng biện luận của họ về vấn đề sử dụng hợp lý được xem xét giải quyết sớm và được thực hiện một cách hiệu quả. Theo công ty này, giới phát triển AI nên được phép sử dụng sách có bản quyền để phát triển các mô hình AI vì nội dung của những cuốn sách có "các sự kiện và ý tưởng không nằm trong diện bảo vệ bản quyền" mà thuộc về phạm vi công cộng.
"Fair use" đang được các công ty AI dựa vào để biện luận cho hành vi "ngầm" sử dụng tác phẩm của giới xuất bản. Ảnh: Vietnambiz. |
Đồng thời, NVIDIA lập luận rằng mô hình AI của họ không sử dụng sách theo cách con người vẫn làm, không phát triển kỹ năng đọc sách, hiểu biết cơ bản về cốt truyện và cũng không sao chép chúng.
Thay vào đó, AI đơn giản xem xét “các sự kiện và ý tưởng” trong sách, “thay đổi” mục đích ban đầu của chúng để xây dựng một mô hình AI tối tân. Họ tuyên bố rằng các yếu tố này đủ cấu thành nguyên tắc sử dụng hợp lý.
Nói cách khác, "nguyên đơn không thể sử dụng cáo buộc bản quyền để ngăn cản quyền truy cập vào các sự kiện và ý tưởng này. Đồng thời, quá trình phát triển AI có tính chuyển đổi cao được bảo vệ hoàn toàn bởi nguyên tắc sử dụng hợp lý đã được thiết lập rõ ràng từ lâu”, NVIDIA tuyên bố.
Nhà sản xuất chip tin rằng họ không làm gì sai và có thể sẽ đề cập đến kết quả một số vụ án bản quyền trong các hồ sơ nộp lên toà trong thời gian tới. Trong đó có vụ kiện của Hiệp hội tác giả Mỹ Authors Guild nhằm vào Google với phán quyết kết luận rằng việc sao chép sách để tạo cơ sở dữ trên Google là hành vi sử dụng hợp lý. Do đó, Google Books vẫn tồn tại cho đến ngày nay.
NVIDIA không phải là công ty duy nhất dựa vào biện hộ “sử dụng hợp lý” để phản bác các khiếu nại vi phạm bản quyền liên quan đến AI. Nhiều công ty khác cũng đang áp dụng cách tiếp cận tương tự.
Trong bối cảnh sự thành công của phương pháp biện hộ này sẽ là một chìa khóa cho tương lai phát triển mô hình AI, các vụ kiện sẽ khiến tòa án bận rộn trong nhiều năm tới. Ngay cả sau khi phán quyết được đưa ra, vẫn sẽ có kháng cáo và có thể sẽ đưa vụ việc lên tận Tòa án Tối cao.
Trong khoảng thời gian đó, hành động của NVIDIA và các công ty AI khác sẽ bị các đơn vị nắm giữ bản quyền và công chúng giám sát chặt chẽ. Gần đây cũng xuất hiện nhiều thông tin cáo buộc NVIDIA cùng nhiều công ty khác thu thập cả video và bản ghi từ YouTube để phát triển AI.
Đọc được sách hay, hãy gửi review cho Tri Thức - Znews
Bạn đọc được một cuốn sách hay, bạn muốn chia sẻ những cảm nhận, những lý do mà người khác nên đọc cuốn sách đó, hãy viết review và gửi về cho chúng tôi. Tri Thức - Znews mở chuyên mục “Cuốn sách tôi đọc”, là diễn đàn để chia sẻ review sách do bạn đọc gửi đến qua Email: books@zingnews.vn. Bài viết cần gửi kèm ảnh chụp cuốn sách, tên tác giả, số điện thoại.
Trân trọng.