|
|
Sách nói về Harry Potter tràn ngập YouTube. Ảnh: YouTube. |
Tin tức về AI và sách nói đang xuất hiện dồn dập. Nhà sản xuất sách nói Bolinda, có trụ sở tại Australia, gần đây thông báo sẽ tạo ra một bản sao AI mô phỏng giọng nói của tác giả ăn khách Barbara Cartland (bà mất năm 2000).
Hai ngày sau đó, Spotify thông báo việc hợp tác với ElevenLabs để cung cấp tính năng cho phép các tác giả tự xuất bản sách nói do AI lồng tiếng.
Trong khi đó, một bài báo điều tra gần đây của New York Times tiết lộ việc sử dụng AI để vi phạm bản quyền sách nói với quy mô lớn trên YouTube.
“Nếu thử tìm kiếm các cuốn sách ăn khách, bạn sẽ tìm thấy bản sách nói miễn phí của chúng trên YouTube”, Giám đốc điều hành của Hiệp hội tác giả Mỹ cho biết.
Một cuộc khảo sát năm 2025 cho thấy 35% người tiêu dùng sách nói đã nghe sách nói trên YouTube. Trong đó, sách nói do AI thuật lại chiếm 23%.
Sự phát triển của giọng nói AI
Thực tế là giọng đọc công nghệ xuất hiện từ lâu. Hệ thống thí nghiệm chuyển văn bản thành giọng nói tự động đầu tiên được tạo ra năm 1968 tại phòng thí nghiệm nghiên cứu ở Nhật Bản. Công nghệ này sau đó được IBM phát triển đầu những năm 1980.
Năm 1986, hãng này giới thiệu phần mềm đọc màn hình thành tiếng nói đầu tiên dành cho người dùng phổ thông trên máy tính cá nhân. Công nghệ này ban đầu chỉ dành cho người khiếm thị. Họ là những người đầu tiên đón nhận điều đó.
Nhưng khi giọng nói AI được phát triển trở nên tự nhiên hơn, mối lo ngại về tác động của chúng đối với sách nói ngày càng tăng lên. Năm 2009, Hiệp hội tác giả Mỹ từng chặn tính năng chuyển văn bản thành giọng nói của Kindle 2, với lý do vi phạm bản quyền sách nói của họ.
|
| Các nhà xuất bản đang tìm cách phát hiện các bản sách nói vi phạm bản quyền trên các nền tảng. Ảnh: Publishers Weekly. |
Nhiều tác giả nổi tiếng cũng đã phản đối việc tự động chuyển văn bản thành giọng nói trên.
“Ngày AI cung cấp những bản đọc Kindle hoàn hảo, chúng ta sẽ có những vấn đề quan trọng hơn cần giải quyết, hơn là vấn đề bản quyền sách nói”, tác giả khoa học viễn tưởng và công nghệ Cory Doctorow cho hay.
Storytel của Thụy Điển, nền tảng phát trực tuyến lớn nhất tại thị trường Bắc Âu, báo cáo năm 2024 rằng, chín trong số mười người nghe “không thể phân biệt được giọng kể nào là của con người” khi họ thử nghiệm các giọng nói do AI tạo ra trong chương trình Voice Switcher của mình.
Giống Spotify, Storytel sử dụng công nghệ AI của ElevenLabs. Với Voice Switcher, người nghe có thể lựa chọn giữa người kể chuyện gốc, 3 giọng nói khác do AI tạo ra, hoặc phiên bản AI của diễn viên kiêm người kể chuyện nổi tiếng người Thụy Điển Stefan Sauk.
Lạm dụng giọng nói AI
Hiện nay, việc sao chép giọng nói đang bị lạm dụng một cách đáng lo ngại. Trước tình trạng này, cùng các loại công nghệ mô phỏng con người deepfake khác, Liên Hợp Quốc phải đưa ra lời cảnh tỉnh về vấn đề sử dụng AI để thu lợi bất chính vào tháng 3 năm nay.
Ngành xuất bản sách nói cũng không thoát khỏi tình trạng này. Năm 2023, các bản ghi âm giọng đọc truyện Harry Potter của Stephen Fry bị sử dụng trái phép. Năm nay, tác giả Shaun Rein phát hiện các bản deepfake của chính mình trên YouTube. Nhân vật AI này đang đọc các chương trong chính cuốn sách của ông.
YouTube đã tìm cách giải quyết vấn nạn này bằng cách tự động quét nội dung được tải lên để xem chúng có khớp với cơ sở dữ liệu khổng lồ của họ hay không. Tuy nhiên, có 2 khó khăn.
Một là, sách nói thường không được đăng ký bản quyền trên YouTube. Hai là hệ thống quét của YouTube kém hiệu quả với sách nói.
Chỉ một vài thay đổi nhỏ như tốc độ đọc, độ cao giọng nói hoặc thêm tiếng ồn và nhạc nền cũng đủ giúp các bản sách nói trái phép vượt qua tường lửa.
Tương lai của sách nói
Bối cảnh hiện nay của AI và ngành sách nói đang đặt ra câu hỏi về trách nhiệm và phản ứng của tất cả bên liên quan. Các giọng đọc sách nói lo ngại về tương lai việc làm và giá trị bản quyền tác phẩm của họ.
Các công đoàn và nhóm hoạt động đang tích cực vận động để có quy định kiểm soát AI và nội dung tác phẩm chặt chẽ hơn. Trong khi đó, tác giả và nhà xuất bản cũng muốn những nền tảng lớn như YouTube hành động chống lại nạn vi phạm bản quyền.
Nhà lập pháp, công ty công nghệ và doanh nghiệp thương mại lớn đứng trước sức ép phải tìm cách bảo đảm rằng công nghệ AI được sử dụng một cách minh bạch, có đạo đức.
Hành trình này khó khăn với toàn ngành xuất bản. Tuy nhiên, không thể bác bỏ vai trò của giọng đọc AI đối với người dùng và tương lai của ngành sách nói nói chung.
Giọng đọc của con người mang đến trải nghiệm nghe tuyệt vời, với sự biểu cảm, sự sống động và sự chân thực. Tuy nhiên, giọng đọc bằng AI rẻ hơn, nhanh hơn và dễ tiếp cận đang đóng vai trò ngày càng quan trọng, đặc biệt với những người bị khiếm thị hoặc một số dạng rối loạn thần kinh khiến họ không thể đọc sách.
Đọc được sách hay, hãy gửi review cho Tri Thức - Znews
Bạn đọc được một cuốn sách hay, bạn muốn chia sẻ những cảm nhận, những lý do mà người khác nên đọc cuốn sách đó, hãy viết review và gửi về cho chúng tôi. Tri Thức - Znews mở chuyên mục “Cuốn sách tôi đọc”, là diễn đàn để chia sẻ review sách do bạn đọc gửi đến qua Email: books@znews.vn. Bài viết cần gửi kèm ảnh chụp cuốn sách, tên tác giả, số điện thoại.
Trân trọng.