Công ty sách nói Việt thử nghiệm ứng dụng giọng đọc AI nhưng vấp phải tranh cãi từ người dùng. Nhiều người cho rằng trải nghiệm nghe sách bị giảm giá trị và thiếu gắn kết cá nhân.

Độc giả trải nghiệm sách nói ở TP.HCM. Ảnh: Tâm Anh.

“Gần đây trang này (Fonos - PV) bắt đầu kết hợp giữa sách nói do người đọc và sách nói do AI đọc. Nhưng có điều là sách nói do người đọc thì họ sẽ không bao giờ công khai tên (hay biệt danh) của người đọc, trong khi với sách nói AI thì họ sẽ đặt một cái tên gì đó, kiểu Hải Đăng (nam AI), Trà My (nữ AI). Nói cách khác, là họ xóa bỏ danh tính con người trong khi lại nhân tính hóa cho AI”, TS Vũ Hoàng Linh viết trên trang cá nhân có hơn 38.000 người theo dõi vào chiều 20/11.

Bài đăng trên trang cá nhân của ông nhanh chóng gây chú ý. Theo nhiều độc giả, họ sử dụng sách nói không chỉ vì nội dung mà còn muốn nghe giọng đọc, muốn biết ai là người đồng hành với mình suốt 10-20 tiếng đọc sách. Trong khi đó, giọng AI làm ranh giới trải nghiệm cá nhân và sản phẩm công nghiệp trở nên mờ nhạt.

Đại diện công ty sách nói Fonos chia sẻ với Tri Thức - Znews về chính sách sử dụng AI trong các sản phẩm sách nói đồng thời cho biết chức năng này “đang trong quá trình thử nghiệm”. Không chỉ Việt Nam, các công ty phát triển sách nói toàn cầu như Audible, Apple hay Google đều có xu hướng đẩy mạnh AI để giảm chi phí và mở rộng thị trường.

Nhân hóa AI?

Trong bài viết, TS Vũ Hoàng Linh cho rằng với người nghe sách nói, việc biết người đọc là ai rất quan trọng. Bởi lẽ, người đó sẽ đi cùng độc giả trong 10-20 tiếng của quyển sách. Nếu thích, họ có thể chọn thêm các sản phẩm khác để nghe hoặc ngược lại.

Mặt khác, theo ông, việc ghi danh người đọc sách cũng thể hiện cách tôn trọng những người tham gia sản xuất sách nói. “Việc biến họ thành những người đọc không tên như những chiếc máy đọc là không công bằng và thiếu tôn trọng họ. Về mặt tâm lý thì người nghe sách cũng sẽ sẵn sàng trả tiền hơn nếu họ biết anh Nguyễn Văn A hay chị Trần Thị B, người đang đọc sách cho họ nghe, sẽ có tiền mua sữa cho con từ việc họ bỏ tiền ra mua sách nói”, TS Linh viết.

Độc giả cho rằng Fonos đang vô tình "xóa bỏ danh tính con người" trong khi "nhân hóa AI". Ảnh: FBNV.

Đồng quan điểm, Tú Anh (22 tuổi, ngụ xã Bà Điểm, TP.HCM) là một người thường nghe sách nói trước khi ngủ. Cô cho biết bản thân đôi khi khó chịu khi vô tình bật trúng một sản phẩm sử dụng giọng AI.

“Tôi hiểu là các đơn vị cũng phải tính đến chi phí sản xuất nhưng tôi vẫn thích giọng người thật hơn. Có những đoạn như sinh con, AI không thể nào diễn tả được tiếng thở dốc, sự sợ hãi hay cảm xúc thật sự của người phụ nữ. Người nghe không có được sự đồng cảm”, Tú Anh nhận xét.

Chia sẻ với Tri Thức - Znews về vấn đề này, đại diện Fonos cho biết đơn vị đang trong quá trình thử nghiệm giọng nói AI để “mở rộng lựa chọn nhiều giọng đọc cho người dùng”. Công ty khẳng định minh bạch với độc giả trong việc dán nhãn đâu là sách do người thật đọc và đâu là sách do AI trước khi họ quyết định mua sách.

“Các giọng AI đều được tạo ra bởi những hãng công nghệ lớn và họ đã đặt tên sẵn cho từng giọng. Khi tích hợp vào hệ thống, việc giữ lại tên đó chỉ để đảm bảo đúng kỹ thuật. Còn voice talent (Tạm dịch: Người lồng tiếng) của Fonos, trước giờ chúng tôi mời làm việc theo mô hình studio production, không phải mô hình ‘nghệ sĩ - tác phẩm’, để tập trung vào nội dung cuốn sách thay vì phân tán vào việc ai đọc”, người đại diện công ty sách nói lý giải.

Thử nghiệm giọng đọc AI trong sách nói diễn ra trong bối cảnh ngành xuất bản Việt Nam chuyển mình mạnh mẽ theo hướng số hóa. Theo số liệu của Cục Xuất bản, In và Phát hành, năm 2024, số lượng xuất bản phẩm điện tử tăng 120,7% so với năm trước, đạt khoảng 4.050 đầu sách. Riêng mảng sách nói ghi nhận 1.886 đầu sách mới, mang về doanh thu ước đạt 102 tỷ đồng .

Ngành sách nói toàn cầu chia phe vì làn sóng AI

Tháng 5, Audible, nền tảng sách nói thuộc sở hữu Amazon, công bố mở rộng thử nghiệm các giọng đọc nhân tạo. Làn sóng phản đối từ cộng đồng diễn viên lồng tiếng và tác giả ngay lập tức bùng lên. Ở Australia, nơi thị trường audiobook đang phát triển ổn định, giới nghệ sĩ lo ngại không chỉ vì nguy cơ mất việc mà còn vì sự sụt giảm chất lượng khi những khoảnh khắc giàu cảm xúc được thay bằng giọng máy.

“Tôi từng đọc những cảnh cãi vã đánh nhau đến cảnh yêu đương cháy bỏng, AI thì làm sao biết tiếng thở dốc hay tiếng khóc thật sự ra sao?”, Annabelle Tudor, một nghệ sĩ audiobook ở Melbourne chia sẻ với Guardian. Với cô, giọng đọc là một kỹ năng mà công nghệ chưa thể bắt chước.

Simon Kennedy - Chủ tịch Hiệp hội Diễn viên lồng tiếng Australia - cho rằng đẩy mạnh AI là cách mà các công ty “chọn số lượng thay vì chất lượng”. Ông cho biết mỗi giờ sách nói hoàn chỉnh đòi hỏi người đọc phải ghi âm gấp đôi hoặc gấp ba thời lượng, chưa kể thời gian nghiên cứu nội dung.

Audible là nền tảng sách nói thuộc sở hữu Amazon. Đơn vị công bố mở rộng thử nghiệm các giọng đọc nhân tạo từ tháng 5. Ảnh: Alamy.

Từ đầu năm 2023, Apple và Google đã lần lượt tung ra các dịch vụ sách nói sử dụng AI để phục vụ nhóm tác giả tự xuất bản. Apple Books cho phép người dùng truy cập hàng trăm tựa sách có chú thích “được kể lại bằng giọng kỹ thuật số”, trong khi Google Play Books cung cấp các lựa chọn giọng AI theo vùng miền cho tiếng Anh, Pháp, Tây Ban Nha, Bồ Đào Nha... với chi phí thấp.

Một trong những tác giả đầu tiên tham gia chương trình thử nghiệm của Apple là Kristen Ethridge, nhà văn chuyên viết tiểu thuyết tình cảm ở Mỹ. “Tôi không có lựa chọn giữa người và máy. Tôi chỉ có lựa chọn có audiobook hay không”, cô nói. Với những độc giả cao tuổi, có thu nhập thấp, việc sử dụng sách nói do AI đọc là cách để tiếp cận nhiều nội dung hơn với chi phí thấp hơn.

Đại diện Audible khẳng định họ “không có ý định thay thế giọng người thật” mà muốn “bổ sung lựa chọn, giúp nhiều tác giả và đầu sách tiếp cận được công chúng hơn”.

Năm 2023 và 2024, Audible Studios còn tuyển thêm nhiều diễn viên giọng nói hơn trước đây. Tuy nhiên, hãng này cũng đang thử nghiệm công nghệ “nhân bản giọng nói”, cho phép người đọc tạo ra bản sao giọng nói của mình để tăng sản lượng sách nói với sự cho phép của chính họ.

Theo dự đoán của nhiều chuyên gia chia sẻ với Guardian, tương lai của sách nói có thể sẽ chia thành hai dòng sản phẩm. Một là các bản đọc chuyên nghiệp, giàu cảm xúc dành cho người nghe khó tính; hai là các bản đọc AI hướng đến đại chúng phổ thông với mức giá phải chăng và tốc độ sản xuất nhanh hơn.