Độc giả trải nghiệm sách nói tại TP.HCM. Ảnh: Voiz FM. |
Trong một lần tìm kiếm sách nói để nghe, độc giả Nguyễn Đức Giang (30 tuổi, trú tại Đông Anh, Hà Nội) cảm thấy kỳ lạ khi giọng đọc không giống như các video trước đó anh từng thấy. Phần chú thích bị chèn vào văn bản chính, không có độ trầm bổng lên xuống. Sau khi nghe đến một nửa chương một, Giang đành bỏ dở và thử nghe thêm một số tập khác. Lúc này anh mới nhận ra rằng đây là giọng đọc của máy chứ không phải của người.
Chưa bàn đến vấn đề bản quyền sách, các video sách nói trên mạng xã hội khiến nhiều người nghe có trải nghiệm khó chịu, tìm đến các đơn vị sách nói có bản quyền và thu âm giọng người đọc.
Điểm yếu giọng đọc của máy
Trong một số phiên bản được quảng cáo là sách nói trên mạng, người tạo ra đã sử dụng các phần mềm AI để đọc văn bản. Theo phản hồi của các thính giả, những giọng đọc này rõ ràng, đúng phát âm và có chất giọng đẹp, không bị ngọng hay phát âm sai. Có thể thấy các phần mềm chuyển văn bản thành giọng nói với AI hiện tại đã mô phỏng được khá tốt các phát âm cũng như nhịp điệu trong tiếng Việt. Tuy nhiên vẫn có vài hạn chế và chỉ khi nghe nhiều, người dùng mới có thể nhận thấy.
Anh Nguyễn Đức Giang là một người dành phần lớn thời gian trên nền tảng YouTube để tìm kiếm sách nói. Thể loại chính của độc giả này là tiểu thuyết dã sử, tiểu thuyết giả tưởng, thần thoại của các tác giả Trung Quốc. Khi đang tìm kiếm các tập của bộ Tam Quốc diễn nghĩa, anh Giang đã gặp phải một loạt video nội dung từ sách do AI đọc.
“Giọng đọc AI ban đầu có thể nghe rất tốt vì trí tuệ nhân tạo bây giờ có thể mô phỏng lại giọng người. Tuy nhiên, có những điểm đặc biệt mà tôi nhận thấy rằng AI chưa thể làm được là ngắt nghỉ một cách máy móc, không nhấn các từ, các chữ để thể hiện được ý đồ của tác giả trong đoạn văn. Có những đoạn mang không khí hào hùng nhưng đọc rất chán, chẳng khác gì cảnh tả mào đầu”, anh Nguyễn Đức Giang cho biết.
Chính vì lí do này, anh Giang đã quyết định tìm tới các ứng dụng sách nói tốt hơn để nghe được trọn vẹn cuốn sách mình yêu thích. Anh Giang cũng nhận ra rằng, các ứng dụng có bản quyền sẽ có chất lượng tốt hơn, đầy đủ hơn.
Sự việc trên còn xảy ra với một số thính giả khác, anh Đức Trung (trú tại TP.HCM) cũng khó chịu khi gặp những video sách nói sử dụng giọng đọc AI. “Không thể phủ nhận rằng giọng đọc của trí tuệ nhân tạo còn tốt hơn một số kênh sách nói có chất lượng thu âm kém, nhưng mình vẫn thấy chúng khó nghe vì thiếu cảm xúc”, độc giả này chia sẻ.
Với những tác phẩm nằm trong chủ đề Phật Giáo hay tâm linh, anh Trung mong đợi người đọc có thể truyền tải nội dung qua sự mềm mại nhưng vẫn phải tròn và rõ chữ. Trong khi đó, giọng đọc AI có xu hướng kéo dài phần âm cuối mỗi chữ khiến người nghe cảm thấy rất kỳ quặc.
AI cần phải học nhiều hơn
Giọng đọc AI đang là một trong những chủ đề luôn được chú ý đối với các doanh nghiệp làm sách nói, đặc biệt khi nó mang lại nhiều hứa hẹn về việc rút ngắn thời gian sản xuất và khả năng làm việc không ngừng nghỉ. Theo chia sẻ từ đại diện của Voiz FM, giọng đọc nhân tạo vẫn chưa thể thay thế hoàn toàn giọng đọc người thật, ít nhất là ở hiện tại.
Một trong những lợi thế lớn của AI là khả năng sản xuất liên tục, không cần nghỉ ngơi để giữ giọng như con người, và cũng không gặp phải các vấn đề về khan tiếng. Tuy nhiên, để AI có thể mang lại kết quả chính xác và chất lượng như mong đợi, dữ liệu đầu vào cần được xử lý rất kỹ lưỡng. Điều này đòi hỏi phải có một lượng lớn dữ liệu âm thanh được chuẩn hóa và đa dạng hóa, nhằm giúp AI học hỏi và cải thiện.
Dù vậy, khả năng ứng dụng của giọng đọc AI hiện tại vẫn chủ yếu giới hạn trong các thể loại sách non-fiction như kinh tế, tài chính, self-help,... Trong khi đó, với những thể loại yêu cầu sự linh hoạt và cảm xúc như tiểu thuyết, văn học hay sách thiếu nhi, giọng đọc của con người vẫn đang chiếm ưu thế rõ rệt.
Lý do là giọng đọc của người thật thể thể hiện được tư duy và cảm xúc, một yếu tố quan trọng trong việc truyền tải nội dung đến người nghe.
“Các nghệ sĩ giọng đọc (voice talent) có thể linh hoạt chuyển đổi giữa các nội dung khác nhau, từ việc dẫn truyện qua việc nhập vai vào nhân vật để diễn thoại. Họ có khả năng điều chỉnh tốc độ đọc phù hợp với từng đoạn nội dung: có khi chậm rãi, từ tốn, có khi nhanh, hào hứng để tạo động lực cho người nghe. Đây là điều mà giọng đọc AI hiện tại còn thiếu sót”, đại diện Voiz FM chia sẻ.
Bạn đọc trải nghiệm sách nói tại một lễ hội đường sách trên đường Nguyễn Huệ, TP.HCM. Ảnh: Chí Hùng. |
Ngoài ra, giọng đọc AI cũng gặp khó khăn khi phải xử lý các dạng nội dung đặc biệt như bảng biểu hay hình vẽ trong sách. Để cải thiện giọng đọc AI, cần phải tập trung vào việc giúp AI “học” thêm về cách diễn đạt cảm xúc, khả năng xử lý ngữ cảnh và sự nhạy bén trong việc chuyển đổi giữa các dạng nội dung khác nhau.
Tư duy cảm xúc, điều mà AI chưa có, cũng đóng vai trò quan trọng trong việc sáng tạo sản phẩm sách nói. Mỗi người đọc đều mang đến một phong cách riêng biệt, khả năng cảm nhận và truyền tải câu chuyện theo cách mà họ hiểu và đồng cảm. Đây là yếu tố tạo nên sự khác biệt lớn giữa giọng đọc người và giọng đọc AI.
Để AI có thể thực sự tiệm cận được với khả năng của con người, việc cải thiện tư duy nhân tạo, giúp AI hiểu sâu hơn nội dung cũng như bối cảnh của câu chuyện là cần thiết. Điều này mở ra những cơ hội phát triển mới cho ngành sách nói, nhưng đồng thời cũng đặt ra nhiều thách thức trong việc quy định sử dụng trí tuệ nhân tạo.
Đọc được sách hay, hãy gửi review cho Tri Thức - Znews
Bạn đọc được một cuốn sách hay, bạn muốn chia sẻ những cảm nhận, những lý do mà người khác nên đọc cuốn sách đó, hãy viết review và gửi về cho chúng tôi. Tri Thức - Znews mở chuyên mục “Cuốn sách tôi đọc”, là diễn đàn để chia sẻ review sách do bạn đọc gửi đến qua Email: books@zingnews.vn. Bài viết cần gửi kèm ảnh chụp cuốn sách, tên tác giả, số điện thoại.
Trân trọng.