Voice cloning là ứng dụng nhân bản giọng nói bằng AI đang được chú ý. Tại Việt Nam, AusyncLab là một trong những đơn vị nghiên cứu và triển khai giải pháp voice cloning với chất lượng tốt, mở ra cơ hội mới cho nhiều ngành nghề, từ truyền thông, giáo dục, chăm sóc khách hàng đến giải trí. Đội ngũ phát triển của AusyncLab với sứ mệnh nâng cao phát triển giọng nói tiếng Việt phục vụ người Việt và thị trường trong nước.
Voice Cloning - công nghệ của tương lai
Voice cloning là công nghệ sử dụng trí tuệ nhân tạo để “sao chép” giọng nói của một người cụ thể. Với AusyncLab, chỉ cần 3 đến 7 giây âm thanh mẫu sẽ tạo ra giọng nói giống gần như hoàn toàn với người thật về âm sắc, tốc độ nói, nhấn nhá và cảm xúc.
Khác công cụ chuyển văn bản thành giọng nói truyền thống vốn có chất giọng “robot”, công nghệ voice cloning mang lại trải nghiệm tự nhiên, cảm xúc và cá nhân hóa hơn. Điều này mở ra vô vàn ứng dụng thực tiễn như tạo giọng nói cho nhân vật ảo trong phim hoạt hình, trò chơi điện tử; lồng tiếng tự động cho video, sách nói, chương trình truyền hình; cá nhân hóa trải nghiệm chăm sóc khách hàng với tổng đài có giọng người quen thuộc; lưu giữ giọng nói của người thân, người nổi tiếng hoặc các nhân vật lịch sử; giảm thời gian thu âm, tối ưu hóa công việc.
|
| Một trong những giao diện trên website của AusyncLab. |
Chỉ trong vài tháng, công ty thu hút được nhiều sự quan tâm của người dùng có nhu cầu về nhân bản giọng nói.
“Chúng tôi muốn nhân bản giọng nói không chỉ chính xác, mà còn mang được cảm xúc, ngữ điệu - điều tạo nên bản sắc cá nhân trong mỗi người”, ông Nguyễn Minh Anh - Giám đốc điều hành AusyncLab - chia sẻ.
Chú trọng sự minh bạch và cải tiến sản phẩm
Trong bối cảnh công nghệ deepfake phát triển mạnh, AusyncLab luôn ưu tiên tính minh bạch và đạo đức khi triển khai sản phẩm. Mỗi trường hợp sử dụng giọng nói nhân bản đều cần sự cho phép rõ ràng từ chủ sở hữu. Công ty cũng phát triển công cụ “dấu vết giọng nói” (voice watermarking) để ngăn chặn giả mạo và bảo vệ bản quyền. Mỗi người dùng khi sử dụng giọng nói sẽ cần cam kết sử dụng đúng mục đích để tránh hành vi lợi dụng nhằm trục lợi.
“AusyncLab hiểu rằng mỗi giọng nói là duy nhất và có thể bị lạm dụng nếu không kiểm soát. Đó là lý do chúng tôi xây dựng bộ nguyên tắc sử dụng công nghệ này ngay từ đầu”, ông Lê Tấn Nghĩa - đồng sáng lập AusyncLab - phát biểu.
Không chỉ nhân bản giọng nói tiếng Việt, AusyncLab còn phát triển lên đến 17 ngôn ngữ như Anh, Trung Quốc, Hàn Quốc, Đức, Do Thái, Nhật Bản... Người dùng chỉ cần một giọng gốc tiếng Việt đã có thể chuyển đổi nhân bản giọng nói sang các tiếng khác nhau.
Ngoài sản phẩm về voice cloning, AusyncLab tiếp tục phát triển để ra mắt sản phẩm mới như Instant avatar (đồng bộ lời nói với avatar để tạo nhân vật ảo), Speech editing (chỉnh sửa âm thanh, thay đổi lời nói) ,Voice design (thiết kế giọng nói theo phong cách của mình), Lipsync (tối ưu từng câu chữ khớp với từng khuôn miệng).
Mặc dù mới ra mắt thị trường từ tháng 12/2024 nhưng AusyncLab đã được chọn vào vòng tiếp theo của chương trình Microsoft for Startups, được hỗ trợ chi phí lên đến 150.000 USD. Điều này tạo động lực giúp AusyncLab khẳng định vị thế trên thị trường với các công ty cùng ngành.
AusyncLab cũng có những cơ hội được hợp tác với các doanh nghiệp như VTC Netviet, Bệnh viên Đa khoa Quốc tế GSV, Byscom (tư vấn giải pháp kinh doanh online), GSVMindmaid (cung cấp giải pháp trợ lý ảo cho doanh nghiệp), AiMake (cung cấp giải pháp kinh doanh bằng các ứng dụng AI)...
Không dừng ở đó, tính đến tháng 5, AusyncLab đã có khoảng 50.000 người dùng với nhiều lĩnh vực khác nhau, tạo động lực để công ty ngày càng phát triển và nâng cấp trang thiết bị hơn.
Dự kiến đến cuối năm 2025, đầu năm 2026, AusyncLab sẽ đạt được mốc 200.000 người dùng, tạo nên cộng đồng AusyncLab vững mạnh.
Công nghệ voice cloning không chỉ thay đổi cách con người tương tác với máy móc, mà còn đặt ra câu hỏi lớn về danh tính, cảm xúc và đạo đức.
Mặc dù đội ngữ còn non trẻ nhưng AusyncLab hứa hẹn trở thành kỳ lân trong lĩnh vực nhân bản giọng nói bằng AI.