|
|
Giao diện ứng dụng Google Translate ngày 10/6, với tính năng Dịch trực tiếp. |
Trong thông báo về mô hình Gemini 3.5 Live Translate ngày 10/6, Google cho biết đang đưa tính năng phiên dịch thời gian thực lên ứng dụng Google Meet và Google Translate đến nhiều thị trường, trong đó có Việt Nam.
Nâng cấp lớn nhất trong lần cập nhật này là khả năng chuyển ngữ thành tiếng bản địa một cách tự nhiên và phát ngay khi người bên kia đang nói. Cụ thể, thay vì phải chờ người nói phát biểu hết câu, bấm nút dịch rồi đợi hệ thống xử lý như trước, công nghệ AI mới của Google giúp nhận diện và phân tích dữ liệu âm thanh trực tiếp trong cuộc hội thoại.
Ví dụ trong cuộc trò chuyện với một người nói tiếng Anh, người dùng có thể mở ứng dụng, chọn cặp ngôn ngữ Anh - Việt. Một giọng tiếng Việt sẽ được phát song song với âm thanh gốc qua tai nghe. Đặc biệt, AI có thể giữ nguyên ngữ điệu, tốc độ và cao độ của người nói gốc.
Từ hôm nay (10/6), người dùng tại Việt Nam đã có thể sử dụng qua ứng dụng Google Translate trên thiết bị chạy iOS và Android, chọn Dịch trực tiếp ở góc trái màn hình. Điều kiện cần là kết nối với tai nghe để nghe phiên dịch. Google cho biết ứng dụng có thể phản ánh chính xác tông giọng của người nói với hơn 70 ngôn ngữ.
| |
| Đây là bước đi chiến lược của Google nhằm tối ưu hóa trải nghiệm giao tiếp không rào cản của người dùng. Ảnh: BRG. |
Riêng người dùng Android sẽ có thêm chế độ nghe riêng tư "Listening Mode". Khi áp điện thoại vào tai, âm thanh dịch sẽ phát qua loa thoại thay vì loa ngoài. Tính năng này hữu ích trong những tình huống người dùng muốn nghe bản dịch mà không để người khác nghe thấy, hoặc khi không có sẵn tai nghe.
Đối với doanh nghiệp, tính năng này sẽ xuất hiện trên Google Meet từ tháng này. Google Meet sẽ hỗ trợ hơn 2.000 cặp tổ hợp dịch trực tiếp, không còn bị rào cản phụ thuộc vào tiếng Anh như trước.
Gemini 3.5 Live Translate là mô hình âm thanh tiên tiến nhất của Google, hỗ trợ dịch thuật giọng nói trong thời gian thực. Hệ thống này có khả năng tự động nhận diện và xử lý hơn 70 ngôn ngữ khác nhau, với tốc độ gần như tức thì.
Ngoài ứng dụng Meet và Translate, Google cũng triển khai tính năng cho các nhà phát triển thông qua Gemini Live API và Google AI Studio, giúp xây dựng ứng dụng dịch giọng nói.
Grab là một trong các đối tác đang thử nghiệm mô hình này nhằm hỗ trợ giao tiếp đa ngôn ngữ theo thời gian thực giữa tài xế và hành khách tại điểm đón. Hiện 10 triệu cuộc gọi thoại thông qua nền tảng Grab được thực hiện bằng cách này mỗi tháng, theo Google.
Nhiều đối tác lớn đã thử nghiệm và đánh giá cao công nghệ mới này. “Khi thử nghiệm Gemini 3.5 Live Translate, chúng tôi đánh giá cao khả năng tự động phát hiện nhiều ngôn ngữ và dịch lời nói chính xác với độ trễ thấp”, ông Philipp Kandal, Giám đốc Sản phẩm tại Grab, chia sẻ.
Tập đoàn giải trí CJ ENM của Hàn Quốc cũng kỳ vọng lớn vào công nghệ này. “Các thử nghiệm ban đầu cho thấy chất lượng đầy hứa hẹn, mang lại trải nghiệm chân thực hơn cho người xem toàn cầu và Hàn Quốc”, bà Bella Baek, Giám đốc AI tại CJ ENM, cho biết.
Hai nhà sáng lập Google tự tay làm nên tất cả
Kể về câu chuyện của 25 doanh nhân của thế giới, sách "Họ đã làm gì để thay đổi thế giới?" vừa là một “kho” tư liệu về tinh thần doanh nhân vừa là nguồn cảm hứng cho những ai muốn tự mình sáng tạo nên những điều ý nghĩa.

