Năm 2017, trong bối cảnh lĩnh vực trí tuệ nhân tạo (AI) ngày càng phát triển mạnh mẽ, Zalo đã “đặt cược lớn” khi đầu tư làm sản phẩm “AI-first” đầy tiềm năng nhưng cũng không kém phần cạnh tranh: Trợ lý giọng nói. Lựa chọn của Zalo được ví gần như “đâm đầu vào đá” khi phải đối đầu cùng những “ông lớn” như Google hay Microsoft…
Làm trợ lý giọng nói tiếng Việt - quyết định táo bạo của Zalo
Chia sẻ trong một buổi phỏng vấn gần nhất với truyền thông, nhà sáng lập Zalo Vương Quang Khải - người được mệnh danh là “chàng Don Quixote” của làng công nghệ Việt Nam, bất ngờ tiết lộ rằng “Zalo từng cách mỏ vàng Crypto chỉ một cái gật đầu”, nhưng cuối cùng lại quyết định “đặt cược” vào AI.
Tại sao Zalo lại chọn AI thay vì crypto? Trong khi nhiều người trở thành triệu phú nhờ đầu tư vào crypto, quyết định của Zalo có vẻ như đi ngược lại xu hướng.
“Đó có lẽ là lựa chọn từ trực giác của một kỹ sư với nỗi ám ảnh bị tụt hậu khỏi dòng chảy phát triển công nghệ, còn thực tế tôi không có nhiều thông tin. Khi ra quyết định tôi cũng không tự tin, nhất là giai đoạn khoảng năm 2020-2021, khi AI chưa có nhiều thành tựu rõ rệt thì crypto lại cực kỳ hấp dẫn”, ông Khải nhớ lại.
Tuy nhiên, với góc nhìn của một kỹ sư, “cha đẻ” của Zalo nhận thấy tiềm năng ứng dụng rộng lớn của AI trong cuộc sống hàng ngày.
Lựa chọn tập trung vào trợ lý giọng nói, theo ông Khải, còn dựa trên những phân tích sâu sắc về xu hướng phát triển của công nghệ và thế mạnh sẵn có của Zalo. Vào thời điểm thị trường tiền mã hoá tăng trưởng, đa số ứng dụng của crypto đều liên quan đến tài chính, cũng là ngành mà Zalo không có nhiều lợi thế.
Trong khi đó, các “Big Tech” như Google, Facebook, Microsoft, Amazon, Apple đều không tham gia crypto nhưng lại đầu tư quyết liệt vào AI. Điều này càng làm nhà sáng lập Zalo vững tin vào quyết định lựa chọn lĩnh vực trí tuệ nhân tạo.
Việc tập trung phát triển trợ lý giọng nói tiếng Việt cũng là một quyết định táo bạo nữa của Zalo. Trong khi các ông lớn công nghệ đang cạnh tranh nhau trên thị trường trợ lý ảo toàn cầu, Zalo lại chọn một hướng đi khác biệt: địa phương hóa AI. Kiki được thiết kế đặc biệt để phục vụ người dùng Việt Nam, với khả năng hiểu và đáp ứng các yêu cầu bằng tiếng Việt một cách chính xác và tự nhiên.
Ông Khải cho rằng giọng nói là một phương thức giao tiếp tự nhiên và hiệu quả, đặc biệt là trong bối cảnh người dùng ngày càng bận rộn. “Khi chúng ta sử dụng các thiết bị như điện thoại, tốc độ gõ phím khá chậm, còn nói thì nhanh hơn nhiều. Vì thế, tôi tin rằng giọng nói sẽ là một phương pháp chính để con người trao đổi với máy móc trong tương lai”.
Không chỉ vậy, việc phát triển trợ lý giọng nói tiếng Việt sẽ giúp Zalo tận dụng lợi thế từ chức năng gửi tin nhắn thoại đã có từ trước và hiểu biết sâu sắc về thị trường nội địa.
Trợ lý giọng nói "make in Vietnam" có gì đặc biệt?
Con đường phát triển trợ lý Kiki không hề bằng phẳng. Đội ngũ đã phải đối mặt với nhiều khó khăn, ngay cả trong việc thu hút nhân tài AI do vấp phải sự cạnh tranh khốc liệt từ các "ông lớn" công nghệ. Tương tự OTT, AI cũng là ngành công nghệ world-class (đẳng cấp thế giới). Những người giỏi nhất chỉ có ở Mỹ hay Trung Quốc với các công việc rất tốt không lý do gì bỏ sự nghiệp đầy triển vọng để về Việt Nam. Ngoài khó khăn nhân sự, máy móc phần cứng và dữ liệu cũng là một bài toán Zalo AI cần giải.
Tuy nhiên, bằng tinh thần “ngây thơ không biết sợ”, đội ngũ non trẻ thời bấy giờ của Zalo AI đã vượt qua mọi trở ngại. “Chính những kỹ sư trẻ, ngây thơ và đầy nhiệt huyết ấy đã tạo nên xương sống cho đội ngũ của Zalo AI bây giờ,” ông Khải khẳng định.
Một trong những bài học quý giá đội ngũ Zalo AI rút ra được từ quá trình phát triển Kiki là tập trung vào những tính năng cốt lõi, đáp ứng nhu cầu thực tế của người dùng.
Trước khi Kiki ra đời, thị trường trợ lý ảo toàn cầu đã có 2 cái tên rất sáng giá là Amazon Alexa và Google Assistant. Cả hai sản phẩm quốc tế này đều có rất nhiều chức năng, khiến đội ngũ bị cuốn vào việc cố nghĩ ra nhiều tính năng vui vẻ tương tự. “Đây là sai lầm,” ông Khải nói.
Vị lãnh đạo Zalo và đội ngũ kĩ sư nhận ra thay vì “so kè” phải giỏi hơn Android Auto hay Apple Carplay, đội ngũ cần xác định đúng nhu cầu của người dùng Việt Nam và đáp ứng thật tốt điều đó.
Do đó, Zalo không cố gắng tạo ra một trợ lý đa năng với hàng loạt tính năng hào nhoáng mà tập trung vào 2 chức năng chính: nghe nhạc và dẫn đường. Đây cũng là điểm mạnh của Kiki.
Khi so với các đối thủ cạnh tranh quốc tế, trợ lý giọng nói của Zalo có ưu thế vì có tính địa phương hóa cao, còn khi so với thị trường nội địa, Kiki rất thực dụng và hữu ích đối với người dùng. Nhờ đó, Kiki đã đạt được độ chính xác cao và trở thành trợ lý đắc lực cho tài xế.
Đơn cử như nhờ kinh nghiệm vận hành Zing MP3, đội ngũ Zalo biết người Việt thích nghe những ca khúc nào, ca sĩ nào. “Vì thế dù gọi sai tên của bài hát hay phát âm ‘ngọng’ tên ca sĩ tiếng Anh thì Kiki vẫn hiểu đúng. Tương tự như vậy với bản đồ, khi chúng tôi lên danh sách từng con phố, từng địa điểm phổ biến ở các thành phố lớn khắp Việt Nam”, ông Vương Quang Khải chia sẻ.
Nhờ định hướng đi vào “ngách hẹp,” tận dụng lợi thế có sẵn, Kiki đã trở thành một trong những ứng dụng trợ lý giọng nói phổ biến nhất tại Việt Nam. Theo nhà sáng lập Zalo, ước tính cứ 5 xe ô tô đang chạy trên đường ở Việt Nam sẽ có 1 xe cài Kiki. Đây cũng là ứng dụng chiếm thị phần nhanh nhất trong lịch sử Zalo.
Với gần 1 triệu lượt cài đặt, Kiki không chỉ đơn thuần là một trợ lý giọng nói, mà còn là một người bạn đồng hành thông minh, luôn sẵn sàng hỗ trợ tài xế trên mọi nẻo đường. Liên tục được cập nhật tính năng mới, Kiki giúp người lái xe tập trung vào việc điều khiển xe, đáp ứng đa dạng nhu cầu của người dùng chỉ bằng giọng nói.
Kiki được huấn luyện với một lượng lớn dữ liệu tiếng Việt, giúp trợ lý này hiểu và đáp ứng các yêu cầu của người dùng một cách chính xác, kể cả những câu hỏi phức tạp hoặc những giọng địa phương khác nhau.
Không chỉ được người dùng cá nhân ưa chuộng, Kiki còn được các nhà sản xuất ô tô và phụ kiện tin tưởng lựa chọn. Hiện có hơn 22 đối tác hàng đầu trong lĩnh vực cung cấp linh kiện và phân phối ô tô tại Việt Nam tích hợp Kiki vào sản phẩm của mình. Điều này cho thấy tiềm năng phát triển rất lớn của trợ lý ảo này trên thị trường Việt Nam.
Sự thành công của Kiki không chỉ là một câu chuyện về một sản phẩm công nghệ, mà còn là minh chứng cho sự phát triển mạnh mẽ của ngành AI tại Việt Nam. Trong tương lai, người dùng có thể kỳ vọng sẽ thấy Kiki xuất hiện trên nhiều thiết bị thông minh hơn nữa, phục vụ tối đa đời sống của người dùng Việt Nam.
Trợ lý giọng nói tiếng Việt Kiki là một sản phẩm trí tuệ nhân tạo của Zalo, ra mắt từ cuối năm 2020. Ứng dụng các công nghệ tiên tiến hiện nay của thế giới như xử lý ngôn ngữ tự nhiên, biểu đồ tri thức, dữ liệu lớn (big data), Kiki có thể thực hiện được nhiều tác vụ phổ biến trong đời sống, thông qua việc ra lệnh bằng giọng nói.
Khi được tích hợp lên ôtô, trợ lý giọng nói Kiki mang đến trải nghiệm rảnh tay (hand-free), giúp tài xế tập trung và lái xe an toàn hơn. Hiện tại đã có gần 1 triệu ô tô cài đặt trợ lý giọng nói Kiki tại Việt Nam.