Bạn có thể chuyển sang phiên bản mobile rút gọn của Tri thức trực tuyến nếu mạng chậm. Đóng

TL;DR

Câu chuyện phía sau Kiki - Trợ lý tiếng nói của người Việt

Trợ lý ảo Kiki thể hiện khát vọng thực hiện sản phẩm "AI-first" của đội ngũ Zalo.

tro ly ao kiki anh 1

“Kiki ơi. Dẫn đường đi Vũng Tàu”.

“Đây là chỉ đường trên ứng dụng bản đồ”, trợ lý ảo trên xe hơi trả lời. Chỉ chưa đầy 1 giây sau, đường đi đã được trợ lý ảo Kiki hiển thị để sẵn sàng lên đường.

Đó chỉ là một trong số ít trải nghiệm của anh Trần Mạnh Hiệp, quản trị viên diễn đàn Tinhte với trợ lý ảo Kiki. Chỉ sau thời gian ngắn sử dụng, anh Hiệp đã có ấn tượng tốt với Kiki.

Trải nghiệm trợ lý ảo tiếng Việt Kiki trên ôtô Trợ lý ảo Kiki có thể nhận lệnh bằng tiếng Việt, hỗ trợ chỉ đường, nghe nhạc, đọc tin tức và tìm kiếm các thông tin khác.

“Điểm tôi thích nhất ở Kiki là nó hỗ trợ tiếng Việt, và lại là giọng tiếng Việt rất thân thiện. Không phải loại xe nào cũng có trợ lý ảo tiếng Việt, mà Kiki thì được tích hợp vào những ứng dụng mà hầu như ai cũng có sẵn trên smartphone”, anh Hiệp chia sẻ với Zing sau khi trải nghiệm Kiki.

Sản phẩm thể hiện tầm nhìn “AI-first”

Kiki có lẽ là sản phẩm thích hợp nhất để Zalo giải thích về tầm nhìn “AI-first” (AI là nhân vật chính) của mình. Đã đầu tư vào nghiên cứu trí tuệ nhân tạo nhiều năm, những người đứng đầu của Zalo hiểu rằng trí tuệ nhân tạo sẽ chỉ thực sự thay đổi cuộc sống của người dùng khi được tích hợp vào những sản phẩm gần gũi, sử dụng hàng ngày.

"Khi làm AI, chúng ta không chỉ muốn những hệ thống rất hay, phức tạp mà không nhìn thấy. Chúng ta muốn những sản phẩm AI-first, trong đó AI là tác nhân trực tiếp tạo ra những thay đổi trong cuộc sống. Đó là khát vọng của chúng ta", ông Vương Quang Khải, lãnh đạo Zalo chia sẻ tại Zalo AI Summit, diễn ra tháng 12/2020.

Zalo trong nhiều năm qua đã ra mắt nhiều sản phẩm thay đổi cuộc sống, trải nghiệm của người dùng như Zing MP3 hay Zalo. Tuy nhiên, đơn vị này định hướng sản phẩm quan trọng tiếp theo của Zalo sẽ là một sản phẩm trí tuệ nhân tạo bởi những tác động lớn lao của AI với cuộc sống con người.

tro ly ao kiki anh 2

Trợ lý ảo có lẽ là sản phẩm trí tuệ nhân tạo gần gũi nhất hiện nay. Sử dụng giọng nói, phương thức giao tiếp cơ bản và tự nhiên nhất của con người, trợ lý ảo hoàn toàn có thể trở thành bước nhảy tiếp theo về giao diện và công nghệ.

“Trợ lý ảo đại diện cho bước thay đổi nền tảng và giao diện lớn thứ ba trong ba thập kỷ qua, sau web năm 1990 và smartphone khoảng thập niên 2010. Mỗi bước đều thay đổi cách con người tương tác và truy cập nội dung số.

Cả cái click chuột trên nền web, hay cái chạm trên smartphone đều yêu cầu người dùng học một ‘ngôn ngữ’ mới để tương tác với công nghệ. Bước chuyển sang giọng nói không yêu cầu sự luyện tập gì cả. Người dùng chỉ cần nói thật tự nhiên”, tạp chí Harvard Business Review nhận định vào năm 2019.

Giọng nói là phương thức giao tiếp tốt nhất giữa con người với máy tính, và sẽ là công cụ chính để con người giao tiếp với máy tính trong 5-10 năm tới.

Ông Vương Quang Khải, lãnh đạo Zalo.

Giải thích kỹ hơn về lý do chọn trợ lý ảo giọng nói, đội ngũ phát triển Zalo cho rằng không chỉ tự nhiên hơn gõ phím, giọng nói còn đem lại khả năng tương tác với tốc độ cao hơn nhiều.

“Giọng nói là phương thức giao tiếp tốt nhất giữa con người với máy tính. Tiếng nói rất tự nhiên, một em bé dưới 1 tuổi đã có thể nói được rồi. Giọng nói cũng có thể truyền tải dữ liệu với tốc độ rất cao. Người đánh máy chuyên nghiệp có thể gõ được khoảng 100 từ/phút, nhưng người nói nhanh có thể nói 120-150 từ/phút một cách dễ dàng.

Với những ưu điểm đấy, giọng nói sẽ là công cụ chính để con người giao tiếp với máy tính trong 5-10 năm tới”, ông Khải chia sẻ. Lãnh đạo Zalo cũng cho rằng có lẽ chỉ những ứng dụng trực tiếp đọc tín hiệu từ não mới vượt trội so với giọng nói.

Sự đơn giản còn giúp cho trợ lý ảo giọng nói giúp mọi người tận dụng lợi thế của công nghệ. Không chỉ những người rành công nghệ, bất cứ ai, từ trẻ em tới người già đều có thể làm quen và sử dụng trợ lý ảo.

“Với công cụ trợ lý ảo, chúng ta có thể mang công nghệ đến mọi người. Đó là lý do chúng tôi phát triển sản phẩm AI-first như trợ lý ảo”, ông Khải kết luận.

“Ước mơ” của đội ngũ phát triển

Được giới thiệu từ sự kiện Zalo AI Summit năm 2018, ban đầu Kiki chỉ hoạt động trên nền tảng Android. Sau 2 năm phát triển, trợ lý ảo này đã xuất hiện trên hàng loạt nền tảng mới như iOS, trên xe hơi và cả loa thông minh.

“Sau hai năm thì đội ngũ Kiki đã đưa được trợ lý ảo lên loa thông minh”, Nguyễn Hoàng Khánh Duy, thành viên phát triển Kiki chia sẻ về “ước mơ” của cả nhóm đã trở thành hiện thực vào cuối năm 2020.

Tất nhiên, ra mắt được trợ lý ảo là một chuyện, đội ngũ Zalo vẫn phải liên tục cải thiện khả năng của Kiki trong suốt gần 2 năm. Với mỗi công dụng của Kiki, đội ngũ đều phải giải nhiều bài toán trong thực tế sử dụng.

tro ly ao kiki anh 3

Đối với chức năng mở nhạc, nhiều khi người dùng chẳng thể nhớ nổi tên bài hát, mà chỉ thuộc một đoạn trong lời, thậm chí phần thuộc đó cũng không chính xác. Để giải quyết bài toán xử lý ngôn ngữ tự nhiên trong thực tế này, Duy cho biết nhóm phát triển phải tích hợp thêm tính năng nhận biết lời bài hát cũng như dự đoán tên bài hát gần chính xác.

“Với trợ lý ảo, bạn chỉ có một cơ hội duy nhất để đưa ra kết quả cho người dùng. Nếu lựa chọn bài hát sai để bật, đó sẽ là một trải nghiệm không vui vẻ”, Duy chia sẻ.

Với trợ lý ảo, bạn chỉ có một cơ hội duy nhất để đưa ra kết quả cho người dùng. Nếu lựa chọn bài hát sai để bật, đó sẽ là một trải nghiệm không vui vẻ.

Nguyễn Hoàng Khánh Duy, thành viên nhóm phát triển Kiki.

Trả lời câu hỏi cũng là một chức năng quan trọng của trợ lý ảo. Giống như phần tìm kiếm bài hát, đưa ra câu trả lời đúng cũng là phần ảnh hưởng rất lớn tới trải nghiệm người dùng. Ngoài ra, trợ lý ảo còn phải liên tục cập nhật, đưa ra những dữ liệu mới nhất.

“Chúng tôi muốn Kiki có khả năng phản hồi càng nhiều câu hỏi càng tốt, nhưng chất lượng câu trả lời cũng rất quan trọng”, Nguyễn Trường Sơn, thành viên nhóm phát triển Kiki chia sẻ.

“Khi phát triển sản phẩm, nhiều lúc bạn hình dung bài toán sẽ như thế này. Tuy nhiên, khi đã ra mắt rồi sẽ có những vấn đề khác, bài toán khác mà bạn phải làm. Đó là những bài toán thật sự của người dùng, và chỉ khi giải quyết được những bài toán ấy thì sản phẩm mới thành công”, Khánh Duy kết luận.

Con đường phía trước của trợ lý ảo Việt Nam

Tại thời điểm được giới thiệu trên xe hơi và loa thông minh vào tháng 12/2020, Kiki gần như đã được tích hợp hoàn chỉnh trên cả 2 nền tảng phổ biến hiện nay là Android Auto và Apple CarPlay.

Đây cũng là 2 nền tảng hệ điều hành chính trên xe hơi, xuất hiện trên phần lớn xe tầm trung ra mắt trong vòng 2 năm nay. Tuy nhiên, với mong muốn phục vụ được nhiều khách hàng nhất có thể, đội ngũ Kiki không dừng lại ở đó.

“Hai nền tảng đó là những nền tảng chính, nhưng chỉ là với xe đời mới hoặc cao cấp. Ngoài ra, mình phải hỗ trợ những xe đời cũ hơn. Nhiều người chỉ lắp đầu bên thứ ba chứ không phải đầu theo xe. Mình sẽ cố gắng hỗ trợ được nhiều đối tác, nền tảng nhất”, ông Phạm Kim Long, trưởng nhóm phát triển Kiki chia sẻ.

tro ly ao kiki anh 4

Khi được hỏi liệu có lo lắng khi các nền tảng lớn của Google hay Apple được tích hợp sâu hơn trên các hệ thống xe hơi, ông Long cho rằng khả năng thấu hiểu người Việt của Kiki sẽ là điểm nhấn.

“Google họ có xử lý tiếng Việt rồi, nhưng mình vẫn tự tin là Kiki sẽ làm tốt hơn về mặt nội dung như nghe nhạc, tin tức. Có nhiều thứ như hỏi về giá xăng, thời tiết, Kiki vẫn hiểu tốt hơn về thói quen, nhu cầu của người Việt hơn.

Trợ lý ảo của các ông lớn có thể làm tốt bài toán tổng quá mà cả thế giới cần, nhưng Kiki có thể hiểu rõ hơn nhu cầu, thói quen của người Việt.

Ông Phạm Kim Long, trưởng nhóm phát triển Kiki.

Những ông lớn có thể xử lý tốt ngôn ngữ ở lớp ngoài, giải những bài toán tổng quát mà cả thế giới cần, nhưng mình tin rằng Kiki vẫn làm được tốt hơn nhu cầu sâu bên trong của người Việt”, ông Long khẳng định.

Cũng có chung nhận định rằng Kiki có lợi thế riêng, nhưng anh Trần Mạnh Hiệp lại cho rằng lợi thế đó đến từ những dịch vụ mà Zalo đã xây dựng trước đó như Zalo, Zing MP3.

“Khi đi xe thì chủ yếu tôi sẽ dùng tìm đường, nghe nhạc, hoặc gọi điện cho người khác mà không muốn phải thao tác trên điện thoại. Hai tính năng đầu thì giờ Kiki đã làm tốt rồi.

Tôi biết sẽ rất khó để các hãng như Apple, Google mở hết mọi tính năng cho trợ lý ảo thứ ba. Tuy nhiên, Kiki có thể tận dụng luôn tính năng gọi điện trên Zalo, vốn cũng có nhiều người dùng”, anh Trần Mạnh Hiệp chia sẻ với Zing.

Trợ lý giọng nói tiếng Việt Kiki dùng trên xe Maserati, loa thông minh

Tại Zalo AI Summit lần 4 diễn ra tại TP.HCM ngày 20/12, trợ lý Tiếng Việt Kiki do Zalo AI phát triển đã chính thức ra mắt.

Tuấn Anh

Bạn có thể quan tâm