Từ năm 2017, AI (trí tuệ nhân tạo) bắt đầu được người dùng chú ý nhờ các ứng dụng thực tiễn, đặc biệt là sự đầu tư mạnh tay từ các tập đoàn lớn như Amazon với Alexa, Google với Google Assistant hay Apple với Siri.
Tuy vậy những trợ lý ảo trên chỉ được đầu tư để hiểu tốt tiếng Anh và tương thích với các ứng dụng nước ngoài. Điều này tạo ra khoảng trống giao thoa giữa công nghệ Việt Nam và thế giới, cần có một trợ lý ảo phục vụ riêng cho người Việt.
Trợ lý ảo đầu tiên cho người Việt
Ngày 26/12, tại sự kiện Zalo AI Summit 2018, Zalo cho biết họ đang bước đầu xây dựng một trợ lý ảo có khả năng giao tiếp tốt bằng tiếng Việt. Đây được xem là một trong những thành tựu đầu tiên sau khi ông Vương Quang Khải tiết lộ trung tâm nghiên cứu Zalo AI vào cuối năm 2017.
Ki-Ki của Zalo là trợ lý ảo sử dụng trí tuệ nhân tạo đầu tiên của Việt Nam. |
Trợ lý ảo sử dụng trí tuệ nhân tạo của Zalo có tên Ki-Ki. Qua video trải nghiệm bản beta, Ki-Ki có khả năng nhận diện khá tốt giọng nói tự nhiên của người Việt. Bên cạnh đó, Ki-Ki cũng trả lời bằng giọng của ba miền gồm Bắc, Trung, Nam khá tự nhiên.
Trước Ki-Ki, nhiều startup công nghệ cũng sử dụng AI cho một số nhu cầu đặc thù như học anh văn, chatbot... Trợ lý ảo có khả năng đa nhiệm, phục vụ nhiều thói quen và liên kết với các ứng dụng Việt vẫn chưa có bên nào thật sự trình làng.
Tại sự kiện Zalo AI Summit 2017, một số diễn giả cho rằng Việt Nam bắt đầu phát triển công nghệ trí tuệ nhân tạo còn nhiều bỡ ngỡ so với các nước trên thế giới. "Làm AI ở Việt Nam gặp nhiều khó khăn cả về con người và cơ sở hạ tầng. Nghiên cứu trí tuệ nhân tạo cần rất nhiều tiền", diễn giả Bạch Hưng Nguyên đến từ Alibaba, tập đoàn công nghệ lớn nhất Trung Quốc chia sẻ.
Tuy vậy, các diễn giả tham gia đều tin rằng các cá nhân và các doanh nghiệp Việt nếu có quyết tâm có thể tự lực để đón sóng công nghệ trí tuệ nhân tạo thay vì bị động chờ đợi các chương trình cấp quốc gia.
Việc công bố dự án trợ lý ảo Ki-Ki chỉ sau một năm thành lập trung tâm Zalo AI phần nào cho thấy các kỹ sư Việt Nam có khả năng hội nhập với làng công nghệ thế giới, áp dụng cho những nhu cầu thực tế, phục vụ riêng cho người dùng Việt.
Trợ lý ảo sẽ giúp cai nghiện smartphone
Năm 2007, chiếc iPhone đầu tiên ra đời làm thay đổi hoàn toàn nền công nghiệp di động và thói quen của người dùng. Điện thoại nút bấm dần bị thay thế bằng điện thoại cảm ứng với các thao tác vuốt, chạm, chụm... Từ đó hệ sinh thái ứng dụng và thiết kế của điện thoại cũng bắt buộc phải thay đổi theo.
Hơn 10 năm trôi qua, vẫn chưa có một cuộc cách mạng nào thực sự có thể thay đổi thói quen của người dùng. Tuy vậy, những năm gần đây, sự phát triển của công nghệ AI, nhận diện giọng nói và máy học hứa hẹn sẽ tạo ra một cuộc cách mạng mới về hình thức tương tác với các thiết bị công nghệ. Không bấm, không vuốt, người dùng tương lai có thể sẽ chuyển sang nói.
Thay đổi thói quen vuốt, chạm phần nào giúp người dùng giảm thời gian sử dụng thiết bị công nghệ. |
Ưu điểm của ra lệnh giọng nói là giúp người dùng tương tác với thiết bị ít hơn nhưng có hiệu suất làm việc cao hơn. Điều này rất cần thiết cho lối sống đa nhiệm. Người dùng có thể vừa chuẩn bị bữa sáng, vừa nghe trợ lý ảo đọc tin tức. Hay có thể vừa lái xe và ra lệnh tìm kiếm đường. Giọng nói là hình thức tương tác giúp rút ngắn thời gian nhập lệnh tốt nhất hiện nay.
Ngoài ra, trợ lý ảo nhận lệnh bằng giọng nói có thể giúp người dùng giảm dần thời gian sử dụng điện thoại di động, điều mà các ông lớn công nghệ bắt đầu quan tâm.
Những năm gần đây "Thế hệ cúi đầu" là danh từ đang được sử dụng rộng rãi để chỉ những người ôm khư khư chiếc điện thoại thông minh, dán mắt vào màn hình. Với hình thức tương tác bằng giọng nói, người dùng sẽ giảm tối thiểu thời gian sử dụng thiết bị.
Ở một số trường hợp, người dùng chỉ muốn xem giờ trên smartphone. Thế nhưng thói quen sử dụng và sự thu hút của thiết bị khiến họ mất từ 1-3 phút chỉ để kiểm tra các thông báo. Dù ban đầu, mục đích của người dùng là để xem giờ. Với trợ lý ảo, người dùng chỉ cần ra lệnh giọng nói và nhận được kết quả bằng giọng nói.
Phát triển trợ lý ảo cần những gì?
Để trợ lý ảo thân thiện với người dùng thì khả năng nghe, hiểu và trả lời bằng ngôn ngữ tự nhiên là điều quan trọng nhất. Đây chính là thế mạnh mà các doanh nghiệp Việt Nam cần tận dụng, bởi chỉ người Việt mới có thể vận dụng tốt ngôn ngữ mẹ đẻ của mình.
Để cải thiện khả năng nghe và nói cho trợ lý ảo, việc quan trọng nhất là xây dựng kho dữ liệu khổng lồ về nhận dạng giọng và trả lời bằng ngôn ngữ tự nhiên. "Trợ lý ảo khác chatbot ở chỗ cá nhân hóa hơn, hiểu được thói quen của người dùng", diễn giả Phạm Kim Long, tác giả của hai bộ gõ Labankey và Unikey chia sẻ.
Kho dữ liệu nhận diện giọng nói và ngôn ngữ tự nhiên là hai yếu tố quan trọng giúp người dùng có thể tương tác tốt với trợ lý ảo. |
Cũng theo diễn giả Phạm Kim Long, trợ lý ảo cần phải là một nền tảng mở, có khả năng hoạt động, liên kết với nhiều nền tảng ứng dụng khác để giúp ích cho cuộc sống của người dùng.
Trước mắt, Ki-Ki của Zalo đã có thể thực hiện các tác vụ cơ bản nhưng rất đặc thù nhờ liên kết với các ứng dụng Việt như Zalo, Baomoi, Zing MP3. Người dùng có thể truy xuất thông tin từ công cụ tìm kiếm, soạn thảo tin nhắn, tìm kiếm, phát nhạc, nhờ Ki-Ki đọc tin tức...
Tuy vậy, trợ lý ảo trên smartphone vẫn là chưa đủ. Trong giai đoạn bùng nổ thiết bị IoT (Internet of Things - Vạn vật kết nối) như hiện này thi bất cứ thiết bị công nghệ kết nối Internet nào cũng cần có trợ lý ảo. Một trong số đó là loa thông minh.
Các ông trùm công nghệ trên thế giới như Google, Amazon, Apple đều chuẩn bị phần cứng này cho hệ sinh thái trợ lý ảo của mình. Nhìn thấy xu hướng này, trong thời gian tới, trợ lý ảo Ki-Ki cũng sẽ được tích hợp trên loa thông minh với khả năng kết nối, ra lệnh điều khiển các thiết bị IoT trong nhà.