Trong vài ngày qua, Google Dịch trở thành trò đùa trên mạng xã hội. Cụ thể, khi người dùng điền câu “what doing you now” từ tiếng Anh sang tiếng Việt sẽ nhận được kết quả có nội dung “sai rồi ĐM, phải là ‘What are you doing now'”.
Nhiều người dùng đăng tải lỗi này lên mạng xã hội, chia sẻ sự bất ngờ khi một công ty nổi tiếng về AI lại có lỗi ngớ ngẩn như vậy. Đến 14h ngày 16/8, bản dịch của câu tiếng Anh nêu trên đã được thay thế bằng một cụm từ tiếng Việt có nghĩa, mặc cho bản gốc bị sai ngữ pháp.
Công cụ Google Dịch trả về kết quả có nội dung sai lệch. |
Lỗi này có thể đến từ tính năng đóng góp của người dùng. Theo Google, việc đóng góp bản dịch giúp cải thiện sự chính xác của ngôn ngữ. Tuy nhiên, tính năng này cũng nhiều lần bị lợi dụng để cho ra các kết quả dịch khó hiểu, vô nghĩa hoặc nực cười.
Google dùng các bản dịch trên web dựa theo ngữ cảnh để đưa vào hệ thống trí tuệ nhân tạo của mình. Trong trường hợp này, vì câu tiếng Anh bị sai ngữ pháp nên sẽ không có bản đóng góp nghĩa tiếng Việt. Có thể một số người dùng đã lợi dụng lỗ hổng này trong chính sách của Google Dịch để cung cấp bản dịch có nội dung sai lệch.
Đây không phải lần đầu công cụ dịch tiếng Việt của Google cho kết quả bị sai lệch. Năm 2019, khi dịch câu “go o morning” từ tiếng Anh sang tiếng Việt, kết quả trả về là “tiếng Anh ghi cũng ngu, phải là good Morning”. Hay cụm từ “I’m tr” bị dịch thành “sai chính tả rồi má”.
Ngày 25/1/2019, nhiều video trên kênh YouTube của DJ Alan Walker đã bị đổi tên bằng cách đóng góp bản dịch. Bài hát Alone - MV với 1,1 tỷ lượt xem của DJ Alan Walker đã bị đổi tên thành "Alan Walker - Một mình (Alone) - Các bạn qua kênh "*** Nhạc 8D" nghe nhạc nhé".
Trên Reddit, có hẳn một cộng đồng tên Translate Gate để người dùng đăng tải những trường hợp dịch thuật ngớ ngẩn của Google Dịch. Nhiều người dùng trên Twitter thậm chí đặt giả thuyết những kết quả dịch khó hiểu được thu thập từ những email, tin nhắn riêng tư của người dùng.
Năm 2018, đại diện Google là Justin Burr giải thích với Vice rằng giả thuyết trên là không đúng. "Google Translate học hỏi từ những ví dụ dịch thuật trên web, và không dùng đến cũng như không có quyền truy cập vào những tin nhắn riêng tư. Việc dịch thuật khó hiểu chỉ là kết quả của việc liên tục đưa những từ khóa vô nghĩa vào hệ thống", ông Burr khẳng định.
Nói với Vice, Alexander Rush, giáo sư dự khuyết chuyên ngành xử lý dữ liệu tự nhiên tại đại học Harvard cho rằng đúng ra các bộ lọc kiểm định chất lượng nội bộ của Google phải phát hiện những bản dịch lỗi.
Sean Colbath, nhà khoa học tại BBN Technologies thì cho rằng với một số ngôn ngữ liên quan nhiều đến tôn giáo, Google có thể sử dụng các tài liệu như Kinh thánh để huấn luyện cỗ máy của mình. Điều đó khiến kết quả đầu ra cũng bị lệch. Ông Burr, đại diện của Google từ chối xác nhận hoặc phủ định các ý kiến nói trên.
Lạm dụng tính năng đóng góp cộng đồng không phải chuyện chỉ xảy ra với Google Dịch. Năm 2016, nhiều người chơi Pokemon Go trong nước đã phá hoại dữ liệu bản đồ Google Maps bằng cách tạo nhiều địa điểm ảo hoặc vị trí mới nhằm tăng số lượng PokeStop - khu vực người chơi nhận các vật phẩm miễn phí nhưng cần thiết, như bóng Pokeball, các loại đá hồi phục sức lực cho Pokemon…
Thậm chí, có một số người còn đặt lại tên cho địa điểm, tạo địa điểm giả mạo và “dời” nhiều địa danh từ nơi này qua nơi khác.