Apple có sợ 'ảo giác AI'?

Thứ năm, 15/8/2024 07:31 (GMT+7)
07:31 15/8/2024

Để AI của mình không gặp "ảo giác" - hiện tượng đưa thông tin sai lệch, không có thật, Apple đã chèn những câu lệnh cấm trí tuệ nhân tạo cung cấp thông tin sai lệch.

Được công bố tại WWDC 2024, Apple Intelligence là loạt tính năng trí tuệ nhân tạo (AI) trên iPhone, iPad và máy tính Mac, có khả năng tạo nội dung, hình ảnh và tóm tắt văn bản.

Với Apple Intelligence, người dùng có thể tạo hình ảnh thông qua Image Playground và nhận tóm tắt email, thông báo và nhiều loại văn bản khác nhau.

Ngoài ra, AI của Apple còn tính năng Smart Replies, giúp trả lời email và tin nhắn dễ dàng hơn đáng kể. Tuy nhiên, cũng tương tự những hệ thống AI khác, nhiều người đặt câu hỏi về hiện tượng ảo giác với Apple Intelligence.

Cấm cung cấp thông tin sai lệch

Theo IBM, ảo giác (hallucination) là hiện tượng mô hình ngôn ngữ lớn (LLM) - thường là chatbot hoặc công cụ thị giác máy tính - nhận mẫu dữ liệu không tồn tại hoặc không thể nhận dạng với con người, từ đó tạo kết quả vô nghĩa hoặc sai lệch.

Nói cách khác, người dùng thường yêu cầu AI tạo kết quả chính xác, dựa trên dữ liệu đã đào tạo. Tuy nhiên trong một số trường hợp, kết quả của AI không dựa trên dữ liệu chính xác, tạo phản hồi "ảo giác".

Trong báo cáo độc quyền của AppleInsider về dự án BlackPearl, để giải quyết, một số câu lệnh (prompt) đã được Apple xác định trước và tích hợp vào hệ điều hành, đóng vai trò là rào cản cho trí tuệ nhân tạo này.

Một câu lệnh (prompt) ngăn AI bịa đặt thông tin được Apple chèn vào trong bản thử nghiệm đầu tiên macOS 15.1. Ảnh: Reddit/devanxd2000.

Trong một ví dụ, prompt của Apple bắt đầu bằng cách ra lệnh trực tiếp cho AI đảm nhận vai trò của một chuyên gia trong việc tạo bản tóm tắt của một loại văn bản cụ thể.

AI được yêu cầu duy trì vai trò này và giới hạn phản hồi của mình ở độ dài được xác định trước là 10 từ, 20 từ hoặc ba câu, tùy thuộc vào mức độ tóm tắt cần thiết.

Khi tóm tắt tin nhắn, thông báo và ngăn xếp thông báo, phần mềm AI của Apple được yêu cầu tập trung vào các chi tiết chính có liên quan đến người dùng cuối như tên, địa điểm và ngày tháng. AI tạo sinh cũng được hướng dẫn tập trung vào chủ đề chung của tất cả các thông báo.

AppleInsider nhận định, đoạn prompt này đã mang đến cái nhìn sâu sắc về các vấn đề mà Apple dự đoán và giải thích chính xác những gì phần mềm AI cần tránh khi tạo phản hồi bằng văn bản hoặc khi tạo hình ảnh.

Ảo giác thường liên quan đến não người hoặc động vật chứ không phải máy móc. Tuy nhiên, khái niệm này cũng được dùng với AI bởi mô tả chính xác cách mô hình tạo kết quả.

Nó tương tự cách con người đôi khi thấy vật thể kỳ lạ trên trời, âm thanh không rõ nguồn gốc hoặc thứ gì đó chạm vào cơ thể.

Theo một người dùng trên Reddit phát hiện, để ngặn chặn điều này, Táo khuyết đã chèn prompt vào công cụ soạn thảo với chỉ thị mang tính hàng rào an toàn.

Cụ thể, phía Apple đặt ra tình huống: "Bạn là trợ lý giúp người dùng trả lời thư của họ. Khi nhận được thư, ban đầu bạn sẽ cung cấp bản nháp phản hồi dựa trên một đoạn trích trả lời ngắn. Để bản nháp phản hồi đẹp và đầy đủ hơn, bạn sẽ cung cấp một bộ câu hỏi và câu trả lời".

Với prompt này, Apple Intelligence được yêu cầu viết một bản trả lời ngắn gọn và tự nhiên bằng cách sửa đổi bản nháp phản hồi để kết hợp các câu hỏi đã cho với câu trả lời của chúng.

Một đoạn prompt của Apple được sử dụng cho các tính năng như tóm tắt email. Ảnh: AppleInsider.

Ở phần cuối, AI được yêu cầu giới hạn câu trả lời trong vòng 50 từ. Đặc biệt, trí tuệ nhân tạo không được "ảo tưởng" hoặc bịa ra thông tin thực tế.

Ngăn chặn nội dung không phù hợp

Ngoài vấn đề ảo giác, Apple còn ngăn AI của mình tạo ra nội dung phản cảm. Những hạn chế đã được Táo khuyết đặt cho tính năng Memories có sẵn trong ứng dụng Photos.

"Không tạo nội dung liên quan đến tôn giáo, chính trị, gây hại, bạo lực, tình dục, tục tĩu hoặc bất kỳ nội dung gây tiêu cực, buồn bã hoặc khiêu khích", trích từ đoạn prompt của Apple trong tính năng Memories.

AppleInsider dẫn một số nguồn tin nội bộ cho biết Apple luôn muốn ngăn phần mềm AI của mình tạo ra những loại nội dung này.

Trong các công cụ kiểm tra nội bộ liên quan đến Apple Intelligence, phần mềm của nhà sản xuất iPhone sẽ từ chối tạo phản hồi nếu có ngôn ngữ xúc phạm trong đoạn prompt do người dùng cung cấp.

Trong cuộc phỏng vấn với The Washington Post, Cook thừa nhận "chưa từng khẳng định" Apple Intelligence hoàn toàn không tạo ra thông tin sai lệch hoặc gây hiểu lầm.

Apple đã thực hiện nhiều biện pháp kiểm tra để ngăn công cụ AI tạo ra nội dung phản cảm và vi phạm bản quyền. Ảnh: AppleInsider.

"Tôi nghĩ chúng tôi đã hoàn thành mọi thứ cần làm, bao gồm cân nhắc kỹ mức độ sẵn sàng áp dụng công nghệ vào các lĩnh vực. Do đó, tôi tin chắc (Apple Intelligence) sẽ có chất lượng rất cao. Nhưng phải thành thật rằng độ chính xác có thể không đến 100%. Tôi chưa từng khẳng định điều này", Cook nhấn mạnh.

Mặc dù vậy, với những đoạn prompt mang tình rào chắn, có thể thấy Apple đã rất cẩn thận để đảm bảo an toàn cho người dùng.

Apple Intelligence được thiết kế để cung cấp các tính năng AI với những lợi ích hữu hình giúp giao tiếp dễ dàng hơn, cho dù là thông qua hình ảnh do AI tạo ra hay văn bản tóm tắt do AI tạo ra.

Tuy nhiên, AppleInsider cũng cho rằng những đoạn prompt của Apple dù có tác dụng giảm tỷ lệ ảo giác và ngăn chặn việc tạo ra nội dung không phù hợp, nhưng chừng đó là không đủ để ngăn chặn cả hai điều này xảy ra.

Theo đó, người dùng vẫn có thể tìm ra cách "lách" để thao túng đoạn prompt, vì vậy không có gì đảm bảo rằng AI của Apple sẽ không gây ảo giác hoặc tạo ra nội dung phản cảm.

Những câu chuyện bên trong Apple

Văn hóa bí mật luôn là một điểm đặc biệt của Apple. Cuộc đời Steve Jobs, Tim Cook và quá trình sáng tạo những sản phẩm quan trọng như iPhone thường chỉ được tiết lộ qua những trang sách, nơi các tác giả dành nhiều năm để mang tới những câu chuyện hấp dẫn