Bí mật của ChatGPT

Chủ nhật, 11/8/2024 14:25 (GMT+7)
14:25 11/8/2024

Công cụ của OpenAI có thể phát hiện nội dung được tạo tự động bởi ChatGPT với độ chính xác lên đến 99,9%. Tuy nhiên, họ quyết định không công bố.

Không lâu sau thời điểm tháng 11/2022, khi OpenAI đưa ChatGPT lên nền tảng web và cho phép mọi người sử dụng, nhiều trường học cấm học sinh dùng công cụ này vì lo ngại gian lận.

Học sinh có thể sử dụng AI để tạo ra bài viết theo nhiều chủ đề khác nhau hoặc giải các bài tập được giao. Đến nay, chưa có bất kỳ công cụ nào xác định được văn bản do AI tạo ra.

Tuy nhiên, theo WSJ, một ứng dụng “chống ChatGPT” thật sự tồn tại.

Phát hiện chính xác 99,9%

OpenAI thảo luận nội bộ về công cụ "đóng dấu văn bản" ChatGPT trong 2 năm qua. Nguồn tin của WSJ cho biết ứng dụng đã hoàn chỉnh từ cách đây ít nhất một năm. Nó có thể phát hiện văn bản được tạo bằng ChatGPT với độ chính xác 99,9%. Bước cuối cùng để ra mắt chỉ là “nhấn nút”.

“ChatGPT vận hành trên một hệ thống AI có khả năng dự đoán từ hoặc cụm từ nào (được gọi là token) sẽ xuất hiện tiếp theo trong câu. Công cụ chống gian lận do OpenAI phát triển điều chỉnh nhỏ cách chọn token.

Những thay đổi này sẽ để lại một dấu hiệu được gọi là watermark”, nguồn tin của WSJ, người đã đọc qua tài liệu mô tả công cụ chống ChatGPT, tiết lộ.

Bằng mắt thường, không thể thấy được các watermark này trên văn bản, nhưng công nghệ phát hiện của OpenAI thì nhận ra. Công cụ thậm chí còn đưa ra tỷ lệ toàn bộ hay một phần tài liệu được viết bởi ChatGPT.

Nhiều trường học cấm cửa ChatGPT vì lo ngại gian lận. Ảnh: iStock.

"Khả năng Mặt Trời bốc hơi vào ngày mai còn cao hơn là bài luận (do AI tạo ra) không để lại dấu hiệu", John Thickstun, một nhà nghiên cứu tại Stanford, thành viên của nhóm phát triển phương pháp đóng dấu tương tự cho văn bản AI, cho biết.

Tuy nhiên, có nhân viên OpenAI cho rằng phương pháp này có thể bị qua mặt bằng kĩ thuật đơn giản như dịch bằng Google sang ngôn ngữ khác rồi chuyển ngược trở lại hoặc yêu cầu ChatGPT thêm biểu tượng cảm xúc vào văn bản sau đó xoá thủ công.

Ai được dùng công cụ phát hiện ChatGPT?

Trong nội bộ OpenAI, cuộc bàn luận về việc cung cấp cho ai công cụ phát hiện văn bản tạo ra bởi ChatGPT thu hút sự quan tâm lớn. Hầu hết đều nghĩ điều này là lựa chọn khó khăn.

Nếu ít người dùng, công cụ sẽ không hữu ích. Nếu quá nhiều người có quyền truy cập, những kẻ xấu có thể giải mã kỹ thuật đóng watermark, từ đó tìm cách vượt qua.

OpenAI cân nhắc cung cấp trực tiếp cho các đơn vị giáo dục hoặc công ty bên thứ 3 giúp trường xác định nội dung do AI viết.

Google phát triển công cụ đóng dấu bản quyền SynthID, có thể phát hiện văn bản do Gemini AI tạo ra. SynthID đang trong giai đoạn thử nghiệm và chưa được cung cấp rộng rãi.

OpenAI cũng có một công cụ để xác định hình ảnh có phải tạo ra từng ứng dụng chuyển văn bản thành hình ảnh DALL-E 3 hay không. Công ty ưu tiên chèn watermark vào âm thanh và hình ảnh hơn là văn bản vì tác hại đáng kể hơn, đặc biệt là trong năm bầu cử ở Mỹ.

OpenAI cũng phát triển công cụ 'đóng dấu' ảnh tạo bởi DALL-E 3. Ảnh Zdnet.

Vào tháng 1/2023, OpenAI từng phát hành thuật toán giúp phát hiện văn bản được viết bởi một số mô hình AI, bao gồm cả mô hình của chính họ. Nhưng thuật toán chỉ thành công 26%. Chỉ sau 7 tháng, OpenAI đã gỡ bỏ.

Có những công cụ khác do một số đơn vị và nhà nghiên cứu độc lập phát triển để phát hiện văn bản được tạo bằng AI, được nhiều giáo viên sử dụng. Nhưng đôi khi chúng không phát hiện văn bản được sinh bởi các mô hình ngôn ngữ lớn tiên tiến và có thể tạo ra kết quả giả.

Mối đe doạ với chính ChatGPT

OpenAI lo việc phát hành công cụ có khả năng phát hiện văn bản tạo bởi ChatGPT sẽ là một quyết định “tự bắn vào chân”. Một cuộc khảo sát cho thấy khoảng 1/3 người dùng sẽ từ bỏ chatbot này nếu biện phát chống gian lận được triển khai.

Cụ thể, OpenAI ủy quyền thực hiện một nghiên cứu vào tháng 4/2023. Kết quả cho thấy sự ủng hộ trên toàn thế giới đối với một công cụ có thể phát hiện văn bản ChatGPT. Trung bình cứ 4 người được hỏi thì 3 người muốn có, chỉ một người không.

Tuy nhiên, một nghiên cứu khác của OpenAI trong cùng tháng cho thấy 69% người dùng ChatGPT nghĩ rằng công nghệ phát hiện gian lận sẽ dẫn đến cáo buộc sai lầm.

Quan trọng hơn, 30% số người được hỏi cho biết sẽ sử dụng ChatGPT ít hơn nếu công ty triển khai hệ thống đóng dấu văn bản mà các chatbot AI đối thủ không có.

Kể từ đó, đội ngũ phát triển tại OpenAI tranh luận về lợi ích của việc cung cấp công cụ chống gian lận cho công chúng.

Vào đầu tháng 6, các thành viên cấp cao và nhà nghiên cứu của OpenAI lại thảo luận về dự án. Nhóm nhất trí rằng công nghệ watermark hoạt động tốt, nhưng kết quả của cuộc khảo sát người dùng ChatGPT từ năm ngoái vẫn còn rất đáng lưu tâm.

OpenAI đang xem xét các phương án tiếp cận khác, ít gây tranh cãi hơn. Tuy nhiên, mọi thứ vẫn chưa có hướng đi rõ ràng.

Dùng ChatGPT thế nào để không tạo ra nội dung vô tri

Sự phát triển của AI mở ra nhiều tiềm năng nhưng cũng có không ít mối lo đối với ngành xuất bản, đặc biệt là nhóm tác giả viết sách.

Các tác giả sách cần phải chấp nhận sự vươn lên của AI, sử dụng chúng như một "siêu trợ lý" thay vì chối bỏ trào lưu. Chia sẻ với Tri thức - Znews, nhiều cây viết cho rằng người làm sách vẫn có thể đứng vững trong thời đại AI nếu biết cách tận dụng sức mạnh của trí tuệ nhân tạo.

Elon Musk tố cha đẻ ChatGPT lừa dối

Tỷ phú Elon Musk tái khởi kiện OpenAI, CEO Sam Altman cùng một số cá nhân khác do đặt lợi nhuận và lợi ích thương mại lên trên “lợi ích của nhân loại”.

09:15 6/8/2024

Muốn dùng AI, đừng chỉ nghĩ đến ChatGPT

Thay vì tìm kiếm qua nhiều website khác nhau, các đối thủ AI như Perplexity, POE có thể trả lời bằng cách kết hợp nhiều chatbot, cập nhật theo thời gian thực và dẫn nguồn.

17:00 26/6/2024

Nguyễn Hiếu

Theo WSJ

phát hiện dùng ChatGPT ChatGPT chống gian lận OpenAI

Bí mật của ChatGPT

Phát hiện chính xác 99,9%

Ai được dùng công cụ phát hiện ChatGPT?

Mối đe doạ với chính ChatGPT

Elon Musk tố cha đẻ ChatGPT lừa dối

Muốn dùng AI, đừng chỉ nghĩ đến ChatGPT

Apple Intelligence thì khác gì ChatGPT?

'Cha đẻ' ChatGPT sắp hết tiền

Steve Jobs đã tiên đoán ChatGPT từ 40 năm trước?

Bạn có thể quan tâm