AI mạnh nhất thế giới của Google có gì?

Thứ năm, 7/12/2023 10:11 (GMT+7)
10:11 7/12/2023

Nếu ra mắt trước ChatGPT của OpenAI, Gemini có thể đã thống trị thế giới. Giờ đây Google tự tin mô hình AI của mình đã vượt qua GPT-4.

Gemini sẽ sớm được tích hợp vào hệ sinh thái Google. Ảnh: Warketing Digital.

Giám đốc điều hành Sundar Pichai cho biết đây là khởi đầu cho một kỷ nguyên mới của AI tại Google: kỷ nguyên Gemini. Gemini là mô hình ngôn ngữ lớn mới nhất của Google, được giới thiệu lần đầu tại Hội nghị Nhà phát triển I/O vào tháng 6 và chính thức ra mắt đêm 7/12.

AI mạnh nhất thế giới

Google gọi Gemini là AI mạnh nhất của họ từ trước đến nay, đồng thời cũng là công nghệ hoành tráng nhất của họ kể từ sau thuật toán Page Rank của Google Tìm kiếm. Nó sẽ xuất hiện trên Bard và Pixel 8 Pro từ hôm nay và sớm được tích hợp với các sản phẩm khác trên các dịch vụ của Google như Chrome, Tìm kiếm, Quảng cáo…

Là mô hình đa phương thức, Gemini được học từ dữ liệu hình ảnh, video và cả âm thanh thay vì chỉ văn bản như các chatbot nổi tiếng. “Đó là mô hình trí tuệ lớn nhất và nhiều tính năng nhất của chúng tôi. Nó cũng bao hàm những công nghệ phổ quát nhất,” Eli Collins - Phó chủ tịch mảng sản phẩm của DeepMind - cho biết.

Gemini có 3 phiên bản, bao gồm Ultra - cao cấp nhất, Nano - tinh gọn hơn, ít tốn hiệu năng và Pro - kích thước trung bình và khả năng trung bình. Tại buổi ra mắt, Google đã trình chiếu một số bản demo minh họa khả năng xử lý thông tin hình ảnh của Gemini.

Gemini có 3 phiên bản: Ultra, Pro và Nano. Ảnh: Google.

Mô hình AI này có khả năng phản hồi và hiểu một video có nội dung bất kỳ. Đội ngũ của Google cũng chỉ ra Gemini có thể hỗ trợ nghiên cứu khoa học bằng cách trả lời các câu hỏi về một bài nghiên cứu có biểu đồ và phương trình.

Hiện, khả năng cơ bản nhất của Gemini là nhập văn bản và gửi văn bản. Nhưng phiên bản cao cấp hơn - Gemini Ultra - có thể hoạt động với hình ảnh, video, âm thanh, thậm chí còn có tính “khái quát hơn thế nữa”, CEO DeepMind Demis Hassabis nói. “Nó vẫn còn tiềm năng cho hành động, chạm giống với robot.”

Sau này, Gemini sẽ có nhiều giác quan hơn, nhận thức rõ và chính xác hơn. “Các AI sẽ phần nào hiểu rõ hơn về thế giới xung quanh chúng”, ông cho biết.

Đương nhiên, những cách hiểu sai, định kiến và các vấn đề khác vẫn còn tồn đọng. Nhưng càng biết nhiều, chúng sẽ càng cải thiện hơn, Hassabis nói.

Gemini đánh bại ChatGPT ở 30 bài kiểm tra. Ảnh: ZDNet.

Đối thủ nặng ký của GPT-4

Theo Phó chủ tịch Eli Collins, Gemini Pro thừa sức vượt mặt GPT-3.5 có trên ChatGPT ở 6/8 bài kiểm tra thường được sử dụng để so sánh tính thông minh của phần mềm AI.

Trong khi đó, Gemini Ultra đạt điểm 90%, cao hơn tất cả mô hình AI, kể cả GPT-4 trong bài kiểm tra Massive Multitask Language Understanding (MMLU). Đây là thang đo được các nhà nghiên cứu hàn lâm lập ra với bộ câu hỏi kết hợp 57 chủ đề như toán, vật lý, lịch sử, luật, y học và đạo đức.

“Gemini là sản phẩm tiên tiến nhất, đứng top trong 30/32 bài đánh giá phổ biến trong cộng đồng nghiên cứu máy học. Bởi vậy, chúng tôi cho rằng nó là công nghệ dẫn đầu thế giới trong mọi mặt”, Collins khẳng định.

Với CEO Pichai và Hassabis, Gemini vừa là sự khởi đầu của một dự án lớn hơn vừa là một sự lột xác của tập đoàn công nghệ. Đây là mô hình AI mà Google đã chờ đợi và hướng tới trong nhiều năm.

Gemini là kế hoạch được Google ấp ủ từ lâu, trước khi xuất hiện OpenAI với ChatGPT. Ảnh: Google.

Trong các bài kiểm tra, lợi thể của Gemini là nhờ khả năng hiểu và tương tác với video và âm thanh. Tất cả đều nằm trong tính toán ban đầu của Google. Thay vì đào tạo các mô hình riêng biệt cho hình ảnh và giọng nói như DALL-E của OpenAI, gã khổng lồ công nghệ Mỹ lại xây dựng một mô hình AI đa phương thức ngay từ đầu.

“Chúng tôi luôn quan tâm đến những hệ thống mang tính tổng quát cao. Sau đó, kết hợp tất cả để thu thập càng nhiều dữ liệu càng tốt từ và đưa ra phản hồi đa dạng nhất có thể”, CEO DeepMind Demis Hassabis cho biết.

Theo Wired, Google đã phát minh ra một vài công nghệ cho ChatGPT từ lâu nhưng lại chậm ra mắt chatbot của riêng mình vì lo ngại nó có thể phát ngôn tiêu cực, nguy hiểm. Cho đến nay, chatbot Bard của Google vẫn chưa thể so sánh được với ChatGPT. Gã khổng lồ tìm kiếm cho biết điều đó đang thay đổi, bắt đầu từ bây giờ. Bard sẽ là lần đầu tiên mọi người tiếp xúc với Gemini.

Tuy nhiên, điểm cũng chỉ là điểm. Bài kiểm tra thực sự về khả năng của Gemini sẽ bắt đầu khi người dùng sử dụng nó để lên ý tưởng, tra cứu thông tin, viết mã… CEO Google khẳng định người dùng sẽ nhìn thấy sự cải thiện ở mọi thứ khi có bàn tay của Gemini hỗ trợ.

Những câu hỏi chúng ta phải đối mặt trong thế giới AI

Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.

Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.

Sam Altman: Tôi đã trải qua đủ loại cảm xúc trong 24 giờ đầu

CEO OpenAI có những chia sẻ về việc bất ngờ bị sa thải vào cuối tháng 11, bày tỏ mong muốn sẵn sàng hợp tác với các công ty trong lĩnh vực AI tại Việt Nam.

21:30 6/12/2023