Bạn có thể chuyển sang phiên bản mobile rút gọn của Tri thức trực tuyến nếu mạng chậm. Đóng

AI không cần mạng của Google làm được gì?

Mô hình cơ bản của Gemma 4 có thể suy luận, phân tích hình ảnh và viết mã, hỗ trợ chạy trên máy tính và cả smartphone.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 1

Gemma 4 là mô hình ngôn ngữ lớn (LLM) do Google DeepMind phát triển. Đây là dòng mô hình mã nguồn mở, hỗ trợ xử lý thông tin trực tiếp trên máy mà không cần Internet. Người dùng có thể tải, tùy chỉnh và triển khai trên máy tính hay thiết bị di động thông thường.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 2

Dòng mô hình Gemma 4 được phân phối với 4 phiên bản: E2B, E4B, 31B và 26B A4B. 2 phiên bản E2B và E4B yêu cầu RAM tối thiểu 4-6 GB (4-bit) hoặc 10-16 GB (16-bit), phù hợp để chạy trên thiết bị di động và máy tính cấu hình vừa phải. Trong khi đó, phiên bản 26B A4B yêu cầu tối thiểu 18 GB RAM, còn 31B cần ít nhất 20 GB.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 3

Theo MindStudio, một trong những lợi thế khi chạy mô hình AI cục bộ gồm tính bảo mật, không có chi phí bổ sung. Tuy nhiên, hiệu năng hoạt động các mô hình phụ thuộc vào phần cứng thiết bị. Người dùng di động có thể cài ứng dụng Google AI Edge Gallery (ảnh), trong khi máy tính cần các công cụ như LM Studio hay Ollama. Ảnh: Google.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 4

LM Studio trên máy tính cho phép chọn và tải Gemma 4 từ lần chạy đầu tiên. Phiên bản E4B có dung lượng khoảng 6,3 GB, hỗ trợ suy luận và phân tích hình ảnh. Gemma 4 E4B trên di động có dung lượng 3,6 GB khi tải bằng Google AI Edge Gallery.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 5

Sau khi tải xong, người dùng được chuyển về giao diện tương tác dạng chatbot. Trong phần chọn mô hình bên dưới, nhấn vào Gemma 4 E4B. Tại cửa sổ tiếp theo, chọn Load Model rồi chờ khoảng một phút để khởi động mô hình.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 6

Tương tự những mô hình phổ biến khác, Gemma 4 E4B hỗ trợ tương tác tiếng Việt. Thử nghiệm trên Mac mini M4 (RAM 16 GB) với câu lệnh "Xin chào", mô hình mất khoảng 8 giây suy luận và phản hồi.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 7

Khi hỏi “Bạn có thể làm được gì?”, Gemma 4 E4B mất khoảng 13 giây để hiểu và dịch câu lệnh lập tức sang tiếng Anh, sau đó viết dần câu trả lời.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 8

Do chạy trực tiếp trên thiết bị, thời gian phản hồi của mô hình có thể khác nhau tùy phần cứng. Với cùng câu hỏi “Bạn có thể làm được gì?”, mô hình mất khoảng 45 giây để trả lời đầy đủ trên điện thoại iPhone 15 Pro.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 9

Một câu hỏi suy luận khác cũng được trả lời nhanh và chính xác, ví dụ như "Một chuyến tàu khởi hành lúc 8h15 sáng và đến nơi lúc 11h47 sáng. Chuyến đi kéo dài bao lâu?". Nhìn chung, các câu lệnh suy luận đơn giản như trên không quá phức tạp với những LLM thế hệ mới.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 10

Thử nghiệm với yêu cầu mang tính logic như "Có bao nhiêu chữ 'r' trong từ 'strawberry'?". Câu hỏi này từng làm khó nhiều LLM thế hệ trước, song Gemma 4 E4B chỉ mất khoảng 3 giây để trả lời chính xác.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 13

Điểm nổi bật của Gemma 4 E4B đến từ khả năng đa phương thức, hỗ trợ đầu vào hình ảnh. Ví dụ, LLM có thể phân tích ảnh và trả lời câu hỏi xoay quanh địa danh, các chi tiết nổi bật và thời tiết, khí hậu trong ảnh.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 14

Khi được yêu cầu trích xuất toàn bộ chữ trong ảnh chụp trang tạp chí, Gemma 4 mất hơn 30 giây để trả kết quả. Thời gian này không quá chênh lệch so với những mô hình chạy online mà người dùng thường tiếp cận.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 15

Trên ứng dụng smartphone, người dùng cần chọn tính năng từ giao diện chính (AI Chat, Ask Image...), sau đó chọn mô hình để sử dụng. Do hoạt động dựa trên GPU, thiết bị có thể nóng lên trong quá trình AI suy luận.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 16

Người dùng cũng có thể tải file tài liệu, định dạng DOCX hay PDF, sau đó yêu cầu phân tích hoặc tóm tắt văn bản. Theo đại diện Google, thế hệ mô hình mới kiểm soát việc tạo chuỗi ký tự hiệu quả. Mô hình hạn chế tình trạng suy nghĩ thừa thãi, giúp giảm áp lực tính toán cho card đồ họa và bộ nhớ máy tính.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 17

Gemma 4 cũng có thể lập trình. Trong một thử nghiệm, mô hình được yêu cầu sử dụng HTML, CSS và JavaScript để xây dựng hệ điều hành chạy trực tiếp trên trình duyệt. Người dùng cần tăng độ dài Context Length trước khi khởi động để đảm bảo mô hình cho ra đáp án đầy đủ. Dù vậy, AI vẫn có thể gặp sai sót khi file HTML chưa hoàn chỉnh, một số thành phần trong ứng dụng không hoạt động.

Tai Google Gemma 4,  Gemma 4 la gi,  Gemma 4 vs Gemini,  tai AI mien phi anh 18

Nhìn chung, những câu lệnh đòi hỏi nhiều bước hoặc dữ liệu phức tạp có thể "làm khó" Gemma 4. Một số câu lệnh có thể tiêu tốn nhiều token xử lý. Việc đặt giới hạn token quá lớn có thể tiêu tốn nhiều RAM hoặc VRAM của máy.

Những câu hỏi chúng ta phải đối mặt trong thế giới AI

Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.

Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.

Android sắp đổi mới

Google có kế hoạch biến Android thành "hệ thống AI" khi tích hợp sâu rộng Gemini vào nền tảng.

Google vừa đặt nút chấm hết cho một loạt ứng dụng AI

Tận dụng mô hình Gemini, AI trên trình duyệt Chrome có thể tóm tắt nội dung, gửi email và tóm tắt video YouTube nhanh chóng, khiến nhiều ứng dụng bên thứ ba lỗi thời.

AI của Google đã có thể đọc mail, xem ảnh người dùng

Tính năng Personal Intelligence cho phép Gemini tự động truy xuất hình ảnh, email để đưa ra phản hồi cá nhân hóa cho từng người dùng.

AI chua tao ra 'tham hoa viec lam' hinh anh

AI chưa tạo ra 'thảm họa việc làm'

0

CEO OpenAI Sam Altman nhận định AI chưa gây mất việc trên diện rộng, dù công nghệ này đang được triển khai nhanh chóng trong nhiều lĩnh vực.

Phúc Thịnh

Bạn có thể quan tâm