Điện thoại tạo được ảnh từ câu lệnh trong thời gian thực. |
Xu hướng AI hóa đang tăng trưởng mạnh mẽ trong ngành smartphone. Báo cáo của các công ty nghiên cứu thị trường cho thấy tiềm năng lớn của tính năng này, giúp mảng di động có đà phát triển trở lại. Những doanh nghiệp đi đầu dần cập nhật Generative AI flagship, tạo hiệu ứng tốt ở người dùng và doanh số.
Tuy nhiên, các giải pháp tạo sinh thông dụng hiện đều đi API đám mây của bigtech như Google, OpenAI hay Baidu. Chúng vẫn tồn tại hạn chế về độ trễ và bảo mật. Tại triển lãm công nghệ Computex 2024 tại Đài Bắc (Đài Loan), việc đưa AI về chạy trên ngay trên máy bị là xu thế để giải quyết những vấn đề này.
AI ngay trên điện thoại
Trong khuôn khổ sự kiện, nhà sản xuất chip MediaTek trình diễn khả năng AI tối đa một NPU của smartphone có thể làm được. Kết quả cho ra không hề thua kém giải pháp đám mây. Những tác vụ tạo sinh phức tạp như âm thanh, hình ảnh, video cũng có thể được thực hiện ngay trên điện thoại mà không cần Internet.
Thiết bị được đưa ra trình diễn là nguyên mẫu của nhà sản xuất được gắn chip đầu bảng Dimensity 9300. Đây là vi xử lý di động đầu tiên có APU/NPU hỗ trợ các API mô hình ngôn ngữ lớn phổ biến như Llama 2, Baichuan 2, Baidu AI LLM.
Chức năng xóa thông minh trên Find X7 Pro sử dụng Dimensity 9300 để xử lý ngay trên điện thoại, không kết nối mạng. |
Hai ứng dụng đã được thương mại hóa của dòng SoC nằm trên sản phẩm Vivo và Oppo. Trong đó, model X100 Pro hỗ trợ tổng hợp nội dung văn bản chính xác. Còn chiếc Find X7 Pro có thể xóa vật thể và bù pixel trong app thư viện. Hai tác vụ này được chạy local trên điện thoại. Trong khi đó, Galaxy AI phải sử dụng API Gemini qua đám mây của Google để xử lý các tác vụ tương tự ở dòng S24.
Giải pháp mới hạn chế độ trễ khi phải đưa dữ liệu lên máy chủ, chờ xử lý và trả về. Người dùng cũng có thể sử dụng ngay cả khi kết nối Internet không ổn định. Đồng thời, lệnh được làm việc trên máy, hạn chế mối nguy lộ lọt thông tin nhạy cảm.
Tiềm năng NPU trên chip điện thoại
Ngoài ra, MediaTek còn trình diễn sức mạnh AI của dòng chip nói trên bằng các tác vụ chưa được đối tác thương mại hóa.
Nguyên mẫu có thể tạo ảnh từ câu lệnh, tương tự chức năng của Stable Diffusion hay Mid Journey. Đáng chú ý, NPU của chip có thể xử lý tác vụ này theo thời gian thực. Cụ thể, hình ảnh sẽ thay đổi ngay lập tức sau khi câu lệnh được đưa ra, không có độ trễ. Khi Prompt được chỉnh sửa, thành quả cũng được cập nhật.
Ngoài tạo ảnh từ lệnh, Dimensity 9300 cũng nhận đầu vào là dữ liệu của camera. Thông qua một số preset có sẵn, ảnh mới sẽ được tạo theo các phong cách khác nhau. Chức năng này có thể được ứng dụng để tạo video hình động ngắn. Tuy nhiên, thời gian xử lý sẽ lâu hơn.
Các ứng dụng này vận hành dựa trên mô hình LoRA Fusion. Đây là giải pháp AI tạo sinh được ra mắt hồi đầu năm của công ty Đài Loan. Nó được mở để các nhà phát triển app, hãng di động có thể tận dụng để khai thác chức năng AI của dòng vi xử lý. Tuy nhiên, những công cụ như vậy chưa có mặt nhiều trên thị trường.
AI của điện thoại xử lý ảnh tại biên. |
Tổng thể các chức năng tạo sinh của chip MediaTek không mới. Tuy nhiên, việc chúng được tinh chỉnh để hoạt động hoàn toàn trên di động là một bước tiến lớn. Xu hướng này có thể thúc đẩy các hãng chip tăng cường bộ xử lý AI riêng và mở rộng các tính năng liên quan đến AI người dùng có thể sử dụng mà không cần tiêu tốn dữ liệu mạng.
Ở mặt vĩ mô, khi mỗi chiếc smartphone tự xử lý công việc liên quan đến trí tuệ nhân tạo ngay trên máy, chi phí về mạng, token API sẽ được giải quyết. Người dùng có thể sử dụng công cụ miễn phí hoàn toàn, không cần trả tiền cho một bên nào khác như những lo ngại gần đây.
Dùng ChatGPT thế nào để không tạo ra nội dung vô tri
Sự phát triển của AI mở ra nhiều tiềm năng nhưng cũng có không ít mối lo đối với ngành xuất bản, đặc biệt là nhóm tác giả viết sách.
Các tác giả sách cần phải chấp nhận sự vươn lên của AI, sử dụng chúng như một "siêu trợ lý" thay vì chối bỏ trào lưu. Chia sẻ với Tri thức - Znews, nhiều cây viết cho rằng người làm sách vẫn có thể đứng vững trong thời đại AI nếu biết cách tận dụng sức mạnh của trí tuệ nhân tạo.