So với các đối thủ lớn, công cụ của Apple cho đến nay vẫn chậm chân trong cuộc đua tích hợp AI vào nền tảng.
Thậm chí, Apple đã hủy bỏ nỗ lực kéo dài hàng thập kỷ nhằm chế tạo một chiếc ôtô điện, với quyết định "khai tử" dự án Titan được tiến hành từ năm 2015.
Sau khi kết thúc dự án này, nhiều người trong số gần 2.000 nhân viên đã được chuyển sang “Nhóm Dự án Đặc biệt” để tập trung vào phát triển AI.
Lu mờ ranh giới giữa hình ảnh và văn bản
Dù đi sau, nhưng nhà sản xuất iPhone đã có bước đột phá đáng kể về AI. Cụ thể, các nhà nghiên cứu của Apple đã phát triển các phương pháp mới giúp đào tạo LLM trên cả văn bản và hình ảnh.
Điêu này hứa hẹn giúp các hệ thống AI trong tương lai của hãng mạnh mẽ và linh hoạt hơn các đối thủ trên thị trường. VentureBeat nhận định đây có thể là một bước tiến đáng kể cho trí tuệ nhân tạo và các sản phẩm của Apple trong tương lai.
Cụ thể, theo kết quả của nghiên cứu được đăng tải trên trang arXiv.org, công trình nghiên cứu về LLM của Apple có tên MM1 đã chứng minh việc kết hợp cẩn thận các loại dữ liệu đào tạo và kiến trúc mô hình khác nhau có thể giúp nâng cao hiệu suất tiên tiến trên một loạt các điểm chuẩn AI.
Mô hình ngôn ngữ lớn MM1 của Apple. Ảnh: Brandon McKinzie. |
Bằng việc đào tạo các mô hình trên một tập dữ liệu đa dạng bao gồm thông tin ngôn ngữ và hình ảnh, MM1 có thể thực hiện xuất sắc các nhiệm vụ như chú thích, trả lời câu hỏi bằng hình ảnh và suy luận ngôn ngữ tự nhiên.
Trong quá trình nghiên cứu, đội ngũ Apple cũng phát hiện ra rằng việc lựa chọn bộ mã hóa hình ảnh và độ phân giải của hình ảnh đầu vào có tác động lớn đến hiệu suất của mô hình.
Điều này cho thấy việc tiếp tục mở rộng quy mô và sàng lọc các thành phần trực quan trong mô hình đa phương thức này sẽ là chìa khóa để đạt được nhiều thành tựu hơn nữa.
Đây là một phát hiện thú vị bởi trước đây, mối liên hệ giữa hình ảnh và ngôn ngữ được cho là ít quan trọng khi huấn luyện các LLM.
Một chi tiết khác cũng được giới chuyên môn đánh giá cao ở MM1 là quy mô ấn tượng với khả năng xử lý 3 tỷ, 7 tỷ và 30 tỷ tham số tùy theo các kích cỡ mà nhà phát triển lựa chọn.
Gizmochina đánh giá nhờ việc xây dựng một cách tỉ mỉ khi sử dụng kiến trúc "Mixture of Experts" và phương pháp "Top-2 Gating", nhóm nghiên cứu MM1 đã làm "lu mờ ranh giới giữa hình ảnh và văn bản".
MM1 có thể thực hiện xuất sắc các nhiệm vụ như chú thích, trả lời câu hỏi bằng hình ảnh và suy luận ngôn ngữ tự nhiên. Ảnh: Brandon McKinzie. |
Cách tiếp cận này không chỉ mang lại kết quả xuất sắc trong các tiêu chuẩn trước đào tạo mà còn mang lại hiệu suất cao trên các tiêu chuẩn đa phương thức hiện có.
Ngay cả sau khi tinh chỉnh cho các tác vụ cụ thể, MM1 vẫn duy trì hiệu suất cạnh tranh vượt trội so với hầu hết đối thủ có cùng quy mô và kích thước xử lý tương tự trên thị trường.
Canh bạc hàng tỷ USD của Apple
Nghiên cứu về MM1 được công bố trong bối cảnh Apple đang tăng cường đầu tư vào AI nhằm bắt kịp các đối thủ như Google, Microsoft và Amazon vốn đang rất tích cực trong cuộc đua tích hợp AI tạo sinh vào sản phẩm.
Theo The Verge, Táo khuyết được cho là đang chi hàng triệu USD mỗi ngày để đào tạo một mô hình ngôn ngữ lớn (LLM) có tên mã nội bộ Ajax.
Apple tỏ ra quyết liệt trong cuộc đua tích hợp AI vào sản phẩm của hãng. Ảnh: Krongkaew. |
Một số chuyên gia cho biết Ajax thậm chí còn được đánh giá cao hơn cả ChatGPT 3.5. Với mục tiêu giúp các thiết bị trong hệ sinh thái giao tiếp với nhau, tài khoản chuyên rò rỉ tin công nghệ yeux1122 của Hàn Quốc tiết lộ Apple còn đang “huấn luyện” cách giao tiếp sao cho tự nhiên nhất có thể chứ không chỉ là những câu ra lệnh cứng nhắc.
Apple còn dự tính bổ sung các tính năng như tự động tóm tắt, tự động hoàn thành vào các ứng dụng cốt lõi và phần mềm năng suất như Pages và Keynote. Họ cũng nỗ lực tích hợp AI vào các dịch vụ như Apple Music để tối ưu hóa việc tạo danh sách phát.
Trong cuộc họp cổ đông thường niên của Apple vào đầu tháng 3, CEO Tim Cook hé lộ cuối năm nay, AI tạo sinh sẽ có mặt trên các sản phẩm của Táo khuyết.
"Apple nhận thấy tiềm năng đột phá đáng kinh ngạc của AI tạo sinh. Đó là lý do mà chúng tôi đang đầu tư đáng kể vào lĩnh vực này. Chúng tôi tin rằng điều đó sẽ mở ra những cơ hội mang tính đột phá cho người dùng khi nhắc đến năng suất, khả năng giải quyết vấn đề và hơn thế nữa", Tim Cook cho biết.
Để tăng thêm sức mạnh cho đội ngũ AI của mình, theo Bloomberg, Apple ngày 15/3 đã mua lại startup DarwinAI của Canada với số tiền chưa được tiết lộ.
Thương vụ thâu tóm DarwinAI có thể là chìa khóa giúp Apple tích hợp AI tạo sinh vào hệ sinh thái sản phẩm. Ảnh: Medium. |
Theo nguồn tin giấu tên, hàng chục nhân viên của DarwinAI đã gia nhập vào nhóm phát triển AI của Táo khuyết.
Bloomberg nhận định yếu tố mang tính quyết định trong thương vụ này nằm ở công nghệ cốt lõi của DarwinAI chuyên phát triển cho các hệ thống trí tuệ nhân tạo nhỏ và nhanh hơn.
Đây là điều hữu ích cho Apple, bởi hãng tập trung vào việc tích hợp AI trên các thiết bị thay vì hoàn toàn là xử lý trên điện toán đám mây.
Những câu chuyện bên trong Apple
Văn hóa bí mật luôn là một điểm đặc biệt của Apple. Cuộc đời Steve Jobs, Tim Cook và quá trình sáng tạo những sản phẩm quan trọng như iPhone thường chỉ được tiết lộ qua những trang sách, nơi các tác giả dành nhiều năm để mang tới những câu chuyện hấp dẫn