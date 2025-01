Các mô hình này thuộc về nhóm mô hình AI mới mà DeepSeek gọi là Janus-Pro. Chúng có kích thước từ 1 tỷ đến 7 tỷ tham số. Janus-Pro được phát hành dưới giấy phép MIT, nghĩa là nó có thể được sử dụng cho mục đích thương mại mà không có giới hạn.

Janus-Pro, được DeepSeek mô tả là một "khung tự hồi quy mới", có thể vừa phân tích vừa tạo ra hình ảnh mới. Theo công ty này, trên hai tiêu chuẩn đánh giá AI là GenEval và DPG-Bench, mô hình Janus-Pro-7B đã vượt qua DALL-E 3 cũng như các mô hình khác như PixArt-alpha, Emu3-Gen, và Stable Diffusion XL của Stability AI.

Hạn chế của mô hình này là độ phân giải ảnh đầu vào để phân tích bị giới hạn ở mức 384 x 384. Tuy nhiên, hiệu suất của Janus-Pro vẫn rất ấn tượng, đặc biệt là khi xét đến kích thước tối ưu của các mô hình.

"Janus-Pro vượt trội hơn các mô hình thống nhất trước đây và có hiệu suất tương đương hoặc vượt trội so với các mô hình chuyên biệt", DeepSeek viết trong một bài đăng trên Hugging Face.

Phòng thí nghiệm AI DeepSeek đang gây sốt ở phương Tây vào tuần này sau khi ra mắt mô hình R1, với khả năng tư duy, vào tuần trước. Ứng dụng DeepSeek vươn lên đứng đầu bảng xếp hạng App Store của Apple, vượt qua ChatGPT của OpenAI.

Các mô hình ngôn ngữ của DeepSeek, được đào tạo bằng các kỹ thuật hiệu quả về mặt tính toán, đã khiến nhiều nhà phân tích Phố Wall và các chuyên gia công nghệ đặt câu hỏi liệu Mỹ có thể duy trì vị thế dẫn đầu trong cuộc đua AI và liệu nhu cầu về chip AI có được duy trì hay không. Điều đó phần nào dẫn đến mức giảm 17% của cổ phiếu Nvidia vào phiên giao dịch ngày 27/1, đồng nghĩa con số 600 tỷ USD giá trị vốn hóa bị "thổi bay".

