Nvidia được xem là cái tên thành công nhất nhờ xu hướng bùng nổ trí tuệ nhân tạo (AI). Theo Mizuho Securities, công ty này kiểm soát 70-95% thị trường chip AI, dùng để đào tạo và triển khai các mô hình như GPT của OpenAI.
Tỷ suất lợi nhuận gộp của Nvidia trong quý gần nhất đạt 78%, khá cao với một công ty sản xuất phần cứng. Để so sánh, Intel và AMD có tỷ suất lợi nhuận lần lượt 41% và 47%.
Vị thế của Nvidia trên thị trường chip AI đang vững chắc. Sự kết hợp giữa bộ xử lý đồ họa (GPU) như H100, kèm phần mềm CUDA mang đến giải pháp gần như không thể thay thế, CNBC mô tả.
Dù vậy, CEO Nvidia Jensen Huang thừa nhận "lo lắng và quan ngại" công ty sẽ đánh mất lợi thế. Trong một hội nghị cuối năm 2023, ông nói rằng rất nhiều đối thủ mạnh đang trỗi dậy.
Nhu cầu tìm giải pháp thay thế
Khi giai đoạn đào tạo trôi qua, các công ty chuyển sang đầu tư hệ thống triển khai AI, còn gọi là suy luận (inference), đòi hỏi sức mạnh và chi phí thấp hơn. Để so sánh, chip AI dòng cao cấp của Nvidia giá khoảng 30.000 USD, khiến nhiều khách hàng mong muốn tìm giải pháp thay thế.
Thành lập vào 2019, D-Matrix có kế hoạch ra mắt thẻ bán dẫn cho máy chủ vào cuối năm, nhằm giảm chi phí và độ trễ khi chạy mô hình AI. Công ty đã huy động 110 triệu USD tháng 9/2023.
"Nvidia muốn nắm giữ 100%, nhưng các khách hàng không thích như vậy... Sẽ không lành mạnh nếu một công ty giành lấy tất cả", Sid Sheth, đồng sáng lập D-Matrix, cho biết.
CEO Nvidia Jensen Huang. Ảnh: Bloomberg. |
Ngoài D-Matrix, các doanh nghiệp từ startup đến tập đoàn đa quốc gia đều muốn chiếm thị phần trên thị trường chip AI, dự kiến đạt doanh thu 400 tỷ USD trong 5 năm tới. Theo Bank of America, Nvidia đã bán được 34,5 tỷ USD chip AI năm ngoái, chiếm phần lớn trong tổng doanh thu 80 tỷ USD.
Nhiều công ty dùng GPU Nvidia cũng tin rằng một kiến trúc mới, hoặc các chỉnh sửa nhất định có thể xử lý vài tác vụ tốt hơn hiện nay. Một số doanh nghiệp cũng phát triển công nghệ xử lý AI trực tiếp, thay vì dựa vào lượng lớn GPU trên đám mây.
"Không ai phủ nhận Nvidia đang là phần cứng nhiều công ty mong muốn để chạy mô hình AI. Tuy nhiên sự cạnh tranh trong lĩnh vực ngày càng lớn khi các công ty khổng lổ phát triển chip riêng, kể cả startup nhỏ cũng thiết kế bán dẫn", Fernando Vidal, đồng sáng lập công ty nghiên cứu 3Fourteen Research, cho biết.
Cạnh tranh từ các hãng chip
Lisa Su, CEO AMD tin rằng vẫn còn nhiều cơ hội thành công trong lĩnh vực này.
"Điều quan trọng là có rất nhiều lựa chọn. Tôi nghĩ chúng ta sẽ chứng kiến tình huống có nhiều giải pháp thay vì chỉ một", Su cho biết trong một sự kiện vào tháng 12/2023.
Tương tự Nvidia, AMD sản xuất GPU chơi game, tối ưu xử lý AI trong trung tâm dữ liệu. Chip mạnh nhất hiện nay của công ty là Instinct MI300X, được Microsoft trang bị cho dịch vụ đám mây Azure.
CEO AMD Lisa Su. Ảnh: Bloomberg. |
MI300X được AMD nhấn mạnh khả năng suy luận, trái ngược các dòng chip mạnh về đào tạo của Nvidia. Theo nhóm phân tích của Morgan Stanley, doanh số chip AI của AMD năm nay có thể vượt 4 tỷ USD.
Intel, cái tên bị chính Nvidia vượt mặt về doanh thu, cũng tìm cách thâm nhập thị trường chip AI. Vào tháng 4, công ty này ra mắt chip Gaudi 3, so sánh trực tiếp với Nvidia H100 về hiệu quả chi phí, khả năng suy luận và tốc độ đào tạo nhanh hơn.
Theo các nhà phân tích của Bank of America, thị phần Intel trên thị trường chip AI năm nay sẽ chưa đến 1%. So với Nvidia, rào cản lớn nhất của các đối thủ đến từ phần mềm.
Intel, AMD và Google đều tham gia nhóm UXL, mục tiêu phát triển phần mềm thay thế Nvidia CUDA, giúp kiểm soát phần cứng cho các ứng dụng AI.
Những khách hàng lớn
Không chỉ nội bộ ngành chip, đối thủ tiềm tàng của Nvidia còn đến từ những khách hàng lớn. Google, Microsoft hay Amazon đều phát triển chip AI dùng nội bộ. Tính cả Oracle, nhóm công ty này chiếm hơn 40% doanh thu của Nvidia.
Năm 2018, Amazon giới thiệu chip AI đầu tiên với tên Inferentia. 3 năm sau, công ty trình làng chip Tranium để đào tạo AI. Khách hàng không thể mua chip trực tiếp, chỉ thuê thông qua dịch vụ đám mây AWS.
Google cũng kiên trì phát triển chip AI. Từ năm 2015, công ty này sử dụng bộ xử lý Tensor (TPU) để đào tạo và triển khai mô hình AI. Tháng 5 năm nay, Google công bố phiên bản thứ 6 của Tensor mang tên Trillium, dùng để phát triển mô hình Gemini và Imagen.
Google ra mắt chip AI Trillium hồi tháng 5. Ảnh: Google/YouTube. |
Microsoft cũng trên đường hoàn thiện chip riêng. Năm 2023, công ty này tuyên bố đang phát triển chip xử lý và bộ tăng tốc AI, lần lượt tên Cobalt và Maia.
Không cung cấp dịch vụ đám mây, song Meta vẫn cần sức mạnh tính toán lớn để chạy phần mềm, website và phân phối quảng cáo. Dù vẫn chi hàng tỷ USD mua chip Nvidia, công ty mẹ của Facebook cho biết đã sử dụng một số chip tự phát triển trong trung tâm dữ liệu, đánh giá "hiệu quả hơn" GPU thông thường.
Sức ép từ startup
Nvidia còn đối mặt cạnh tranh từ một số startup. Theo dữ liệu từ PitchBook, các nhà đầu tư mạo hiểm đã đổ 6 tỷ USD vào startup phát triển chip AI trong 2023, tăng nhẹ so với mức 5,7 tỷ USD một năm trước.
Theo CNBC, đây là lĩnh vực khó đối với startup bởi thiết kế, phát triển và sản xuất chip rất tốn kém. Dù vậy, các công ty vẫn cố gắng tìm sự khác biệt.
Chip Cerebras WSE-3. Ảnh: Cerebras Systems. |
Cerebras Systems, nhà sản xuất chip AI tại Thung lũng Silicon, đặt trọng tâm cải thiện khả năng xử lý tác vụ cơ bản và tình trạng "nghẽn cổ chai". Theo Bloomberg, công ty được thành lập năm 2015 và định giá 4 tỷ USD.
Andrew Feldman, CEO Cerebras cho biết chip WSE-2 của công ty có thể tích hợp GPU, CPU và bộ nhớ bổ sung lên một bảng mạch lớn, giúp đào tạo mô hình tốt hơn.
"Chúng tôi dùng một chip khổng lồ, còn họ dùng nhiều chip nhỏ. Họ gặp khó khăn trong việc chuyển dữ liệu, chúng tôi thì không", Feldman tự tin tuyên bố.
Apple và Qualcomm
Bên cạnh công ty phần cứng, hoạt động kinh doanh trung tâm dữ liệu của Nvidia còn chịu sức ép từ xu hướng xử lý AI trực tiếp trên thiết bị.
Các mô hình lớn như GPT yêu cầu cụm GPU mạnh mẽ để suy luận. Trong khi đó, những công ty như Apple và Microsoft đang tập trung phát triển mô hình nhỏ, yêu cầu ít năng lượng chạy trên thiết bị dùng pin.
iPhone 15 Pro. Ảnh: Bloomberg. |
Dù có thể không thông minh bằng ChatGPT bản mới nhất, các mô hình nhỏ vẫn đủ khả năng xử lý tác vụ cơ bản, chẳng hạn như tóm tắt văn bản hay tìm kiếm hình ảnh.
Chip xử lý của Apple và Qualcomm cũng được thiết kế xử lý tác vụ AI hiệu quả hơn, bằng cách tích hợp bộ xử lý thần kinh (NPU). Nổi bật nhất là Qualcomm với dòng chip Snapdragon X, hỗ trợ xử lý một số tính năng AI trực tiếp trên máy tính.
Những dòng laptop và tablet mới của Apple cũng được quảng cáo "tối ưu cho AI" nhờ NPU trên chip M-series. Tại hội nghị WWDC 2024 sắp diễn ra, Táo khuyết có kế hoạch công bố loạt tính năng AI mới, có khả năng chạy trực tiếp trên iPhone và iPad.
Những câu hỏi chúng ta phải đối mặt trong thế giới AI
Chúng ta có rất nhiều câu hỏi về thế giới AI, mà đó đều là những nghi hoặc không dễ có ngay đáp án.
Cuốn sách Thời đại AI - Và tương lai loài người chúng ta trình bày cách AI làm thay đổi mối quan hệ của chúng ta với tri thức, chính trị và xã hội. Mục tiêu tối thượng của cuốn sách này là giải thích về AI và cung cấp cho độc giả những câu hỏi mà chúng ta sẽ phải đối mặt trong những năm tới lẫn bộ công cụ để bắt đầu trả lời chúng.