AI Crazy
New member
Tại CES 2026, AMD tiết lộ sơ lược về dòng tăng tốc Instinct MI500 dự kiến ra mắt năm 2027, cùng kế hoạch dùng kiến trúc CDNA 6, tiến trình 2nm và bộ nhớ HBM4E. Công ty cũng giới thiệu các sản phẩm trung gian như MI440X và nền tảng tham chiếu Helios.
AMD đã dùng sân khấu CES 2026 để trình bày kế hoạch phần cứng AI ngắn hạn và dài hạn, bao gồm cái nhìn ban đầu về series tăng tốc Instinct MI500 dự kiến xuất hiện vào năm 2027.
Song song đó, hãng giới thiệu Helios — một nền tảng tham chiếu dạng rack-scale xây dựng quanh GPU Instinct MI455X và CPU EPYC Venice. Helios được mô tả là bản thiết kế cho hạ tầng AI quy mô lớn chứ không phải sản phẩm bán đại trà.
Để phục vụ các triển khai doanh nghiệp tại chỗ, AMD đưa ra Instinct MI440X, một card tăng tốc mới được thiết kế để lắp vào hệ thống tám GPU hiện có, phù hợp cho huấn luyện, tinh chỉnh và suy luận.
Điểm đáng chú ý nhất là tầm nhìn cho MI500. AMD cho biết MI500 sẽ dựa trên kiến trúc CDNA 6, sản xuất trên tiến trình 2nm và dùng bộ nhớ HBM4E. Công ty tuyên bố thiết kế này có thể mang lại mức tăng hiệu năng AI đến 1.000 lần so với thế hệ MI300X, mặc dù hiện chưa có bài benchmark chi tiết vì sản phẩm còn ở giai đoạn xa.
Tuy nhiên, thời điểm ra mắt MI500 là một thách thức với AMD vì đối thủ NVIDIA đang chuẩn bị triển khai nền tảng Vera‑Rubin trong năm nay. NVIDIA tại CES 2026 đã trình bày nền tảng rack-scale mới làm từ sáu thành phần chính: CPU Vera, GPU Rubin, bộ chuyển mạch NVLink 6, ConnectX‑9 SuperNIC, DPU BlueField‑4 và switch Ethernet Spectrum‑6.
Trong cấu hình NVL72, hệ thống kết hợp 72 GPU Rubin và 36 CPU Vera qua NVSwitch và NVLink để hoạt động như một hệ thống chia sẻ bộ nhớ. GPU Rubin dùng tám cụm HBM4 và được trang bị Transformer Engine mới với khả năng nén thích ứng ở phần cứng, nhằm tăng hiệu quả khi suy luận và huấn luyện mà không ảnh hưởng độ chính xác mô hình.
NVIDIA cho biết các hệ thống dựa trên Rubin sẽ sẵn sàng từ nửa sau 2026, với cấu hình NVL72 quy mô rack và cấu hình nhỏ hơn HGX NVL8, được triển khai qua nhà cung cấp đám mây, nhà điều hành hạ tầng AI và các đối tác hệ thống. Điều đó có nghĩa là khi MI500 chính thức xuất hiện năm 2027, nền tảng Vera‑Rubin của NVIDIA nhiều khả năng đã được triển khai rộng rãi, tạo ra bối cảnh cạnh tranh khốc liệt trên thị trường tăng tốc AI.
Tóm lại, AMD đặt cược vào bước nhảy kiến trúc lớn với MI500 (CDNA 6, 2nm, HBM4E) nhưng sẽ phải đương đầu với đối thủ đã có mặt sớm hơn trên thị trường. Trong khi đó, các sản phẩm trung gian như MI440X và bản tham chiếu Helios giúp AMD củng cố lộ trình tới 2027.
AMD đã dùng sân khấu CES 2026 để trình bày kế hoạch phần cứng AI ngắn hạn và dài hạn, bao gồm cái nhìn ban đầu về series tăng tốc Instinct MI500 dự kiến xuất hiện vào năm 2027.
Song song đó, hãng giới thiệu Helios — một nền tảng tham chiếu dạng rack-scale xây dựng quanh GPU Instinct MI455X và CPU EPYC Venice. Helios được mô tả là bản thiết kế cho hạ tầng AI quy mô lớn chứ không phải sản phẩm bán đại trà.
Để phục vụ các triển khai doanh nghiệp tại chỗ, AMD đưa ra Instinct MI440X, một card tăng tốc mới được thiết kế để lắp vào hệ thống tám GPU hiện có, phù hợp cho huấn luyện, tinh chỉnh và suy luận.
Điểm đáng chú ý nhất là tầm nhìn cho MI500. AMD cho biết MI500 sẽ dựa trên kiến trúc CDNA 6, sản xuất trên tiến trình 2nm và dùng bộ nhớ HBM4E. Công ty tuyên bố thiết kế này có thể mang lại mức tăng hiệu năng AI đến 1.000 lần so với thế hệ MI300X, mặc dù hiện chưa có bài benchmark chi tiết vì sản phẩm còn ở giai đoạn xa.
Tuy nhiên, thời điểm ra mắt MI500 là một thách thức với AMD vì đối thủ NVIDIA đang chuẩn bị triển khai nền tảng Vera‑Rubin trong năm nay. NVIDIA tại CES 2026 đã trình bày nền tảng rack-scale mới làm từ sáu thành phần chính: CPU Vera, GPU Rubin, bộ chuyển mạch NVLink 6, ConnectX‑9 SuperNIC, DPU BlueField‑4 và switch Ethernet Spectrum‑6.
Trong cấu hình NVL72, hệ thống kết hợp 72 GPU Rubin và 36 CPU Vera qua NVSwitch và NVLink để hoạt động như một hệ thống chia sẻ bộ nhớ. GPU Rubin dùng tám cụm HBM4 và được trang bị Transformer Engine mới với khả năng nén thích ứng ở phần cứng, nhằm tăng hiệu quả khi suy luận và huấn luyện mà không ảnh hưởng độ chính xác mô hình.
NVIDIA cho biết các hệ thống dựa trên Rubin sẽ sẵn sàng từ nửa sau 2026, với cấu hình NVL72 quy mô rack và cấu hình nhỏ hơn HGX NVL8, được triển khai qua nhà cung cấp đám mây, nhà điều hành hạ tầng AI và các đối tác hệ thống. Điều đó có nghĩa là khi MI500 chính thức xuất hiện năm 2027, nền tảng Vera‑Rubin của NVIDIA nhiều khả năng đã được triển khai rộng rãi, tạo ra bối cảnh cạnh tranh khốc liệt trên thị trường tăng tốc AI.
Tóm lại, AMD đặt cược vào bước nhảy kiến trúc lớn với MI500 (CDNA 6, 2nm, HBM4E) nhưng sẽ phải đương đầu với đối thủ đã có mặt sớm hơn trên thị trường. Trong khi đó, các sản phẩm trung gian như MI440X và bản tham chiếu Helios giúp AMD củng cố lộ trình tới 2027.
Bài viết liên quan