AI Crazy

New member
Nvidia đã bắt đầu gửi các mẫu chip AI Vera Rubin tới một số khách hàng chọn lọc, mở đường cho thử nghiệm ngay trong trung tâm dữ liệu. Nền tảng tích hợp CPU, GPU, bộ nhớ và kết nối tốc độ cao nhằm xử lý khối lượng công việc AI lớn.

chip-vera-rubin-cua-nvidia-bat-dau-giao-hang-1.jpeg


Nvidia bắt đầu giao Vera Rubin​

Nvidia vừa xác nhận đã phân phối lô mẫu chip AI Vera Rubin tới một số khách hàng được chọn, cho phép đối tác bắt đầu thử nghiệm các khối lượng công việc AI nặng ngay lập tức.

Vera Rubin là nền tảng tích hợp CPU và GPU với bộ nhớ dung lượng cao, các CPU chuyên dụng và liên kết nội bộ tốc độ cao để giảm tắc nghẽn khi huấn luyện và suy luận mô hình. Thiết kế hướng tới hỗ trợ mô hình tạo sinh lớn và mạng nơ-ron sâu đòi hỏi băng thông bộ nhớ lớn.

Nền tảng được cung cấp dưới dạng khay tính toán NVL72 VR200 lắp sẵn, tích hợp CPU, GPU, bộ nhớ và thành phần mạng trong hệ thống sẵn sàng gắn vào rack. Điều này giúp đơn giản hóa việc tích hợp và cho phép các đối tác như Foxconn, Quanta và Supermicro bắt đầu thử nghiệm khối lượng công việc dữ liệu lớn ngay lập tức.

Về kiến trúc, Vera Rubin sử dụng NVLink 6.0 switch ASIC, DPU BlueField-4 kèm SSD tích hợp và liên kết dựa trên quang học để tăng tốc tính toán quy mô lớn. Mạng được hỗ trợ bởi Spectrum-6 Photonics Ethernet và card Quantum-CX9 InfiniBand, cùng silicon chuyển mạch thiết kế cho khả năng kết nối mở rộng giữa các rack trong trung tâm dữ liệu.

Theo tuyên bố của Colette Kress, giám đốc tài chính Nvidia, công ty đã giao các mẫu Vera Rubin đầu tiên trong tuần và dự kiến bắt đầu giao hàng sản xuất vào nửa sau của năm. Thiết kế khay mô-đun không dây cáp giúp tăng độ bền và thuận tiện trong bảo trì so với thế hệ Blackwell, và Nvidia kỳ vọng nhiều nhà xây dựng mô hình đám mây sẽ triển khai Vera Rubin.

Ngoài hạ tầng trung tâm dữ liệu, Nvidia còn hướng nền tảng này vào ứng dụng thực tế như tích hợp AI cho xe tự hành thông qua nền tảng Alpamayo và các dự án robotaxi, tận dụng mật độ xử lý và băng thông bộ nhớ cao của Vera Rubin.

Dù có nhiều tiến bộ kỹ thuật, mức độ phổ biến vẫn chưa chắc chắn. Các nhà phân tích lưu ý rủi ro liên quan tới cơ cấu tài chính phức tạp, vòng đầu tư khép kín và căng thẳng địa chính trị — ví dụ các quy định của Mỹ có thể ảnh hưởng tới việc bán chip AI tiên tiến sang Trung Quốc. Hiệu quả thực tế sẽ phụ thuộc vào cách các khách hàng tích hợp đồng bộ CPU, GPU và tài nguyên mạng để tăng tốc khối lượng công việc AI ở quy mô lớn.

Nguồn: Techradar
 
Back
Top