1. GPU AMD Instinct MI400 Series
• HBM4 432 GB bộ nhớ, băng thông bộ nhớ độc lập 19.6 TB/s mỗi GPU, và 40 PFLOPS FP4 hiệu năng thấp–độ chính xác (dense).
• Tổng cộng 72 GPU MI400 trong rack, mang lại 2.9 exaFLOPS FP4 inference và 1.4 exaFLOPS FP8 training.
________________________________________
2. Liên kết UALink chuẩn mở
• Ultra Accelerator Link (UALink) — giải pháp thay thế NVLink, cho phép liên kết giữa 72 GPU và NIC qua băng thông 260 TB/s nội bộ.
• Mỗi GPU có 300 GB/s băng thông scale-out kết nối với Pensando Vulcano NIC 800 GbE.
________________________________________
• CPU EPYC “Venice” (Zen 6, 256 lõi, nhanh hơn Zen 5 ~70%, băng thông RAM đến 1.6 TB/s, hỗ trợ PCIe Gen6).
• NIC Pensando “Vulcano”, chuẩn UEC, hỗ trợ PCIe & UALink, tốc độ mạng 800 GbE, tăng scale-out bandwidth 8× so với thế hệ trước.
________________________________________
4. Thiết kế rack-scale “double-wide”
• Rack kép (double wide) chuẩn OCPv3W để chứa 72 GPU MI400, EPYC CPUs và Vulcano NIC.
• Thiết kế này cho phép mở rộng băng thông lớn hơn quy mô 19″ thông thường, phù hợp cho trung tâm dữ liệu quy mô lớn mà không bị giới hạn bởi diện tích mặt sàn .
________________________________________
5. Hiệu năng & mất năng lượng
• Helios mang đến 2.9 exaFLOPS FP4, 1.4 exaFLOPS FP8; băng thông nội bộ 260 TB/s, cộng thêm 50 % bandwidth và scale out so với thế hệ MI350 rack.
• Thiết kế tối ưu năng lượng: AMD đặt mục tiêu tiết kiệm 20× hiệu năng/rack tiêu thụ điện vào năm 2030 so với năm 2024.
________________________________________
6. Khả năng triển khai thực tế
• AMD hỗ trợ phần mềm ROCm 7 và khung phát triển để đảm bảo tích hợp đầy đủ; MI350 đã được triển khai qua các CSP như Oracle OCI và các đối tác OEM/ODM.
• Đối thủ trực tiếp: Nvidia Vera Rubin NVL144 cũng hỗ trợ 72 GPU/rack, 3.6 exaFLOPS FP4 – nên Helios cạnh tranh trực tiếp ở thị trường “rack-scale AI”
________________________________________
• Helios là bước tiến quan trọng trong cuộc đua AI server khi AMD tạo ra solution tích hợp từ CPU–GPU–NIC–interconnect, giúp tối ưu hiệu năng & năng lượng.
• Thiết kế mở, băng thông cao, và tính linh hoạt của kiến trúc hướng tới triển khai trong các trung tâm dữ liệu quy mô petaflop.
• Dự kiến ra mắt năm 2026, Helios có tiềm năng thúc đẩy AMD cạnh tranh mạnh với Nvidia ở phân khúc rack-scale AI.
#AI #AMD #FASTEST #ANHDUCJSC