AWS ra mắt Blackwell-Powered AI Servers

AWS ra mắt Blackwell-Powered AI Servers

AWS ra mắt Blackwell-Powered AI Servers

Ngày đăng Bởi
 
 
 
 
1. Hiệu năng siêu khủng – 360 petaflops FP8, 13.4 TB HBM3e
• Mỗi UltraServer gồm 36 hoặc 72 GPU NVIDIA Blackwell kết nối trong cùng một NVLink domain, tổng đạt 360 petaflops (FP8) và 13.4 TB HBM3e bộ nhớ tốc cao.
• Sức mạnh này tăng >20× GPU TFLOPS và >11× dung lượng GPU HBM so với EC2 P5en đời trước.
________________________________________
2. Thiết kế rack-scale & kết nối hiệu quả
• UltraCluster đầu tiên: triển khai ở Dallas Local Zone, hỗ trợ kết nối lên đến hàng chục nghìn GPU với EFAv4—băng thông 28.8 Tbps, cải thiện tốc độ giao tiếp 18% so với EFAv3.
• Dùng NVLink 5 thế hệ mới – cho kết nối giữa GPU nhanh hơn đến 1.8 TB/s mỗi GPU.
________________________________________
3. Làm mát công nghệ cao – In Row Heat Exchanger (IRHX)
• AWS hợp tác với NVIDIA phát triển hệ thống làm mát tự thiết kế IRHX gồm pump, fan coil & cold plate, đảm bảo hỗ trợ GPU Blackwell 72 đơn vị mà không cần thay đổi thiết kế data center.
• IRHX phù hợp cho các data center hiện hữu, không cần cải tạo lớn—sẵn sàng tận dụng hạ tầng hiện có của AWS.
________________________________________
4. An toàn & ổn định – AWS Nitro System
• UltraServers chạy trên kiến trúc AWS Nitro System thế hệ 6, đảm bảo tính bảo mật cao: người dùng AWS không thể truy cập dữ liệu GPU. Firmware có thể cập nhật mà không gián đoạn hoạt động.
• Hệ thống UltraCluster thế hệ 3 giảm 40% năng lượng tiêu thụ và giảm 80% cáp, giúp tăng độ tin cậy và giảm điểm lỗi.
________________________________________
 5. Hỗ trợ mạng & dịch vụ quản lý
• EFAv4 + GPUDirect RDMA: giao tiếp giữa các GPU có độ trễ thấp và băng thông cao.
• Tích hợp với Amazon SageMaker HyperPod & EKS, tự động provision, cân bằng tải và thay thế node hỏng trong cùng domain NVLink.
________________________________________
6. Ứng dụng và lợi ích thực tế
• Thích hợp cho training frontier models (trillion-parameter), inference mô hình reasoning/agentic AI, ứng dụng đa dạng như drug discovery, enterprise search, video generation.
• P6e GB200 cung cấp khả năng inference nhanh chóng trong 1 NVLink domain, giảm latency và cải thiện hiệu năng cho workloads real-time.
 
 
AWS ra mắt Blackwell-Powered AI Servers

AWS ra mắt Blackwell-Powered AI Servers

Ngày đăng Bởi
 
 
 
 
1. Hiệu năng siêu khủng – 360 petaflops FP8, 13.4 TB HBM3e
• Mỗi UltraServer gồm 36 hoặc 72 GPU NVIDIA Blackwell kết nối trong cùng một NVLink domain, tổng đạt 360 petaflops (FP8) và 13.4 TB HBM3e bộ nhớ tốc cao.
• Sức mạnh này tăng >20× GPU TFLOPS và >11× dung lượng GPU HBM so với EC2 P5en đời trước.
________________________________________
2. Thiết kế rack-scale & kết nối hiệu quả
• UltraCluster đầu tiên: triển khai ở Dallas Local Zone, hỗ trợ kết nối lên đến hàng chục nghìn GPU với EFAv4—băng thông 28.8 Tbps, cải thiện tốc độ giao tiếp 18% so với EFAv3.
• Dùng NVLink 5 thế hệ mới – cho kết nối giữa GPU nhanh hơn đến 1.8 TB/s mỗi GPU.
________________________________________
3. Làm mát công nghệ cao – In Row Heat Exchanger (IRHX)
• AWS hợp tác với NVIDIA phát triển hệ thống làm mát tự thiết kế IRHX gồm pump, fan coil & cold plate, đảm bảo hỗ trợ GPU Blackwell 72 đơn vị mà không cần thay đổi thiết kế data center.
• IRHX phù hợp cho các data center hiện hữu, không cần cải tạo lớn—sẵn sàng tận dụng hạ tầng hiện có của AWS.
________________________________________
4. An toàn & ổn định – AWS Nitro System
• UltraServers chạy trên kiến trúc AWS Nitro System thế hệ 6, đảm bảo tính bảo mật cao: người dùng AWS không thể truy cập dữ liệu GPU. Firmware có thể cập nhật mà không gián đoạn hoạt động.
• Hệ thống UltraCluster thế hệ 3 giảm 40% năng lượng tiêu thụ và giảm 80% cáp, giúp tăng độ tin cậy và giảm điểm lỗi.
________________________________________
 5. Hỗ trợ mạng & dịch vụ quản lý
• EFAv4 + GPUDirect RDMA: giao tiếp giữa các GPU có độ trễ thấp và băng thông cao.
• Tích hợp với Amazon SageMaker HyperPod & EKS, tự động provision, cân bằng tải và thay thế node hỏng trong cùng domain NVLink.
________________________________________
6. Ứng dụng và lợi ích thực tế
• Thích hợp cho training frontier models (trillion-parameter), inference mô hình reasoning/agentic AI, ứng dụng đa dạng như drug discovery, enterprise search, video generation.
• P6e GB200 cung cấp khả năng inference nhanh chóng trong 1 NVLink domain, giảm latency và cải thiện hiệu năng cho workloads real-time.
 
 
Trước Kế hoạch giải quyết năng lượng của các “ông lớn” công nghệ.
Tiếp theo Amazon xây dựng siêu data center AI lớn nhất tại Indiana.
Bình luận
Copyright © 2024 - Fastest, All Rights Reserved.