Supermicro mở rộng hệ thống Blackwell – Tối ưu hóa cho AI Factory

Supermicro mở rộng hệ thống Blackwell – Tối ưu hóa cho AI Factory

Supermicro mở rộng hệ thống Blackwell – Tối ưu hóa cho AI Factory

Ngày đăng Bởi
1. 4U DLC-2 Liquid-Cooled System – NVIDIA HGX B200
• Tiết kiệm năng lượng và nước
Cung cấp giải pháp làm mát bằng chất lỏng thế hệ mới (DLC 2), giúp tiết kiệm năng lượng đến 40% cho trung tâm dữ liệu và giảm 40% lượng nước sử dụng so với hệ thống làm mát khí truyền thống.
• Hiệu quả làm mát vượt trội
Hệ thống có khả năng thu nhiệt cực cao – lên đến 98% lượng nhiệt được hấp thụ qua plating lạnh của CPU, GPU, DIMM, VRM, PSU…
• Hoạt động êm ái và triển khai nhanh
Hoạt động ở mức ồn chỉ khoảng 50 dB, loại bỏ nhu cầu dùng quạt chạy nhanh hoặc thiết bị cánh sau nặng; đồng thời giúp nhanh chóng triển khai vào hoạt động.
• Khả năng triển khai ở quy mô rack tối ưu
Tích hợp giải pháp vertical Coolant Distribution Manifolds (CDM) để tối ưu không gian rack, cho phép:
o 8 hệ thống liquid cooled 4U với 64 GPU trong 1 rack 42U,
o hoặc đến 12 hệ thống (96 GPU) trong rack 52U.
• Cấu hình phần cứng mạnh mẽ
o CPU: Dual-socket Intel Xeon 6700 Series, mỗi socket hỗ trợ P core tối đa 350 W.
o Bộ nhớ: 32 DIMM DDR5 RDIMM, lên đến 8 TB (5200 MT/s) hoặc 4 TB (6400 MT/s).
o GPU: NVIDIA HGX B200 với 8 GPU, mỗi GPU 180 GB HBM3e, tổng cộng 1.4 TB HBM3e; kết nối NVLink thế hệ thứ 5 tốc độ 1.8 TB/s.
o Hỗ trợ mạng: 8 x 400 G ConnectX 7 NICs và 2 x BlueField 3 DPUs, dễ dàng quản lý từ front cold aisle. Hỗ trợ cả Quantum 2 InfiniBand và Spectrum X Ethernet.
• Tương thích tương lai với HGX B300
Hệ thống được thiết kế để dễ dàng nâng cấp lên nền tảng NVIDIA HGX B300 trong tương lai, giúp đầu tư linh hoạt và dài hơi hơn
2. 8U Air-Cooled Front I/O System – NVIDIA HGX B200
• Thiết kế front I/O tiện lợi
Các thành phần như NIC, DPU, storage và công cụ quản lý được bố trí ở mặt trước, giúp việc bảo trì tại hành lang lạnh (cold aisle) trở nên dễ dàng hơn.
• Tối ưu hiệu suất làm mát khí
Thiết kế 8U với CPU tray giảm chiều cao nhưng giữ nguyên GPU tray 6U đầy đủ để tối ưu luồng khí làm mát GPU.
• Thông số phần cứng tương đồng 4U
CPU, bộ nhớ, GPU, mạng và I/O đều giống như hệ thống liquid cooled, bao gồm:
o Dual-socket Xeon 6700 Series
o 32 DIMM DDR5 (đến 8 TB)
o 8 GPU HGX B200, mỗi GPU 180 GB HBM3e (1.4 TB tổng)
o ConnectX 7 NICs + BlueField 3 DPUs
o Tốc độ inference lên tới 15x, training nhanh hơn 3x so với GPU thế hệ Hopper.
• Phù hợp với môi trường không có hạ tầng làm mát bằng chất lỏng
Thiết kế này là lựa chọn lý tưởng cho các AI factory không có hệ thống liquid cooling, nhưng vẫn cần hiệu suất cao và khả năng mở rộng tốt
3. Điểm nổi bật chung & Tầm nhìn chiến lược
• Kiến trúc Building Block linh hoạt
Cho phép tùy chọn linh kiện như CPU, GPU, memory, networking, storage và cooling phù hợp với từng nhu cầu khách hàng.
• Tối ưu hóa chi phí vận hành (OPEX)
Nhờ tiết kiệm điện – nước – giảm noise – tăng density, hai hệ thống đều hỗ trợ giảm chi phí vận hành đáng kể, đặc biệt khi triển khai ở quy mô lớn.
• Sẵn sàng cho tương lai
Tương thích nâng cấp lên HGX B300, giúp bảo vệ đầu tư về mặt hạ tầng và dễ dàng mở rộng khi công nghệ mới ra mắt
Supermicro mở rộng hệ thống Blackwell – Tối ưu hóa cho AI Factory

Supermicro mở rộng hệ thống Blackwell – Tối ưu hóa cho AI Factory

Ngày đăng Bởi
1. 4U DLC-2 Liquid-Cooled System – NVIDIA HGX B200
• Tiết kiệm năng lượng và nước
Cung cấp giải pháp làm mát bằng chất lỏng thế hệ mới (DLC 2), giúp tiết kiệm năng lượng đến 40% cho trung tâm dữ liệu và giảm 40% lượng nước sử dụng so với hệ thống làm mát khí truyền thống.
• Hiệu quả làm mát vượt trội
Hệ thống có khả năng thu nhiệt cực cao – lên đến 98% lượng nhiệt được hấp thụ qua plating lạnh của CPU, GPU, DIMM, VRM, PSU…
• Hoạt động êm ái và triển khai nhanh
Hoạt động ở mức ồn chỉ khoảng 50 dB, loại bỏ nhu cầu dùng quạt chạy nhanh hoặc thiết bị cánh sau nặng; đồng thời giúp nhanh chóng triển khai vào hoạt động.
• Khả năng triển khai ở quy mô rack tối ưu
Tích hợp giải pháp vertical Coolant Distribution Manifolds (CDM) để tối ưu không gian rack, cho phép:
o 8 hệ thống liquid cooled 4U với 64 GPU trong 1 rack 42U,
o hoặc đến 12 hệ thống (96 GPU) trong rack 52U.
• Cấu hình phần cứng mạnh mẽ
o CPU: Dual-socket Intel Xeon 6700 Series, mỗi socket hỗ trợ P core tối đa 350 W.
o Bộ nhớ: 32 DIMM DDR5 RDIMM, lên đến 8 TB (5200 MT/s) hoặc 4 TB (6400 MT/s).
o GPU: NVIDIA HGX B200 với 8 GPU, mỗi GPU 180 GB HBM3e, tổng cộng 1.4 TB HBM3e; kết nối NVLink thế hệ thứ 5 tốc độ 1.8 TB/s.
o Hỗ trợ mạng: 8 x 400 G ConnectX 7 NICs và 2 x BlueField 3 DPUs, dễ dàng quản lý từ front cold aisle. Hỗ trợ cả Quantum 2 InfiniBand và Spectrum X Ethernet.
• Tương thích tương lai với HGX B300
Hệ thống được thiết kế để dễ dàng nâng cấp lên nền tảng NVIDIA HGX B300 trong tương lai, giúp đầu tư linh hoạt và dài hơi hơn
2. 8U Air-Cooled Front I/O System – NVIDIA HGX B200
• Thiết kế front I/O tiện lợi
Các thành phần như NIC, DPU, storage và công cụ quản lý được bố trí ở mặt trước, giúp việc bảo trì tại hành lang lạnh (cold aisle) trở nên dễ dàng hơn.
• Tối ưu hiệu suất làm mát khí
Thiết kế 8U với CPU tray giảm chiều cao nhưng giữ nguyên GPU tray 6U đầy đủ để tối ưu luồng khí làm mát GPU.
• Thông số phần cứng tương đồng 4U
CPU, bộ nhớ, GPU, mạng và I/O đều giống như hệ thống liquid cooled, bao gồm:
o Dual-socket Xeon 6700 Series
o 32 DIMM DDR5 (đến 8 TB)
o 8 GPU HGX B200, mỗi GPU 180 GB HBM3e (1.4 TB tổng)
o ConnectX 7 NICs + BlueField 3 DPUs
o Tốc độ inference lên tới 15x, training nhanh hơn 3x so với GPU thế hệ Hopper.
• Phù hợp với môi trường không có hạ tầng làm mát bằng chất lỏng
Thiết kế này là lựa chọn lý tưởng cho các AI factory không có hệ thống liquid cooling, nhưng vẫn cần hiệu suất cao và khả năng mở rộng tốt
3. Điểm nổi bật chung & Tầm nhìn chiến lược
• Kiến trúc Building Block linh hoạt
Cho phép tùy chọn linh kiện như CPU, GPU, memory, networking, storage và cooling phù hợp với từng nhu cầu khách hàng.
• Tối ưu hóa chi phí vận hành (OPEX)
Nhờ tiết kiệm điện – nước – giảm noise – tăng density, hai hệ thống đều hỗ trợ giảm chi phí vận hành đáng kể, đặc biệt khi triển khai ở quy mô lớn.
• Sẵn sàng cho tương lai
Tương thích nâng cấp lên HGX B300, giúp bảo vệ đầu tư về mặt hạ tầng và dễ dàng mở rộng khi công nghệ mới ra mắt
Trước Meta ký hợp đồng $10 tỷ với Google Cloud cho hạ tầng AI
Tiếp theo Máy chủ 2U tích hợp GPU RTX PRO 6000
Bình luận
Copyright © 2024 - Fastest, All Rights Reserved.