ServerICTСерверы GPUSupermicroSupermicro B200 Nvidia

Сервер GPU Supermicro B200 Nvidia

GPU (Видеокарта)

NVIDIA HGX B200 180 ГБ HBM3e, NVIDIA HGX B200 8-GPU, NVIDIA HGX B200 8-GPU 180 ГБ HBM3e, NVIDIA Tesla HGX B200 SXM с NVLink и NVSwitch для связи между GPU

Количество дисков 1

2 | 4

Модель

SYS-A22G-NBRT | S-A22GA-B200-180GB-8 | AS-A126GS-TNBR

CPU-var

AMD EPYC 9354, 3.25 ГГц (Boost 3.8 ГГц), 256 МБ кэш, 280 Вт TDP, сокет SP5, Intel Xeon 6960P 6-го поколения, 72 ядра, 2.7 ГГц (500 Вт), 2.3 ГГц (400 Вт), Intel® Xeon® 6 6960P 72C 2,7 ГГц 500 Вт, P4X-GNR6972P 2P, 96C (2.6G/500W, 2.2/400)

Связаться со специалистом:

info@serverict.com

от 50 578 848 ₽ *

* цена в рублях по курсу ЦБ РФ на день оплаты по безналичному расчету.

Техническая поддержка

3-летняя гарантия на сервера и накопители от производителя

Работаем с НДС на основании закона
от 28.06.2022 № 213-ФЗ

Supermicro Серверы GPU

Варианты Supermicro B200 Nvidia

B200 Nvidia Арт. S-SYS-B200-1-128GB

Сеть 1: Nvidia 900-9X766-003N-SQ0 PCIe 1-port IB 400GE OSFP Gen5х8

Диск 1: 1.9TB NVMe PCIe4 M.2 22x80mm 3D TLC

Количество дисков 1: 2

56 838 057 ₽

B200 Nvidia Арт. S-SYS-B200-1-64 GB

Сеть 1: Nvidia 900-9X766-003N-SQ0 PCIe 1-портовый IB 400GE OSFP Gen5х8

Диск 1: 1,9 ТБ NVMe

Количество дисков 1: 2

59 459 912 ₽

B200 Nvidia Арт. S-A22GA-B200-180GB-8

Сеть 1: 8× 400 Gb InfiniBand / Ethernet OSFP карты AOC-CX766003N-SQ0

Диск 1: 3.84 ТБ

Количество дисков 1: 4

50 578 848 ₽

B200 Nvidia Арт. S-A126GS-B200-64G-8

Сеть 1: 2× 10GbE RJ45 Intel X710

Сеть 2: 1× Intel X710 PCIe 3.0 x8 2×10G SFP+ (LR-Link

Диск 1: 960GB Samsung PM9A3 NVMe PCIe 4.0 (U.2, 7mm)

Количество дисков 1: 2

51 235 716 ₽

Бренд

Supermicro

RAM

24 слота DIMM, поддержка до 6 ТБ ECC DDR5 RDIMM/MRDIMM с интенсивностью до 6400 МТ/с

GPU (Видеокарта)

NVIDIA HGX B200 180 ГБ HBM3e, NVIDIA HGX B200 8-GPU, NVIDIA HGX B200 8-GPU 180 ГБ HBM3e, NVIDIA Tesla HGX B200 SXM с NVLink и NVSwitch для связи между GPU

Количество дисков 1

2, 4

Модель

SYS-A22G-NBRT, S-A22GA-B200-180GB-8, AS-A126GS-TNBR

CPU-var

Количество CPU

RAM-var

96GB DDR5-6400 RDIMM, 96 ГБ DDR5-6400 RDIMM, 96 ГБ DDR5-6400 RDIMM ECC ×24, всего 2.3 ТБ, Samsung DDR5 64GB RDIMM 4800 Мбит/с (2Rx4) ECC Reg 1.1V

Kolichestvo planok

Disk1

1.9TB NVMe PCIe4 M.2 22x80mm 3D TLC, 1,9 ТБ NVMe, 3.84 ТБ, 960GB Samsung PM9A3 NVMe PCIe 4.0 (U.2, 7mm)

KolvoD1

2, 4

disk2

960 ГБ, 7.68TB Samsung PM9A3 NVMe PCIe 4.0 (U.2, 7mm)

Network1

Nvidia 900-9X766-003N-SQ0 PCIe 1-port IB 400GE OSFP Gen5х8, Nvidia 900-9X766-003N-SQ0 PCIe 1-портовый IB 400GE OSFP Gen5х8, 8× 400 Gb InfiniBand / Ethernet OSFP карты AOC-CX766003N-SQ0, 2× 10GbE RJ45 Intel X710

network2

1× Intel X710 PCIe 3.0 x8 2×10G SFP+ (LR-Link

Kol-vo-GPU

GPU (Nvidia)

NVIDIA HGX B200

Оперативная память (RAM)

96 ГБ DDR5-6400 RDIMM ECC ×24, всего 2.3 ТБ

GPU сервер Supermicro B200 Nvidia относится к топовому классу вычислительных платформ для задач искусственного интеллекта. В основе — восемь ускорителей Nvidia B200 в исполнении SXM, объединенных через NVLink 5.0: суммарный объем HBM3e-памяти достигает 1,44 ТБ, чего хватает для запуска крупных языковых моделей без квантизации и без разделения весов между узлами.

Архитектура и ключевые параметры

Чип Nvidia B200 построен на архитектуре Blackwell с 208 млрд транзисторов. Он работает с форматами FP4, FP8, BF16, FP32 и FP64 — один сервер перекрывает задачи от ультрабыстрого инференса до расчетов с двойной точностью. Корпус — 4U Rackmount с полностью жидкостным охлаждением по схеме DLC-2. Это принципиально: при TDP восьми ускорителей воздушное охлаждение физически не справляется с теплоотводом.

Процессорная база — два Intel Xeon серии 6900 с поддержкой до 128 физических ядер на сервер. Слотов под DDR5 ECC — 24, максимальный объем ОЗУ — 6 ТБ. Дисковая подсистема: 10 отсеков 2.5" NVMe с горячей заменой, шина PCIe 5.0. Питание — шесть резервированных блоков по 5 250 Вт с возможностью замены под нагрузкой.

Полные характеристики платформы SYS-422GA-NBRT-LCC:

8 ускорителей Nvidia HGX B200, 180–192 ГБ HBM3e на каждый
Суммарная GPU-память: 1,44–1,5 ТБ
Шина GPU: NVLink 5.0 + NVSwitch, пропускная способность до 14,4 ТБ/с
CPU: 2× Intel Xeon Scalable серии 6900, до 64 ядер на процессор
ОЗУ: до 6 ТБ DDR5 ECC, 24 слота (DDR5-6400 с MRDIMM)
Хранилище: 10× 2.5" NVMe Hot Swap (PCIe 5.0) + 2× M.2 NVMe
Охлаждение: жидкостное DLC-2, требуется CDU мощностью от 250 кВт
Питание: 6 блоков по 5 250 Вт (горячая замена)
Форм-фактор: 4U Rackmount
Сеть: 8× NVIDIA ConnectX-7 по 400 GbE + 2× BlueField-3 DPU

Производительность относительно предыдущего поколения

Переход с H100 на B200 — не плановое обновление, а смена логики работы с памятью. Пропускная способность HBM3e выросла до 8 ТБ/с на один ускоритель против 3,35 ТБ/с у H100. Для больших батчей и длинного контекста это убирает память как узкое место.

По результатам MLPerf-бенчмарков: одиночный B200 быстрее одиночного H100 примерно в 2,2 раза при обучении и до 4 раз при инференсе. На уровне готовых систем разрыв шире — DGX B200 против DGX H100 показывает трехкратный прирост при тренинге и 15-кратный при инференсе.

Transformer Engine второго поколения переключает точность между FP8 и BF16 пословно — это ускоряет обучение без потери точности модели. Поддержка Multi-Instance GPU (MIG) позволяет нарезать каждый ускоритель на независимые виртуальные экземпляры, что критично для инференс-сервисов с несколькими изолированными рабочими нагрузками.

Совместимость с фреймворками и моделями

B200 работает с полным стеком NVIDIA AI Enterprise: CUDA, TensorRT, TensorRT-LLM, Triton, PyTorch, vLLM. Протестированные конфигурации покрывают весь диапазон актуальных открытых моделей:

DeepSeek-R1 685B — запускается без квантизации, требует ~689 ГБ VRAM.
Mistral-Large-3-675B — рассчитана на reasoning и RAG-пайплайны.
GigaChat3-702B — работает в полной точности на восьми B200.
GPT-oss 120B — распараллеливается по 2–4 GPU, подходит для больших батчей.
Stable Diffusion XL, Flux.2-dev, Kandinsky 5.0 — генерация изображений и видео.

GPU сервер Supermicro с ускорителями Nvidia B200 рассчитан на подключение в кластеры NVIDIA DGX и NVIDIA HGX B200: до 8 серверов в одной стойке 42U (модель SRS-48UDLC-4U8N-L1), суммарно 64 ускорителя Blackwell на стойку.

Где применяется платформа

GPU Supermicro чаще всего применяется для четырех задач:

Тренинг и дообучение больших моделей. При 1,44 ТБ суммарной HBM3e-памяти модели до ~700B параметров помещаются на одном сервере без pipeline-разбиения. Задачи, которые раньше занимали несколько недель на H100-кластере, выполняются за сопоставимое время на одном узле B200.
Продакшн-инференс. vLLM и TensorRT-LLM на B200 в режиме FP8 дают меньшую задержку первого токена, чем H100 в FP16 — при сравнимой точности ответа. MIG позволяет параллельно держать несколько моделей в памяти без конкурентного доступа.
HPC и научные вычисления. Суммарная мощность в FP64 на уровне 296 TFLOPS делает платформу пригодной для молекулярной динамики, климатического моделирования и финансовых расчетов, где двойная точность обязательна.

Интеграция в AI-кластеры. Восемь портов ConnectX-7 по 400 GbE и два BlueField-3 DPU на сервер дают суммарную сетевую пропускную способность свыше 3,2 Тбит/с. Это перекрывает требования к East-West трафику в мультитенантных кластерах.

Часто задаваемые вопросы

Для каких задач платформа подходит лучше всего?

Обучение и дообучение LLM от 7B до 700B+ параметров, инференс с высоким QPS, HPC-расчеты с FP64, генерация изображений и видео диффузионными моделями. По MLPerf-бенчмаркам один B200 дает 2,2× при тренинге и до 4× при инференсе относительно H100. На уровне систем DGX разрыв — 3× при тренинге и 15× при инференсе.

Можно ли расширить сервер под растущие задачи?

Память расширяется до 6 ТБ DDR5 через 24 слота. Дисковая емкость — до 10 NVMe в горячей замене. Серверы объединяются в кластеры через InfiniBand NDR или Ethernet 400 GbE: одна стойка вмещает до восьми платформ, 64 ускорителя суммарно. ServerICT согласовывает финальный состав накопителей, сетевых карт и блоков питания под конкретную задачу при заказе.

Что нужно учесть по питанию и охлаждению?

Платформа требует жидкостного охлаждения — воздушная схема для этого класса мощности не применяется. Нужен контур охлаждения с CDU от 250 кВт и соответствующее электропитание: при восьми ускорителях под нагрузкой суммарное энергопотребление узла превышает 10 кВт. Перед заказом инженеры ServerICT оценят, что нужно доработать в инфраструктуре ЦОД.

Как устроена гарантия и обслуживание?

ServerICT выдает собственную гарантию на 12 месяцев — она работает независимо от того, присутствует ли вендор официально на российском рынке. Постгарантийное сопровождение оформляется отдельным договором. Каждая поставка идет с заводскими документами, актами таможенного оформления и сертификатами.

Помогут ли с установкой ПО и настройкой?

Да. Отдел MLOps-инженеров ServerICT закрывает установку драйверов, сборку CUDA-окружения, развертывание vLLM и TensorRT-LLM, конфигурацию кластера. Инженеры работали с продакшн-инфраструктурой под реальные AI-проекты и знают, где возникают проблемы при первом запуске LLM на железе.

Чтобы получить расчет стоимости и сроков поставки GPU сервера Supermicro B200 под вашу задачу — оставьте заявку или свяжитесь с менеджером ServerICT напрямую.

Доставка – за наш счет!

Доставим ваш товар в любую точку России бесплатно.

- Ожидаете оборудование в Москве? Наша компания или наши партнеры привезут аппаратуру по указанному адресу. Очень быстро.

Время доставки до Москвы:

- - OEM и товары со склада: 3-5 недель
  - Full Factory: 4-12 недель (в зависимости от бренда, сроков производства и очереди)

Офис в другом регионе? Сразу после завершения таможенного оформления транспортная компания привезет вашу покупку в нужный город.
Приятно удивим скоростью доставки.

Доставляем товар максимально аккуратно. Потому что, если с грузом что-то случится, убытки покрывать нам.
Наше кредо: полная защита финансовых интересов клиента!

Как купить?

Расчет в рублях, по курсу ЦБ РФ на день платежа. Только так.
Строго соблюдаем налоговый режим (ОСНО), поэтому 20 % НДС входит в стоимость вашего товара.
У нас 100%-ная предоплата. По классике: утром деньги, вечером стулья.
Но: если вы – наш постоянный клиент, то сможете оплатить заказ позже. Договоримся!
Физическим лицам отправляем ссылку на оплату через онлайн-кассу — быстро и удобно.

Подпишитесь на обновления ServerICT

Получайте информацию о наличии оборудования, спецусловиях и новых решениях для бизнеса.

Почему выбирают SERVER ICT

15 лет работаем с Китаем

Оказываем услуги системным интеграторам, входящим в топ-100 российского рынка, и дистрибьюторам, входящим в топ-5!

×2 оборот за два года

В последние два года оборот компании устойчиво растет, что свидетельствует о её эффективности и прогрессе.

>300 поставщиков со всего мира

Мы гордимся сотрудничеством с более чем 300 международными поставщиками, предлагая качественное оборудование.

90% cкидка от GPL

Предлагаем вам цену на товар на 90% ниже, чем GPL, так как мы получаем оборудование напрямую от изготовителя, что гораздо дешевле.

Подберем любое оборудование* под ваш запрос

Прикрепить ТЗ или реквизиты

Подтверждаю, что ознакомлен(а) с Политикой конфиденциальности

Подтверждаю согласие на обработку персональных данных

Подтверждаю согласие на получение рекламы

* ноутбуки, настольные компьютеры, телефоны, планшеты и т.д.