Сервер GPU Supermicro B200 Nvidia

GPU (Видеокарта)

NVIDIA HGX B200 180 ГБ HBM3e, NVIDIA HGX B200 8-GPU, NVIDIA HGX B200 8-GPU 180 ГБ HBM3e, NVIDIA Tesla HGX B200 SXM с NVLink и NVSwitch для связи между GPU

Количество дисков 1

2 | 4

Модель

SYS-A22G-NBRT | S-A22GA-B200-180GB-8 | AS-A126GS-TNBR

cpuvar

AMD EPYC 9354, 3.25 ГГц (Boost 3.8 ГГц), 256 МБ кэш, 280 Вт TDP, сокет SP5, Intel Xeon 6960P 6-го поколения, 72 ядра, 2.7 ГГц (500 Вт), 2.3 ГГц (400 Вт), Intel® Xeon® 6 6960P 72C 2,7 ГГц 500 Вт, P4X-GNR6972P 2P, 96C (2.6G/500W, 2.2/400)
Связаться со специалистом:
от 50 578 848 ₽ *

* цена в рублях по курсу ЦБ РФ на день оплаты по безналичному расчету.

3-летняя гарантия на сервера и накопители от производителя
Работаем с НДС на основании закона
от 28.06.2022 № 213-ФЗ
Варианты Supermicro B200 Nvidia
Бренд

Supermicro

Количество дисков 1

2, 4

Модель

SYS-A22G-NBRT, S-A22GA-B200-180GB-8, AS-A126GS-TNBR

GPU (Nvidia)

NVIDIA HGX B200

Оперативная память (RAM)

96 ГБ DDR5-6400 RDIMM ECC ×24, всего 2.3 ТБ

GPU сервер Supermicro B200 Nvidia относится к топовому классу вычислительных платформ для задач искусственного интеллекта. В основе — восемь ускорителей Nvidia B200 в исполнении SXM, объединенных через NVLink 5.0: суммарный объем HBM3e-памяти достигает 1,44 ТБ, чего хватает для запуска крупных языковых моделей без квантизации и без разделения весов между узлами.

Архитектура и ключевые параметры

Чип Nvidia B200 построен на архитектуре Blackwell с 208 млрд транзисторов. Он работает с форматами FP4, FP8, BF16, FP32 и FP64 — один сервер перекрывает задачи от ультрабыстрого инференса до расчетов с двойной точностью. Корпус — 4U Rackmount с полностью жидкостным охлаждением по схеме DLC-2. Это принципиально: при TDP восьми ускорителей воздушное охлаждение физически не справляется с теплоотводом.

Процессорная база — два Intel Xeon серии 6900 с поддержкой до 128 физических ядер на сервер. Слотов под DDR5 ECC — 24, максимальный объем ОЗУ — 6 ТБ. Дисковая подсистема: 10 отсеков 2.5" NVMe с горячей заменой, шина PCIe 5.0. Питание — шесть резервированных блоков по 5 250 Вт с возможностью замены под нагрузкой.

Полные характеристики платформы SYS-422GA-NBRT-LCC:

  • 8 ускорителей Nvidia HGX B200, 180–192 ГБ HBM3e на каждый

  • Суммарная GPU-память: 1,44–1,5 ТБ

  • Шина GPU: NVLink 5.0 + NVSwitch, пропускная способность до 14,4 ТБ/с

  • CPU: 2× Intel Xeon Scalable серии 6900, до 64 ядер на процессор

  • ОЗУ: до 6 ТБ DDR5 ECC, 24 слота (DDR5-6400 с MRDIMM)

  • Хранилище: 10× 2.5" NVMe Hot Swap (PCIe 5.0) + 2× M.2 NVMe

  • Охлаждение: жидкостное DLC-2, требуется CDU мощностью от 250 кВт

  • Питание: 6 блоков по 5 250 Вт (горячая замена)

  • Форм-фактор: 4U Rackmount

  • Сеть: 8× NVIDIA ConnectX-7 по 400 GbE + 2× BlueField-3 DPU

Производительность относительно предыдущего поколения

Переход с H100 на B200 — не плановое обновление, а смена логики работы с памятью. Пропускная способность HBM3e выросла до 8 ТБ/с на один ускоритель против 3,35 ТБ/с у H100. Для больших батчей и длинного контекста это убирает память как узкое место.

По результатам MLPerf-бенчмарков: одиночный B200 быстрее одиночного H100 примерно в 2,2 раза при обучении и до 4 раз при инференсе. На уровне готовых систем разрыв шире — DGX B200 против DGX H100 показывает трехкратный прирост при тренинге и 15-кратный при инференсе.

Transformer Engine второго поколения переключает точность между FP8 и BF16 пословно — это ускоряет обучение без потери точности модели. Поддержка Multi-Instance GPU (MIG) позволяет нарезать каждый ускоритель на независимые виртуальные экземпляры, что критично для инференс-сервисов с несколькими изолированными рабочими нагрузками.

Совместимость с фреймворками и моделями

B200 работает с полным стеком NVIDIA AI Enterprise: CUDA, TensorRT, TensorRT-LLM, Triton, PyTorch, vLLM. Протестированные конфигурации покрывают весь диапазон актуальных открытых моделей:

  • DeepSeek-R1 685B — запускается без квантизации, требует ~689 ГБ VRAM.

  • Mistral-Large-3-675B — рассчитана на reasoning и RAG-пайплайны.

  • GigaChat3-702B — работает в полной точности на восьми B200.

  • GPT-oss 120B — распараллеливается по 2–4 GPU, подходит для больших батчей.

  • Stable Diffusion XL, Flux.2-dev, Kandinsky 5.0 — генерация изображений и видео.

GPU сервер Supermicro с ускорителями Nvidia B200 рассчитан на подключение в кластеры NVIDIA DGX и NVIDIA HGX B200: до 8 серверов в одной стойке 42U (модель SRS-48UDLC-4U8N-L1), суммарно 64 ускорителя Blackwell на стойку.

Где применяется платформа

GPU Supermicro чаще всего применяется для четырех задач:

  1. Тренинг и дообучение больших моделей. При 1,44 ТБ суммарной HBM3e-памяти модели до ~700B параметров помещаются на одном сервере без pipeline-разбиения. Задачи, которые раньше занимали несколько недель на H100-кластере, выполняются за сопоставимое время на одном узле B200.

  2. Продакшн-инференс. vLLM и TensorRT-LLM на B200 в режиме FP8 дают меньшую задержку первого токена, чем H100 в FP16 — при сравнимой точности ответа. MIG позволяет параллельно держать несколько моделей в памяти без конкурентного доступа.

  3. HPC и научные вычисления. Суммарная мощность в FP64 на уровне 296 TFLOPS делает платформу пригодной для молекулярной динамики, климатического моделирования и финансовых расчетов, где двойная точность обязательна.

Интеграция в AI-кластеры. Восемь портов ConnectX-7 по 400 GbE и два BlueField-3 DPU на сервер дают суммарную сетевую пропускную способность свыше 3,2 Тбит/с. Это перекрывает требования к East-West трафику в мультитенантных кластерах.

Часто задаваемые вопросы

Для каких задач платформа подходит лучше всего?

Обучение и дообучение LLM от 7B до 700B+ параметров, инференс с высоким QPS, HPC-расчеты с FP64, генерация изображений и видео диффузионными моделями. По MLPerf-бенчмаркам один B200 дает 2,2× при тренинге и до 4× при инференсе относительно H100. На уровне систем DGX разрыв — 3× при тренинге и 15× при инференсе.

Можно ли расширить сервер под растущие задачи?

Память расширяется до 6 ТБ DDR5 через 24 слота. Дисковая емкость — до 10 NVMe в горячей замене. Серверы объединяются в кластеры через InfiniBand NDR или Ethernet 400 GbE: одна стойка вмещает до восьми платформ, 64 ускорителя суммарно. ServerICT согласовывает финальный состав накопителей, сетевых карт и блоков питания под конкретную задачу при заказе.

Что нужно учесть по питанию и охлаждению?

Платформа требует жидкостного охлаждения — воздушная схема для этого класса мощности не применяется. Нужен контур охлаждения с CDU от 250 кВт и соответствующее электропитание: при восьми ускорителях под нагрузкой суммарное энергопотребление узла превышает 10 кВт. Перед заказом инженеры ServerICT оценят, что нужно доработать в инфраструктуре ЦОД.

Как устроена гарантия и обслуживание?

ServerICT выдает собственную гарантию на 12 месяцев — она работает независимо от того, присутствует ли вендор официально на российском рынке. Постгарантийное сопровождение оформляется отдельным договором. Каждая поставка идет с заводскими документами, актами таможенного оформления и сертификатами.

Помогут ли с установкой ПО и настройкой?

Да. Отдел MLOps-инженеров ServerICT закрывает установку драйверов, сборку CUDA-окружения, развертывание vLLM и TensorRT-LLM, конфигурацию кластера. Инженеры работали с продакшн-инфраструктурой под реальные AI-проекты и знают, где возникают проблемы при первом запуске LLM на железе.

Чтобы получить расчет стоимости и сроков поставки GPU сервера Supermicro B200 под вашу задачу — оставьте заявку или свяжитесь с менеджером ServerICT напрямую.

Доставка – за наш счет!

Доставим ваш товар в любую точку России бесплатно.

    • Ожидаете оборудование в Москве? Наша компания или наши партнеры привезут аппаратуру по указанному адресу. Очень быстро.

Время доставки до Москвы:

      • OEM и товары со склада: 3-5 недель
      • Full Factory: 4-12 недель (в зависимости от бренда, сроков производства и очереди)

 

  • Офис в другом регионе? Сразу после завершения таможенного оформления транспортная компания привезет вашу покупку в нужный город.
    Приятно удивим скоростью доставки.

Доставляем товар максимально аккуратно. Потому что, если с грузом что-то случится, убытки покрывать нам.
Наше кредо: полная защита финансовых интересов клиента!

Как купить?

  • Расчет в рублях, по курсу ЦБ РФ на день платежа. Только так.
  • Строго соблюдаем налоговый режим (ОСНО), поэтому 20 % НДС входит в стоимость вашего товара.
  • У нас 100%-ная предоплата. По классике: утром деньги, вечером стулья.
  • Но: если вы – наш постоянный клиент, то сможете оплатить заказ позже. Договоримся!
  • Физическим лицам отправляем ссылку на оплату через онлайн-кассу — быстро и удобно.

Подпишитесь на обновления ServerICT

Получайте информацию о наличии оборудования, спецусловиях и новых решениях для бизнеса.

Почему выбирают SERVER ICT

15 лет работаем с Китаем

Оказываем услуги системным интеграторам, входящим в топ-100 российского рынка, и дистрибьюторам, входящим в топ-5! 

×2 оборот за два года

В последние два года оборот компании устойчиво растет, что свидетельствует о её эффективности и прогрессе.

>300 поставщиков со всего мира

Мы гордимся сотрудничеством с более чем 300 международными поставщиками, предлагая качественное оборудование.

90% cкидка от GPL

Предлагаем вам цену на товар на 90% ниже, чем GPL, так как мы получаем оборудование напрямую от изготовителя, что гораздо дешевле.

Подберем любое оборудование* под ваш запрос

    * ноутбуки, настольные компьютеры, телефоны, планшеты и т.д.