Сервер GPU Supermicro B200 Nvidia
GPU (Видеокарта)
Количество дисков 1
Модель
cpuvar
* цена в рублях по курсу ЦБ РФ на день оплаты по безналичному расчету.
от 28.06.2022 № 213-ФЗ
Supermicro
2, 4
SYS-A22G-NBRT, S-A22GA-B200-180GB-8, AS-A126GS-TNBR
NVIDIA HGX B200
GPU сервер Supermicro B200 Nvidia относится к топовому классу вычислительных платформ для задач искусственного интеллекта. В основе — восемь ускорителей Nvidia B200 в исполнении SXM, объединенных через NVLink 5.0: суммарный объем HBM3e-памяти достигает 1,44 ТБ, чего хватает для запуска крупных языковых моделей без квантизации и без разделения весов между узлами.
Архитектура и ключевые параметры
Чип Nvidia B200 построен на архитектуре Blackwell с 208 млрд транзисторов. Он работает с форматами FP4, FP8, BF16, FP32 и FP64 — один сервер перекрывает задачи от ультрабыстрого инференса до расчетов с двойной точностью. Корпус — 4U Rackmount с полностью жидкостным охлаждением по схеме DLC-2. Это принципиально: при TDP восьми ускорителей воздушное охлаждение физически не справляется с теплоотводом.
Процессорная база — два Intel Xeon серии 6900 с поддержкой до 128 физических ядер на сервер. Слотов под DDR5 ECC — 24, максимальный объем ОЗУ — 6 ТБ. Дисковая подсистема: 10 отсеков 2.5" NVMe с горячей заменой, шина PCIe 5.0. Питание — шесть резервированных блоков по 5 250 Вт с возможностью замены под нагрузкой.
Полные характеристики платформы SYS-422GA-NBRT-LCC:
-
8 ускорителей Nvidia HGX B200, 180–192 ГБ HBM3e на каждый
-
Суммарная GPU-память: 1,44–1,5 ТБ
-
Шина GPU: NVLink 5.0 + NVSwitch, пропускная способность до 14,4 ТБ/с
-
CPU: 2× Intel Xeon Scalable серии 6900, до 64 ядер на процессор
-
Охлаждение: жидкостное DLC-2, требуется CDU мощностью от 250 кВт
-
Питание: 6 блоков по 5 250 Вт (горячая замена)
-
Форм-фактор: 4U Rackmount
-
Сеть: 8× NVIDIA ConnectX-7 по 400 GbE + 2× BlueField-3 DPU
Производительность относительно предыдущего поколения
Переход с H100 на B200 — не плановое обновление, а смена логики работы с памятью. Пропускная способность HBM3e выросла до 8 ТБ/с на один ускоритель против 3,35 ТБ/с у H100. Для больших батчей и длинного контекста это убирает память как узкое место.
По результатам MLPerf-бенчмарков: одиночный B200 быстрее одиночного H100 примерно в 2,2 раза при обучении и до 4 раз при инференсе. На уровне готовых систем разрыв шире — DGX B200 против DGX H100 показывает трехкратный прирост при тренинге и 15-кратный при инференсе.
Transformer Engine второго поколения переключает точность между FP8 и BF16 пословно — это ускоряет обучение без потери точности модели. Поддержка Multi-Instance GPU (MIG) позволяет нарезать каждый ускоритель на независимые виртуальные экземпляры, что критично для инференс-сервисов с несколькими изолированными рабочими нагрузками.
Совместимость с фреймворками и моделями
B200 работает с полным стеком NVIDIA AI Enterprise: CUDA, TensorRT, TensorRT-LLM, Triton, PyTorch, vLLM. Протестированные конфигурации покрывают весь диапазон актуальных открытых моделей:
-
DeepSeek-R1 685B — запускается без квантизации, требует ~689 ГБ VRAM.
-
Mistral-Large-3-675B — рассчитана на reasoning и RAG-пайплайны.
-
GigaChat3-702B — работает в полной точности на восьми B200.
-
GPT-oss 120B — распараллеливается по 2–4 GPU, подходит для больших батчей.
-
Stable Diffusion XL, Flux.2-dev, Kandinsky 5.0 — генерация изображений и видео.
GPU сервер Supermicro с ускорителями Nvidia B200 рассчитан на подключение в кластеры NVIDIA DGX и NVIDIA HGX B200: до 8 серверов в одной стойке 42U (модель SRS-48UDLC-4U8N-L1), суммарно 64 ускорителя Blackwell на стойку.
Где применяется платформа
GPU Supermicro чаще всего применяется для четырех задач:
-
Тренинг и дообучение больших моделей. При 1,44 ТБ суммарной HBM3e-памяти модели до ~700B параметров помещаются на одном сервере без pipeline-разбиения. Задачи, которые раньше занимали несколько недель на H100-кластере, выполняются за сопоставимое время на одном узле B200.
-
Продакшн-инференс. vLLM и TensorRT-LLM на B200 в режиме FP8 дают меньшую задержку первого токена, чем H100 в FP16 — при сравнимой точности ответа. MIG позволяет параллельно держать несколько моделей в памяти без конкурентного доступа.
-
HPC и научные вычисления. Суммарная мощность в FP64 на уровне 296 TFLOPS делает платформу пригодной для молекулярной динамики, климатического моделирования и финансовых расчетов, где двойная точность обязательна.
Интеграция в AI-кластеры. Восемь портов ConnectX-7 по 400 GbE и два BlueField-3 DPU на сервер дают суммарную сетевую пропускную способность свыше 3,2 Тбит/с. Это перекрывает требования к East-West трафику в мультитенантных кластерах.
Часто задаваемые вопросы
Для каких задач платформа подходит лучше всего?
Обучение и дообучение LLM от 7B до 700B+ параметров, инференс с высоким QPS, HPC-расчеты с FP64, генерация изображений и видео диффузионными моделями. По MLPerf-бенчмаркам один B200 дает 2,2× при тренинге и до 4× при инференсе относительно H100. На уровне систем DGX разрыв — 3× при тренинге и 15× при инференсе.
Можно ли расширить сервер под растущие задачи?
Память расширяется до 6 ТБ DDR5 через 24 слота. Дисковая емкость — до 10 NVMe в горячей замене. Серверы объединяются в кластеры через InfiniBand NDR или Ethernet 400 GbE: одна стойка вмещает до восьми платформ, 64 ускорителя суммарно. ServerICT согласовывает финальный состав накопителей, сетевых карт и блоков питания под конкретную задачу при заказе.
Что нужно учесть по питанию и охлаждению?
Платформа требует жидкостного охлаждения — воздушная схема для этого класса мощности не применяется. Нужен контур охлаждения с CDU от 250 кВт и соответствующее электропитание: при восьми ускорителях под нагрузкой суммарное энергопотребление узла превышает 10 кВт. Перед заказом инженеры ServerICT оценят, что нужно доработать в инфраструктуре ЦОД.
Как устроена гарантия и обслуживание?
ServerICT выдает собственную гарантию на 12 месяцев — она работает независимо от того, присутствует ли вендор официально на российском рынке. Постгарантийное сопровождение оформляется отдельным договором. Каждая поставка идет с заводскими документами, актами таможенного оформления и сертификатами.
Помогут ли с установкой ПО и настройкой?
Да. Отдел MLOps-инженеров ServerICT закрывает установку драйверов, сборку CUDA-окружения, развертывание vLLM и TensorRT-LLM, конфигурацию кластера. Инженеры работали с продакшн-инфраструктурой под реальные AI-проекты и знают, где возникают проблемы при первом запуске LLM на железе.
Чтобы получить расчет стоимости и сроков поставки GPU сервера Supermicro B200 под вашу задачу — оставьте заявку или свяжитесь с менеджером ServerICT напрямую.
Доставка – за наш счет!
Доставим ваш товар в любую точку России бесплатно.
-
- Ожидаете оборудование в Москве? Наша компания или наши партнеры привезут аппаратуру по указанному адресу. Очень быстро.
Время доставки до Москвы:
-
-
- OEM и товары со склада: 3-5 недель
- Full Factory: 4-12 недель (в зависимости от бренда, сроков производства и очереди)
-
- Офис в другом регионе? Сразу после завершения таможенного оформления транспортная компания привезет вашу покупку в нужный город.
Приятно удивим скоростью доставки.
Доставляем товар максимально аккуратно. Потому что, если с грузом что-то случится, убытки покрывать нам.
Наше кредо: полная защита финансовых интересов клиента!
Как купить?
- Расчет в рублях, по курсу ЦБ РФ на день платежа. Только так.
- Строго соблюдаем налоговый режим (ОСНО), поэтому 20 % НДС входит в стоимость вашего товара.
- У нас 100%-ная предоплата. По классике: утром деньги, вечером стулья.
- Но: если вы – наш постоянный клиент, то сможете оплатить заказ позже. Договоримся!
- Физическим лицам отправляем ссылку на оплату через онлайн-кассу — быстро и удобно.
Подпишитесь на обновления ServerICT
Получайте информацию о наличии оборудования, спецусловиях и новых решениях для бизнеса.
Почему выбирают SERVER ICT
15 лет работаем с Китаем
Оказываем услуги системным интеграторам, входящим в топ-100 российского рынка, и дистрибьюторам, входящим в топ-5!
×2 оборот за два года
В последние два года оборот компании устойчиво растет, что свидетельствует о её эффективности и прогрессе.
>300 поставщиков со всего мира
Мы гордимся сотрудничеством с более чем 300 международными поставщиками, предлагая качественное оборудование.
90% cкидка от GPL
Предлагаем вам цену на товар на 90% ниже, чем GPL, так как мы получаем оборудование напрямую от изготовителя, что гораздо дешевле.