Сервер GPU ASROCK B300 Nvidia
Модель
cpuvar
disk1
network1
* цена в рублях по курсу ЦБ РФ на день оплаты по безналичному расчету.
от 28.06.2022 № 213-ФЗ
ASROCK
8U16X-GNR2 B300
Nvidia B300
ASRock 8U16X-GNR2 B300 — серверная платформа вокруг сборки NVIDIA HGX B300 NVL8: восемь ускорителей Blackwell Ultra в едином NVSwitch-домене с жидкостным охлаждением. Суммарно это 2,3 ТБ GPU-памяти HBM3e, 144 петафлопса FP4 и 14,4 ТБ/с NVLink-полосы внутри узла. По данным NVIDIA, один такой сервер при инференсе Llama 3.1 405B работает в 11 раз быстрее H100-системы аналогичного класса.
Технические характеристики платформы
|
Параметр |
Значение |
|
Модель шасси |
ASRock 8U16X-GNR2 B300 |
|
Форм-фактор |
8U Rackmount |
|
8× NVIDIA B300 SXM6, NVIDIA HGX B300 NVL8 |
|
|
GPU-память |
288 ГБ HBM3e на GPU, ~2,3 ТБ суммарно |
|
Пропускная способность GPU-памяти |
8 ТБ/с на GPU |
|
Производительность (система) |
144 PFLOPS FP4 |
|
NVLink |
5-го поколения, 14,4 ТБ/с суммарно |
|
GPU-интерконнект |
|
|
2× Intel Xeon серии 6700P или 6700E, сокет LGA4710 |
|
|
32 слота DDR5, 2DPC, до нескольких ТБ |
|
|
Хранилище |
до 12× 2.5" SSD |
|
Питание |
6+6 блоков по 3000 Вт, уровень Titanium |
|
Охлаждение |
жидкостное (обязательно) |
|
Сеть |
Dual 1GbE Base-T (управление) |
|
Гарантия |
3 года от производителя |
Что делает платформу значимой для AI-инфраструктуры
Архитектура Blackwell Ultra — это не следующая версия B200, а принципиально другой подход к памяти. Каждый B300 несет 288 ГБ HBM3e через 12-слойные стеки памяти вместо 8-слойных у B200. Суммарные 2,3 ТБ на одном узле позволяют держать в памяти модели с числом параметров, которые прежде требовали нескольких серверов. Для задач с длинным контекстом и большими KV-кешами это означает устранение главного узкого места — постоянного обращения к CPU-памяти или внешнему хранилищу.
NVLink пятого поколения с суммарной полосой 14,4 ТБ/с внутри узла снижает накладные расходы tensor parallelism до уровня, при котором разбиение трансформерных слоев между восемью GPU перестает быть узким местом. Pipeline parallelism и expert parallelism для MoE-архитектур получают достаточную пропускную способность для предсказуемого масштабирования.
Intel Xeon серии 6700 в двухсокетной конфигурации дает 32 DDR5-слота (16 на CPU) в режиме 2DPC. По сравнению с платформами на базе Xeon 6900P с меньшим числом слотов это позволяет набрать несколько ТБ системной RAM без перехода на дорогие модули высокой емкости. Серия 6700E несет E-ядра с повышенной энергоэффективностью: до 1,46× производительности на ватт относительно Intel Xeon 5-го поколения. Для предобработки датасетов, управления потоками данных к GPU и CPU-bound операций это снижает общее энергопотребление системы.
Ключевые возможности и параметры платформы:
- 2,3 ТБ суммарной GPU-памяти HBM3e — в 3,6 раза больше, чем у H100
- 144 PFLOPS FP4 на систему из 8 GPU
- NVLink 5-го поколения с полосой 14,4 ТБ/с между ускорителями
- 11× быстрее H100 при инференсе Llama 3.1 405B (данные NVIDIA)
- 4× быстрее обучение LLM класса Llama 3.1 405B по сравнению с H100
- Intel Xeon 6700E/P: до 1,46× производительности на ватт vs. Xeon 5-го пок.
- Блоки питания уровня Titanium — наивысший класс КПД среди стандартных PSU
Производитель дает 3-летнюю гарантию на серверы и накопители.
ASRock Rack как платформа под HGX B300
ASRock производит серверы с GPU с 2015 года, и это не случайный выход в сегмент по запросу рынка. Компания прошла через несколько поколений NVIDIA GPU: от V100 до A100, H200 и теперь B300. Каждое поколение сопровождалось переработкой конструкции шасси под новые требования по питанию и охлаждению.
Для B300 ASRock спроектировал шасси 8U16X-GNR2 с шестью блоками питания Titanium по 3000 Вт каждый в конфигурации 6+6. Это обеспечивает резервирование при суммарном потреблении, которое у восьми B300 при полной нагрузке превышает 11 кВт только от GPU. Двухуровневая компоновка — CPU и память в верхней части, GPU-сборка HGX в нижней — разделяет тепловые контуры процессорного и GPU-отсеков, что повышает стабильность при непрерывной работе.
32 DDR5-слота в режиме 2DPC — характерное решение ASRock Rack для платформ на Xeon 6700. В сравнении с конкурентами, использующими меньшее число слотов при более емких модулях, это снижает стоимость набора системной RAM при том же суммарном объеме.
Поддержка NVIDIA AI Enterprise, полная совместимость с CUDA 12.x, PyTorch, TensorFlow, TensorRT-LLM, vLLM и JAX подтверждена производителем для платформ ASRock на HGX-сборках.
Сценарии применения
Инференс фронтирных моделей
2,3 ТБ GPU-памяти держат модели с числом параметров свыше 1 трлн без разбиения по узлам. RAG-системы с большими базами знаний, юридический анализ документов с контекстом 256K+ токенов, медицинская диагностика по длинным записям — все это требует именно такого объема памяти на один сервер. По данным NVIDIA, инференс Llama 3.1 405B на HGX B300 идет в 11 раз быстрее, чем на H100, — прирост достигается за счет снятия ограничений по памяти, а не только за счет более высокой вычислительной мощности.
Тренинг LLM и мультимодальных архитектур
По данным NVIDIA, обучение Llama 3.1 405B на HGX B300 идет в четыре раза быстрее, чем на H100-системе аналогичного класса. Для исследовательских команд, которые итерируют архитектуры, это сокращает время одного эксперимента с недель до дней. Поддержка FP8 Transformer Engine второго поколения автоматически переключает точность вычислений между слоями без ручной настройки — скорость тренинга растет без деградации качества сходимости.
Корпоративные AI-платформы
Несколько узлов ASRock 8U16X-GNR2 B300 объединяются в кластер через InfiniBand NDR2 800G — каждый GPU получает выделенный 800-гигабитный сетевой канал. GPUDirect RDMA устраняет CPU из пути передачи данных между серверами при распределенном тренинге. Для корпоративных сред критично, что платформа сертифицирована NVIDIA и поддерживает NVIDIA AI Enterprise с корпоративным уровнем сервисного обслуживания.
Обработка больших данных в реальном времени
Пропускная способность HBM3e 8 ТБ/с на GPU снимает ограничения при потоковой обработке структурированных и мультимедийных данных. Аналитические пайплайны, которые раньше требовали несколько часов на CPU-кластере, выполняются за минуты. RAPIDS на B300 обрабатывает терабайтные таблицы в режиме, при котором GPU-память не становится узким местом даже при крупных батчах.
HPC-вычисления
Поддержка FP16 и BF16 Tensor Core при 36 PFLOPS на систему покрывает задачи геофизического и климатического моделирования, численной гидродинамики и обработки медицинских изображений. Для задач с требованием двойной точности FP64 рекомендуется уточнить спецификацию у менеджера ServerICT — B300 оптимизирован прежде всего под AI-нагрузки, а не под классические HPC-задачи с высокими требованиями к FP64.
Часто задаваемые вопросы
Какова цена сервера NVIDIA HGX B300?
Стартовая цена конфигурации ASRock 8U16X-GNR2 B300 через ServerICT — от 77 234 680 ₽ по курсу ЦБ на день оплаты. Итоговая стоимость зависит от версии CPU, объема ОЗУ и состава накопителей. Расчет под конкретную конфигурацию — у персонального менеджера.
Какие варианты конфигураций доступны?
Базовая конфигурация — Intel Xeon 6700E/6700P, Dual 1GbE, до 12× 2.5" SSD. Версия CPU, объем и тип DDR5-памяти, состав накопителей и сетевых карт согласовываются при заказе. ServerICT подбирают состав под конкретную задачу.
Какая гарантия и техническая поддержка предоставляется?
Производитель ASRock дает 3-летнюю гарантию на серверы и накопители. ServerICT дополнительно предоставляют собственную гарантию на 12 месяцев, действующую независимо от официального присутствия вендора в России. Инженеры компании сопровождают запуск инфраструктуры после доставки.
Можно ли арендовать сервер?
ServerICT занимается продажей и поставкой оборудования, а не арендой. Для аренды вычислительных мощностей на B300 обратитесь к российским облачным провайдерам, развертывающим эту платформу.
Как быстро осуществляется доставка?
Средний срок — три недели с момента подтверждения заказа. Перед отправкой ServerICT фиксируют комплектность фотоотчетом с завода, оборудование проходит таможню с полным документальным сопровождением. Доступна рассрочка до 90 дней.
Какие требования к размещению сервера?
B300 SXM6 при TDP 1400 Вт на GPU требует обязательного жидкостного охлаждения — воздушное охлаждение не справляется с тепловой нагрузкой восьми ускорителей. Для полноценного раскрытия межузловой пропускной способности нужна сетевая инфраструктура 800 Гбит/с (InfiniBand NDR2 или Ethernet 800G). Суммарное энергопотребление узла при полной нагрузке превышает 15 кВт — рекомендуется стойка с выделенной мощностью от 20 кВт. Инженеры ServerICT проверят соответствие инфраструктуры перед заказом.
Чтобы получить расчет стоимости, уточнить финальную конфигурацию и согласовать требования к инфраструктуре ЦОД — свяжитесь с менеджером ServerICT или заполните форму заявки. Ответ придет в течение рабочего дня.
Доставка – за наш счет!
Доставим ваш товар в любую точку России бесплатно.
-
- Ожидаете оборудование в Москве? Наша компания или наши партнеры привезут аппаратуру по указанному адресу. Очень быстро.
Время доставки до Москвы:
-
-
- OEM и товары со склада: 3-5 недель
- Full Factory: 4-12 недель (в зависимости от бренда, сроков производства и очереди)
-
- Офис в другом регионе? Сразу после завершения таможенного оформления транспортная компания привезет вашу покупку в нужный город.
Приятно удивим скоростью доставки.
Доставляем товар максимально аккуратно. Потому что, если с грузом что-то случится, убытки покрывать нам.
Наше кредо: полная защита финансовых интересов клиента!
Как купить?
- Расчет в рублях, по курсу ЦБ РФ на день платежа. Только так.
- Строго соблюдаем налоговый режим (ОСНО), поэтому 20 % НДС входит в стоимость вашего товара.
- У нас 100%-ная предоплата. По классике: утром деньги, вечером стулья.
- Но: если вы – наш постоянный клиент, то сможете оплатить заказ позже. Договоримся!
- Физическим лицам отправляем ссылку на оплату через онлайн-кассу — быстро и удобно.
Подпишитесь на обновления ServerICT
Получайте информацию о наличии оборудования, спецусловиях и новых решениях для бизнеса.
Почему выбирают SERVER ICT
15 лет работаем с Китаем
Оказываем услуги системным интеграторам, входящим в топ-100 российского рынка, и дистрибьюторам, входящим в топ-5!
×2 оборот за два года
В последние два года оборот компании устойчиво растет, что свидетельствует о её эффективности и прогрессе.
>300 поставщиков со всего мира
Мы гордимся сотрудничеством с более чем 300 международными поставщиками, предлагая качественное оборудование.
90% cкидка от GPL
Предлагаем вам цену на товар на 90% ниже, чем GPL, так как мы получаем оборудование напрямую от изготовителя, что гораздо дешевле.