NVIDIA Rubin CPX GPU представлена на AI Infra Summit 2025

NVIDIA представила Rubin CPX — новый ускоритель для глубокого ИИ с поддержкой видео

На конференции AI Infra Summit компания NVIDIA анонсировала Rubin CPX — уникальный графический ускоритель нового поколения, специально созданный для задач с большими объемами контекста в системах искусственного интеллекта. В отличие от остальных моделей семейства Rubin, которые будут мультичиповыми, CPX выполнен на единичном монолитном кристалле. Это позволяет добиться впечатляющей производительности в 30 петафлопс (NVFP4) и использовать огромный объём памяти — 128 ГБ GDDR7.

Почему Rubin CPX важен для ИИ с длинным контекстом

Сегодня многие передовые AI-модели — будь то сложный анализ текста, исходного кода или продолжительная обработка мультимедийных данных — требуют «длинной памяти», то есть возможности учитывать одновременно миллионы токенов (отдельных элементов информации). Rubin CPX специально разрабатывался для таких сценариев, где классические ускорители начинают испытывать серьёзные ограничения. Его архитектура отлично подходит для задач с продлённым вниманием и анализом масштабных потоков данных.

Встроенное видеопродюсирование — важное преимущество

Главная «фишка» Rubin CPX — встроенный видеоподсистемный блок, включающий сразу четыре видеокодера NVENC и четыре видеодекодера NVDEC. Это позволяет ускорителю самостоятельно работать с видео, не прибегая к дополнительным кодерам и декодерам, что крайне важно для AI-приложений, которые обрабатывают видео в реальном времени — например, видеонаблюдение, потоковый анализ или мультимедийная аналитика.

Согласно заявлениям NVIDIA, Rubin CPX в три раза быстрее справляется с вычислениями, связанными с обработкой внимания (attention), по сравнению с текущими ускорителями GB300 Blackwell Ultra. Это делает новинку особенно ценным инструментом для масштабирования задач inference (выводов) на этапе тестирования и реального использования моделей.

Память и пропускная способность: силовой тандем

Хотя официальных данных по пропускной способности памяти пока нет, можно предположить, что при 512-битной шине и скорости GDDR7 в 30 Гбит/с пиковая пропускная способность памяти достигает около 1,8 Терабайт в секунду. Это впечатляющий показатель, который гарантирует, что Rubin CPX справится как с тяжелыми вычислительными нагрузками в фазе «прогрева» контекста, так и с интенсивной генерацией новых токенов.

Vera Rubin NVL144 CPX — платформа нового уровня

Для реального использования Rubin CPX будет интегрирован в серверную платформу Vera Rubin NVL144 CPX. Этот комплекс сочетает классические Rubin GPU с новыми CPX-моделями, обеспечивая оптимальный баланс производительности для различных AI-задач. По прогнозам NVIDIA, целый стойковый кластер Kyber сможет выдать суммарную производительность до 8 экзафлопс с пропускной способностью памяти 1,7 петабайт в секунду.

Инфраструктура будет поддерживать высокоскоростные сетевые адаптеры ConnectX-9 с пропускной способностью 1600 Гбит/с и коммутаторы Spectrum6 с емкостью 102,4 Тбит/с. Для эффективного масштабирования в крупных дата-центрах применят технологию co-packaged optics — встроенную оптику, снижающую задержки и энергопотребление.

Rubin CPX

Кому пригодится Rubin CPX

NVIDIA позиционирует Rubin CPX как специализированное решение для «inference» в системах искусственного интеллекта нового поколения — тех, которые переходят от простого текстового генератора к многошаговым агентам с сложным рассуждением и долговременной памятью. Такие системы требуют двух ключевых ресурсов — огромной параллельной мощности для вычисления внимания и стабильной пропускной способности памяти для генерации огромного потока токенов.

Rubin CPX оптимизирован именно под эти задачи, позволяя разработчикам создавать и масштабировать сложные модели рассуждения без потерь производительности. Предполагается, что новинка появится в продаже в конце 2026 года, спустя несколько месяцев после выхода первых основной линейки Rubin.

Перспективы для России

Хотя официальной информации о поставках Rubin CPX на российский рынок пока нет, оборудование класса Vera Rubin и ускорители Rubin традиционно находят покупателей среди крупных российских дата-центров и исследовательских организаций. С учётом сложностей с зарубежными поставками высокотехнологичных компонентов, задержка с появлением новинки в России может составлять от нескольких месяцев до года.

Ориентировочная стоимость одного ускорителя Rubin CPX наверняка будет превышать несколько миллионов рублей, что сделает их устройствами исключительно для корпоративного сегмента и крупных проектов в области искусственного интеллекта и научных вычислений.

Мнение эксперта

По мнению экспертов в области высокопроизводительных вычислений, Rubin CPX — это шаг вперед для NVIDIA, который поможет компании сохранить лидерство в сегменте вычислительных систем для сложных AI-задач. Монолитный дизайн и встроенная видеоподсистема — ключ к эффективной работе с мультимедийным контентом и длинными текстами, что становится особенно востребованным на фоне развития генеративного ИИ и многошаговых агентов.

Для российских разработчиков и исследователей это может быть важным источником новых возможностей, особенно в сферах, где критичны скорость обработки и масштабируемость — например, в телекоммуникациях, промышленном анализе и научных вычислениях.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *