Новый акселератор AMD Instinct MI400 с 432 ГБ HBM4 и 40 PFLOPs запускается в 2026

AMD Instinct MI400 — прорыв в мире ИИ-ускорителей: вдвое мощнее, с огромным объёмом памяти и невероятной пропускной способностью

Компания AMD, не давая отрасли расслабиться, продолжает поднимать планку в области вычислений для искусственного интеллекта и супервычислений. Помимо свежих моделей серии MI350, представители красной команды раскрыли первые подробности о грядущей линейке Instinct MI400, которая выходит на рынок примерно в 2026 году. И судя по характеристикам, AMD готовит настоящий прорыв, который принесёт с собой значительный прирост производительности и новые архитектурные решения.


В два раза больше вычислительной мощности и почти трехкратный прирост пропускной способности памяти

Основной акцент в новых графических ускорителях Instinct MI400 сделан на резком увеличении вычислительной мощности и пропускной способности памяти. AMD заявляет, что вычислительная мощность MI400 будет вдвое выше, чем у только что вышедших MI350, а точнее — 40 PFLOPs (петафлопс) в формате FP4 и 20 PFLOPs для FP8. Для сравнения, MI350 предлагает 20 PFLOPs (FP4) и 10 PFLOPs (FP8).

Что это значит на практике? Флопс (FLOPS) — это мера производительности, отражающая количество операций с плавающей запятой, которые устройство может выполнить за секунду. Чем выше этот показатель, тем быстрее и эффективнее графический ускоритель справляется с задачами ИИ, моделирования и других нагрузок.

Ещё одна важная новинка — использование более современной памяти HBM4 (High Bandwidth Memory четвертого поколения). Вместо 288 ГБ HBM3e у MI350, у будущей MI400 будет 432 ГБ памяти — на 50% больше. Но главное — пропускная способность выросла с 8 ТБ/сек до впечатляющих 19,6 ТБ/сек. Для понимания масштабов: эта скорость передачи данных означает, что GPU сможет ещё быстрее обмениваться информацией с памятью, что критично при обучении больших нейросетей и работе с массивами данных.

Также в MI400 будет реализована серия очень высокоскоростных интерфейсов — 300 ГБ/сек каналов передачи данных для каждого GPU. Всё это обещает свести к минимуму узкие места в системах и повысить эффективность масштабируемых кластеров.


Архитектурные инновации: больше чиплетов и новая система взаимодействия

Текущие решения серии MI300 построены на модуле с двумя ускоряемыми вычислительными кристаллами (XCD — eXtended Compute Die) в составе одного активного интерфейсного кристалла (AID — Active Interposer Die). У MI400 количество XCD увеличится в два раза — до четырёх на один AID. При этом в одном ускорителе будет не один, а два AID, что в сумме даст восемь XCD на одном чипе.

Архитектура AMD Instinct MI400
Схема архитектуры AMD Instinct MI400

Помимо этого, AMD разделила мультимедийные и входно-выходные (I/O) кристаллы, что позволит повысить гибкость и эффективность обмена данными внутри GPU и с внешней системой. Для улучшенной коммуникации между частями чипа предусмотрен локальный модуль (MID) для каждого AID, обеспечивающий более тесную и быструю связь между вычислительными блоками и интерфейсами.

Для взаимосвязи между чиплетами и элементами внутри MI400 используется технология Infinity Fabric — «магистраль» AMD для передачи данных, известная из процессоров Ryzen и EPYC. Благодаря её применению в ускорителях достигается высокая скорость и низкая задержка при коммуникации между частями сложного многокристального устройства.


Архитектура CDNA Next, или UDNA — будущее вычислений AMD

MI400 будет построена на базе новой архитектуры, условно называемой CDNA-Next, которая, судя по всему, претерпит ребрендинг в UDNA. Это часть крупной стратегии AMD по объединению игровых (RDNA) и вычислительных (CDNA) графических архитектур, чтобы добиться общей экосистемы и упростить разработку.

CDNA-Next обещает повышенную энергоэффективность, улучшенную поддержку ИИ-задач и глубокое структурное совершенствование, чтобы выдерживать растущие требования больших дата-центров и специализированных вычислительных кластеров.


Таблица сравнения ключевых параметров ускорителей AMD Instinct

Параметр Instinct MI400 Instinct MI350X Instinct MI325X Instinct MI300X Instinct MI250X
Архитектура CDNA Next / UDNA CDNA 4 Aqua Vanjaram (CDNA 3) Aqua Vanjaram (CDNA 3) Aldebaran (CDNA 2)
Техпроцесс GPU TBD 3 нм 5+6 нм 5+6 нм 6 нм
Количество XCD (чиплетов) 8 (MCM) 8 (MCM) 8 (MCM) 8 (MCM) 2 (MCM)
Кол-во ядер GPU TBD 16 384 19 456 19 456 14 080
INT8 производительность TBD 5200 TOPS 2614 TOPS 2614 TOPS 383 TOPS
FP4 (FP6) производительность 40 PFLOPs 20 PFLOPs
FP8 производительность 20 PFLOPs 10 PFLOPs 2.6 PFLOPs 2.6 PFLOPs
Память 432 ГБ HBM4 288 ГБ HBM3e 256 ГБ HBM3e 192 ГБ HBM3 128 ГБ HBM2e
Пропускная способность 19,6 ТБ/с 8 ТБ/с 6 ТБ/с 5.3 ТБ/с 3.2 ТБ/с
Энергопотребление (TDP) TBD 1400 Вт 1000 Вт 750 Вт 560 Вт

Что это значит для российских дата-центров и разработчиков

Рост производительности MI400 — это развитие возможностей для компаний и исследовательских центров, работающих с ИИ-моделями и большими данными. За счёт удвоенной мощи и почти трёхкратного увеличения пропускной способности памяти можно существенно сократить время обучения сложных нейросетей и повысить эффективность алгоритмов машинного обучения.

В России, где высокотехнологичные дата-центры стремятся догнать мировые аналоги, появление подобных ускорителей даст новый импульс развитию отечественных проектов в сфере ИИ, анализа больших данных и научных исследований. Однако стоит отметить, что ситуация с поставками западных комплектующих в России остаётся сложной — вполне возможно, что к моменту выхода MI400 официальная дистрибуция будет ограничена. Тем не менее, заинтересованные организации смогут приобрести эти решения через специализированных поставщиков высокопроизводительного оборудования.


Кратко о перспективах и ожиданиях

  • Запуск ожидается примерно в 2026 году: Это традиционный период вывода новых продуктов AMD, позволяющий оценить конкурентное окружение уже в момент релиза.
  • Технология HBM4 с 432 ГБ памяти и почти 20 ТБ/с пропускной способности — серьёзный прорыв, значительно опережающий конкурентов.
  • Архитектурные улучшения с большим числом чиплетов и новыми интеграционными решениями усилят масштабируемость и универсальность устройств.
  • Применение для больших ИИ-кластеров, систем глубокого обучения, высокопроизводительных вычислений.

Заключение

AMD Instinct MI400 — это амбициозный шаг в эволюции искусственного интеллекта и высокопроизводительных вычислений. Удвоенная вычислительная мощность по сравнению с MI350, использование новейшей памяти HBM4 с огромной пропускной способностью и новые архитектурные решения делают MI400 серьёзным конкурентом на рынке ускорителей.

Для России это новость о том, что передовые технологии продолжают развиваться, и рано или поздно на отечественные рынок и исследовательские проекты придёт новая волна вычислительных возможностей, необходимых для решений задач следующего уровня сложности. Следите за обновлениями — и мы обязательно расскажем подробнее, когда появится новая информация о доступности и ценах в России.


AMD Instinct MI400

Архитектура AMD Instinct MI400

Источник

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *