Новый акселератор AMD Instinct MI400 с 432 ГБ HBM4 и 40 PFLOPs запускается в 2026

Содержание

AMD Instinct MI400 — прорыв в мире ИИ-ускорителей: вдвое мощнее, с огромным объёмом памяти и невероятной пропускной способностью

Компания AMD, не давая отрасли расслабиться, продолжает поднимать планку в области вычислений для искусственного интеллекта и супервычислений. Помимо свежих моделей серии MI350, представители красной команды раскрыли первые подробности о грядущей линейке Instinct MI400, которая выходит на рынок примерно в 2026 году. И судя по характеристикам, AMD готовит настоящий прорыв, который принесёт с собой значительный прирост производительности и новые архитектурные решения.

В два раза больше вычислительной мощности и почти трехкратный прирост пропускной способности памяти

Основной акцент в новых графических ускорителях Instinct MI400 сделан на резком увеличении вычислительной мощности и пропускной способности памяти. AMD заявляет, что вычислительная мощность MI400 будет вдвое выше, чем у только что вышедших MI350, а точнее — 40 PFLOPs (петафлопс) в формате FP4 и 20 PFLOPs для FP8. Для сравнения, MI350 предлагает 20 PFLOPs (FP4) и 10 PFLOPs (FP8).

Что это значит на практике? Флопс (FLOPS) — это мера производительности, отражающая количество операций с плавающей запятой, которые устройство может выполнить за секунду. Чем выше этот показатель, тем быстрее и эффективнее графический ускоритель справляется с задачами ИИ, моделирования и других нагрузок.

Ещё одна важная новинка — использование более современной памяти HBM4 (High Bandwidth Memory четвертого поколения). Вместо 288 ГБ HBM3e у MI350, у будущей MI400 будет 432 ГБ памяти — на 50% больше. Но главное — пропускная способность выросла с 8 ТБ/сек до впечатляющих 19,6 ТБ/сек. Для понимания масштабов: эта скорость передачи данных означает, что GPU сможет ещё быстрее обмениваться информацией с памятью, что критично при обучении больших нейросетей и работе с массивами данных.

Также в MI400 будет реализована серия очень высокоскоростных интерфейсов — 300 ГБ/сек каналов передачи данных для каждого GPU. Всё это обещает свести к минимуму узкие места в системах и повысить эффективность масштабируемых кластеров.

Архитектурные инновации: больше чиплетов и новая система взаимодействия

Текущие решения серии MI300 построены на модуле с двумя ускоряемыми вычислительными кристаллами (XCD — eXtended Compute Die) в составе одного активного интерфейсного кристалла (AID — Active Interposer Die). У MI400 количество XCD увеличится в два раза — до четырёх на один AID. При этом в одном ускорителе будет не один, а два AID, что в сумме даст восемь XCD на одном чипе.

Схема архитектуры AMD Instinct MI400

Помимо этого, AMD разделила мультимедийные и входно-выходные (I/O) кристаллы, что позволит повысить гибкость и эффективность обмена данными внутри GPU и с внешней системой. Для улучшенной коммуникации между частями чипа предусмотрен локальный модуль (MID) для каждого AID, обеспечивающий более тесную и быструю связь между вычислительными блоками и интерфейсами.

Для взаимосвязи между чиплетами и элементами внутри MI400 используется технология Infinity Fabric — «магистраль» AMD для передачи данных, известная из процессоров Ryzen и EPYC. Благодаря её применению в ускорителях достигается высокая скорость и низкая задержка при коммуникации между частями сложного многокристального устройства.

Архитектура CDNA Next, или UDNA — будущее вычислений AMD

MI400 будет построена на базе новой архитектуры, условно называемой CDNA-Next, которая, судя по всему, претерпит ребрендинг в UDNA. Это часть крупной стратегии AMD по объединению игровых (RDNA) и вычислительных (CDNA) графических архитектур, чтобы добиться общей экосистемы и упростить разработку.

CDNA-Next обещает повышенную энергоэффективность, улучшенную поддержку ИИ-задач и глубокое структурное совершенствование, чтобы выдерживать растущие требования больших дата-центров и специализированных вычислительных кластеров.

Таблица сравнения ключевых параметров ускорителей AMD Instinct

Параметр	Instinct MI400	Instinct MI350X	Instinct MI325X	Instinct MI300X	Instinct MI250X
Архитектура	CDNA Next / UDNA	CDNA 4	Aqua Vanjaram (CDNA 3)	Aqua Vanjaram (CDNA 3)	Aldebaran (CDNA 2)
Техпроцесс GPU	TBD	3 нм	5+6 нм	5+6 нм	6 нм
Количество XCD (чиплетов)	8 (MCM)	8 (MCM)	8 (MCM)	8 (MCM)	2 (MCM)
Кол-во ядер GPU	TBD	16 384	19 456	19 456	14 080
INT8 производительность	TBD	5200 TOPS	2614 TOPS	2614 TOPS	383 TOPS
FP4 (FP6) производительность	40 PFLOPs	20 PFLOPs	—	—	—
FP8 производительность	20 PFLOPs	10 PFLOPs	2.6 PFLOPs	2.6 PFLOPs	—
Память	432 ГБ HBM4	288 ГБ HBM3e	256 ГБ HBM3e	192 ГБ HBM3	128 ГБ HBM2e
Пропускная способность	19,6 ТБ/с	8 ТБ/с	6 ТБ/с	5.3 ТБ/с	3.2 ТБ/с
Энергопотребление (TDP)	TBD	1400 Вт	1000 Вт	750 Вт	560 Вт

Что это значит для российских дата-центров и разработчиков

Рост производительности MI400 — это развитие возможностей для компаний и исследовательских центров, работающих с ИИ-моделями и большими данными. За счёт удвоенной мощи и почти трёхкратного увеличения пропускной способности памяти можно существенно сократить время обучения сложных нейросетей и повысить эффективность алгоритмов машинного обучения.

В России, где высокотехнологичные дата-центры стремятся догнать мировые аналоги, появление подобных ускорителей даст новый импульс развитию отечественных проектов в сфере ИИ, анализа больших данных и научных исследований. Однако стоит отметить, что ситуация с поставками западных комплектующих в России остаётся сложной — вполне возможно, что к моменту выхода MI400 официальная дистрибуция будет ограничена. Тем не менее, заинтересованные организации смогут приобрести эти решения через специализированных поставщиков высокопроизводительного оборудования.

Кратко о перспективах и ожиданиях

Запуск ожидается примерно в 2026 году: Это традиционный период вывода новых продуктов AMD, позволяющий оценить конкурентное окружение уже в момент релиза.
Технология HBM4 с 432 ГБ памяти и почти 20 ТБ/с пропускной способности — серьёзный прорыв, значительно опережающий конкурентов.
Архитектурные улучшения с большим числом чиплетов и новыми интеграционными решениями усилят масштабируемость и универсальность устройств.
Применение для больших ИИ-кластеров, систем глубокого обучения, высокопроизводительных вычислений.

Заключение

AMD Instinct MI400 — это амбициозный шаг в эволюции искусственного интеллекта и высокопроизводительных вычислений. Удвоенная вычислительная мощность по сравнению с MI350, использование новейшей памяти HBM4 с огромной пропускной способностью и новые архитектурные решения делают MI400 серьёзным конкурентом на рынке ускорителей.

Для России это новость о том, что передовые технологии продолжают развиваться, и рано или поздно на отечественные рынок и исследовательские проекты придёт новая волна вычислительных возможностей, необходимых для решений задач следующего уровня сложности. Следите за обновлениями — и мы обязательно расскажем подробнее, когда появится новая информация о доступности и ценах в России.