AMD Instinct MI400 — прорыв в мире ИИ-ускорителей: вдвое мощнее, с огромным объёмом памяти и невероятной пропускной способностью
Компания AMD, не давая отрасли расслабиться, продолжает поднимать планку в области вычислений для искусственного интеллекта и супервычислений. Помимо свежих моделей серии MI350, представители красной команды раскрыли первые подробности о грядущей линейке Instinct MI400, которая выходит на рынок примерно в 2026 году. И судя по характеристикам, AMD готовит настоящий прорыв, который принесёт с собой значительный прирост производительности и новые архитектурные решения.
В два раза больше вычислительной мощности и почти трехкратный прирост пропускной способности памяти
Основной акцент в новых графических ускорителях Instinct MI400 сделан на резком увеличении вычислительной мощности и пропускной способности памяти. AMD заявляет, что вычислительная мощность MI400 будет вдвое выше, чем у только что вышедших MI350, а точнее — 40 PFLOPs (петафлопс) в формате FP4 и 20 PFLOPs для FP8. Для сравнения, MI350 предлагает 20 PFLOPs (FP4) и 10 PFLOPs (FP8).
Что это значит на практике? Флопс (FLOPS) — это мера производительности, отражающая количество операций с плавающей запятой, которые устройство может выполнить за секунду. Чем выше этот показатель, тем быстрее и эффективнее графический ускоритель справляется с задачами ИИ, моделирования и других нагрузок.
Ещё одна важная новинка — использование более современной памяти HBM4 (High Bandwidth Memory четвертого поколения). Вместо 288 ГБ HBM3e у MI350, у будущей MI400 будет 432 ГБ памяти — на 50% больше. Но главное — пропускная способность выросла с 8 ТБ/сек до впечатляющих 19,6 ТБ/сек. Для понимания масштабов: эта скорость передачи данных означает, что GPU сможет ещё быстрее обмениваться информацией с памятью, что критично при обучении больших нейросетей и работе с массивами данных.
Также в MI400 будет реализована серия очень высокоскоростных интерфейсов — 300 ГБ/сек каналов передачи данных для каждого GPU. Всё это обещает свести к минимуму узкие места в системах и повысить эффективность масштабируемых кластеров.
Архитектурные инновации: больше чиплетов и новая система взаимодействия
Текущие решения серии MI300 построены на модуле с двумя ускоряемыми вычислительными кристаллами (XCD — eXtended Compute Die) в составе одного активного интерфейсного кристалла (AID — Active Interposer Die). У MI400 количество XCD увеличится в два раза — до четырёх на один AID. При этом в одном ускорителе будет не один, а два AID, что в сумме даст восемь XCD на одном чипе.
Схема архитектуры AMD Instinct MI400
Помимо этого, AMD разделила мультимедийные и входно-выходные (I/O) кристаллы, что позволит повысить гибкость и эффективность обмена данными внутри GPU и с внешней системой. Для улучшенной коммуникации между частями чипа предусмотрен локальный модуль (MID) для каждого AID, обеспечивающий более тесную и быструю связь между вычислительными блоками и интерфейсами.
Для взаимосвязи между чиплетами и элементами внутри MI400 используется технология Infinity Fabric — «магистраль» AMD для передачи данных, известная из процессоров Ryzen и EPYC. Благодаря её применению в ускорителях достигается высокая скорость и низкая задержка при коммуникации между частями сложного многокристального устройства.
Архитектура CDNA Next, или UDNA — будущее вычислений AMD
MI400 будет построена на базе новой архитектуры, условно называемой CDNA-Next, которая, судя по всему, претерпит ребрендинг в UDNA. Это часть крупной стратегии AMD по объединению игровых (RDNA) и вычислительных (CDNA) графических архитектур, чтобы добиться общей экосистемы и упростить разработку.
CDNA-Next обещает повышенную энергоэффективность, улучшенную поддержку ИИ-задач и глубокое структурное совершенствование, чтобы выдерживать растущие требования больших дата-центров и специализированных вычислительных кластеров.
Таблица сравнения ключевых параметров ускорителей AMD Instinct
Параметр | Instinct MI400 | Instinct MI350X | Instinct MI325X | Instinct MI300X | Instinct MI250X |
---|---|---|---|---|---|
Архитектура | CDNA Next / UDNA | CDNA 4 | Aqua Vanjaram (CDNA 3) | Aqua Vanjaram (CDNA 3) | Aldebaran (CDNA 2) |
Техпроцесс GPU | TBD | 3 нм | 5+6 нм | 5+6 нм | 6 нм |
Количество XCD (чиплетов) | 8 (MCM) | 8 (MCM) | 8 (MCM) | 8 (MCM) | 2 (MCM) |
Кол-во ядер GPU | TBD | 16 384 | 19 456 | 19 456 | 14 080 |
INT8 производительность | TBD | 5200 TOPS | 2614 TOPS | 2614 TOPS | 383 TOPS |
FP4 (FP6) производительность | 40 PFLOPs | 20 PFLOPs | — | — | — |
FP8 производительность | 20 PFLOPs | 10 PFLOPs | 2.6 PFLOPs | 2.6 PFLOPs | — |
Память | 432 ГБ HBM4 | 288 ГБ HBM3e | 256 ГБ HBM3e | 192 ГБ HBM3 | 128 ГБ HBM2e |
Пропускная способность | 19,6 ТБ/с | 8 ТБ/с | 6 ТБ/с | 5.3 ТБ/с | 3.2 ТБ/с |
Энергопотребление (TDP) | TBD | 1400 Вт | 1000 Вт | 750 Вт | 560 Вт |
Что это значит для российских дата-центров и разработчиков
Рост производительности MI400 — это развитие возможностей для компаний и исследовательских центров, работающих с ИИ-моделями и большими данными. За счёт удвоенной мощи и почти трёхкратного увеличения пропускной способности памяти можно существенно сократить время обучения сложных нейросетей и повысить эффективность алгоритмов машинного обучения.
В России, где высокотехнологичные дата-центры стремятся догнать мировые аналоги, появление подобных ускорителей даст новый импульс развитию отечественных проектов в сфере ИИ, анализа больших данных и научных исследований. Однако стоит отметить, что ситуация с поставками западных комплектующих в России остаётся сложной — вполне возможно, что к моменту выхода MI400 официальная дистрибуция будет ограничена. Тем не менее, заинтересованные организации смогут приобрести эти решения через специализированных поставщиков высокопроизводительного оборудования.
Кратко о перспективах и ожиданиях
- Запуск ожидается примерно в 2026 году: Это традиционный период вывода новых продуктов AMD, позволяющий оценить конкурентное окружение уже в момент релиза.
- Технология HBM4 с 432 ГБ памяти и почти 20 ТБ/с пропускной способности — серьёзный прорыв, значительно опережающий конкурентов.
- Архитектурные улучшения с большим числом чиплетов и новыми интеграционными решениями усилят масштабируемость и универсальность устройств.
- Применение для больших ИИ-кластеров, систем глубокого обучения, высокопроизводительных вычислений.
Заключение
AMD Instinct MI400 — это амбициозный шаг в эволюции искусственного интеллекта и высокопроизводительных вычислений. Удвоенная вычислительная мощность по сравнению с MI350, использование новейшей памяти HBM4 с огромной пропускной способностью и новые архитектурные решения делают MI400 серьёзным конкурентом на рынке ускорителей.
Для России это новость о том, что передовые технологии продолжают развиваться, и рано или поздно на отечественные рынок и исследовательские проекты придёт новая волна вычислительных возможностей, необходимых для решений задач следующего уровня сложности. Следите за обновлениями — и мы обязательно расскажем подробнее, когда появится новая информация о доступности и ценах в России.