Следующее поколение HBM: революция в памяти для дата-центров и ИИ
Совместное исследование корейского Института передовых технологий KAIST и лаборатории TeraByte (специализирующейся на межсоединениях и упаковке памяти) раскрывает пути развития стандартов HBM (High Bandwidth Memory) вплоть до HBM8. Каждое новое поколение HBM обещает кардинальное увеличение пропускной способности, объёмов и энергоэффективности, отвечая на взрывной рост потребностей дата-центров и искусственного интеллекта.
Общий взгляд на HBM4–HBM8: почему это важно для России?
HBM — это особый тип высокоскоростной памяти, который располагается в нескольких слоях (stack), обеспечивая гигантские пропускные способности и компактность. Уже сегодня HBM используется в топовых графических процессорах и ускорителях, а для российских центров обработки данных с задачами ИИ и рендеринга это будет критично для эффективности и скорости обработки.
Перевод цен: пока новые поколения находятся на стадии исследований, точные цены неизвестны, но мы можем ориентироваться на прецеденты: например, стоимость HBM4 для дата-центров может достигать десятков миллионов рублей за модуль, что оправдано в корпоративных масштабах.
Возможность появиться в России зависит от глобальных поставок и политики компаний вроде NVIDIA и AMD, но учитывая тесную связь с индустрией ИИ, ожидать их появления на отечественном рынке стоит к середине следующего десятилетия.
HBM4 — старт эры гигабайт и терабайт в секунду
Первым на горизонте стоит стандарт HBM4, который уже планируют использовать в 2026 году в новых моделях AMD Instinct MI400 и NVIDIA Rubin. Оба производителя подтвердили, что для своих серверных и ИИ-GPU они выбрали именно HBM следующего поколения.
HBM4 предлагает:
- Скорость передачи данных: около 8 Гбит/с на линию.
- Шина: 2048 или 4096 бит (I/O).
- Пропускная способность: до 2 ТБ/с на стек памяти.
- Высота стека: 12-16 слоев (Hi).
- Ёмкость: от 36 до 48 ГБ на стек.
- Потребление: до 75 Вт на стек.
- Охлаждение: жидкостное прямого охлаждения (Direct-To-Chip).
Это уже серьезный шаг вперед по сравнению с HBM3 — вдвое выше скорость и более крупные стеки. В случае AMD MI400 речь идёт о 432 ГБ общей памяти и почти 20 ТБ/с пропускной способности.
Параметры HBM4-системы NVIDIA Rubin и AMD MI400 отражают новый уровень производительности
HBM5 — огромная пропускная способность для NVIDIA Feynman (около 2029 года)
HBM5 в своем базовом варианте (Non-e) сохранит скорость 8 Гбит/с, но удвоит количество I/O до 4096, а пропускную способность увеличит до 4 ТБ/с на стек.
Характеристики HBM5:
- Ёмкость: 80 ГБ на стек (16 слоёв по 40 Гбит).
- Потребление: 100 Вт на стек.
- Особенности: охлаждение за счёт погружения, улучшенное тепловое соединение и новый тип калибровочного конденсатора для более стабильной работы.
NVIDIA Feynman — предполагаемый первый пользователь HBM5 — получит пакет с восемью HBM5-стеками общей ёмкостью до 400-500 ГБ и TDP до 4,4 кВт, что сродни 4 мощным серверным графическим ускорителям в одном чипе.
Пакет GPU с восьмью HBM5-стеками обещает феноменальную производительность
HBM6: следующий рывок к экстремальной памяти (ориентировочно 2032 годы)
HBM6 удваивает скорость передачи данных — до 16 Гбит/с, сохраняя 4096 линий ввода-вывода. Благодаря расширению высоты стека до 20 слоев и увеличению ячейки памяти до 48 Гбит, общая ёмкость стека достигает 120 ГБ.
Характеристики HBM6:
- Пропускная способность: 8 ТБ/с.
- Потребление: 120 Вт на стек.
- Упаковка: новая технология без bump’ов с прямым медным соединением (Cu-Cu Direct Bonding).
- Охлаждение: жидкостное погружение.
- Инновации: мультибашенные стеки памяти и гибридный межсоединительный слой (активный/гибридный с кремнием и стеклом).
Пакеты с 16 HBM6 стеками смогут предложить памяти более 1,5 ТБ с пропускной способностью до 256 ТБ/с и энергопотреблением почти 6 кВт, поддерживая супермощные графические решения.
HBM6 — следующий уровень плотности и скорости памяти
HBM7 и HBM8: выход в класс эксабайтных скоростей и ёмкостей
HBM7 ломает привычные границы — скорость выводов достигает 24 Гбит/с, количество линий ввода-вывода — 8192, что суммарно даёт фантастические 24 ТБ/с на стек. Высота стека вырастает до 24 слоев, ёмкость достигает почти 200 ГБ на стек, а энергопотребление — до 160 Вт.
HBM8, который выйдет в 2038 году, пойдёт ещё дальше:
- Скорость вывода: 32 Гбит/с.
- I/O линии: 16384.
- Пропускная способность: 64 ТБ/с.
- Ёмкость: 200-240 ГБ на стек.
- Энергопотребление: 180 Вт.
- Технологии упаковки: прямое медное соединение без bump’ов, встроенное охлаждение, решение с коаксиальными TSV (Through-Silicon Via) и двойной интерпозер.
Суммарные характеристики для систем с HBM7/HBM8 впечатляют — речь о гигантских объёмах памяти (до 6 ТБ) и невероятной производительности, которая позволит быстро и эффективно решать задачи в сферах больших данных, ИИ и моделирования.
HBM7 и HBM8 готовы вывести вычислительную память за рамки сегодняшних ограничений
Инновационные архитектуры и охлаждение: HBF и Embedded Cooling
Одной из любопытных разработок здесь стала HBF (High-Bandwidth Flash) — архитектура, которая позволит объединять быструю DRAM-память HBM с флеш-памятью NAND по технологии TSV. Это позволит расширить общую ёмкость памяти без потери скорости, что критично для тяжёлых задач ИИ и больших языковых моделей (LLM).
Новые методы охлаждения включают:
- Погружное охлаждение (Immersion Cooling), где элементы заливаются в диэлектрическую жидкость, повышая эффективность тепловыделения.
- Встроенное охлаждение через интерпозер и непосредственно через модули с пайкой Bump-less Cu-Cu.
- Термальное связывание и специальные теплоотводы — для поддержания стабильной работы при мощности сотен ватт на стек.
Это важно — ведь для высокопроизводительных графических решений потребление и тепло зачастую являются главными ограничениями.
Заключение: чего ждать рынку и российским пользователям?
Пока HBM4 и HBM5 обещают появиться уже в ближайшие 3–5 лет в виде решений AMD и NVIDIA, более дальние поколения предложат радикальное увеличение параметров, которое перевернёт представление о памяти для высокопроизводительных систем.
Для российских дата-центров и компаний, работающих в сфере машинного обучения, это означает:
- Возможность решать сложные ИИ-задачи быстрее и эффективнее.
- Уменьшение задержек благодаря высокой пропускной способности.
- Существенную экономию пространства благодаря плотности памяти.
- Однако высокая стоимость и необходимость продвинутого инженерного обеспечения (охлаждение, питание) сохраняются.
Эксперты отмечают, что для широкой доступности HBM решений остаётся ключевой вопрос локализации производства и логистики. При сохранении текущих трендов российские научные и промышленные организации смогут получить доступ к новым поколениям HBM примерно в середине следующего десятилетия — тогда как индивидуальные пользователи либо смогут столкнуться с ограниченным предложением, либо получат доступ через зарубежные системы.
Краткая сводка по поколениям HBM:
Поколение | Скорость перед. (Гбит/с) | I/O (бит) | Пропусккабельность (ТБ/с) | Емкость на стек (ГБ) | Высота стека (слоев) | Потребление (Вт) | Ожидаемая дата выхода |
---|---|---|---|---|---|---|---|
HBM4 | 8 | 2048-4096 | 2 | 36-48 | 12-16 | 75 | 2026 |
HBM5 | 8 | 4096 | 4 | 80 | 16 | 100 | 2029 |
HBM6 | 16 | 4096 | 8 | 96-120 | 16-20 | 120 | 2032 |
HBM7 | 24 | 8192 | 24 | 160-192 | 20-24 | 160 | ~2035 |
HBM8 | 32 | 16384 | 64 | 200-240 | 20-24 | 180 | 2038 |
Революция в памяти — это то, что позволит ИИ, VR, научным 계산ам и другим сферам взлететь на новый уровень. Следить за развитием HBM-технологий стоит уже сейчас, особенно тем, кто заинтересован в высокопроизводительных вычислениях — успехи в области упаковки, охлаждения и совместных архитектур открывают невероятные перспективы.
Автор: эксперт IT-журналист с многолетним опытом в компьютерных технологиях и аналитике рынка