Новая архитектура HBM: HBM4-8 с пропускной способностью до 64 ТБ/с и емкостью 240 ГБ

Следующее поколение HBM: революция в памяти для дата-центров и ИИ

Совместное исследование корейского Института передовых технологий KAIST и лаборатории TeraByte (специализирующейся на межсоединениях и упаковке памяти) раскрывает пути развития стандартов HBM (High Bandwidth Memory) вплоть до HBM8. Каждое новое поколение HBM обещает кардинальное увеличение пропускной способности, объёмов и энергоэффективности, отвечая на взрывной рост потребностей дата-центров и искусственного интеллекта.


Общий взгляд на HBM4–HBM8: почему это важно для России?

HBM — это особый тип высокоскоростной памяти, который располагается в нескольких слоях (stack), обеспечивая гигантские пропускные способности и компактность. Уже сегодня HBM используется в топовых графических процессорах и ускорителях, а для российских центров обработки данных с задачами ИИ и рендеринга это будет критично для эффективности и скорости обработки.

Перевод цен: пока новые поколения находятся на стадии исследований, точные цены неизвестны, но мы можем ориентироваться на прецеденты: например, стоимость HBM4 для дата-центров может достигать десятков миллионов рублей за модуль, что оправдано в корпоративных масштабах.

Возможность появиться в России зависит от глобальных поставок и политики компаний вроде NVIDIA и AMD, но учитывая тесную связь с индустрией ИИ, ожидать их появления на отечественном рынке стоит к середине следующего десятилетия.


HBM4 — старт эры гигабайт и терабайт в секунду

Первым на горизонте стоит стандарт HBM4, который уже планируют использовать в 2026 году в новых моделях AMD Instinct MI400 и NVIDIA Rubin. Оба производителя подтвердили, что для своих серверных и ИИ-GPU они выбрали именно HBM следующего поколения.

HBM4 предлагает:

  • Скорость передачи данных: около 8 Гбит/с на линию.
  • Шина: 2048 или 4096 бит (I/O).
  • Пропускная способность: до 2 ТБ/с на стек памяти.
  • Высота стека: 12-16 слоев (Hi).
  • Ёмкость: от 36 до 48 ГБ на стек.
  • Потребление: до 75 Вт на стек.
  • Охлаждение: жидкостное прямого охлаждения (Direct-To-Chip).

Это уже серьезный шаг вперед по сравнению с HBM3 — вдвое выше скорость и более крупные стеки. В случае AMD MI400 речь идёт о 432 ГБ общей памяти и почти 20 ТБ/с пропускной способности.


HBM4 Specs

Параметры HBM4-системы NVIDIA Rubin и AMD MI400 отражают новый уровень производительности


HBM5 — огромная пропускная способность для NVIDIA Feynman (около 2029 года)

HBM5 в своем базовом варианте (Non-e) сохранит скорость 8 Гбит/с, но удвоит количество I/O до 4096, а пропускную способность увеличит до 4 ТБ/с на стек.

Характеристики HBM5:

  • Ёмкость: 80 ГБ на стек (16 слоёв по 40 Гбит).
  • Потребление: 100 Вт на стек.
  • Особенности: охлаждение за счёт погружения, улучшенное тепловое соединение и новый тип калибровочного конденсатора для более стабильной работы.

NVIDIA Feynman — предполагаемый первый пользователь HBM5 — получит пакет с восемью HBM5-стеками общей ёмкостью до 400-500 ГБ и TDP до 4,4 кВт, что сродни 4 мощным серверным графическим ускорителям в одном чипе.


HBM5 & Feynman

Пакет GPU с восьмью HBM5-стеками обещает феноменальную производительность


HBM6: следующий рывок к экстремальной памяти (ориентировочно 2032 годы)

HBM6 удваивает скорость передачи данных — до 16 Гбит/с, сохраняя 4096 линий ввода-вывода. Благодаря расширению высоты стека до 20 слоев и увеличению ячейки памяти до 48 Гбит, общая ёмкость стека достигает 120 ГБ.

Характеристики HBM6:

  • Пропускная способность: 8 ТБ/с.
  • Потребление: 120 Вт на стек.
  • Упаковка: новая технология без bump’ов с прямым медным соединением (Cu-Cu Direct Bonding).
  • Охлаждение: жидкостное погружение.
  • Инновации: мультибашенные стеки памяти и гибридный межсоединительный слой (активный/гибридный с кремнием и стеклом).

Пакеты с 16 HBM6 стеками смогут предложить памяти более 1,5 ТБ с пропускной способностью до 256 ТБ/с и энергопотреблением почти 6 кВт, поддерживая супермощные графические решения.


HBM6 Diagram

HBM6 — следующий уровень плотности и скорости памяти


HBM7 и HBM8: выход в класс эксабайтных скоростей и ёмкостей

HBM7 ломает привычные границы — скорость выводов достигает 24 Гбит/с, количество линий ввода-вывода — 8192, что суммарно даёт фантастические 24 ТБ/с на стек. Высота стека вырастает до 24 слоев, ёмкость достигает почти 200 ГБ на стек, а энергопотребление — до 160 Вт.

HBM8, который выйдет в 2038 году, пойдёт ещё дальше:

  • Скорость вывода: 32 Гбит/с.
  • I/O линии: 16384.
  • Пропускная способность: 64 ТБ/с.
  • Ёмкость: 200-240 ГБ на стек.
  • Энергопотребление: 180 Вт.
  • Технологии упаковки: прямое медное соединение без bump’ов, встроенное охлаждение, решение с коаксиальными TSV (Through-Silicon Via) и двойной интерпозер.

Суммарные характеристики для систем с HBM7/HBM8 впечатляют — речь о гигантских объёмах памяти (до 6 ТБ) и невероятной производительности, которая позволит быстро и эффективно решать задачи в сферах больших данных, ИИ и моделирования.


HBM7 - HBM8

HBM7 и HBM8 готовы вывести вычислительную память за рамки сегодняшних ограничений


Инновационные архитектуры и охлаждение: HBF и Embedded Cooling

Одной из любопытных разработок здесь стала HBF (High-Bandwidth Flash) — архитектура, которая позволит объединять быструю DRAM-память HBM с флеш-памятью NAND по технологии TSV. Это позволит расширить общую ёмкость памяти без потери скорости, что критично для тяжёлых задач ИИ и больших языковых моделей (LLM).

Новые методы охлаждения включают:

  • Погружное охлаждение (Immersion Cooling), где элементы заливаются в диэлектрическую жидкость, повышая эффективность тепловыделения.
  • Встроенное охлаждение через интерпозер и непосредственно через модули с пайкой Bump-less Cu-Cu.
  • Термальное связывание и специальные теплоотводы — для поддержания стабильной работы при мощности сотен ватт на стек.

Это важно — ведь для высокопроизводительных графических решений потребление и тепло зачастую являются главными ограничениями.


Заключение: чего ждать рынку и российским пользователям?

Пока HBM4 и HBM5 обещают появиться уже в ближайшие 3–5 лет в виде решений AMD и NVIDIA, более дальние поколения предложат радикальное увеличение параметров, которое перевернёт представление о памяти для высокопроизводительных систем.

Для российских дата-центров и компаний, работающих в сфере машинного обучения, это означает:

  • Возможность решать сложные ИИ-задачи быстрее и эффективнее.
  • Уменьшение задержек благодаря высокой пропускной способности.
  • Существенную экономию пространства благодаря плотности памяти.
  • Однако высокая стоимость и необходимость продвинутого инженерного обеспечения (охлаждение, питание) сохраняются.

Эксперты отмечают, что для широкой доступности HBM решений остаётся ключевой вопрос локализации производства и логистики. При сохранении текущих трендов российские научные и промышленные организации смогут получить доступ к новым поколениям HBM примерно в середине следующего десятилетия — тогда как индивидуальные пользователи либо смогут столкнуться с ограниченным предложением, либо получат доступ через зарубежные системы.


Краткая сводка по поколениям HBM:

Поколение Скорость перед. (Гбит/с) I/O (бит) Пропусккабельность (ТБ/с) Емкость на стек (ГБ) Высота стека (слоев) Потребление (Вт) Ожидаемая дата выхода
HBM4 8 2048-4096 2 36-48 12-16 75 2026
HBM5 8 4096 4 80 16 100 2029
HBM6 16 4096 8 96-120 16-20 120 2032
HBM7 24 8192 24 160-192 20-24 160 ~2035
HBM8 32 16384 64 200-240 20-24 180 2038

Революция в памяти — это то, что позволит ИИ, VR, научным 계산ам и другим сферам взлететь на новый уровень. Следить за развитием HBM-технологий стоит уже сейчас, особенно тем, кто заинтересован в высокопроизводительных вычислениях — успехи в области упаковки, охлаждения и совместных архитектур открывают невероятные перспективы.


Автор: эксперт IT-журналист с многолетним опытом в компьютерных технологиях и аналитике рынка

Источник

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *