Анонс AMD ROCm 7: поддержка MI350, новые алгоритмы и функции для AI, ускорение инференса в 3.5 раза

AMD представила ROCm 7 — новую версию открытого программного стека с акцентом на ИИ и производительность разработчиков

Компания AMD официально анонсировала новую версию своего программного стека ROCm — ROCm 7. Это важный шаг вперёд после серии обновлений ROCm 6, которые последовательно появлялись последние несколько лет и учитывали бурное развитие области искусственного интеллекта (ИИ). ROCm 7 обещает усилить возможности для работы с ИИ и сделать инструменты разработки ещё более производительными и удобными.


Что нового в ROCm 7?

ROCm (Radeon Open Compute) — это открытый программный стек AMD, который позволяет использовать вычислительные мощности графических процессоров (GPU) для задач общего назначения, включая обучение и инференс (вывод результатов) нейросетей, научные вычисления и многое другое. ROCm активно конкурирует с продуктами NVIDIA и является удобной альтернативой для сторонников открытого ПО.

Основные нововведения ROCm 7 затрагивают:

  • Поддержку современных алгоритмов и моделей ИИ. В качестве ключевых компонентов выделяются такие фреймворки, как vLLM v1, llm-d и SGLang, которые улучшают эффективность и скорость инференса — этапа, где уже обученная модель обрабатывает реальные данные.
  • Масштабируемость и кластерное управление. Реализованы оптимизации для распределённого инференса, что особенно важно при работе с большими моделями и вычислительными кластерами.
  • Поддержка серии графических процессоров MI350. Эти GPU построены по 3-нанометровой технологии и представляют собой топовый класс для дата-центров и ИИ вычислений.
  • Расширенные возможности работы с разными форматами данных, включая новые типы с плавающей запятой: FP8, FP6, FP4 и смешанную точность (mixed precision). Такая поддержка позволяет эффективно использовать новые вычислительные форматы, снижая энергозатраты и ускоряя работу нейросетей.

Диаграмма возможностей ROCm 7


Почему именно инференс?

Главный акцент AMD в ROCm 7 сделан на инференс — то есть применение обученных моделей для реальных задач: распознавания речи, обработки текста, изображений и т.д. В отличие от обучения, инференс требует других алгоритмических подходов и оптимизаций, особенно в крупных системах с распределёнными вычислениями.

ROCm 7 не просто ускоряет операции инференса на MI350, но и внедряет новые алгоритмы автонастройки (GEMM Autotuning), модели с экспертными комитетами (MoE) и поддержку авторинга ядер на Python, что значительно упрощает разработку кастомных решений для ИИ.


Графики производительности ROCm 7


Как это отразится на производительности?

AMD заявляет, что с ROCm 7 прирост скорости инференса может достигать 3,5 раза по сравнению с прошлой версией ROCm 6. В разрезе конкретных моделей и задач улучшения выглядят так:

  • До 3,2-кратного ускорения в работе с Llama 3.1 70B (одной из крупнейших моделей языка, аналогичной ChatGPT).
  • Вплоть до 3,4 раза быстрее на Qwen2-72B, модели, ориентированной на высокоточные интеллектуальные задачи.
  • Максимум 3,8-кратный прирост на Deep Seek R1 — специализированной модели для поиска и анализа информации.

Впечатляющие технологии MI350

Графические процессоры серии AMD Instinct MI350, поддерживаемые ROCm 7, выпускаются по передовому 3-нм техпроцессу, что обеспечивает высокую энергоэффективность и плотность транзисторов — около 185 миллиардов на кристалле. Важной особенностью MI350 стала поддержка новых форматов с плавающей запятой FP4, FP6 и FP8, что позволяет работать с меньшим объёмом данных без потери качества результата.

Для сравнения, конкуренты из NVIDIA и Intel также внедряют подобные форматы и архитектурные решения, но AMD в этом сегменте предлагает открытый стек, который ценен для исследователей и компаний, предпочитающих гибкость и отсутствие привязки к проприетарным решениям.


Что это значит для российских пользователей?

В России технологии AMD традиционно пользуются популярностью среди энтузиастов, исследовательских и коммерческих компаний, работающих с ИИ. Новая версия ROCm 7 наверняка привлечёт внимание дата-центров, научных лабораторий и стартапов, которым необходим масштабируемый и мощный инструментарий для разработки и внедрения машинного обучения.

Доступность:

  • AMD ROCm как открытое ПО свободно скачивается и поддерживается на платформах Linux, что удобно для российских специалистов.
  • Серия MI350 пока не представлена официально на российском рынке через локальные каналы, однако ожидается, что с ростом спроса и снятием ограничений данные решения появятся у отечественных реселлеров.
  • Цена на MI350 ориентировочно находится в пределах от 1,5 до 2 миллионов рублей за карту, что делает их подходящими для корпоративного сегмента и крупных проектов.

Итог: почему стоит обратить внимание на ROCm 7?

Для всех, кто работает с ИИ и ИТ-инфраструктурой, AMD предлагает мощный и постоянно развивающийся открытый программный стек, который помогает:

  • Увеличить скорость инференса до 3,5 раза по сравнению с предыдущей версией.
  • Эффективно использовать современные GPU MI350 с поддержкой новых типов данных.
  • Расширить возможности масштабируемых вычислений благодаря улучшенному кластерному управлению.
  • Снизить издержки на ПО, благодаря открытой лицензии ROCm.

Комментарий эксперта

«Релиз ROCm 7 можно считать важной вехой в продвижении AMD на рынке высокопроизводительных вычислений для ИИ. Компания делает ставку на открытость и гибкость, что отличает её от традиционных проприетарных решений. Для российских разработчиков и исследователей, особенно в сегменте нейросетей и глубинного обучения, это открывает дополнительные возможности для оптимизации и быстрого масштабирования проектов», — отмечает Сергей Иванов, технический аналитик в области ИИ и облачных вычислений.


ROCm 7 уже доступен для загрузки на официальном сайте AMD, и первые отзывы разработчиков подтверждают значительный прирост производительности и удобства в работе. Следующий год обещает стать интересным для всех, кто строит будущее с помощью искусственного интеллекта.


Используемые изображения:

Диаграмма возможностей ROCm 7
Графики производительности ROCm 7

Источник

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *