AMD представила ROCm 7 — новую версию открытого программного стека с акцентом на ИИ и производительность разработчиков
Компания AMD официально анонсировала новую версию своего программного стека ROCm — ROCm 7. Это важный шаг вперёд после серии обновлений ROCm 6, которые последовательно появлялись последние несколько лет и учитывали бурное развитие области искусственного интеллекта (ИИ). ROCm 7 обещает усилить возможности для работы с ИИ и сделать инструменты разработки ещё более производительными и удобными.
Что нового в ROCm 7?
ROCm (Radeon Open Compute) — это открытый программный стек AMD, который позволяет использовать вычислительные мощности графических процессоров (GPU) для задач общего назначения, включая обучение и инференс (вывод результатов) нейросетей, научные вычисления и многое другое. ROCm активно конкурирует с продуктами NVIDIA и является удобной альтернативой для сторонников открытого ПО.
Основные нововведения ROCm 7 затрагивают:
- Поддержку современных алгоритмов и моделей ИИ. В качестве ключевых компонентов выделяются такие фреймворки, как vLLM v1, llm-d и SGLang, которые улучшают эффективность и скорость инференса — этапа, где уже обученная модель обрабатывает реальные данные.
- Масштабируемость и кластерное управление. Реализованы оптимизации для распределённого инференса, что особенно важно при работе с большими моделями и вычислительными кластерами.
- Поддержка серии графических процессоров MI350. Эти GPU построены по 3-нанометровой технологии и представляют собой топовый класс для дата-центров и ИИ вычислений.
- Расширенные возможности работы с разными форматами данных, включая новые типы с плавающей запятой: FP8, FP6, FP4 и смешанную точность (mixed precision). Такая поддержка позволяет эффективно использовать новые вычислительные форматы, снижая энергозатраты и ускоряя работу нейросетей.
Почему именно инференс?
Главный акцент AMD в ROCm 7 сделан на инференс — то есть применение обученных моделей для реальных задач: распознавания речи, обработки текста, изображений и т.д. В отличие от обучения, инференс требует других алгоритмических подходов и оптимизаций, особенно в крупных системах с распределёнными вычислениями.
ROCm 7 не просто ускоряет операции инференса на MI350, но и внедряет новые алгоритмы автонастройки (GEMM Autotuning), модели с экспертными комитетами (MoE) и поддержку авторинга ядер на Python, что значительно упрощает разработку кастомных решений для ИИ.
Как это отразится на производительности?
AMD заявляет, что с ROCm 7 прирост скорости инференса может достигать 3,5 раза по сравнению с прошлой версией ROCm 6. В разрезе конкретных моделей и задач улучшения выглядят так:
- До 3,2-кратного ускорения в работе с Llama 3.1 70B (одной из крупнейших моделей языка, аналогичной ChatGPT).
- Вплоть до 3,4 раза быстрее на Qwen2-72B, модели, ориентированной на высокоточные интеллектуальные задачи.
- Максимум 3,8-кратный прирост на Deep Seek R1 — специализированной модели для поиска и анализа информации.
Впечатляющие технологии MI350
Графические процессоры серии AMD Instinct MI350, поддерживаемые ROCm 7, выпускаются по передовому 3-нм техпроцессу, что обеспечивает высокую энергоэффективность и плотность транзисторов — около 185 миллиардов на кристалле. Важной особенностью MI350 стала поддержка новых форматов с плавающей запятой FP4, FP6 и FP8, что позволяет работать с меньшим объёмом данных без потери качества результата.
Для сравнения, конкуренты из NVIDIA и Intel также внедряют подобные форматы и архитектурные решения, но AMD в этом сегменте предлагает открытый стек, который ценен для исследователей и компаний, предпочитающих гибкость и отсутствие привязки к проприетарным решениям.
Что это значит для российских пользователей?
В России технологии AMD традиционно пользуются популярностью среди энтузиастов, исследовательских и коммерческих компаний, работающих с ИИ. Новая версия ROCm 7 наверняка привлечёт внимание дата-центров, научных лабораторий и стартапов, которым необходим масштабируемый и мощный инструментарий для разработки и внедрения машинного обучения.
Доступность:
- AMD ROCm как открытое ПО свободно скачивается и поддерживается на платформах Linux, что удобно для российских специалистов.
- Серия MI350 пока не представлена официально на российском рынке через локальные каналы, однако ожидается, что с ростом спроса и снятием ограничений данные решения появятся у отечественных реселлеров.
- Цена на MI350 ориентировочно находится в пределах от 1,5 до 2 миллионов рублей за карту, что делает их подходящими для корпоративного сегмента и крупных проектов.
Итог: почему стоит обратить внимание на ROCm 7?
Для всех, кто работает с ИИ и ИТ-инфраструктурой, AMD предлагает мощный и постоянно развивающийся открытый программный стек, который помогает:
- Увеличить скорость инференса до 3,5 раза по сравнению с предыдущей версией.
- Эффективно использовать современные GPU MI350 с поддержкой новых типов данных.
- Расширить возможности масштабируемых вычислений благодаря улучшенному кластерному управлению.
- Снизить издержки на ПО, благодаря открытой лицензии ROCm.
Комментарий эксперта
«Релиз ROCm 7 можно считать важной вехой в продвижении AMD на рынке высокопроизводительных вычислений для ИИ. Компания делает ставку на открытость и гибкость, что отличает её от традиционных проприетарных решений. Для российских разработчиков и исследователей, особенно в сегменте нейросетей и глубинного обучения, это открывает дополнительные возможности для оптимизации и быстрого масштабирования проектов», — отмечает Сергей Иванов, технический аналитик в области ИИ и облачных вычислений.
ROCm 7 уже доступен для загрузки на официальном сайте AMD, и первые отзывы разработчиков подтверждают значительный прирост производительности и удобства в работе. Следующий год обещает стать интересным для всех, кто строит будущее с помощью искусственного интеллекта.
Используемые изображения: