SoftBank и AMD подтвердили оркестрацию GPU для ИИ‑инфраструктуры нового поколения

Компании SoftBank и Advanced Micro Devices (AMD) приступили к совместной проверке возможности использования графических процессоров AMD Instinct™ для развития вычислительных ресурсов ИИ‑инфраструктуры нового поколения.

Суть разработки

В рамках проверки идёт работа над функционалом, который позволит:

  • разделять ресурсы GPU;
  • оптимально распределять их в зависимости от требований — например, от размера модели ИИ‑приложения и количества одновременных выполнений.

Для этого SoftBank разрабатывает механизм управления вычислительными ресурсами и оптимального распределения ИИ‑приложений — Orchestrator. Благодаря ему несколько ИИ‑приложений могут эффективно работать на GPU AMD Instinct в ответ на запросы пользователей.

Контекст разработки: рост спроса на генеративный ИИ

С ростом популярности генеративного ИИ увеличивается и спрос на приложения, работающие на базе ИИ‑моделей — в частности, больших языковых моделей (LLM).

Особенности LLM:

  • потребность в вычислительных ресурсах сильно варьируется — это зависит от числа параметров и одновременного выполнения модели;
  • равномерное распределение ресурсов может привести к дефициту или избытку GPU, что снижает эффективность работы.

Именно поэтому SoftBank разрабатывает Orchestrator — систему, которая позволит гибко управлять вычислительными ресурсами с учётом размера модели и требований к выполнению ИИ‑приложений. Цель — создать ИИ‑инфраструктуру нового поколения.

Обзор совместной проверки

В сотрудничестве с AMD компания SoftBank разработала усовершенствованную функцию Orchestrator. Она использует возможности разделения GPU в процессорах AMD Instinct™ — это позволяет использовать один GPU как несколько логических устройств.

Ключевые преимущества функции:

  • гибкое и оптимальное распределение ресурсов GPU с учётом требований ИИ‑приложения (размер модели, параллельность выполнения);
  • возможность эффективно запускать несколько ИИ‑приложений на одном GPU;
  • минимальная нагрузка на ресурсы GPU и снижение вероятности их избытка.

Эффективность усовершенствованного Orchestrator уже подтверждена.

Демонстрация результатов

Демонстрация, посвящённая совместной проверке, планируется на стенде AMD в рамках мероприятия MWC Barcelona 2026.

Технические детали — включая архитектуру и методы управления Orchestrator — доступны в блоге Исследовательского института передовых технологий SoftBank.

Дальнейшие планы

SoftBank и AMD продолжат совместную техническую оценку, чтобы расширить возможности использования GPU AMD Instinct™ в ИИ‑инфраструктуре нового поколения.

Комментарии представителей компаний

Рюдзи Вакикава (Ryuji Wakikawa), вице‑президент и руководитель Исследовательского института передовых технологий корпорации SoftBank:

«В ходе совместной проверки с AMD мы реализовали логику оркестрации для управления GPU AMD Instinct™. Это позволяет эффективнее запускать несколько ИИ‑приложений на одном GPU. SoftBank продолжит работу над повышением эффективности использования вычислительных ресурсов».

Кумаран Сива (Kumaran Siva), корпоративный вице‑президент по стратегическому развитию рынка AMD:

«AMD и SoftBank сосредоточены на создании высокопроизводительной и эффективной инфраструктуры, которая поможет внедрить вывод ИИ в реальные условия. Благодаря нашему сотрудничеству SoftBank оптимизирует распределение ресурсов GPU в соответствии с требованиями моделей и создаёт гибкие платформы вывода, поддерживающие широкий спектр реальных ИИ‑сервисов. Мы рады продолжать работу с SoftBank над развитием корпоративных технологий вывода ИИ для инфраструктуры нового поколения».




Прокомментировать в Телеграм: https://t.me/n8nhow

Подписаться на канал обучения n8n: https://t.me/n8ncoaching