Сейчас ваша корзина пуста!
Платформа Arm Lumex оживает с помощью смартфонов и приложений на базе ИИ

В бесконечной гонке за улучшением производительности ИИ на каждом возможном устройстве важно следить за Arm. Архитектуры вычислений компании для процессоров (CPU) и графических процессоров (GPU) обеспечивают работу практически всех смартфонов мира, а также все большего числа ПК, носимых устройств и других гаджетов. От архитектурных лицензий таких как Apple и Qualcomm до прямых клиентов IP, таких как MediaTek и Xiaomi, охват Arm в клиентских устройствах колоссален.
С представлением новой платформы Lumex и ключевых компонентов, таких как новая архитектура CPU C1 и архитектура GPU Mali G1, есть много аспектов, которые стоит проанализировать. Во-первых, важно отметить, что Lumex ориентирован в первую очередь на мобильные устройства, но элементы его дизайна также повлияют на будущие чип-дизайны для ПК и других устройств.
Платформа Lumex интересна с нескольких точек зрения. Она представляет собой последнюю попытку компании продвинуться выше в стек дизайна и создания ценности для мобильных устройств. Lumex строится на базе CSS (Compute Subsystem) для клиентских решений и добавляет еще больше возможностей, чтобы упростить и ускорить процесс использования дизайнов на базе Arm, улучшая при этом общую производительность системы.
Совершенно как Neoverse позволила Arm выйти за пределы просто интеллектуальной собственности (IP) для отдельных вычислительных ядер на рынке серверов и инфраструктуры, Lumex является кульминацией усилий компании по созданию большей ценности для мобильного клиентского рынка. Дополнительно, он дополняет общую бренд-стратегию компании, направленную на создание названий платформ для всех ключевых категорий, в которых они участвуют.
Инновации в Lumex
Внутри платформы Lumex содержатся несколько важных новых инноваций, которые закладывают основу для дальнейшего улучшения производительности ИИ на устройстве. К ним относятся новые варианты CPU C1 (включая C1 Ultra, C1 Premium, C1 Pro и C1 Nano), которые продолжают впечатляющий многолетний рост производительности на уровне около 15% IPC (инструкций на такт) наряду с линией GPU Mali G1 и ее еще лучшим многолетним ростом на уровне 20% улучшений. Lumex включает новую архитектуру системной магистрали SI L1 и новый SMMU (единица управления системной памятью). Оба этих компонента предлагают преимущества в общей производительности и эффективности системы, особенно для задач, связанных с ИИ.
Производительность и эффективность
Одним из особенно интересных аспектов, которые Arm использует для описания актуальности этих изменений, является то, как различается энергопотребление системной памяти при выполнении задач на базе ИИ и при запуске даже сложных игровых приложений. В частности, процент общего потребления энергии системой, которое занимает память в игровых нагрузках, в среднем составляет около 10-15%, но он увеличивается в 5 раз до более 70% для приложений, ориентированных на ИИ. Другими словами, без какой-либо коррекции общей архитектуры системы можно легко понять, как быстро приложения на базе ИИ могут разрядить аккумулятор, даже по сравнению с энергозатратными играми.
Связь элементов системы
Способ, которым Arm достигает этих системных изменений, состоит в пересмотре способов связи элементов системы. Например, SI L1 не только поддерживает высокоскоростные соединения с различными компонентами в общем дизайне чипа, но и предлагает архитектуру Network on Chip (NOC), которая позволяет служить единой точкой подключения для как CPU, так и GPU к основной памяти. Это позволяет создавать более масштабируемые дизайны, одновременно уменьшая задержки и снижая потребление энергии.
Новая SMMU занимает меньше места на чипе и предоставляет аналогичные системные преимущества, одновременно усиливая безопасность от атак, связанных с виртуализацией.
Инструкции SME2 и ИИ
Еще одним очень интересным улучшением производительности, связанным с ИИ, которое Arm включил в платформу Lumex, является добавление инструкций SME2 (Scalable Matrix Extension) и набора логических компонентов для этих инструкций во всех вариантах новой архитектуры CPU C1. Эта версия технологии предлагает ряд улучшений и расширенных возможностей, которые приводят к улучшениям производительности до 3.7x в различных бенчмарках на основе ИИ, компьютерного зрения и других задач машинного обучения, одновременно снижая энергопотребление CPU на 12% при выполнении инференса.
Будущее на базе Arm Lumex
Хотя улучшения производительности являются значительными, добавление инструкций SME2 также являются показательным примером более широкой тенденции к переносу задач, связанных с ИИ, на более широкий спектр вычислительных архитектур. В начале все внимание было сосредоточено на NPUs (наборы процессоров для нейронных сетей). Однако сегодня оказывается, что многие современные AI-приложения совсем не используют NPU. Вместо этого разработчики программного обеспечения понимают, что, вернувшись к GPU и CPU, они могут добиться достаточной производительности без столь значительного энергопотребления.
С течением времени, возможно, будет разработан более широкий стандарт (например, создание чего-то, подобного DirectX), который позволит эффективно использовать NPU от различных продавцов. Тем временем инновации, такие как SME2, вероятно, принесут более значительные улучшения в производительности AI-приложений, чем ожидали от NPUs. Особенно это будет верно, если они будут использоваться в сочетании с программными инструментами, такими как Kleidi AI от Arm, и другими разработками.
Несмотря на то, что в Lumex отсутствует собственный выделенный IP NPU, Arm рассматривает SME2 как мощный способ улучшить производительность ИИ для мобильных устройств. Хотя реализация новых дизайнов может занять время, очевидно, что Arm активизирует достижения в производительности, ориентированной на ИИ, различными интересными способами.
Прокомментировать в Телеграм: https://t.me/n8nhow
Подписаться на канал обучения n8n: https://t.me/n8ncoaching
