Почему следующая волна инноваций в области ИИ будет основана на агентах

Если обратить внимание на ИИ, можно заметить, что 2025 год станет годом ИИ-агентов. Ожидается значительное массовое внедрение ИИ-агентов, аналогично событию «ChatGPT 2022».

Что такое ИИ-агенты? Их можно воспринимать как цифровых работников. Это автономные программные решения, которые выполняют задачи для достижения цели или принимают решения от вашего имени.

Признаки роста ИИ-агентов легко заметить. Например, Gartner прогнозирует, что к 2028 году 33% корпоративных программных приложений будут использовать ИИ-агентов (по сравнению с менее 1% в 2024 году). Улучшения в возможностях ИИ служат значительным сигналом того, что 2025 год будет знаковым для автономного ИИ.

Модели, работающие только с текстом, устарели. Теперь у нас есть действительно впечатляющие мультимодальные модели, которые необходимы для создания агентного ИИ. Мультимодальная модель — это система ИИ, способная обрабатывать и понимать различные типы входных данных, такие как текст, изображения, аудио и видео, в рамках единой архитектуры. В отличие от ранних моделей ИИ, которые специализировались только на одном виде данных, мультимодальные модели могут эффективно работать с различными форматами, понимая взаимосвязи между ними.

Например, ИИ-агент, отвечающий за управление присутствием компании в социальных сетях, может одновременно анализировать метрики взаимодействия, оценивать качество изображений и видео, а также преобразовывать звонки в службу поддержки в полезные инсайты и генерировать новый визуальный контент, соответствующий эстетике бренда.

Способности к рассуждению

Качественный скачок в способностях к рассуждению, который мы увидели в 2024 году, определяет новый этап в разработке ИИ. Мы ушли от простого сопоставления шаблонов и статистического предсказания. Релиз модели рассуждений OpenAI в декабре прошлого года стал знаковым событием, открывающим возможности для ИИ-систем, которые могут планировать, выполнять и корректировать действия без вмешательства человека.

Это стало возможным благодаря достижениям в моделях, которые могут имитировать структурированные человеческие процессы мышления. Рассуждение в модели ИИ означает ее способность логически обрабатывать информацию, устанавливать связи между концепциями и приходить к выводам через структурированный процесс мышления.

Увеличение размеров контекстов

Вспомните, как мы радовались 4K токенам в 2023 году? В феврале 2024 года Gemini 1.5 представила контекстный размер в более чем 1M токенов. Это уже кажется устаревшим. Обещание неограниченных контекстов кардинально меняет то, что может достичь ИИ. Это особенно важно для автономного ИИ, так как позволяет сохранять последовательность в долгосрочных задачах.

Современные агенты могут поддерживать последовательное понимание при выполнении длительных операций, отслеживая многоэтапные процессы, не теряя из виду предыдущие шаги или требования, что позволяет им работать с уровнем непрерывности и сложности, максимально приближенным к человеческим когнитивным способностям.

Глубокое обучение

Эволюция архитектур глубокого обучения оказалась революционной. Мы перешли от традиционных трансформерных моделей к гибридным архитектурам, которые комбинируют лучшие практики различных подходов. Эти новые системы показывают невероятную адаптивность и могут обучаться как на больших объемах данных, так и на небольших примерах.

Инвестиции в вычислительные мощности

Соревнование в вычислительной инфраструктуре достигло своего апогея. Крупные технологические игроки и государства вкладывают беспрецедентные ресурсы в производство полупроводников и расширение центров обработки данных. Мы начинаем видеть появление специализированных ИИ-чипов, которые делают предыдущие поколения похожими на карманные калькуляторы.

Инвестиции охватывают не только оборудование, но и всю экосистему ИИ-вычислений. Эти вычисления обеспечивают выполнение задач, таких как обработка данных, обучение моделей машинного обучения и запуск алгоритмов. Новые технологии охлаждения, более эффективные системы управления мощностью и инновационные дизайны центров обработки данных — все это часть этого технологического бума. Прогнозы отраслевых аналитиков показывают, что инвестиции в ИИ-вычисления в 2025 году превзойдут объединенные показатели за три предыдущих года.

Продуктовые разработки и предстоящие релизы

Среди ненадлежащих сигналов, подтверждающих, что 2025 год станет знаковым для ИИ-агентов, — это важные недавние продуктовые разработки и запланированные релизы от ведущих компаний:

Salesforce представила свой набор ИИ-агентов для бизнеса, Agentforce, в сентябре 2024 года.
Модели с возможностями для работы в качестве ассистентов, такие как Microsoft Copilot, доступные с января 2024 года, и Google NotebookLM, которые станут доступными для всех пользователей (18+) в июне 2024 года.
Проект Mariner от Google — продвинутый ИИ-агент, будет представлен широкой публике в 2025 году.
Релиз модели рассуждений от OpenAI в декабре 2024 года.
Слухи о предполагаемом инструменте ИИ-агента от OpenAI под кодовым названием Operator, который будет представлен в 2025 году.

Некоторые из крупнейших имен в технике настаивают на росте ИИ-агентов. Например:

Сэм Альтман, генеральный директор OpenAI: «Мы считаем, что в 2025 году мы можем увидеть первых ИИ-агентов, которые «присоединяются к рабочей силе» и существенно изменяют результаты компаний.»
Билл Гейтс, сооснователь Microsoft: «Агенты не только изменят способ взаимодействия людей с компьютерами. Они также перевернут программную индустрию, привнеся крупнейшую революцию в вычисления с тех пор, как мы переходим от ввода команд к нажатию на иконки.»
Сатья Наделла, генеральный директор Microsoft: «SaaS-приложения и бизнес-приложения — эти идеи могут пропасть в эпохе агентов.»

Год агентов уже начался. В области бизнеса мы видим ИИ-агентов, которые могут автономно управлять целыми потоками рабочих процессов — от инициации проектов до контроля качества и развертывания. Финансовые учреждения уже внедряют автономные агенты, которые координируют торговлю, оценку рисков и функции соблюдения норм.

Постоянный прорыв формируется благодаря способности агентов все больше справляться с «нечеткими» задачами, переводя неопределенные инструкции, такие как «оптимизировать процесс обслуживания клиентов», в четкие многоступенчатые планы действий. Особенно интересно появление сотрудничества между агентами. Эти системы могут разделять сложные задачи между собой, согласовывать приоритеты и улаживать конфликтующие подходы, при этом соблюдая заданные человеком цели.

Это комбинирование автономности и прозрачности является движущей силой массового внедрения ИИ-агентов, которое мы увидим в 2025 году.

Как изменятся ваши операции с ИИ-агентами?

Сейчас самое время для бизнес-лидеров оценить потенциал ИИ-агентов для трансформации бизнеса. Начните с определения повторяющихся, трудоемких задач, которые могут извлечь выгоду из автоматизации. Изучайте возможности партнерства с ИИ-инноваторами, которые могут помочь внедрить решения ИИ для максимальной отдачи от инвестиций.

Небольшие стратегические шаги, предпринятые сегодня, могут привести ваш бизнес к успеху в мире, все более формируемом автономным искусственным интеллектом.

Прокомментировать в Телеграм: https://t.me/n8nhow

Подписаться на канал обучения n8n: https://t.me/n8ncoaching

Почему следующая волна инноваций в области ИИ будет основана на агентах

Способности к рассуждению

Увеличение размеров контекстов

Глубокое обучение

Инвестиции в вычислительные мощности

Продуктовые разработки и предстоящие релизы

Как изменятся ваши операции с ИИ-агентами?

Больше записей

Google сокращает затраты на искусственный интеллект с помощью запуска новой модели

Бывшие исследователи Google и Apple запустили Trajectory для улучшения обратной связи AI

Основные модели ИИ постоянно нарушают регламенты ЕС, показывает исследование — TechRepublic

Компании сокращают рабочие места из-за ИИ — но не миллиарды, выплачиваемые инвесторам — 24/7 Wall St.