Сейчас ваша корзина пуста!
OpenAI представила инструменты для создания и управления ИИ‑агентами

Во вторник компания OpenAI выпустила новые инструменты, призванные помочь разработчикам и предприятиям создавать ИИ‑агенты — автоматизированные системы, способные самостоятельно выполнять задачи. В основе решений лежат собственные модели и фреймворки OpenAI.
Responses API: основа для кастомных ИИ‑агентов
Новые инструменты входят в состав Responses API — платформы, которая позволяет компаниям разрабатывать собственных ИИ‑агентов. Такие агенты могут:
- выполнять веб‑поиск;
- сканировать файлы в корпоративных базах данных;
- навигацию по веб‑сайтам — аналогично продукту OpenAI Operator.
Responses API фактически заменяет Assistants API, которую OpenAI планирует прекратить поддерживать в первой половине 2026 года.
Что такое ИИ‑агенты и почему к ним такой интерес?
В последние годы ажиотаж вокруг ИИ‑агентов значительно вырос. При этом индустрия до сих пор испытывает трудности с чётким определением того, что именно представляют собой такие агенты. Пример чрезмерного ажиотажа — китайский стартап Butterfly Effect, который на этой неделе привлёк внимание новой платформой ИИ‑агентов Manus. Однако вскоре выяснилось, что платформа не оправдывает многих обещаний компании.
Для OpenAI важно успешно реализовать потенциал ИИ‑агентов. Как отметил Оливье Годеман (Olivier Godement), руководитель продуктовой линейки API в OpenAI, в интервью TechCrunch: «Продемонстрировать работу агента довольно просто. Масштабировать его — сложно, а добиться того, чтобы люди регулярно им пользовались, — очень сложно».
Предыдущие шаги OpenAI в области ИИ‑агентов
Ранее в этом году OpenAI представила двух ИИ‑агентов в ChatGPT:
- Operator — агент, который выполняет навигацию по веб‑сайтам от имени пользователя;
- Deep research — агент, составляющий исследовательские отчёты.
Эти инструменты дали представление о возможностях агентских технологий, однако их автономность оставляла желать лучшего.
Возможности Responses API
С помощью Responses API OpenAI предлагает разработчикам доступ к компонентам, лежащим в основе ИИ‑агентов. Это позволит создавать собственные приложения в стиле Operator и deep research. OpenAI надеется, что разработчики смогут создать более автономные решения, чем те, что доступны сегодня.
Используя Responses API, разработчики могут задействовать те же модели ИИ (в предварительной версии), которые лежат в основе инструмента веб‑поиска ChatGPT Search:
- GPT‑4o search;
- GPT‑4o mini search.
Эти модели способны искать ответы на вопросы в интернете, ссылаясь на источники при формировании ответов. OpenAI утверждает, что GPT‑4o search и GPT‑4o mini search отличаются высокой фактической точностью. В рамках теста SimpleQA (оценивает способность моделей отвечать на короткие вопросы, требующие фактов) GPT‑4o search набрал 90 %, а GPT‑4o mini search — 88 % (чем выше показатель, тем лучше). Для сравнения: модель GPT‑4.5, которая значительно крупнее и была выпущена недавно, набрала лишь 63 %.
Дополнительные инструменты в составе Responses API
Responses API также включает:
- Утилиту поиска по файлам — позволяет быстро сканировать файлы в базах данных компании для извлечения информации (OpenAI утверждает, что не будет использовать эти файлы для обучения моделей).
- Модель Computer‑Using Agent (CUA) — лежит в основе Operator. Модель генерирует действия с мышью и клавиатурой, позволяя автоматизировать такие задачи, как ввод данных и рабочие процессы в приложениях.
Предприятия могут запускать модель CUA (выпускается в исследовательской предварительной версии) локально на своих системах. Потребительская версия CUA, доступная в Operator, может выполнять действия только в интернете.
Ограничения и текущие вызовы
Несмотря на прогресс, Responses API не решает все технические проблемы, с которыми сталкиваются ИИ‑агенты сегодня:
- ИИ‑инструменты поиска более точны, чем традиционные модели ИИ, но проблема галлюцинаций ИИ (ошибок в ответах) остаётся актуальной. Например, GPT‑4o search ошибается в 10 % случаев при ответе на фактические вопросы.
- ИИ‑инструменты поиска часто испытывают трудности с короткими навигационными запросами (например, «счёт Lakers сегодня»).
- Согласно недавним отчётам, ссылки в ChatGPT не всегда надёжны.
В блоге, предоставленном TechCrunch, OpenAI отметила, что модель CUA «пока не отличается высокой надёжностью для автоматизации задач в операционных системах» и склонна к «непреднамеренным» ошибкам.
Тем не менее OpenAI подчёркивает, что это ранние версии инструментов для агентов, и компания постоянно работает над их улучшением.
Agents SDK: открытый инструментарий для разработчиков
Вместе с Responses API OpenAI выпускает Agents SDK — открытый инструментарий, который предлагает разработчикам бесплатные инструменты для:
- интеграции моделей с внутренними системами;
- установки защитных механизмов;
- мониторинга деятельности ИИ‑агентов для отладки и оптимизации.
Agents SDK является продолжением Swarm — фреймворка для оркестрации мультиагентных систем, выпущенного OpenAI в конце прошлого года.
Перспективы развития ИИ‑агентов
Оливье Годеман выразил надежду, что OpenAI сможет преодолеть разрыв между демонстрациями ИИ‑агентов и реальными продуктами в этом году. Он считает, что «агенты — это наиболее значимое применение ИИ, которое нас ждёт».
Это перекликается с заявлением генерального директора OpenAI Сэма Альтмана, сделанным в январе: 2025 год станет годом, когда ИИ‑агенты войдут в рабочую среду.
Независимо от того, станет ли 2025 год «годом ИИ‑агента», последние релизы OpenAI демонстрируют стремление компании перейти от эффектных демонстраций к созданию действительно полезных инструментов.
Прокомментировать в Телеграм: https://t.me/n8nhow
Подписаться на канал обучения n8n: https://t.me/n8ncoaching
