Индийские ИИ‑стартапы полагаются на западные API и закрытые модели, а не на обучение ИИ — результаты опроса

Результаты опроса, проведённого венчурной компанией Activate Signal, показали, что экосистема искусственного интеллекта (ИИ) в Индии в значительной степени зависит от закрытых проприетарных моделей западного производства. Как минимум три из четырёх внедрений ИИ используют такие модели через API, не занимаясь обучением собственных решений.

В рамках исследования были опрошены 244 технических директора, разработчиков и создателей ИИ‑стартапов из 12 отраслей в Индии. Цель опроса — понять, как ИИ используется в производственных процессах. В выборку вошли:

  • 53 % — разработчики;
  • 37 % — основатели компаний;
  • 10 % — менеджеры по продукту и специалисты широкого профиля.

Индия: приоритет API, а не открытый код

Опрос выявил, что почти три из четырёх индийских внедрений ИИ опираются на закрытые модели, доступные через API. Это свидетельствует о высокой зависимости от западных решений:

  • 74 % используют закрытые западные модели через API;
  • лишь 13 % индийских разработчиков адаптируют модели под конкретные задачи.

API (Application Programming Interfaces) — это интерфейсы программирования приложений, которые позволяют приложениям и системам эффективно обмениваться данными.

Среди индийских стартапов, использующих GPU (графические процессоры), распределение вычислительных мощностей выглядит следующим образом:

  • 65 % — на выполнение конкретных задач (например, генерацию изображений);
  • 21 % — на обучение новых моделей;
  • 14 % — на тонкую настройку существующих моделей.

В отчёте подчёркивается: «Большая часть этой экосистемы использует API, а не обучает модели».

Также отмечается, что 43 % респондентов проводят тонкую настройку моделей — «больше, чем многие ожидали, но всё же не большинство».

«60 % разработчиков тратят менее $2 400 в месяц. Инвестировать в инфраструктуру для обучения становится всё менее целесообразно, когда можно использовать возможности, вызываемые через API. Возможности для создания ценности находятся на уровне приложений и сервисов, а не на уровне моделей», — говорится в отчёте.

Таким образом, согласно отчёту, стоит поддерживать не те компании, у которых больше GPU, а те, которые глубоко понимают рабочие процессы, основанные на ИИ — в том числе через API.

Только 13 % опрошенных компаний используют модели с открытым исходным кодом:

  • 9 % — западные (преимущественно американские) открытые модели;
  • 3 % — восточные открытые модели.

Кроме того, 16 % разработчиков сталкиваются с проблемой отсутствия суверенных данных.

Индия внедряет ИИ‑агенты

62 % разработчиков планируют интегрировать рабочие процессы с ИИ‑агентами в ближайшие шесть месяцев. Это может свидетельствовать о высоком темпе внедрения таких решений в Индии.

В отчёте указаны вероятные причины такого внедрения:

  • рабочие процессы с ИИ‑агентами соответствуют сильным сторонам Индии в области автоматизации процессов;
  • современные модели поддерживают агентов производственного уровня, которые могут потенциально достигать требуемых результатов, а не просто давать рекомендации.

Однако стоимость остаётся главным препятствием для внедрения таких рабочих процессов (43 %).

«Проблема — в стоимости. Рабочие процессы с ИИ‑агентами — самые дорогие и склонные к сбоям из‑за умножения вызовов API, задержек и частоты ошибок», — отмечается в отчёте.

Middleware (промежуточное ПО) — это слой программного обеспечения, который соединяет операционную систему с приложениями, данными и пользователями.

Нехватка специалистов по ИИ тормозит рост

После проблемы суверенитета данных одним из главных нетехнических факторов, сдерживающих рост, является нехватка специалистов в области операций с ИИ (28,9 %).

«Проблема с кадрами не в области инженерии машинного обучения. Она в области операций с ИИ. Индия готовит людей, способных создавать модели. Но не хватает тех, кто может оценивать, оптимизировать, развёртывать и контролировать системы ИИ в производственной среде», — говорится в отчёте.

При этом 55 % респондентов заявили, что у них нет существенных нетехнических препятствий. Также:

  • 17,8 % отметили влияние запрета на теневой ИТ;
  • 15,6 % — влияние стоимости закупок.

Теневой ИТ (shadow IT) — это программное обеспечение, которое компания может запретить своим сотрудникам использовать без одобрения (например, заблокировать конкретное приложение в сети).

Кто доминирует на рынке API

Согласно отчёту:

  • OpenAI доминирует в пространстве API для генерации текста с долей в 48 %;
  • Anthropic занимает 25 % рынка в этой сфере.

В области генерации кода:

  • Anthropic’s Claude Code лидирует с долей в 42 %;
  • OpenAI’s Codex — всего 7 %.

На вопрос «Если бы вы могли использовать только одного поставщика LLM в течение следующих 12 месяцев, кого бы вы выбрали?» респонденты ответили:

  • 42 % — Anthropic;
  • 32 % — OpenAI;
  • 19 % — Google’s Gemini;
  • 4 % — открытые модели;
  • 2 % — модель Meta’s Llama.

Падение популярности GitHub Copilot

24 % респондентов отказались от использования GitHub Copilot, несмотря на его структурные и дистрибутивные преимущества (например, интеграцию с VS Code — одним из доминирующих редакторов кода с долей рынка более 70 %).

Claude Code занимает 42 % рынка помощников по кодированию среди индийских разработчиков — больше, чем Cursor и GitHub Copilot вместе взятые.

Отчёт указывает, что Copilot — единственный инструмент, от которого чаще всего отказываются после того, как технологический стек респондента становится «стабильным».

Среди причин предпочтения Claude Code разработчики называют:

  • многоэтапное выполнение задач;
  • навигацию по всей кодовой базе;
  • поддержание контекста.

Google лидирует в генерации контента

Несмотря на то что OpenAI разработала модели для генерации изображений (DALL‑E в 2021 году и Sora в 2024 году), компания отстаёт от Google в этой сфере. Доля Google в генерации изображений и видео почти вдвое превышает долю OpenAI (29 %) среди опрошенных индийских компаний и разработчиков.

Google вышла на рынок генерации изображений для потребителей в 2022 году с моделью Imagen, а затем расширила своё присутствие с помощью модели Veo в 2024 году.

В отчёте отмечается отсутствие индийских компаний в секторе генерации голоса. При этом 37 % разработчиков используют API для работы с голосом в производственных процессах, полагаясь в основном на американских поставщиков, таких как ElevenLabs и OpenAI.

«Доля Google в 49 % обусловлена моделями Imagen 4, Veo 3 и её дистрибутивным охватом через Android и Chrome. Это преимущество, основанное на дистрибуции, а не на качестве модели — и его сложнее всего преодолеть», — говорится в отчёте.

Среди индийских компаний, работающих над моделями для генерации голоса на индийских языках, можно выделить:

  • Vaani;
  • Gnani AI;
  • Sarvam AI (поддерживается правительством, имеет «суверенную» модель, обученную на основных индийских языках).

Недавно Sarvam AI продемонстрировала живую озвучку речи министра финансов Нирмалы Ситхараман на телеканале Republic TV с помощью своей новой модели для дубляжа.




Прокомментировать в Телеграм: https://t.me/n8nhow

Подписаться на канал обучения n8n: https://t.me/n8ncoaching