Google’s Gemini запустил новую ИИ‑модель для создания музыки — Lyria 3

18 февраля компания Google объявила о запуске в бета‑версии новой модели искусственного интеллекта для создания музыки — Lyria 3. Модель интегрирована в приложение Gemini. С её помощью пользователи могут генерировать музыкальные композиции длительностью до 30 секунд в самых разных популярных стилях.

Как работает Lyria 3

Для создания песни пользователю достаточно:

  • ввести текстовый промпт;
  • загрузить фото или видео.

Каждая сгенерированная композиция сопровождается обложкой, созданной с помощью модели искусственного интеллекта Nano Banana.

Цели и особенности модели

В пресс‑релизе указано, что цель Lyria 3 — «не создать музыкальный шедевр, а дать вам весёлый и уникальный способ самовыражения».

Это уже третья версия модели Lyria. В новой итерации реализованы три ключевых улучшения:

  • ранее пользователи должны были самостоятельно предоставлять тексты песен;
  • был ограничен творческий контроль над такими элементами, как стиль, вокал и темп;
  • треки были менее сложными с музыкальной точки зрения.

Подход к оригинальности и защите авторских прав

В пресс‑релизе подчёркивается, что Lyria 3 разработана для оригинального самовыражения, а не для имитации существующих исполнителей. В модели предусмотрены фильтры, которые проверяют выходные данные на совпадение с уже существующим контентом. Однако отмечается, что этот подход «может быть не безупречным». В случае обнаружения нарушений пользователи могут сообщить о треках, которые потенциально нарушают чьи‑либо права.

Представитель компании сообщил изданию Billboard, что модель учитывает авторские права и партнёрские соглашения. Обучение модели проводится только на тех музыкальных произведениях, на которые у YouTube и Google есть права в соответствии с условиями обслуживания, партнёрскими соглашениями и действующим законодательством.

Ограничения и возможности модели

Lyria 3 не позволяет создавать песни на основе конкретных исполнителей, песен, книг и других защищённых материалов. Тем не менее тестирование модели показало, что она понимает характеристики запрещённых ключевых слов и может использовать их для генерации композиций.

Например, на запрос «песня о любви, как если бы Хитклиф из „Грозового перевала“ пел Кэти в стиле Кейт Буш» модель ответила следующим образом: «Хотя я не могу создать песню, которая напрямую использует персонажей из конкретной книги или точно имитирует стиль конкретного исполнителя, я сгенерировала трек, который передаёт яростную, захватывающую драму вашего запроса!»

Сгенерированный трек был описан как «драматический эфирный арт‑поп, пропитанный готическим романтизмом, с атмосферными синтезаторами». В песне упоминались Хитклиф и «одинокие вересковые пустоши», что демонстрирует понимание моделью стиля Кейт Буш и особенностей романа Эмили Бронте.

Формат вывода и защита контента

Пользователи могут скачать сгенерированную песню в формате MP3 или в виде видео, включающего музыку и обложку. Все треки, созданные в приложении Gemini, содержат SynthID — невидимый аудиоводяной знак, который идентифицирует контент, созданный с помощью ИИ от Google.




Прокомментировать в Телеграм: https://t.me/n8nhow

Подписаться на канал обучения n8n: https://t.me/n8ncoaching