Сейчас ваша корзина пуста!
Google’s Gemini запустил новую ИИ‑модель для создания музыки — Lyria 3

18 февраля компания Google объявила о запуске в бета‑версии новой модели искусственного интеллекта для создания музыки — Lyria 3. Модель интегрирована в приложение Gemini. С её помощью пользователи могут генерировать музыкальные композиции длительностью до 30 секунд в самых разных популярных стилях.
Как работает Lyria 3
Для создания песни пользователю достаточно:
- ввести текстовый промпт;
- загрузить фото или видео.
Каждая сгенерированная композиция сопровождается обложкой, созданной с помощью модели искусственного интеллекта Nano Banana.
Цели и особенности модели
В пресс‑релизе указано, что цель Lyria 3 — «не создать музыкальный шедевр, а дать вам весёлый и уникальный способ самовыражения».
Это уже третья версия модели Lyria. В новой итерации реализованы три ключевых улучшения:
- ранее пользователи должны были самостоятельно предоставлять тексты песен;
- был ограничен творческий контроль над такими элементами, как стиль, вокал и темп;
- треки были менее сложными с музыкальной точки зрения.
Подход к оригинальности и защите авторских прав
В пресс‑релизе подчёркивается, что Lyria 3 разработана для оригинального самовыражения, а не для имитации существующих исполнителей. В модели предусмотрены фильтры, которые проверяют выходные данные на совпадение с уже существующим контентом. Однако отмечается, что этот подход «может быть не безупречным». В случае обнаружения нарушений пользователи могут сообщить о треках, которые потенциально нарушают чьи‑либо права.
Представитель компании сообщил изданию Billboard, что модель учитывает авторские права и партнёрские соглашения. Обучение модели проводится только на тех музыкальных произведениях, на которые у YouTube и Google есть права в соответствии с условиями обслуживания, партнёрскими соглашениями и действующим законодательством.
Ограничения и возможности модели
Lyria 3 не позволяет создавать песни на основе конкретных исполнителей, песен, книг и других защищённых материалов. Тем не менее тестирование модели показало, что она понимает характеристики запрещённых ключевых слов и может использовать их для генерации композиций.
Например, на запрос «песня о любви, как если бы Хитклиф из „Грозового перевала“ пел Кэти в стиле Кейт Буш» модель ответила следующим образом: «Хотя я не могу создать песню, которая напрямую использует персонажей из конкретной книги или точно имитирует стиль конкретного исполнителя, я сгенерировала трек, который передаёт яростную, захватывающую драму вашего запроса!»
Сгенерированный трек был описан как «драматический эфирный арт‑поп, пропитанный готическим романтизмом, с атмосферными синтезаторами». В песне упоминались Хитклиф и «одинокие вересковые пустоши», что демонстрирует понимание моделью стиля Кейт Буш и особенностей романа Эмили Бронте.
Формат вывода и защита контента
Пользователи могут скачать сгенерированную песню в формате MP3 или в виде видео, включающего музыку и обложку. Все треки, созданные в приложении Gemini, содержат SynthID — невидимый аудиоводяной знак, который идентифицирует контент, созданный с помощью ИИ от Google.
Прокомментировать в Телеграм: https://t.me/n8nhow
Подписаться на канал обучения n8n: https://t.me/n8ncoaching
