Google lanza una herramienta para crear música con inteligencia artificial usando su modelo Gemini
Google amplía las capacidades de Gemini, permitiendo crear música personalizada con inteligencia artificial de forma rápida y sencilla para todos los usuarios.
Google ha ampliado la funcionalidad de su aplicación Gemini más allá del procesamiento de texto e imágenes, incluyendo ahora la generación de música mediante inteligencia artificial. Desde hoy, Gemini impulsa una beta de creación musical que utiliza el modelo generativo Lyria 3, desarrollado por DeepMind, y permite a los usuarios componer pistas de 30 segundos con letras en cuestión de segundos, usando solo un prompt o incluso una fotografía.
Este modelo avanzado mejora en tres aspectos principales respecto a versiones previas: genera letras automáticamente, ofrece un control más preciso sobre el estilo, la voz y el tempo, y produce pistas con sonidos más realistas y mayor profundidad. Según Google, la idea no es crear sustitutos para plataformas de streaming ni éxitos comerciales, sino ofrecer una herramienta divertida y sencilla para que cualquier persona pueda añadir música a su día a día sin tener conocimientos técnicos ni contratar productores profesionales. Basta con describir una sensación, como «un tributo nostálgico al afrobeat por la comida de mi mamá» o «una R&B cómica sobre un calcetín solitario», para obtener una mini canción pulida.
Además, Gemini permite subir una foto o un vídeo y convertir ese momento en una banda sonora personalizada con letra, incluso generando arte de portada con Nano Banana, facilitando así la creación y compartición de contenido musical en plataformas como Shorts de YouTube. La integración de estas herramientas amplía las capacidades creativas del sistema, que ya no solo trabaja con imágenes, sino también con vídeos y sonidos.
Por otro lado, Google señala que Lyria 3 ha sido entrenado con rigurosos controles de derechos de autor y acuerdos con socios, enfocándose en la generación de contenido original y no en copiar material existente. El sistema cuenta con filtros para detectar posibles infracciones y permite reportar contenido que vulnere derechos. Cada pista generada incluye la marca de agua SynthID, la tecnología de Google para identificar contenido creado por IA, complementada ahora con herramientas de análisis para verificar si un archivo fue producido con sus modelos de inteligencia artificial.
La funcionalidad está disponible para mayores de 18 años y en varios idiomas, entre ellos inglés, alemán, español, francés, hindi, japonés, coreano y portugués. Inicialmente para escritorio y próximamente para dispositivos móviles, la plataforma también ofrecerá límites de uso superiores para usuarios con suscripción Premium, como Google AI Plus, Pro y Ultra. Con estas novedades, Google apuesta por democratizar la creación musical, permitiendo a todas las personas expresarse creativamente de forma lúdica y sin competir con músicos profesionales, facilitando la realización de canciones personalizadas para cumpleaños, grupos de chat o contenido en Shorts, en cuestión de segundos.