La nueva herramienta de inteligencia artificial de Google promete imágenes de alta calidad, pero restringe la generación de personas a suscriptores premium.
Google ha dado un paso significativo en el competitivo mundo de la generación de imágenes por inteligencia artificial (IA) al lanzar Imagen 3, su más reciente modelo de creación visual, ahora disponible de forma gratuita para todos los usuarios de Gemini en dispositivos móviles y de escritorio.
Esta movida estratégica coloca a Google en una posición destacada -aunque todavía necesita demostrar una mejor interacción con los usuarios- frente a competidores como DALL-E de OpenAI y Midjourney.
Según Google, Imagen 3 representa su «modelo de generación de imágenes de más alta calidad hasta la fecha», destacando su capacidad mejorada para seguir instrucciones precisas y producir resultados con menos artefactos visuales que sus predecesores.
Sin embargo, existe una limitación significativa: la generación de imágenes de personas está restringida exclusivamente a los suscriptores de Gemini Advanced, un servicio premium con un costo mensual de U$S 19,99 en Estados Unidos, £ 18.99 en Reino Unido y AU$ 32,99 en Australia.
Características y funcionamiento:
- Generación única: A diferencia de otros generadores de IA, Imagen 3 crea una sola imagen por cada prompt, permitiendo refinar los resultados mediante solicitudes de cambios posteriores.
- Alta resolución: Las imágenes generadas se pueden descargar en formato JPEG con una resolución de 2048 x 2048 píxeles.
- Sin límite diario: No hay restricciones en la cantidad de imágenes que se pueden generar, incluso en la versión gratuita.
- Versatilidad creativa: Imagen 3 puede producir desde paisajes fotorrealistas hasta pinturas al óleo texturizadas y escenas de claymation.
- Renderizado de texto: Google afirma que Imagen 3 sobresale en la generación de texto legible dentro de las imágenes, aunque nuestras pruebas sugieren que aún hay margen de mejora en esta área.
Graham Barlow, editor senior de IA en TechRadar, comenta: «Las características mejoradas de Imagen 3 lo posicionan como un fuerte contendiente entre los mejores generadores de imágenes por IA del mercado».
El lanzamiento de Imagen 3 se enmarca en la estrategia de Google para fortalecer su posición en el campo de la IA generativa, un área donde compite ferozmente con empresas como OpenAI y Microsoft.
La decisión de ofrecer esta herramienta de forma gratuita, con la excepción de la generación de imágenes de personas, refleja un equilibrio entre democratizar el acceso a la tecnología de IA y mantener un incentivo para las suscripciones premium.
Es importante destacar que Imagen 3 forma parte del paquete Google One AI Premium Plan, que incluye 2TB de almacenamiento y acceso a Gemini en Google Docs, además de las capacidades avanzadas de generación de imágenes.
La limitación en la creación de imágenes de personas podría ser vista como una medida de precaución ante las crecientes preocupaciones éticas y legales relacionadas con la generación y uso de imágenes sintéticas de individuos.
Esta restricción también podría servir como un diferenciador clave para atraer suscriptores al nivel premium de Gemini.
A medida que la tecnología de generación de imágenes por IA continúa evolucionando rápidamente, es probable que veamos más innovaciones y ajustes en las políticas de uso en el futuro cercano.
Por ahora, Imagen 3 representa un avance significativo en la democratización de herramientas de IA creativas, aunque con algunas limitaciones estratégicas.