Google ha anunciado que volverá a permitir la generación de imágenes de personas mediante su chatbot de IA, Gemini, tras haber suspendido esta función a principios de año debido a la aparición de imágenes históricamente inexactas, como nazis con diversidad racial. Esta característica estará disponible nuevamente en una versión de acceso anticipado para los usuarios de Gemini Advanced, Business y Enterprise en inglés «en los próximos días».
La actualización estará respaldada por Imagen 3, la última versión del generador de imágenes a partir de texto de Google. Imagen 3 fue introducido discretamente a través del AI Test Kitchen a principios de este mes y ahora estará disponible en Gemini en todos los idiomas. Esta herramienta avanzada puede generar desde paisajes fotorealistas hasta pinturas al óleo detalladas con solo una breve descripción.
Google había suspendido la capacidad de Gemini para crear imágenes de personas en febrero después de que se detectaran imágenes históricamente inexactas. El modelo mejorado Imagen 3 incluye medidas de seguridad adicionales y «ofrece un rendimiento favorable en comparación con otros modelos de generación de imágenes disponibles», según Dave Citron, director senior de gestión de productos de Gemini.
Cabe destacar que esta actualización no debe confundirse con la nueva función Remagine de Google, que permite incorporar elementos de IA en las fotos tomadas con la línea de teléfonos Pixel 9.
Además, Gemini restringirá la creación de imágenes fotorealistas de figuras públicas, contenido que involucre menores, y escenas gore, violentas o sexuales. “No todas las imágenes generadas por Gemini serán perfectas, pero continuaremos recogiendo comentarios de los usuarios de acceso anticipado de Gemini Advanced mientras seguimos mejorando”, añade Citron. Google tiene planes de expandir esta capacidad de crear personas generadas por IA a más usuarios y idiomas en el futuro cercano.